Mathwi's tistory :)

Mathwi's tistory :)

  • 분류 전체보기 (7)
    • Mathematics (0)
      • Analysis (0)
      • Applied mathematics (0)
    • Data Science (0)
      • NLP basic (0)
      • LLMs basic (0)
      • Similarity measure (0)
      • Kalman filter (0)
    • Projects (0)
      • LLMs for Mathematical reaso.. (0)
      • Voice phishing detection ba.. (0)
      • Classification based on sim.. (0)
      • Prediction for water level .. (0)
    • Open Seminar (7)
      • Kalman Filter & Anomaly Det.. (1)
      • NLP & LLM (5)
      • Reinforcement Learning (1)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

Mathwi's tistory :)

컨텐츠 검색

태그

최근글

댓글

공지사항

아카이브

Open Seminar/Reinforcement Learning(1)

  • [논문 소개] Solving the Rubik's cube with deep reinforcement learning and search

    서론: 강화 학습으로 루빅스 큐브를 풀 수 있을까?이번 세미나에서 저는 강화 학습(Reinforcement Learning)을 주제로 첫 번째 스터디 발표를 진행했습니다. 단순히 이론만 다루기보다는 흥미로운 응용 사례를 함께 살펴보고 싶었고, 그래서 선택한 논문이 바로 "Solving the Rubik's Cube with Deep Reinforcement Learning and Search" (Nature Machine Intelligence)입니다.이 논문은 강화 학습(Value Iteration), 딥 뉴럴 네트워크(DNN), 그리고 A* 탐색 알고리즘을 결합하여 루빅스 큐브를 풀어내는 방법을 제안합니다. 이번 글에서는 발표 자료를 바탕으로 논문의 핵심 아이디어와 그 배경이 되는 강화 학습 이론을 ..

    2026.04.02
이전
1
다음
Keon-Hwi Kim
© 2026 Mathwi. All rights reserved.

티스토리툴바