Dogun Kim

  • 홈
  • 태그
  • 방명록

틱택토예제 1

ch1. The Reinforcement Learning Problem 2 (Introduction)

https://dogunkim.tistory.com/62 ch1. The Reinforcement Learning Problem 1 ((Introduction))주변 환경과 상호작용하면서 무언가를 배워나간다는 것은 학습과 지능에 관한 거의 모든 이론의 기저에 깔린 개념이다. 세상으로 나온 아기는 누가 무언가를 알려주지 않아도 팔을 휘두르거나dogunkim.tistory.com 목차>1.1 Reinforcement Learning  1.2 Examples  1.3 Elements of Reinforcement Learning  1.4 Limitations and Scope  1.5 An Extended Example: Tic-Tac-Toe  1.6 Summary  1.7 History of Reinforc..

Reinforcement learning/0. Intro 2024.12.26
이전
1
다음
더보기
프로필사진

Dogun Kim

Dept of AI, University of Seoul

  • Studying
    • 논문
      • CV
      • NLP
      • E2E Autonomous Driving (VLM)
      • E2E Autonomous Driving (MBRL)
    • Autonomous Driving
      • 1. Perception
      • 2. LiDAR Perception
      • 3. Sensor Fusion
      • 4. Motion Planning & Control
    • Reinforcement learning
      • 0. Intro
      • 1. Tabular Solution Methods
      • 2. Approximate Solution Methods
      • 3. Frontiers
    • Deep Learning
      • 0. Intro
      • 1. PyTorch
      • 2. Natural language processing
    • 학부 수업
      • 데이터마이닝
      • 확률 및 랜덤 프로세스
      • 학부 수업
      • 정보이론
      • 컴퓨터비전
      • Reliable AI
    • Data Science
      • Data analysis
    • Robotics
      • ROS

Tag

carla v2, 자율주행 평가 지표, PointNet, nuscenes 데이터셋, reinforcement learning, world model, 강화학습, #computervision #cameraprojection #projectivetransformation #weakperspective #orthographicprojection #affineprojection #homocoordinates #calibrationmatrix #vanishingpoint, waymo 데이터셋, pointnet++, retinaface, 자율주행, giou, kitti 데이터셋, 3d 객체 검출, model-based rl, planning algorithm, 자율주행 데이터셋, 3d bounding box, think2drive,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 블로그 이사 왔습니다.

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바