Dogun Kim

  • 홈
  • 태그
  • 방명록

Reinforcement learning/1. Tabular Solution Methods 1

ch2. Multi-arm Bandits

강화학습을 다른 종류의 학습 방법과 구별 짓는 가장 중요한 특징은 올바른 행동을 알려주는 지침이 아닌 행동의 좋고 나쁨을 평가하는 훈련 정보를 사용하는 것이다. 이러한 점 때문에   2.1 Ann-Armed Bandit Problem  2.2 Action-Value Methods  2.3 Incremental Implementation  2.4 Tracking a Nonstationary Problem  2.5 Optimistic Initial Values  2.6 Upper-Condence-Bound Action Selection 2.7 Gradient Bandits  2.8 Associative Search (Contextual Bandits)  2.9 Summary      2.1 Ann-Armed..

Reinforcement learning/1. Tabular Solution Methods 2024.12.26
이전
1
다음
더보기
프로필사진

Dogun Kim

Dept of AI, University of Seoul

  • Studying
    • 논문
      • Vision Language Action (VLA)
      • E2E Autonomous Driving (VLM)
      • E2E Autonomous Driving (MBRL)
      • Robotics
      • NLP
      • CV
    • Autonomous Driving
      • 1. Perception
      • 2. LiDAR Perception
      • 3. Sensor Fusion
      • 4. Motion Planning & Control
    • Reinforcement learning
      • 0. Intro
      • 1. Tabular Solution Methods
      • 2. Approximate Solution Methods
      • 3. Frontiers
    • Deep Learning
      • 0. Intro
      • 1. PyTorch
      • 2. Natural language processing
    • 학부 수업
      • 데이터마이닝
      • 확률 및 랜덤 프로세스
      • 학부 수업
      • 정보이론
      • 컴퓨터비전
      • Reliable AI
      • 인공지능의 윤리
    • Data Science
      • Data analysis
    • Robotics
      • ROS

Tag

think2drive, planning algorithm, 자율주행 평가 지표, model-based rl, 43인치모니터 스마트모니터, giou, carla v2, 강화학습, waymo 데이터셋, nuscenes 데이터셋, LS43FM701, world model, 3d 객체 검출, 자율주행, reinforcement learning, retinaface, #computervision #cameraprojection #projectivetransformation #weakperspective #orthographicprojection #affineprojection #homocoordinates #calibrationmatrix #vanishingpoint, pointnet++, kitti 데이터셋, PointNet,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 블로그 이사 왔습니다.

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바