Dogun Kim

  • 홈
  • 태그
  • 방명록

모델기반학습 1

ch1. The Reinforcement Learning Problem 1 ((Introduction))

주변 환경과 상호작용하면서 무언가를 배워나간다는 것은 학습과 지능에 관한 거의 모든 이론의 기저에 깔린 개념이다. 세상으로 나온 아기는 누가 무언가를 알려주지 않아도 팔을 휘두르거나 주위를 둘러보며 경험을 쌓고 상호작용하며 자신과 주변 환경에 대해서 배워나가게 된다.  우리는 이제 상호작용으로 부터 배우는 과정에서 컴퓨터를 활용하는 방법을 탐구할 것이다. 이 때, 인공지능 연구자나 엔지니어의 시각에서 이상적인 학습 환경을 가정하고 그 안에서 다양한 학습 방법이 갖는 효과에 대해서 수학적 분석과 컴퓨터 실험을 통해 분석할 것이다.  참고1) 앞으로 나올 수학적 증명에 대하여..수학적 증명은 개념의 간결함과 내재된 일반성을 해치지 않으면서, 올바른 방향을 제시할 수 있을 정도로만 진행된다. 너무 스트레스 받..

Reinforcement learning/0. Intro 2024.12.26
이전
1
다음
더보기
프로필사진

Dogun Kim

Dept of AI, University of Seoul

  • Studying
    • 논문
      • CV
      • NLP
      • E2E Autonomous Driving (VLM)
      • E2E Autonomous Driving (MBRL)
    • Autonomous Driving
      • 1. Perception
      • 2. LiDAR Perception
      • 3. Sensor Fusion
      • 4. Motion Planning & Control
    • Reinforcement learning
      • 0. Intro
      • 1. Tabular Solution Methods
      • 2. Approximate Solution Methods
      • 3. Frontiers
    • Deep Learning
      • 0. Intro
      • 1. PyTorch
      • 2. Natural language processing
    • 학부 수업
      • 데이터마이닝
      • 확률 및 랜덤 프로세스
      • 학부 수업
      • 정보이론
      • 컴퓨터비전
      • Reliable AI
    • Data Science
      • Data analysis
    • Robotics
      • ROS

Tag

nuscenes 데이터셋, #computervision #cameraprojection #projectivetransformation #weakperspective #orthographicprojection #affineprojection #homocoordinates #calibrationmatrix #vanishingpoint, 자율주행 데이터셋, planning algorithm, reinforcement learning, 강화학습, waymo 데이터셋, 3d 객체 검출, model-based rl, 3d bounding box, pointnet++, kitti 데이터셋, think2drive, 자율주행, PointNet, retinaface, giou, 자율주행 평가 지표, world model, carla v2,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 블로그 이사 왔습니다.

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바