전체 글 85

논문 리뷰) Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving in CARLA-v2 ((ECCV 2024))

Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving in CARLA-v2https://arxiv.org/abs/2402.16720 Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving (in CARLAReal-world autonomous driving (AD) especially urban driving involves many corner cases. The lately released..

Ch01-3. Introduction to Sensor Fusion nuScenes 데이터셋 살펴보기

1. 센서퓨전 기반 3차원 객체 검출 기술 개요2. 자율주행에 사용되는 센서3. 자율주행 데이터셋4.자율주행 기술 성능 평가지표5. [실습1] 자율주행 데이터셋 살펴보기 nuScenes 5. [실습1] 자율주행 데이터셋 살펴보기 nuSceneshttps://www.nuscenes.org/nuscenes https://www.nuscenes.org/nuscenes www.nuscenes.org위에서 overview를 천천히 읽어보면 좋다. 아래 코랩을 통해 데이터를 하나 하나 살펴보겠다. https://colab.research.google.com/github/nutonomy/nuscenes-devkit/ nuscenes_tutorial.ipynb를 확인하면 된다. !pip install matplotli..

Ch01-2. Introduction to Sensor Fusion 자율주행 데이터셋, 평가 지표

1. 센서퓨전 기반 3차원 객체 검출 기술 개요2. 자율주행에 사용되는 센서3. 자율주행 데이터셋4.자율주행 기술 성능 평가지표5. [실습1] 자율주행 데이터셋 살펴보기 nuScenes 3. 자율주행 데이터셋 자율주행은 학습 기반으로 구현하기에 목적에 맞는 적절한 학습 데이터를 사용하는 것은 매우 중요하다. 자율주행을 구현하는데 cctv와 같이 고정된 곳에서의 데이터를 사용하는 것은 적절하지 않다. 학습 데이터셋을 고를 때 고려 사항1) Sensor Configuration  내가 어떤 걸 구현하고 싶냐에 따라 어떤 센서 구성을 가진 데이터인지 확인해야만 한다. 내가 만약 4D Radar를 연구하고 싶은데 카메라와 라이더 정보만 있는 데이터를 사용하는 건 불가능할 것이다.센서가 어떻게 구성되어 있는지 뿐..

Ch01-1. Introduction to Sensor Fusion 객체 검출, 센서 종류

이번 챕터에서는 자율주행에 사용되는 센서, 데이터셋, 평가 지표에 대해 공부할 것이다. 1. 센서퓨전 기반 3차원 객체 검출 기술 개요2. 자율주행에 사용되는 센서3. 자율주행 데이터셋4.자율주행 기술 성능 평가지표5. [실습1] 자율주행 데이터셋 살펴보기 nuScenes  1. 센서퓨전 기반 3차원 객체 검출 기술 개요 우리는 최종적으로 카메라, 라이더, 레이더와 같은 여러 센서들을 함께 사용하여 3D 환경에서의 Object detection을 수행할 것이다. 이를 위해 먼저 간단하게 Object detection과 Sensor fusion의 개념을 알고 넘어갈 필요가 있다. 2D Object Detection  RGB image와 같은 카메라 센서 입력이 주어졌을 때, 데이터셋에서 정의된 물체가 특정..

논문 리뷰) DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Model

DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Modelhttps://arxiv.org/abs/2310.01412 DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language ModelMultimodal large language models (MLLMs) have emerged as a prominent area of interest within the research community, given their proficiency in handling and reasoning with non-textual data, including images ..

ch2. Multi-arm Bandits

강화학습을 다른 종류의 학습 방법과 구별 짓는 가장 중요한 특징은 올바른 행동을 알려주는 지침이 아닌 행동의 좋고 나쁨을 평가하는 훈련 정보를 사용하는 것이다. 이러한 점 때문에   2.1 Ann-Armed Bandit Problem  2.2 Action-Value Methods  2.3 Incremental Implementation  2.4 Tracking a Nonstationary Problem  2.5 Optimistic Initial Values  2.6 Upper-Condence-Bound Action Selection 2.7 Gradient Bandits  2.8 Associative Search (Contextual Bandits)  2.9 Summary      2.1 Ann-Armed..

ch1. The Reinforcement Learning Problem 2 (Introduction)

https://dogunkim.tistory.com/62 ch1. The Reinforcement Learning Problem 1 ((Introduction))주변 환경과 상호작용하면서 무언가를 배워나간다는 것은 학습과 지능에 관한 거의 모든 이론의 기저에 깔린 개념이다. 세상으로 나온 아기는 누가 무언가를 알려주지 않아도 팔을 휘두르거나dogunkim.tistory.com 목차>1.1 Reinforcement Learning  1.2 Examples  1.3 Elements of Reinforcement Learning  1.4 Limitations and Scope  1.5 An Extended Example: Tic-Tac-Toe  1.6 Summary  1.7 History of Reinforc..

ch1. The Reinforcement Learning Problem 1 ((Introduction))

주변 환경과 상호작용하면서 무언가를 배워나간다는 것은 학습과 지능에 관한 거의 모든 이론의 기저에 깔린 개념이다. 세상으로 나온 아기는 누가 무언가를 알려주지 않아도 팔을 휘두르거나 주위를 둘러보며 경험을 쌓고 상호작용하며 자신과 주변 환경에 대해서 배워나가게 된다.  우리는 이제 상호작용으로 부터 배우는 과정에서 컴퓨터를 활용하는 방법을 탐구할 것이다. 이 때, 인공지능 연구자나 엔지니어의 시각에서 이상적인 학습 환경을 가정하고 그 안에서 다양한 학습 방법이 갖는 효과에 대해서 수학적 분석과 컴퓨터 실험을 통해 분석할 것이다.  참고1) 앞으로 나올 수학적 증명에 대하여..수학적 증명은 개념의 간결함과 내재된 일반성을 해치지 않으면서, 올바른 방향을 제시할 수 있을 정도로만 진행된다. 너무 스트레스 받..