오프라인 강화학습 데이터 효율성 개선

요즘 인공지능 분야에서 ‘강화학습’이라는 단어, 정말 많이 들리시죠? 특히 복잡한 환경에서 에이전트가 스스로 학습하며 최적의 결정을 내리게 하는 기술은 자율주행이나 로봇 제어 같은 실제 생활에 적용될 때 큰 빛을 발하는데요. 하지만 이때 가장 큰 고민은 바로 ‘데이터’더라고요. 수많은 시행착오를 거쳐야만 얻을 수 있는 데이터, 특히 제한된 양의 데이터로도 최고의 성능을 끌어내는 ‘데이터 효율성 개선’은 늘 … Read more