오프라인 강화학습 데이터 효율성 개선

요즘 인공지능 분야에서 ‘강화학습’이라는 단어, 정말 많이 들리시죠? 특히 복잡한 환경에서 에이전트가 스스로 학습하며 최적의 결정을 내리게 하는 기술은 자율주행이나 로봇 제어 같은 실제 생활에 적용될 때 큰 빛을 발하는데요. 하지만 이때 가장 큰 고민은 바로 ‘데이터’더라고요. 수많은 시행착오를 거쳐야만 얻을 수 있는 데이터, 특히 제한된 양의 데이터로도 최고의 성능을 끌어내는 ‘데이터 효율성 개선’은 늘 … Read more

SAC 알고리즘을 이용한 연속 제어 문제 해결

요즘 인공지능, 로봇 제어 같은 첨단 기술 얘기가 나오면 어쩐지 어렵고 멀게만 느껴지시죠? 하지만 우리 삶 속에 AI는 이미 깊숙이 들어와 있고, 그 변화의 속도는 상상 이상입니다. 저도 처음에는 복잡한 알고리즘과 코드의 세계에 발을 들이기가 망설여졌지만, 막상 배우고 적용해보니 세상을 보는 눈이 달라지더라고요. 특히 로봇이나 시스템을 마치 내 몸처럼 정교하게 움직이게 하는 ‘제어’ 기술은 정말 … Read more