“저작권 문제없이 누구나 사용 가능”··· 카카오모빌리티, ‘자율주행 AI 학습용 데이터셋’ 공개

카카오모빌리티는 레벨4 자율주행 구현을 위한 해당 사업에 참여해 차량, 엣지-인프라, 지능학습을 연계하여 융합형 자율주행 데이터의 생성・관리・배포 자동화 기술 개발을 완료했다. 사업의 일환으로 국내 도로 환경에서 구축한 비식별화된 AI 학습용 데이터셋을 일반에 공개하고 저작권 문제없이 누구나 자유롭게 자율주행 연구개발에 활용할 수 있도록 한다는 취지다.

카카오모빌리티에 따르면, 그동안 자율주행을 연구하는 소규모 기업이나 학계, 연구계에서는 막대한 비용과 시간이 소요돼 라이다·레이더·카메라 센서로 자율주행 데이터를 직접 확보하기 어려웠다. 또 이미 공개된 데이터셋은 대부분 해외 지역이나 특정 시간대에 수집된 데이터로 국내 실정에 맞는 연구개발에 한계가 있었다.

카카오모빌리티가 이번에 공개한 데이터셋은 국내 주요 도로변에 설치된 라이다·카메라 센서 등 엣지-인프라와 카카오모빌리티가 직접 운영한 자율주행차를 통해 획득했다. 이는 사람, 차량, 자전거 등 움직이는 3D 동적 객체와 신호등, 표지판 등 2D 정적 객체를 인지 및 판단할 수 있는 10개 유형의 15만건으로 구성된 데이터셋이다. 카카오모빌리티는 “이번에 공개된 데이터로 국내 환경에 적합한 자율주행 AI 모델 개발과 학습에 활용할 수 있을 것”으로 기대했다.

특히 해당 데이터는 도로타입(고속도로, 국도, 지하차도, 터널 등), 시간(주/야간), 날씨(맑음/강우/안개 등) 등 총 31개 카테고리의 다양한 환경 조건에서 수집됐으며, 라이다 센서를 통해 취득한 포인트클라우드의 좌표값은 물론 사람, 사물 등 개체 속성을 구분할 수 있는 세분화(Pointcloud segmentation) 데이터도 포함돼 활용 가치가 높을 것으로 예상된다고 카카오모빌리티는 밝혔다.

ETRI에 따르면, 해당 데이터셋을 학습해 실증한 결과, 사람과 차량, 자전거 등 3D 동적 객체 검출 AI 성능은 약 5~8%, 신호등 인식 AI 성능은 약 2%가 향상된 것으로 나타나는 등 데이터의 신뢰성이 검증됐다.

한편 정부는 2027년 융합형 레벨4+ 자율주행 상용화 기반 완성을 목표로 ‘자율주행 기술개발 혁신사업’을 추진 중이며, 카카오모빌리티는 과학기술정보통신부와 IITP, KADIF의 지원을 받아 해당 사업과제를 수행했다.

장성욱 카카오모빌리티 미래이동연구소장은 “이번 데이터셋 공개가 국내 자율주행 기술의 상용화와 발전을 앞당기는 초석이 되길 기대한다”라며 “앞으로도 다양한 공공 및 민간기업과 협력하여 자율주행 기술 혁신과 공공 데이터 활용 확대에 앞장서겠다”라고 밝혔다.
dl-ciokorea@foundryco.com



Source link

Leave a Comment