자율주행, 헬스케어 AI 학습용 데이터 개방 < 정책 < 뉴스 < 기사본문

박윤규 과학기술정보통신부 제2차관이 12일 서울 강남구 인피닉 AI연구소에서 열린 '제3회 인공지능(AI) 데이터 활용협의회' 에 참석해 노성운 인피닉 대표로부터 '셀프 계산, AI 카운터 시연' 설명을 듣고 있다. [사진=과기정통부]

[정보통신신문=최아름기자]

자율주행, 헬스케어 분야 등 인공지능(AI) 학습용 데이터가 추가 개방된다. 이에 공공에 의해 개방되는 AI 학습용 데이터가 총 381종으로 늘어난다.

과학기술정보통신부는 국내 인공지능 기술과 산업 발전을 견인할 AI 학습용 데이터 190종(5억8000만건)을 AI Hub를 통해 12일부터 추가 개방한다고 밝혔다.

과기정통부는 2017년부터 기업, 연구자 등이 시간·비용 문제 등으로 개별 확보하기 어려운 AI 학습용 데이터를 구축·개방해 왔고, 2020년부터 구축 규모를 대폭 늘린 후 18만건 이상의 다운로드를 기록 중이다.

이번 데이터 개방은 지난해 6월 개방한 2020년 구축 데이터 170종(4억8000만건)에 더해 작년 구축한 190종에 대한 품질·활용성 검증을 거쳐 순차적으로 개방하는 것으로, 총 규모는 381종에 달하게 된다.

박윤규 과학기술정보통신부 제2차관이 12일 서울 강남구 인피닉 AI연구소에서 열린 '제3회 인공지능(AI) 데이터 활용협의회' 에 참석해 인사말을 하고 있다. [사진=과기정통부]

아울러, 이번 데이터 개방과 함께 산·학·연 각 계 전문가가 AI Hub 데이터 활용 촉진과 성과 확산 방안을 논의하는 ‘제3회 AI 데이터 활용협의회’를 박윤규 과기정통부 2차관 주재로 개최했다.

박윤규 차관은 이 날 협의회에 앞서 AI Hub에 개방된 데이터를 활용해 개발한 AI 상품인식·결제 및 보안 서비스로, CES 2022 혁신상을 수상한 인피닉의 ‘AI 카운터’ 시연도 참관했다.

이번에 개방되는 6대 분야 190종의 AI 학습용 데이터는 기획부터 구축까지 산업계, 전문가와 국민이 대거 참여한 결과물로, 한국어 음성·자연어(아동, 다화자 음성 등 44종), 영상·이미지(스포츠 동작, 반려동물 등 39종), 교통·물류(로봇주행, 교통사고 등 22종), 헬스케어(심장질환, 정신건강 등 32종), 재난·안전·환경(과적차량, 물류창고 등 27종), 농·축·수산(정밀 농업, 스마트 양식 등 26종)이다.

이번 데이터 개방은 민간 수요를 바탕으로 분야별 산·학·연 전문가, 데이터 활용기업 등이 직접 참여해 산업 파급효과가 크고 민간에서 대규모로 구축하기 어려운 데이터들을 발굴·선정하는 방식으로 기획됐다.

특히, 데이터 구축 과정에 국내 주요 인공지능·데이터 전문기업은 물론 대학(서울대, KAIST 등 118개), 병원(서울대병원, 국립암센터 등 50개) 등 총 811개 기업·기관과 4만3000여명에 이르는 국민이 참여했다.

또한, 정보통신기술 표준화·인증을 수행하는 한국정보통신기술협회(TTA)의 전문적 품질검증과 함께 실제 데이터 수요자가 요구하는 품질 수준을 확보하기 위해, 주요 대기업(네이버·카카오·LG·KT·현대차 등), 스타트업(라이드플럭스·스트라드비젼 등), 대학 및 연구기관(GIST·부산대·ETRI·한국자동차연구원 등)의 데이터 활용성 검토와 추가 보완을 거쳤다.

과기정통부는 AI 학습용 데이터 추가 개방과 함께, AI Hub 데이터 활용 촉진과 성과 확산 방안을 논의하는 ‘제3회 AI 데이터 활용협의회’를 열어 인공지능·데이터 산업·연구현장의 생생한 의견을 수렴했다.

이날 협의회에는 인공지능 서비스를 직접 개발‧활용하고 있는 대기업(KT, 네이버클로바, 현대자동차 에어스컴퍼니, 카카오엔터프라이즈), 중소‧스타트업(인피닉, 에이아이포펫, 딥노이드, 포티투마루), 유관기관 등(한국자동자연구원, 한국과학기술연구원, 한국환경연구원, 광주과학기술원, 한국지능정보사회진흥원, 한국정보통신기술협회) 등 14개 기업·기관 관계자가 참석했다.

박윤규 과학기술정보통신부 제2차관이 12일 서울 강남구 인피닉 AI연구소에서 열린 '제3회 인공지능(AI) 데이터 활용협의회' 에 참석해 기념촬영 하고 있다. [사진=과기정통부]

우선 과기정통부와 지능정보원은 AI 학습용 데이터 구축·활용 주요 성과와 AI Hub 기능 개선사항 등을 공유하고, AI Hub 데이터 이용 활성화를 위한 지원 방안 등을 제시했다.

이어진 민간의 AI Hub 데이터 활용 우수사례 발표에서는 KT의 다양한 한국어 음성 데이터를 활용한 콜센터 상담 내용 분류 및 요약 성능 향상 사례와 더불어, 에이아이포펫의 AI Hub ‘반려동물 안구질환 이미지 데이터’를 활용한 반려동물 질병 판독 서비스 ‘티티케어(TTcare)’ 개발 사례(CES 2022 혁신상 수상)가 소개됐다.

참석자들은 계속되는 간담회를 통해 인공지능 산업·연구·교육 등 다양한 현장에서 AI Hub 데이터 활용을 더욱 촉진할 수 있는 각종 정책지원 방안 등에 대해 가감 없이 의견을 나눴다.

이 날 협의회를 주재한 박윤규 차관은 “우리 데이터로 우리 기업이 개발한 서비스가 세계적으로 인정받고 있다는 점이 자랑스럽기도 하지만, 동시에 막중한 책임감을 느끼고 있다”며, “앞으로도 다양한 분야에서 의미 있는 활용성과가 나타날 수 있도록 데이터의 양적·질적 가치를 계속해서 높여가나는 것이 협의회를 통해 모색할 중요한 과제”라 언급했다.