UPDATED. 2024-03-29 08:46 (금)
2805억 투입 AI학습데이터 구축사업 사업자 공모
2805억 투입 AI학습데이터 구축사업 사업자 공모
  • 최아름 기자
  • 승인 2023.04.14 17:50
  • 댓글 0
이 기사를 공유합니다

과기정통부
올해 인공지능학습용데이터 구축사업
150종 구축, 말뭉치 데이터 34종 추진
[출처=과기정통부]
[출처=과기정통부]

[정보통신신문=최아름기자]

과학기술정보통신부는 14일부터 5월 19일까지 ’인공지능 학습용데이터 구축사업‘ 참여사업자를 공모한다고 밝혔다.

의료진단, 자율주행, 챗봇, 음성 인식 등 다양한 인공지능 모델 또는 서비스는 데이터 학습을 통해서 구현된다. 대량의 학습데이터는 인공지능의 성능향상과 직결되는 핵심요소이나, 데이터 수집‧가공에는 상당한 시간과 비용이 필요하다. 국내 중견‧중소기업, 스타트업, 대학 등은 AI 개발‧도입을 가로막는 주요 저해요인으로 학습용데이터 부족 문제를 지속적으로 제기하고 있는 실정이다.

이에 과기정통부는 2017년부터 언어, 이미지, 영상, 음성, 센서 등 다양한 유형의 인공지능 학습데이터를 구축해 누구나 손쉽게 활용할 수 있도록 지원하고 있다. 현재 AI 허브를 통해 한국어, 헬스케어, 교통 등 6대 분야 381종의 데이터를 제공 중이며, 이달 말부터는 지난해 구축한 310종을 품질검증을 거쳐 순차적으로 추가 개방할 예정이다.

금년도 구축사업에는 총 2805억원의 예산을 투입해 150종의 신규 데이터를 구축한다. 우선 지난해 수요조사를 통해 접수된 약 1400건의 후보데이터를 토대로 기획된 130종의 데이터는 지정과제 형태로 추진한다. 지정과제는 2022년 1월 수립한 ’AI 학습용 데이터 구축·활용 고도화 방안’에 따라 선정된 14대 분야 118종의 데이터와 ‘22년도 계속과제 12종으로 구성된다. 나머지 20종은 자유과제로 지역특화, 자유주제 등 일반영역과 초거대AI 영역으로 나눠 선정할 예정이다.

특히 금년에는 챗GPT와 같은 초거대AI에 기반한 대화형 모델 지원을 위한 데이터 구축도 추진한다. 기존의 지도학습용 데이터(라벨링데이터) 물량은 일부 축소하고, 한국어 21종 등을 포함한 총 34종의 데이터를 ‘초거대AI 지원 데이터’로 구분해 자기지도학습에 필요한 비라벨링 데이터 구축을 확대한다. 또한 이미지 데이터 48종은 생성형AI 등의 학습에도 활용할 수 있도록 이미지를 묘사‧설명하는 캡션 정보를 추가로 포함한다. ‘24년도부터는 사업개편을 통해 초거대AI 데이터 구축을 별도 트랙으로 신설해 본격 지원할 예정이다.

아울러 그간 적용해 온 수행기관의 인건비 편성요건*을 폐지하고 자동라벨링, 합성데이터(2022년 1종 → 2023년 5종 내외) 등 신기술 도입 적용을 확대한다. 문화관광, 스포츠, 법률 등 산업특화 분야에서의 인공지능 도입을 유도하기 위해 관련 데이터 구축 비중을 2022년도 19%→‘23년도 25%로 높인다. 또한 국회·소방 등 공공분야에서 보유한 데이터의 민간이용 확산을 지원하기 위한 공공분야 학습데이터 구축(5종)도 구축도 강화한다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • [인터넷 신문 등록 사항] 명칭 : ㈜한국정보통신신문사
  • 등록번호 : 서울 아04447
  • 등록일자 : 2017-04-06
  • 제호 : 정보통신신문
  • 대표이사·발행인 : 함정기
  • 편집인 : 이민규
  • 편집국장 : 박남수
  • 서울특별시 용산구 한강대로 308 (한국정보통신공사협회) 정보통신신문사
  • 발행일자 : 2024-03-29
  • 대표전화 : 02-597-8140
  • 팩스 : 02-597-8223
  • 청소년보호책임자 : 이민규
  • 사업자등록번호 : 214-86-71864
  • 통신판매업등록번호 : 제 2019-서울용산-0472호
  • 정보통신신문의 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재·복사·배포 등을 금합니다.
  • Copyright © 2011-2024 정보통신신문. All rights reserved. mail to webmaster@koit.co.kr
한국인터넷신문협회 인터넷신문위원회 abc협회 인증 ND소프트