UPDATED. 2024-04-19 17:36 (금)
“한국형 초거대AI 차별성 확보 위한 국가 차원 투자 시급”
“한국형 초거대AI 차별성 확보 위한 국가 차원 투자 시급”
  • 최아름 기자
  • 승인 2023.04.10 16:15
  • 댓글 0
이 기사를 공유합니다

KISTI, 최신 언어모델 개발ㆍ활용 사례 제시
초거대 AI 모델 국내 차별화 전략 필요 제기
[출처=KISTI]
[출처=KISTI]

[정보통신신문=최아름기자]

한국형 초거대AI 모델의 차별성과 경쟁력 확보를 위해 국가 차원의 대규모 투자가 필요하다는 의견이 제기됐다.

한국과학기술정보연구원(KISTI)은 사람과 의사소통하는 인공지능 언어모델에 대한 ‘KISTI 이슈브리프’를 발간했다.

ChatGPT의 등장으로 인해 사람의 언어를 이해하는 기술에 대한 관심이 많아지는 가운데, 다양한 언어, 문화, 지식 분야에 걸친 정보를 포함하는 인공지능 파운데이션 모델(Foundation Model)들을 경쟁적으로 개발하고 있다.

글로벌 자연어 처리(NLP) 시장 규모는 27.1%의 연평균 복합성장률(CAGR)로 2030년에 910억달러(한화 약 120조원) 수준으로 성장할 것으로 예측하고 있다.

자연어 처리의 핵심이 되는 언어모델은 챗봇(ChatBot)과 같은 대화형 AI 서비스 형태로 제공되고 있으며, 주요 기업으로는 마이크로소프트(Microsoft), 구글(Google), IBM, 메타(구 페이스북), 바이두 등이 있다.

2019년에 구글에서 개발한 트랜스포머(Transformer) 번역 모델에서 언어의 생성에 특화된 디코더(Decoder)를 기반으로한 GPT(Generative Pretrained Transformer) 언어모델에 이어, 언어이해에 집중하는 인코더(Encoder)를 활용한 버트(BERT) 모델이 개발되면서 사람의 언어 인지 성능을 돌파하는 모델들이 연이어 출시됐다.

언어모델의 성능 발전에 있어 모델의 크기는 파라미터(Parameter)로 결정되며, 점차적으로 학습을 위한 파라미터와 데이터는 폭발적으로 늘려 지식을 잘 축적하는 방향으로 발전하고 있다.

최근에 발표된 GPT-4는 파라미터 수를 공개하고 있지 않으나, 조단위가 넘을 것으로 전문가들이 예측하고 있으며, 이전 모델인 GPT-3.5는 1750억개의 파라미터와 570GB 분량의 텍스트 문서를 학습에 활용했다.

[출처=KISTI]
[출처=KISTI]

언어모델은 글로벌 빅테크 기업들을 위주로 발전이 진행됐으며, 국내에서도 네이버의 하이퍼클로바(Hyper-Clova), 카카오 브레인의 KoGPT, LG의 엑사원 등 한국어 기반의 초거대 언어모델을 개발하고 있다.

과학기술분야의 연구를 지원하기 위해 KISTI에서는 한국어에 특화된 KorSci-BERT, KorSci-ELECTRA를 개발했으며, 영어에 특화된 SciDeBERTa 모델을 개발하여 공개했다. 특히, SciDeBERTa 모델은 과학기술분야의 개체명인식 분야에서 전세계 1위를 달성한 모델이다.

언어모델을 기반으로 수학문제 해결, 작문, 코딩, 번역, 교육, 창작 등의 서비스를 제공하고 있으며, 익숙한 대화형 인터페이스를 제공하기 위해 다목적 챗봇, 스마트 스피커 등의 형태로 출시되고 있다.

그러나 이러한 언어모델들은 사용자들에게 잘못된 정보를 제공하지 않도록, 국가별로 상대적인 문화를 이해할 수 있도록, 공통적인 윤리를 지킬 수 있도록, 어떠한 형태로든 차별이 없도록 개발돼야 하고, 글로벌 AI 경쟁에서 국내의 기술력이 리더십을 가질 수 있도록 전략을 갖춰야 한다.

사람들과 자연스러운 대화 방식의 AI에 대한 의존성은 점차 높아질 것으로 예상되기 때문에, 정확하지 않거나 편향된 정보를 사용자들이 무분별하게 받아들일 수 있다. 이러한 기술들이 올바르게 사용될 수 있도록 성별, 연령, 장애, 지역, 인종, 종교, 국가 등 어떠한 형태로든 편향과 차별이 없도록 개발돼야 한다.

마이크로소프트가 오픈AI(OpenAI)에 10조원이 넘는 자본을 투자하며 초거대 언어모델인 GPT 시리즈와 ChatGPT에 대한 기술 독점화 및 유료화를 진행했다.

KISTI는 “초거대 언어모델을 학습하기 위해서는 AI 전문 인력, 초거대 텍스트 데이터, 슈퍼컴퓨터 급의 하드웨어 인프라가 필요하기 때문에 거대 자본의 투입이 불가피하다”며, “국내에서도 해외 AI 모델로부터 독립적이며 차별적인 AI 기술력을 확보하기 위해 연구진들의 협력을 통한 전략을 마련해야 하며, 국가 차원에서의 투자가 이뤄져야 할 것”이라고 밝혔다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • [인터넷 신문 등록 사항] 명칭 : ㈜한국정보통신신문사
  • 등록번호 : 서울 아04447
  • 등록일자 : 2017-04-06
  • 제호 : 정보통신신문
  • 대표이사·발행인 : 함정기
  • 편집인 : 이민규
  • 편집국장 : 박남수
  • 서울특별시 용산구 한강대로 308 (한국정보통신공사협회) 정보통신신문사
  • 발행일자 : 2024-04-19
  • 대표전화 : 02-597-8140
  • 팩스 : 02-597-8223
  • 청소년보호책임자 : 이민규
  • 사업자등록번호 : 214-86-71864
  • 통신판매업등록번호 : 제 2019-서울용산-0472호
  • 정보통신신문의 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재·복사·배포 등을 금합니다.
  • Copyright © 2011-2024 정보통신신문. All rights reserved. mail to webmaster@koit.co.kr
한국인터넷신문협회 인터넷신문위원회 abc협회 인증 ND소프트