UPDATED. 2024-04-26 19:26 (금)
KISTI, 생성형 언어 모델 KONI 개발
KISTI, 생성형 언어 모델 KONI 개발
  • 최아름 기자
  • 승인 2023.12.20 12:30
  • 댓글 0
이 기사를 공유합니다

과학기술데이터 특화 생성형 언어 모델로
출연연, 중소기업, 공공기관 LLM 수요에 대응
KONI 심볼 마크. [사진=KISTI]
KONI 심볼 마크. [사진=KISTI]

[정보통신신문=최아름기자]

한국과학기술정보연구원(KISTI)은 20일 과학기술데이터에 특화되고, 출연연, 공공기관에서 활용이 쉬운 생성형 거대 언어 모델(LLM) KONI(KISTI Open Natural Intelligence, 한글명 고니) 13b를 개발했다고 밝혔다.

챗GPT와 같은 LLM 기술은 다양한 사용자의 질의에 대해 풍부한 답변을 할 수 있다는 장점으로 작년 11월 출시부터 많은 관심을 받아 왔고, 국내에서도 네이버, KT, LG AI 연구원 같은 대기업들을 중심으로 여러 LLM들이 개발됐다.

하지만, 민감 정보나 보안 등의 문제를 중요시하는 출연연 및 공공기관이나 비용 문제로 도입을 망설이던 중소기업은 이들을 활용하는 데 문제점을 보여왔다. 이러한 문제점을 해결하기 위해 KISTI는 보안이나 정보 유출에 안전하면서도, 기존의 LLM이 갖는 환각 현상을 최소화하고, 다양한 과학기술·산업 분야에 특화된 모델 개발이 쉬운 KONI를 개발했다.

KONI는 LLM에서 일반적으로 발생하는 환각 현상을 최소화하기 위해 기존 정보 서비스 시스템이 보유한 데이터를 답변 제공에 활용하는 검색 증강 생성 기술(RAG)의 적용이 쉽도록 개발됐다. 또한, PEFT(Parameteric Efficient Fine Tuning) 기법을 도입해, 파인 튜닝 시 요구되는 전산 비용을 줄이면서도, 다양한 분야의 LLM 수요에 빠르게 대응할 수 있도록 적용 분야별 어댑터 형식의 파인튜닝을 적용, 효율적인 데이터 타입의 활용을 통해 LLM 모델을 개발했다.

이러한 장점들을 바탕으로 KISTI는 KONI 모델의 보급을 통해 보안 및 정보 유출이 염려되거나, 비용이나 전산 자원 부족의 문제로 LLM 도입·활용을 주저했던 수요에 대응할 수 있다. 특히 출연연, 국회나 육군 군수사와 같이 LLM 도입을 고려하고 있으나, 전산 비용, 보안, 정보 유출 등을 이유로 LLM 도입이 어려웠던 출연연, 공공기관, 중소기업에 대한 LLM 지원을 할 예정이다. 또한, 모델 성능도 현재 130억개 파라미터 수준의 모델 크기를 늘리고, 학습 데이터 또한 추가로 확보함으로써 지속적으로 향상시킬 계획이다.

김재수 KISTI 원장은“이번 KONI 13b의 개발을 통해 KISTI는 출연연, 공공기관, 중소기업을 포함해 다양한 과학기술·산업 분야의 LLM 수요에 대응하고, 외부 기관들과의 협력 체계 구축을 통해 지속적인 학습 데이터 확보 및 모델의 보급을 꾀하고, 사용자 피드백을 반영해 KONI 모델의 성능을 지속적으로 개선할 예정”이라고 밝혔다. 또한, “KISTI의 국가과학기술데이터 서비스 분야에서도 KONI-13b를 통해 기존 과학기술정보 유통, 분석 체계를 획기적으로 개선함으로써 일반 대중과 전문과학자 모두가 활용할 수 있는 공학박사 수준의 AI 정보 서비스 체계를 구축해 나갈 것이며, 향후 AI를 통해 가설을 세우고 과학적 발견까지 지원함으로써 실제 연구에서도 활용할 수 있도록 확대할 예정”이라고 밝혔다.

한편, KISTI는 데이터 전문연구기관으로서 D.N.A 핵심 역량을 기반으로 과학기술·산업 분야의 초거대 AI를 구축·활용할 수 있도록 산·학·연·관·군 생태계를 구축하고 지속적으로 확산 노력을 강화할 예정이다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • [인터넷 신문 등록 사항] 명칭 : ㈜한국정보통신신문사
  • 등록번호 : 서울 아04447
  • 등록일자 : 2017-04-06
  • 제호 : 정보통신신문
  • 대표이사·발행인 : 함정기
  • 편집인 : 이민규
  • 편집국장 : 박남수
  • 서울특별시 용산구 한강대로 308 (한국정보통신공사협회) 정보통신신문사
  • 발행일자 : 2024-04-26
  • 대표전화 : 02-597-8140
  • 팩스 : 02-597-8223
  • 청소년보호책임자 : 이민규
  • 사업자등록번호 : 214-86-71864
  • 통신판매업등록번호 : 제 2019-서울용산-0472호
  • 정보통신신문의 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재·복사·배포 등을 금합니다.
  • Copyright © 2011-2024 정보통신신문. All rights reserved. mail to webmaster@koit.co.kr
한국인터넷신문협회 인터넷신문위원회 abc협회 인증 ND소프트