UPDATED. 2022-08-19 19:23 (금)
초대규모·경량화 인공지능 시대 온다
초대규모·경량화 인공지능 시대 온다
  • 차종환 기자
  • 승인 2021.02.13 18:01
  • 댓글 0
이 기사를 공유합니다

‘알파고 쇼크’ 이후 AI 혁신 가속
단순인지∙라벨링 한계 극복

병렬처리 기반 데이터 수용량↑
창조적 AI∙추론하는 AI ‘눈앞’
인공지능은 이미 산업, 기술계를 넘어 정치∙사회∙문화 전반에 영향을 미치고 있다.[사진=클립아트 코리아]
인공지능은 이미 산업, 기술계를 넘어 정치∙사회∙문화 전반에 영향을 미치고 있다.[사진=클립아트 코리아]

2016년 이세돌 9단과의 바둑 대결을 성공적으로 이끌며 전세계적인 이목을 끈 ‘알파고’는 인류에게 인공지능(AI)이 어느 수준까지 발전해왔는지 알 수 있게 한 좋은 계기가 됐다.

5년여가 지난 지금, AI의 발전은 현재진행형이다. 이미 산업, 기술계를 넘어 정치∙사회∙문화 전반에 영향력이 확산되고 있는 AI는 기존에 한계로 지적됐던 부분마저 새로운 기술을 기반으로 약점을 보완해가며 더욱 완벽하게 다듬어지고 있는 모습이다.

한국지능정보사회진흥원(NIA)이 발표한 ‘주목받는 인공지능 9대 핵심기술 분석 및 주요 시사점’ 보고서를 통해 AI 기술의 현주소를 가늠해봤다.

 

■초대규모 모델 ‘GPT-3’

GPT-3(Generation Pre-trained Transformer 3)는 딥러닝을 이용해 사람에 가까운 언어를 구현하는 언어 모델이다. 테슬라 CEO인 일론 머스크가 설립한 AI연구소 ‘오픈AI’에서 개발됐다.

이를 초대규모라 부르는 이유는 2020년 5월 도입된 이전 버전 보다 2배 이상, 마이크로소프트의 ‘튜링LNG’ 보다 약 10배 큰 1750억개 매개변수를 지니고 있기 때문이다. 학습에 활용된 데이터(단어)는 크롤링 4100억개, 웹텍스트 190억개, 책 120억개, 위키피디아 30억개에 달한다.

많은 정보를 학습한 초대규모 모델은 기존 모델 보다 범용성이 확장된 것으로 나타나 그 중요성이 배가되고 있다.

특히 GPT-3는 API를 통해 수많은 AI서비스를 개발할 수 있도록 지원하는 등 일종의 플랫폼 역할로 진화 중이다.

향후 AI 모델 성능 향상을 위해 슈퍼컴퓨터 기반의 초대규모 AI모델이 지속적으로 개발될 전망이다.

 

■개인정보가 보호되는 분산 AI학습 ‘연합학습’

AI 모델 학습시 데이터를 통합∙이동하면서 발생할 수 있는 개인정보보호 이슈의 부담을 완화할 수 있는 개념이다.

데이터를 중앙에 모아서 학습하는 기존의 통합학습과 달리 각 기관에서 학습한 모델의 가중치만 중앙으로 취합하는 방식을 사용한다.

환자의 민감한 개인정보 보호가 중요한 의료 분야에서 대규모 정밀 의학을 가능케 하는 요소로 적극 도입되는 추세다.

분산된 데이터를 활용해 엄격한 규제 문제를 해소하며 필요한 의료 분야 전체 스펙트럼을 포괄하는 대규모 데이터베이스(DB)를 구축하는 것이 가능해진다. 데이터 풀이 확대되면 기존에 연구가 어려웠던 희귀질환 모델 구축, 신약 개발을 통한 출시 시간 단축 등 다양한 혁신이 이뤄질 것이라는 설명이다.

 

■디바이스에 담은 가벼운 AI ‘엣지 AI’

빅데이터 처리가 필요한 AI는 디바이스 단에서는 연산량의 한계 때문에 전통적으로 클라우드 환경에서 처리되는 것이 일반적이었다.

하지만 최근 지연속도에 민감한 서비스들이 많아지면서 데이터 처리를 클라우드까지 동원하지 않고 디바이스 내에서 처리하는 엣지 AI가 주목받고 있다.

데이터의 이동이 발생하지 않기 때문에 중앙집중식 처리에서 발생하는 비용, 속도, 프라이버시 문제를 보완할 수 있지만, 작은 메모리와 계산 능력을 보유한 엣지 디바이스(스마트폰, 차량, 드론 등)의 한계를 극복하면서 AI를 구현하기 위한 개발이 핵심 이슈로 부상하고 있다.

 

■언어처리의 병렬화 ‘트랜스포머’

트랜스포머(Transformer)는 그간 순차적으로 단어를 학습하는 알고리즘의 한계를 극복, 데이터를 병렬식으로 대규모 학습할 수 있도록 하는 기술이다.

언어모델의 표준처럼 불리는 구글의 BERT, 오픈AI의 GPT 등이 트랜스포머 기반으로 개발된 모델이다.

컴퓨터 비전 분야에서도 전통적인 CNN 방식을 벗어나 트랜스포머가 도입되는 추세로, 괄목할만한 성능을 내고 있는 것으로 알려졌다.

 

■단순 인식 아닌 인과적 이해 ‘시스템2 AI’

인간이 무의식적으로 하는 주변 인식, 직감적 위험 회피 등을 처리하는 AI를 ‘시스템1’으로 정의한다면 추상적인 문제를 다루거나 새로운 상황을 처리하기 위한 추론이 필요할 때 사용되는 분석 과정을 ‘시스템2’로 정의한다.

AI가 기대에 비해 활용분야가 제한적인 것은 이러한 ‘시스템2’의 단계까지 발전하지 못한 것이 원인으로 지목되는데, 최근 신경 과학 분야가 함께 융합되면서 ‘시스템2’로의 진화를 앞당기고 있다.

‘시스템2’ 추론이 가능해지면 학습 조건과 동일하지 않은 환경에서도 맥락을 이해하며 상황 대처가 가능한 AI가 구현될 것으로 예상된다.

 

■데이터 라벨링 극복 ‘자기지도학습’

지도학습은 자율주행, 음성 비서 등 AI분야에서 괄목할만한 발전을 주도했으나 그 원천이 되는 데이터를 수작업으로 라벨링 해야하는 번거로움과 비용 부담이 한계로 작용했다.

자기지도학습은 입력값의 일정 부분으로 입력값의 다른 부분을 예측하며, 입력값 자체로 지도(supervision)를 만들어 학습한다.

향후 데이터 라벨링 등 AI 모델링 전에 발생하는 노동집약적인 비효율 문제를 개선하기 위해 자기지도학습이 주목받을 전망이다.

 

■창조하는 AI ‘생성적 AI’

단순히 인지하는 것을 넘어 입력된 학습 데이터의 패턴을 익혀 데이터 분포와 유사한 콘텐츠를 생성하는 AI다.

변증법적 AI 알고리즘 ‘생성적 적대 신경망(GAN)’이 대표적인 기술이다. 실제 데이터와 유사하게 새로운 것을 만들어내는 생성자와 만들어진 것을 평가하는 판별자가 끊임없이 서로 대립하며 성능을 개선해나가는 방식이다.

부족한 데이터셋을 인위적으로 생성할 수 있으며 민감한 정보가 포함된 경우 이를 우회하는 방법으로 사용하기도 한다.

현재 사회적으로 문제되고 있는 딥페이크 영상, 생체 인식 데이터 위조 등이 이 기술을 기반으로 하고 있어 이에 대한 방안이 필요한 상황이다.

 

■누구나 할 수 있는 딥러닝 ‘전이학습’

기존에 학습된 모델의 신경망 일부를 재학습해 원하는 용도에 맞는 모델을 재생성하는 기법이다.

AI 모델 개발시 데이터 부족, 컴퓨팅 자원 부족 등의 한계가 있을 때 이를 극복할 수 있도록 지원하는 응용 기술의 일종이다.

최근 트렌드는 글로벌 테크 기업들이 컴퓨팅 성능을 바탕으로 성능 좋은 모델을 공개하면 중소∙스타트업들은 그 모델을 전이학습해 서비스를 개발하는 식이다.

 

■AI가 만들어낸 AI ‘오토ML’

오토ML(Automated Machine Learning)은 머신러닝 개발 과정에서 소모적이고 반복되는 작업을 자동화 한 프로세스다.

최적의 알고리즘 선정 등을 통해 모델의 성능 향상을 도모할 수 있고 효율적으로 머신러닝 모델을 구축할 수 있다.

현재 3대 클라우드 플랫폼에서도 오토ML 솔루션을 제공하고 있으며, 기업의 수요도 빠르게 증가할 것으로 기대된다.

 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • [인터넷 신문 등록 사항] 명칭 : ㈜한국정보통신신문사
  • 등록번호 : 서울 아04447
  • 등록일자 : 2017-04-06
  • 제호 : 정보통신신문
  • 대표이사·발행·편집인 : 문창수
  • 서울특별시 용산구 한강대로 308 (한국정보통신공사협회) 정보통신신문사
  • 발행일자 : 2022-08-19
  • 대표전화 : 02-597-8140
  • 팩스 : 02-597-8223
  • 청소년보호책임자 : 이민규
  • 사업자등록번호 : 214-86-71864
  • 통신판매업등록번호 : 제 2019-서울용산-0472호
  • 정보통신신문의 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재·복사·배포 등을 금합니다.
  • Copyright © 2011-2022 정보통신신문. All rights reserved. mail to webmaster@koit.co.kr
인터넷신문위원회 abc협회 인증 ND소프트