UPDATED. 2024-04-19 17:36 (금)
지스트, ‘모르는 것’ 인지하는 AI 기술 개발
지스트, ‘모르는 것’ 인지하는 AI 기술 개발
  • 최아름 기자
  • 승인 2023.05.22 13:15
  • 댓글 0
이 기사를 공유합니다

미학습 데이터 식별 가능해져
자율차, 의료진단AI 안전성 개선
입력된 이미지(강아지)에 대해서 확률 값이 계산되는 딥러닝 모델 구조 도식. 딥러닝 모델은 여러 층(Layer)로 구성된 블록으로 이루어져 있다. 해당 그림에서 학습된 카테고리(즉, 분포 내 입력)는 고양이, 강아지, 망아지이다. AI는 답을 몰라도 기존에 학습한 카테고리에서 가장 유사한 값을 정답으로 잘못 인식하게 된다. [출처=지스트]
입력된 이미지(강아지)에 대해서 확률 값이 계산되는 딥러닝 모델 구조 도식. 딥러닝 모델은 여러 층(Layer)로 구성된 블록으로 이루어져 있다. 해당 그림에서 학습된 카테고리(즉, 분포 내 입력)는 고양이, 강아지, 망아지이다. AI는 답을 몰라도 기존에 학습한 카테고리에서 가장 유사한 값을 정답으로 잘못 인식하게 된다. [출처=지스트]

[정보통신신문=최아름기자]

지스트(광주과학기술원) 융합기술학제학부의 이규빈 교수 연구팀이 학습한 적 없는 ‘모르는 데이터’를 구별해 내는 AI 기술을 개발했다.

인공지능(AI) 기술은 2016년 알파고 등장 이후 급속도로 발전해 실생활에 폭넓게 활용되고 있다. 오늘날 이용되는 대부분의 AI는 주어진 후보 중 정답이 없으면 가장 비슷한 답을 찾도록 설계됐다.

특히 딥러닝 모델(Deep learning, 심층학습)은 이미지 인식 능력이 탁월해 컴퓨터비전 분야에서 다양하게 활용되고 있으나, 답을 몰라도 가장 유사한 값을 정답으로 잘못 인식한다는 단점이 있다. 이 경우 자율주행 차량이 장애물을 잘못 인식하는 등 심각한 문제를 일으킬 수 있어 이를 보완할 AI모델의 필요성이 제기되고 있다.

AI모델은 여러 블록으로 구성돼 있는데, 각 블록은 똑같은 작업을 수행한다. 컨베이어 벨트에 재료(데이터)가 들어오고, 여러 사람(블록)이 분업해 순서대로 물건을 완성하는 것과 같다. 연구팀은 이 중 ‘모르는 데이터’ 탐지에 적합한 블록을 찾아내기 위해 직소 퍼즐을 이용했으며, 블록의 활성도를 기준으로 모르는 데이터를 탐지하는 방법을 제안했다.

활성도는 입력된 이미지를 출력하는 블록의 특징 맵의 크기를 뜻한다. 모르는 데이터에 대해서는 크기(활성도)가 작아지고 아는 데이터에 대해서는 커진다.

연구팀은 모르는 데이터의 예시로써 이미지를 직소 퍼즐처럼 잘게 쪼갠 뒤 무작위로 섞어서 입력했다. 실제 이미지와 유사하지만 정답은 아닌 데이터를 입력한 후 활성도에 따라 모르는 데이터 탐지에 적합한 블록을 찾기 위해서다.

기존 연구에서는 가장 많은 데이터를 학습한 마지막 블록을 사용했으나, 연구팀은 마지막 블록이 과도한 학습으로 인해 모르는 데이터도 아는 데이터로 착각하는 경향이 있다는 점을 밝혀냈다.

연구팀은 모르는 데이터(직소 퍼즐)에는 낮은 활성도를, 아는 데이터에는 높은 활성도를 보이는 블록이 모르는 데이터 탐지에 가장 적합한 것으로 보고, 직소 퍼즐에 대한 활성도 대비 학습된 이미지에 대한 활성도가 가장 높은 블록을 선택했다.

입력된 이미지(강아지)에 대해서 확률 값이 계산되는 딥러닝 모델 구조 도식. 딥러닝 모델은 여러 층(Layer)로 구성된 블록으로 이루어져 있다. 해당 그림에서 학습된 카테고리(즉, 분포 내 입력)는 고양이, 강아지, 망아지이다. AI는 답을 몰라도 기존에 학습한 카테고리에서 가장 유사한 값을 정답으로 잘못 인식하게 된다. [출처=지스트]
입력된 이미지(강아지)에 대해서 확률 값이 계산되는 딥러닝 모델 구조 도식. 딥러닝 모델은 여러 층(Layer)로 구성된 블록으로 이루어져 있다. 해당 그림에서 학습된 카테고리(즉, 분포 내 입력)는 고양이, 강아지, 망아지이다. AI는 답을 몰라도 기존에 학습한 카테고리에서 가장 유사한 값을 정답으로 잘못 인식하게 된다. [출처=지스트]

이 방식으로 기존에 사용하던 첫 번째 벤치마크에서는 5.8%, 두 번째 벤치마크에서는 6.8% 향상된 탐지 결과를 얻어 현재까지 가장 높은 수준의 성능이 달성됐다.

이번 연구성과로 딥러닝 모델의 메타인지가 가능해지면 지능을 증강하는 형태의 AI 모델도 개발할 수 있게 된다. 또, 자율주행, 의료 진단 등 안전이나 생명과 직결되는 민감한 분야에서 유용하게 이용할 수 있을 것으로 기대된다.

자율주행차 운행 중 동물을 사람으로 잘못 인식해 급정거하거나 학습한 적 없는 피부병을 기존에 학습한 피부병 중 가장 유사한 질환으로 오진하는 것과 같은 문제를 방지할 수 있다.

입력된 이미지(강아지)에 대해서 확률 값이 계산되는 딥러닝 모델 구조 도식. 딥러닝 모델은 여러 층(Layer)로 구성된 블록으로 이루어져 있다. 해당 그림에서 학습된 카테고리(즉, 분포 내 입력)는 고양이, 강아지, 망아지이다. AI는 답을 몰라도 기존에 학습한 카테고리에서 가장 유사한 값을 정답으로 잘못 인식하게 된다. [출처=지스트]
입력된 이미지(강아지)에 대해서 확률 값이 계산되는 딥러닝 모델 구조 도식. 딥러닝 모델은 여러 층(Layer)로 구성된 블록으로 이루어져 있다. 해당 그림에서 학습된 카테고리(즉, 분포 내 입력)는 고양이, 강아지, 망아지이다. AI는 답을 몰라도 기존에 학습한 카테고리에서 가장 유사한 값을 정답으로 잘못 인식하게 된다. [출처=지스트]

이규빈 교수는 “이번 연구성과를 발전시키면 딥러닝 모델이 인식된 결과를 스스로 인지하는 메타인지 능력을 얻을 수 있다”며 “모르는 것을 아는 것으로 잘못 인식해 발생할 수 있는 막대한 피해를 방지할 수 있을 뿐만 아니라, 지능 증강과 같은 다양한 기술로 응용될 것이라고 기대한다”고 밝혔다.

이번 연구 성과는 컴퓨터비전 분야에서 세계 최고 수준의 학회인 <컴퓨터비전과 패턴인식 학술대회(CVPR)>에서 오는 6월 18일 발표될 예정이다. 연구에 사용된 코드는 깃허브에서 오픈소스로 이용할 수 있다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • [인터넷 신문 등록 사항] 명칭 : ㈜한국정보통신신문사
  • 등록번호 : 서울 아04447
  • 등록일자 : 2017-04-06
  • 제호 : 정보통신신문
  • 대표이사·발행인 : 함정기
  • 편집인 : 이민규
  • 편집국장 : 박남수
  • 서울특별시 용산구 한강대로 308 (한국정보통신공사협회) 정보통신신문사
  • 발행일자 : 2024-04-19
  • 대표전화 : 02-597-8140
  • 팩스 : 02-597-8223
  • 청소년보호책임자 : 이민규
  • 사업자등록번호 : 214-86-71864
  • 통신판매업등록번호 : 제 2019-서울용산-0472호
  • 정보통신신문의 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재·복사·배포 등을 금합니다.
  • Copyright © 2011-2024 정보통신신문. All rights reserved. mail to webmaster@koit.co.kr
한국인터넷신문협회 인터넷신문위원회 abc협회 인증 ND소프트