UPDATED. 2024-03-28 16:55 (목)
한양대, 입모양만으로 말을 이해하는 AI 기술 개발
한양대, 입모양만으로 말을 이해하는 AI 기술 개발
  • 최아름 기자
  • 승인 2023.04.24 16:58
  • 댓글 0
이 기사를 공유합니다

성대장애 있는 환자 의사소통에 큰 도움 기대
3축 가속도계를 이용한 무성 발화 인식 시스템(왼쪽) 및 기존의 근전도계를 이용한 무성 발화 인식 시스템(오른쪽). [사진=한양대]
3축 가속도계를 이용한 무성 발화 인식 시스템(왼쪽) 및 기존의 근전도계를 이용한 무성 발화 인식 시스템(오른쪽). [사진=한양대]

[정보통신신문=최아름기자]

음성 없이 입모양만을 분석해 말을 인식해주는 기술이 국내에서 개발됐다.

한양대학교 임창환 바이오메디컬공학과 교수팀이 세계 최초로 3축 가속도계를 이용한 무음 발화 인식 기술을 개발했다고, 한양대가 24일 밝혔다. 향후 성대 장애로 목소리를 내지 못하는 환자들의 의사소통을 도울 수 있을 것으로 기대된다.

AI스피커 등에 널리 쓰이는 음성인식 기술에 비해 무음 발화 인식 기술은 아직 개발 초기 단계에 있다. 가장 간단한 무음 발화 인식 방법은 카메라로 입모양의 변화를 촬영하는 것이지만 카메라 시야에 얼굴 전체가 잡히는 환경에서만 사용이 가능하다는 한계가 있다.

이외에도 혀, 입술, 턱과 같은 조음기관에 측정기를 부착하는 기술도 개발됐지만 크기가 크고 사용자의 일상생활에 큰 불편을 줄 수 있다는 단점이 있다. 발화 시 얼굴 근육의 근전도나 피부 변형을 측정하는 방법 또한 센서가 피부에 항상 부착돼 있어야 한다는 불편이 있으며, 센서의 내구성이 약하고 정확도가 낮다.

임 교수팀은 스마트폰이나 스마트 워치 등에 내장되는 3축 가속도계를 입 주위에 부착하고 무음 발화를 할 때 측정되는 가속도 신호를 이용해 발화 의도를 인식하는 새로운 방식을 제안했다. 임 교수팀은 일상생활에서 널리 쓰이는 40개의 단어를 소리 내지 않고 말할 때 입 주위 근육의 움직임을 4개의 가속도계 센서를 이용해 측정했다.

임 교수팀은 무음 발화 단어의 인식을 위해서 합성곱 신경망(CNN)과 장단기 메모리(LSTM) 신경망을 결합한 새로운 딥러닝 구조를 제안해 95.58%의 높은 정확도로 단어를 분류해 내는 데 성공했다. 기존 방법과의 비교를 위해 6개의 근전도 센서를 이용해 동일한 단어를 분류했을 때의 정확도는 89.68%로 연구팀의 방식이 더 우수한 분류 성능을 보였다.

임 교수는 해당 기술에 대해 “발성이 어려운 장애인의 의사소통을 위한 새로운 기술로 활용될 수 있을 것”이라며 “실용화를 위해 새끼손톱 크기보다 작은 무선 센서를 개발하고 있다”고 밝혔다. 또한 단어의 분류에서 그치지 않고 음성을 합성하는 연구도 진행하고 있으며. 이미 가시적인 결과를 내 후속 논문을 준비 중에 있다고 전했다.

 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • [인터넷 신문 등록 사항] 명칭 : ㈜한국정보통신신문사
  • 등록번호 : 서울 아04447
  • 등록일자 : 2017-04-06
  • 제호 : 정보통신신문
  • 대표이사·발행인 : 함정기
  • 편집인 : 이민규
  • 편집국장 : 박남수
  • 서울특별시 용산구 한강대로 308 (한국정보통신공사협회) 정보통신신문사
  • 발행일자 : 2024-03-28
  • 대표전화 : 02-597-8140
  • 팩스 : 02-597-8223
  • 청소년보호책임자 : 이민규
  • 사업자등록번호 : 214-86-71864
  • 통신판매업등록번호 : 제 2019-서울용산-0472호
  • 정보통신신문의 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재·복사·배포 등을 금합니다.
  • Copyright © 2011-2024 정보통신신문. All rights reserved. mail to webmaster@koit.co.kr
한국인터넷신문협회 인터넷신문위원회 abc협회 인증 ND소프트