예전에 그런 기사를 본 기억이 있다.
중국의 어느 회사가 번역 전문 인공지능(AI)을 개발했는데, 한 학회에서 그 AI의 실시간 번역을 시연하다가 사실 그 번역은 무대 뒤에서 사람이 하고 있었음이 들통났다는 뉴스였다.
자신들의 기술력을 얼마나 뽐내고 싶었으면 그랬을까 싶어 사뭇 가슴이 찡해진다. 그렇다. 원래 평소엔 잘 됐는데 그날 유독 AI가 말썽을 일으킨 것이리라. 시연이란 게 막상 본무대에선 빵꾸가 나는 것임을 우리 전국의 100만 이과생들은 너무나도 잘 알고 있지 않은가!
AI라고 하면, SF영화에서 보듯 거의 사람이나 진배없는 로봇이 세상을 주름잡는 최첨단의 기술이라는 인식을 하고 있는 사람이라면 이러한 중국의 사례에 피식 웃음을 터트릴 만하다.
하지만 AI의 실상을 잘 알고 있는 사람일수록 그것은 해프닝이 아닌 현실임을 직감할 것이다.
‘데이터 라벨링’이 AI 시대에 뜨는 직종이 된 이유다.
데이터 라벨링이란, AI가 데이터를 이해할 수 있도록 데이터를 가공∙정제하는 것을 뜻한다.
예를 들어, 어느 가족사진을 AI가 판독한다고 하면, 이 사람이 아빠, 이 사람이 엄마, 이 사람이 아들이라는 표시를 사진에 달아주는 작업인 것이다.
이러한 라벨링이 없으면 AI는 그저 남자 사람, 여자 사람, 아기 정도를 구분하는 데 그친다는 얘기다. 각각의 관계에 대해 AI가 알게 뭔가. AI는 가족으로서 살아보지도, 살아볼 수도 없는 문제다. 그것을 이해시키려면 AI에게 성교육까지 시켜야 하는 초유의 사태가 벌어지리라!
이처럼 데이터 라벨링은 사람만이 가질 수 있는 ‘직관력’을 AI에게도 부여함으로써 AI가 겪을 시행착오를 한 번에 줄여주는 작업인 것이다.
요즘엔 이 작업만 해도 돈을 주는 데가 있다고 한다. 국내 활동 중인 라벨러만 20만명에 달한다고 한다. 나한테는 안 알려주고 자기들끼리만 용돈벌이를 하고 있었다니!
사람을 대체하기 위해 등장한 AI가 정작 사람의 도움 없이는 일을 제대로 하지도 못 한다니, 참 아이러니 한 일이 아닐 수 없다.
기술이 발전할수록 사람이 할 일, AI가 할 일이 더욱 명확히 구분되는 모습이 사뭇 흥미롭다. 사람은 엄두도 못 낼 일을 AI가 하고, 사람에게는 누워서 떡 먹기와도 같은 일이 AI에게는 미지의 영역이다.
사람의 마음 속에는 AI가 인간을 정복할지 모른다는 우려가 항상 기저에 깔려있다. 데이터 라벨링이 AI를 돕는 일이라면, 딱 AI가 인간을 넘어설 수 없을 만큼만 도와주는 것이 해법이 될지도 모르겠다.
알파고가 어떻게 인간 바둑계를 평정할 수 있었는지 이제야 알겠다. 흑돌, 백돌(0과 1)만 구분하면 됐으니, 라벨링이 필요없었기 때문이다.