(말로 다 되는 세상)음성인식의 진화, 다음은 자율주행…"데이터 부족은 해결해야 할 과제"

입력 : 2018-08-14 오전 6:00:00
[뉴스토마토 박현준 기자] 인공지능(AI) 전문가들은 음성인식 기술이 향후 콜센터와 스마트홈을 넘어 자율주행 등으로 영역을 넓히며 고도화될 것으로 전망했다. 다만, AI 플랫폼의 학습에 필요한 음성 데이터가 절대 부족한 점은 해결해야 할 과제다. 
 
현재 AI 기반의 음성인식 서비스는 태동 단계다. 가령, AI 스피커에게 오늘의 날씨를 묻거나 음악을 틀어달라고 명령하는 방식으로, 단어 몇 개로 구성된 짧은 문장이 대부분이다. 가정과 달리 기업들의 고객센터로 적용 범위를 넓히면 한계는 금세 드러난다. 고객센터에서 오가는 대화는 현재 AI 스피커가 처리해야 할 명령보다 길고 복잡한 경우가 많다. 일부 기업들은 자사의 콜센터에 음성인식을 적용했지만 아직 초기 단계에 머무는 것도 같은 이유다.
 
SK텔레콤은 지난 9일 서울 워커힐 호텔 44개 객실에 AI 스피커 누구를 활용한 AI 음성 서비스를 공급했다. 사진/SK텔레콤
 
이윤근 한국전자통신연구원(ETRI) 음성지능연구그룹장은 13일 "콜센터의 음성인식 수준을 높여야 상담의 품질도 나아질 것"이라며 "음성을 문자로 전환하고 이를 분석해 필요한 정보를 바로 보여주는 형태로 진화해야 한다"고 말했다. AI 전문기업 마인즈랩은 기존 채팅 형태의 고객센터에 음성인식을 더한 제품을 준비 중이다. 곽세라 마인즈랩 VOC사업부 매니저는 "타이핑이 어려울 경우 음성으로 질문하면 AI 플랫폼이 이를 인식해 음성이나 문자로 답을 하는 형태"라며 "음성인식과 텍스트 분석 기술을 함께 적용했다"고 설명했다.
 
AI와 사물인터넷(IoT), 5세대(5G) 정보통신 등 첨단기술의 집합체로 불리는 자율주행차는 음성인식이 중장기적으로 고도화될 분야로 꼽힌다. 박진호 숭실대 소프트웨어학부 교수는 "음성인식의 고도화가 가장 활발하게 진행될 분야가 자율주행"이라며 "운전자가 원하는 목적지와 자동차의 상태 관련 질문을 시스템이 정확하게 인식해 음성으로 알려준다"고 말했다. 박 교수는 그러면서 "자동차 기계음과 외부의 소리 등 소음이 있는 경우가 많아, 보다 정교한 음성인식이 필요하다"고 지적했다.
 
전문가들은 음성인식의 고도화를 위해서는 다양한 데이터의 축적이 필수적이라고 입을 모았다. AI 플랫폼이 보다 정확하게 음성을 인식하기 위해서는 다양한 음성 데이터를 기반으로 학습을 해야 하기 때문이다. 박 교수는 "음성인식 서비스를 하는 기업들도 데이터가 부족해 직접 만들거나 건당 비용을 지불하며 데이터를 사야 하는 실정"이라며 "결국 다양한 데이터를 보유한 구글이나 네이버 등 플랫폼 사업자들이 유리할 것"이라고 말했다. 이 그룹장은 "국내와 글로벌 제조사들의 AI 스피커에 들어가는 근본적인 기술 격차는 크지 않다"며 "아마존과 구글이 앞서가는 이유는 사용자 데이터를 더 많이 확보했기 때문"이라고 말했다.
 
음성 데이터 축적과 관련해 정부의 역할이 필요하다는 지적도 나왔다. 곽 매니저는 "미국을 비롯한 AI 강국에는 음성 데이터를 공급하는 곳이 많다"며 "국가 차원에서 오픈 데이터를 많이 마련해주면 기업들에게 큰 도움이 될 것"이라고 말했다.
 
박현준 기자 pama8@etomato.com
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지
박현준 기자