딜라이트닷넷

금융권 음성인식 엔진, 탈 ETRI 본격화?

통신방송 17.11.21 06:11

인공지능(AI) 음성인식 시장이 역동적으로 진화하고 있다. 

최근 LG전자가 네이버 음성인식 엔진인 ‘클로바’와 협력하기로 했고 카카오는 삼성전자, 현대자동차 등 국내 굴지의 대기업들과 손잡고 인공지능(AI) 생태계 확장에 나서고 있다. 앞서 카카오는 삼성전자의 AI 플랫폼인 ‘빅스비’와 자사의 AI 플랫폼인 ‘카카오 아이(i)’를 연동한다고 밝히기도 했다. 

이는 인공지능 기반의 음성인식 서비스의 기반이 되는 음성인식 스피커의 폭발적인 성장세와 맞물려 있다. 네이버의 ‘웨이브’는 물론 카카오의 ‘카카오 미니’가 판매와 동시에 완판되는 등 소비자들의 관심이 음성인식 기술에 집중되고 있기 때문이다. 

금융권에서도 이러한 음성인식 기반의 인공지능 기술에 관심을 보이고 있다. 하지만 제조나 유통사와 달리 음성인식 기술을 활용하기 위한 합종연횡은 눈에 잘 띠지 않는다. 최근 신한금융그룹이 음성뱅킹 파일럿 서비스 개발에 도입키로 한 것이 눈에 띄는 정도다. 

업계에선 은행권의 음성인식 분야 협력이 저조한 이유로 ‘보안’을 문제 삼고 있다. 한 업계 관계자는 “현재 금융권의 음성인식 엔진으로 도입되는 것이 한국전자통신연구원(ETRI)이 상용화한 음성인식 기술에 한정돼 있다”며 “다른 음성인식 엔진의 경우 고객과 대화한 데이터가 은행 밖으로 나가야 되는 구조여서 은행이 선뜻 도입하기 쉽지 않다”고 전했다. 

현재 음성인식 업계에서 가장 높은 음성인식 완성도를 보이고 있는 것은 구글의 음성인식 엔진인 ‘구글 어시스턴트’라는 데는 큰 이견이 없는 상황이다. 하지만 구글 어시스턴트 API를 활용한 금융권 음성인식 서비스는 많지 않다. 네이버나 카카오의 음성인식 엔진을 활용하는 사업도 찾아보기 힘들다.

이는 은행권을 비롯해 금융사들이 음성인식에 필요한 엔진인 API를 자체 시스템 속에 구축하려 하지만 이들 음성인식 기업이 가지고 있는 음성인식 API가 대부분 클라우드 형태로 제공되거나 온라인을 통해 음성정보를 가져오는 형태기 때문이다. 때문에 고객과의 음성 데이터를 외부에 제공하는 것에 부담스러워 하는 금융권의 특성상 음성인식 분야에서의 협력을 크게 찾아보기 힘들었다. 

하지만 이러한 음성인식 엔진 활용 기류에도 변화가 올 것으로 보인다. 

최근 선보인 KB국민은행의 ‘리브똑똑’이 애플 시리와 구글 어시스턴트 API를 활용해 사용자의 음성을 인식하고 있는 것으로 알려졌다. 신한금융그룹 조용병 회장은 아마존 본사에 방문해 협력방안에 대해 논의하고, 아마존 음성인식 AI를 도입하기로 결정하기도 했다고 밝힌 바 있다.

이는 금융권이 고객과의 음성 정보를 외부에 전송하는 것에 대해 부담감을 덜은 것으로 풀이된다. 최근 금융감독당국이 금융권의 외부 위탁 업무에 대해 사후 관리로 감독방향을 튼 것도 한 요인으로 분석된다. 글로벌 업체들의 음성인식 기술은 클라우드를 통해 제공되는 데 금융권의 클라우드 이용에 대한 제한이 완화된 것도 한 요인이다. 

지난 20일에는 아마존웹서비스(AWS)가 AWS 공식 블로그를 통해 아마존 폴리(Amazon Polly)의 서울 리전 출시와 함께 텍스트 투 스피치(TTS) API인 ‘서연’의 한국어 음성을 공개하기도 하는 등 외부의 음성인식 엔진을 활용한 금융권의 움직임이 주목되고 있다.