딜라이트닷넷

인공지능(AI) 스피커는 과연 똑똑한가....아쉬움과 가능성

통신방송 17.10.10 09:10

이번 긴 추석 연휴기간동안 꼭 해보고 싶은 것 중 하나가 '인공지능(AI) 스피커'를 테스트해보는 것이었다. 

과연 '인공지능' 이라는 표현을 쓸 정도로 인공지능 스피커의 기능이 뛰어난 것일까. 그동안 언론에 나온 인공지능 스피커의 기능을 액면 그대로 믿은 것은 아니지만 서비스 수준의 실체를 알고 싶었다. 기존 통신요금에 조금만 더 부담하면되기 때문에 1개월전 거실에 인공지능 스피커를 들여놓았다. 

 

결론부터 말하면, 몇번 사용해 보니 인공지능 스피커보다 아직은 그냥 TV 리모컨이 편하다.

'TV 켜줘', '볼룸 높여줘', '야구 채널 틀어줘'... 처음에는 척척 말귀를 알아듣는 것 그 자체가 일단 신기했다. 리모컨의 역할을 적절하게 대체했다. 가끔씩 거실 어딘가로 꽁꽁 숨어버리는 리모컨도 손쉽게 찾아준다. 편리성에 있어서는 분명한 진화다.

하지만 아직은 거기까지인 것 같다. 사실 스마트폰이 솔직히 스스로 진화하는 '인공지능'의 본원적 개념에 현재 어느 정도까지 부합하는지 의문이다. 예를들어 내비게이션 (도로 검색) 기능은 스마트폰 앱과 연계된 기능을 통해서 우리집 주소를 먼저 입력해야하는 번거로움을 감내해야 한다. 인공지능 스피커가 말하면 말하는대로 TV를 통해 뚝딱 모든 것을 알려주는 요술상자는 아니다. 

오히려 처음에는 별 생각없이 지나쳤던 몇가지가 나중에는 불편함으로 느껴지기 부분도 있었다. 

첫째, 음성인식의 정확도다. 정상적인 작동을 위해서는 대체로 정확한 발음이 일정 거리 내에서 전달돼야한다. 거리가 멀거나 발음이 정확하지 않으면(?) 인식률이 크게 떨어진다. 음성인식률은 막연히 생각했던 수준보다는 낮았다. 

여기서 '발음이 정확하지 않는다'고 표현하긴 했지만 일상적인 사람간의 대화라면 그 의미를 충분히 인식할 수 있는 정도의 수준이다. 대충 얘기해도 말귀를 알아듣는 일상의 대화와 비교했을 때 현재의 인공지능 스피커는 분명히 인식률에 문제가 있었고, 사용자를 '불편'하게할 수 있을 것이란 생각을 해본다. 

즉, 단어를 엉뚱하게 인식하거나 또는 아예 반응하지 않는 경우, 다시 'OO야' 호칭을 부른후 명령어를 전달하는 과정은 분명히 사람을 피곤하게 또는 화나게 한다. 그러다보면 어느새 리모컨을 찾기 시작한다.

영화 '타짜'에서 '손은 눈보다 빠르다'는 대사가 나온다. 실제로, 리모컨에 워낙 익숙해진 생활 습관 때문에 그런지 몰라도 아직까지는'리모컨을 누르는 손가락은 인공지능 음성인식 보다 훨씬 빠르다'는 느낌이다.

또한 화자에 따라서도 어느 정도 인식률이 차이가 난다. 정확한 통계는 내보지 않았지만 남자와 여자, 목소리의 패턴에도 인식률의 차이가 있어 보인다. 참고로, 기자의 가족 (4인 가족) 구성원중 아내 목소리의 인식률이 아직까지는 제일 높게 나온다. 목소리가 굵은 막내 아들의 인식률이 제일 저조하다. 일정 거리 이내라면 목소리의 크기는  크게 상관이 없는 것 같다. 

인공지능 스피커의 활성화에 필요한 콘텐츠의 구성도 아직은 부족해 보인다. '환율'을 '확률'로 인식해서 엉뚱한 답을 내놓거나 '국산차'와 같은 질문에는 레저나 자동차 전문 채널 등을 검색해야겠지만 이에 걸맞는 컨텐츠가 제공되지 않았다. 

   

둘째, 프라이버시에 대한 부분이다. 이는 예상치 못했던 부분이다. 혼자사는 1인 가구라면 크게 신경쓰지 않아도 될 문제다. 그러나 공동 생활의 공간에선 음성으로 명령을 내리는 행위 자체가 상황에 따라서는 공동 생활자의 정숙성을 방해하고, 때로는 의도치않게 개인의 취향을 노출시킨다는 점에서 불편할 수 있다는 생각을 해본다. 

최근 금융, 유통 등 산업계 일각에서 인공지능 스피커를 활용한 서비스 모델을 속속 선보이고 있다. 'OO야, 오늘 주가 알려줘', '오늘 날씨는?' 과 같은 생활편의 중심의 컨텐츠를 중심으로 서비스가 제시되고 있다.

그러나 지금과 같은 인공지능 스피커의 수준이라면 사용자들에게 당장 높은 만족을 주기는 어려울 것으로 보인다. 음성 인식의 정확성, 관련한 콘텐츠의 질적인 개선, 눈에 보이지 않았던 프라이버시 부분까지 세심하게 고려된 인공지능 스피커의 개선이 필요하다는 생각을 해본다.

물론 아직은 기대에 못미치지만 인공지능 스피커가 가진 무한한 잠재력과 가능성도 분명히 엿보인다. 음성인식 기술의 정확도, '문장'까지 이해하는 논리적 이해도가 지금 보다 훨씬 더 개선되고, 콘텐츠의 연계성도 보강된다는 점을 전제하다면, 인공지능 스피커는 새롭게 진화된 '생활편의 플랫폼'이 될 수 있을 것이란 생각이다. 

인공지능 스피커가 단순히 TV를 켜고, 볼륨을 높이고, 채널을 찾는 수준에서 그치는 것이 아니라 인공지능 스피커 밴더들이 지향하는 것처럼 집안의 모든 가전기기와 연계한 'IoT(사물인터넷) 플랫폼'으로 온전하게 기능하게 된다면 그 효용의 강력함은 훨씬 더 배가될 것으로 보인다. 

여기에 '음성 인식'에서 향후 더 진화된 '음성 인증'까지 스마트 스피커가 담을 수 있다면 민감한 금융거래까지도 가능한 금융플랫폼의 기능도 충분히 가능할 것으로 기대된다. 

<박기록 기자>rock@ddily.co.kr