상단여백
HOME 뉴스 컴퓨팅
[CES 2018] 사운드하운드, 음성인식 AI 플랫폼 ‘하운디파이’ 시연자동차·지능형 스피커·로봇·가전제품·증강현실·웨어러블 기기 등에 대화형 기능 지원

음성인식 지원 인공지능(AI) 및 대화형 지능 기술 분야를 선도하는 혁신 기업 사운드하운드(SoundHound Inc.)가 자동차, 지능형 스피커, 로봇, 가전제품, 증강현실 기기, 스마트홈, 웨어러블 기기 등 다양한 사물 인터넷(IoT) 영역 제품에 자사의 음성 AI 플랫폼인 ‘하운디파이(Houndify)’가 대거 통합됐다고 발표했다.

‘하운디파이’ 탑재 기기를 전시하는 기업으로는 현대(Hyundai), 휴맥스(HUMAX), 번(BUNN), 메이필드 로보틱스(Mayfield Robotics), 아바타마인드 로봇(AvatarMind Robots), 모디페이스(Modiface), 포토스프링(PhotoSpring), 온쿄(Onkyo) 등이 있다. 이들 기업은 이번 주 라스베이거스에서 진행되는 ‘CES 2018’에서 해당 제품을 시연한다.

현대가 하운디파이 플랫폼을 발판으로 구현한 최신 음성 지원 가상 지원 시스템인 ‘지능형 개인 비서’는 미래형 주행 경험을 선보인다. 시스템의 예방적 지원 기능은 운전자의 필요를 예측할 수 있다. 운전자는 에어컨, 차문 잠금 등 차량 기능도 음성 명령으로 완벽하게 제어할 수 있다.

‘하운디파이’ 플랫폼은 전화 통화, 핸즈 프리 문자 전송, 위치 검색, 이전 검색 변경, 음악 재생, 날씨 파악, 일정 관리 등 다양한 운전자 편의 기능을 구현해준다. 또 ‘카투홈(Car-to-Home)’ 서비스도 지원한다. 운전자가 자동차에서 집 안의 스마트홈 기기를 제어할 수 있는 기능이다.

휴맥스(HUMAX)는 세계 최대급 디지털 셋톱박스, 스마트홈 및 게이트웨이 솔루션 제조사로 세계 90여 개 국가에 제품을 수출하고 있다. 이 회사는 사운드하운드와 제휴해 디스플레이 기능을 갖춘 최신 음성 인식 AI 스피커에 최고 수준의 개인 음성 비서를 통합했다.

사용자는 사운드하운드의 막강한 ‘하운디파이’ 플랫폼에 힘입어 복잡한 복합 명령과 맥락 제공이 필요 없는 후속 질문을 던질 수 있다. 휴맥스의 최신 스피커 사용자는 새로운 ‘기술’을 활성화하지 않고도 ‘하운디파이’의 지속적인 기능 및 전문 지식 확장 혜택을 누릴 수 있다.

하운디파이는 귀엽고 깜찍한 홈 로봇 쿠리(Kuri)를 지원한다. 쿠리는 “안녕 쿠리, 재미있는 농담 한 번 해볼래?”, “집으로 돌아 가렴”, “내가 제일 좋아하는 노래 불러 줘” 등 다양한 명령을 듣고 이해할 수 있다.

아이팔 로봇(robot)은 ‘하운디파이’의 음성 제어 기술을 통합해 로봇의 움직임을 지시하고 팔로우업, 명령 재정의 등 일반적인 음성 지원 기능을 활성화할 수 있다. 또 특정한 상업적 또는 교육적 용도에 맞춤 설정할 수 있다.

세계 굴지의 업소용 음료 공급 장비 기업이자 세계 유수 음료 브랜드 업체로 가정용 커피 머신 브랜드로도 유명한 번(BUNN)은 슈어 이머전 머신(Sure Immersion Machine)을 개발했다. 커피 원두를 바로 갈아 우려내는 ‘빈투컵(bean-to-cup)’ 기능으로 사용자가 고른 원두를 즉석에서 갈아 커피로 내려 준다.

이 기기에는 ‘하운디파이’가 통합돼 있으며 사용자는 “오케이, 바리스타”라는 지시어로 커피 머신을 작동시킬 수 있다. 사용자는 커피가 추출되는 동안 날씨, 스포츠 경기 최신 결과, 영양 정보 등을 질문할 수 있다. 음성 인식 기능은 각 브랜드를 위해 정교하게 맞춤화할 수 있다.

세계에서 가장 정교한 모디페이스(Modiface)의 뷰티 증강현실 엔진을 활용해 아이패드 등 모바일 장치를 사용자가 가상으로 화장을 테스트해볼 수 있는 마법의 거울로 변신시킬 수 있다. ‘하운디파이’가 통합된 ‘모디페이스 메이크업 애플리케이션(Modiface Makeup Application)’은 음성 인식을 지원한다.

예를 들어 사용자가 “초록 아이섀도우를 보여 줘”라거나 “빨간 립스틱에 분홍 블러시를 더해 봐”라고 말하면 애플리케이션이 해당 메이크업을 했을 때 얼굴이 어떻게 보이는 지 보여준다. 모디페이스 기술은 로레알(L'Oreal), 세포라(Sephora), 에스티로더(Estee Lauder), MAC 등 전세계 유수 뷰티 브랜드에서 활용되고 있다.

포토스프링(PhotoSpring)은 사랑하는 사람의 모습을 항상 간직할 수 있도록 지원함으로써 디지털 사진과 동영상 경험을 새롭게 정의한다. 사용하기 쉽고 와이파이 연결을 지원하는 포토스프링의 터치스크린형 디지털 액자는 아이폰이나 안드로이드 및 기타 웹 연결 기기에 저장된 사진과 동영상을 자동 업로드, 공유해준다.

이 액자에는 하운드의 음성 비서 기능이 탑재돼 있으며 사용자는 “오케이 하운드, 내 앨범을 보여 줘” 등의 말로 사진을 감상할 수 있다. 또한 날씨, 지역 맛집 확인, 타이머 설정 등의 기능도 이용할 수 있다.

온쿄(Onkyo exhibits)는 목에 걸어 사용할 수 있는 음성 비서 기능의 웨어러블 스마트 컨시어지 장치를 전시한다. 사용자는 손을 쓸 필요 없이 말로 음성 비서를 활성화해 검색, 탐색, 음악 재생, 문자 전송 등을 실행할 수 있다.

케이반 모하제르(Keyvan Mohajer) 사운드하운드 공동 설립자 겸 최고경영자(CEO)는 “대화형 음성 인식 인터페이스는 주변 사물과 상호작용하는 방식이 진화할 다음 단계”라며 “사물과 대화하는 사용자 행동은 일상 생활의 핵심으로 빠르게 자리잡을 것”이라고 내다봤다.

그는 “하운디파이의 플랫폼 중립적 접근 방식은 모든 수직 시장의 기업들이 각 브랜드 정체성을 유지한 상태로 대화형 음성 인식 인터페이스를 자사 제품에 신속하고 손쉽게 탑재할 수 있도록 지원한다”며 “우리 포트폴리오에 이러한 새로운 제휴 방식을 추가하게 돼 기대가 크다”고 밝혔다.

‘하운디파이’는 개발자와 비즈니스 소유주가 각 사의 브랜드와 사용자를 유지하는 가운데 대화형 인터페이스를 어디든 구축하고 차별화와 혁신을 도모할 수 있도록 뒷받침하는 최초의 독립형 AI 플랫폼이다.

‘하운디파이’는 음성 인식 및 AI 통합에 필요한 모든 기술 요소를 제공한다. 여기에는 세계 최고속 음성인식 기술과 가장 앞선 자연 언어 이해, 사용이 손쉬운 개발자 툴, 지식 그래프, 방대하고 지속 확장되는 도메인(domain)이 포함돼 있다. 도메인은 특정 주제에 대해 자연스럽고 완벽한 대화형(natural and fully conversational) 인터페이스를 제공하는 프로그램으로 사용자가 난해한 암호화 명령이나 기술 문구를 암기하거나 사용할 필요가 없다.

‘하운디파이’ 기술은 사운드하운드가 십년 간 연구개발(R&D) 혁신에 매진한 결실로 독창적이고 의미 있는 장점을 구현해 냈다. 대표적 장점은 사운드하운드의 특허 기술인 ‘스피치투미닝’과 ‘딥미닝언더스탠딩(Speech-to-Meaning and Deep Meaning Understanding)’ 기술이다.

이들 기술은 음성 인식 및 대응에서 유례 없는 속도와 정확성을 제공하며 사용자 위치 또는 이전 명령과 같은 맥락을 이해해 자연스러운 상호작용을 실현한다.

2015년 12월 ‘하운디파이’ 플랫폼 출범 후 6만명 이상의 파트너가 플랫폼에 등록했다. 또한 1000개 이상의 유망 제품에 ‘하운디파이’ 플랫폼이 장착됐다. 전략적 파트너로는 삼성 ARTIK 스마트 IoT 플랫폼(Samsung ARTIK Smart IoT platform)과 엔비디아(NVIDIA)가 있다.

엔비디아는 GPU를 이용해 하운디파이의 대규모 단어 음성 인식 및 자연 언어 이해 기능을 클라우드 연결 없이 차량에 적용할 수 있도록 했다.

그 밖의 하운디파이 통합을 통한 제휴 사례로는 샤프(Sharp)의 ‘로보혼 플랫폼(RoBoHoN platform)’과 랜드 맥넬리(Rand McNally)를 꼽을 수 있다. 랜드맥넬리는 사운드하운드의 음성 기술을 커넥티드 카 장치인 ‘오버드라이브(OverDryve™)’에 적용했다. 또 전세계 11개 자동차 제조사가 사운드하운드와 제휴하고 있다.

이광재 기자  voxpop@internews.kr

<저작권자 © 인터페이스뉴스, 무단 전재 및 재배포 금지>

이광재 기자의 다른기사 보기
icon인기기사
여백
Tour&Life
여백
여백
여백
여백
여백
Back to Top