ETRI, 9개 언어 음성인식기 개발···"추후 20개 언어 확장 예정"

연구팀이 음성인식 기술을 기반으로 만든 자동통역 앱 '지니톡'을 시연하고 있다.<사진=ETRI 제공>
연구팀이 음성인식 기술을 기반으로 만든 자동통역 앱 '지니톡'을 시연하고 있다.<사진=ETRI 제공>
국내 연구팀이 한국어로 말하면 9개 언어로 변환되는 95% 이상 인식률의 음성인식기를 개발했다.

ETRI(한국전자통신연구원·원장 이상훈)는 한국어 뿐만 아니라 영어, 일본어, 중국어, 프랑스어, 스페인어, 독일어, 러시아어, 아랍어 등 실시간으로 사람의 음성을 문자로 변환하는 기술을 개발했다고 18일 밝혔다.

연구팀은 인공지능 딥러닝 기술을 바탕으로 대용량 데이터를 이용해 음성인식기를 개발했다. 대용량 데이터 자동 정제기술로 다국어 음성언어처리 핵심 기술도 확보해 추후 다양한 국가의 음성인식도 확대될 전망이다.

음성인식기 서비스 방식은 기존과 비슷하며 클라이언트 서버형과 단말 탑재형으로 이뤄졌다. 한 번에 수명에서 수십명까지 동시 접속할 수 있다.

연구팀은 향후 음성인식 기술을 필요로 하는 국내 이동통신업체를 비롯해 포털, 음성인식 엔진 기술을 상용화하고 있는 기업체에 기술을 이전할 예정이다. 

김상훈 ETRI 음성지능연구그룹 프로젝트 리더는 "2020년 동경올림픽 개최 시점까지 대상 언어를 14개 언어로 확대하고 추가로 20개 언어 이상으로 늘려 나갈 예정"이라며 "향후 기술 고도화를 통해 음성인식 기술 경쟁력을 높여가겠다"고 말했다.

한편 ETRI는 이번 기술을 내년 평창 동계올림픽 자동 통·번역 서비스 부문 공식 후원사인 한글과컴퓨터와 함께 '지니톡'자동통역 서비스에 적용해 시범서비스 중이다.
 

저작권자 © 헬로디디 무단전재 및 재배포 금지