ETRI, 녹취기록 자동변환 기술개발…외국제품 대비 10%이상 우수

콜센터 녹취데이터 음성인식 시스템 개념도.<이미지=ETR 제공>
콜센터 녹취데이터 음성인식 시스템 개념도.<이미지=ETR 제공>
은행, 증권, 카드사 등 고객의 음성데이터 자료의 중요성이 점점 커지고 있는 가운데 국내 연구진이 콜센터의 녹취 음성데이터를 텍스트로 자동변환하는 기술을 개발하는데 성공했다.

ETRI(한국전자통신연구원·원장 김흥남)는 '자연연 음성인식 소프트웨어(SW)'를 개발하고 상용화를 추진 중이라고 22일 밝혔다.

현재 콜센터의 고객 음성DB는 데이터 센터에 저장만하는 형태로 고객과의 분쟁이나 사고시에만 활용돼 왔다.

최근 금융권을 중심으로 상담원과 고객 음성 데이터를 자동으로 음성 인식 처리하는 기술이 본격적으로 검토되고 있다.

고객 음성DB 분석이 기업의 경영전략 수립과 고객 마케팅, 고객 분쟁 감소 등 경영 자산으로 인식되면서, 대규모의 콜센터를 운영하는 기업들이 관심을 갖게 된 것이다.

현재 전 세계 콜센터와 같은 고객의 음성DB 분석시장은 미국과 이스라엘이 시장을 주도하고 있다. 하지만, 외국산 제품은 영어 등 주요국가 언어를 분석대상으로 하기 때문에 독특한 우리말과 글을 인식하는데 한계가 있다. 또 유지보수에 많은 비용을 수반하게 된다.

더욱 큰 문제는 국내 기업이 보유하고 있는 고객 음성DB의 해외유출로 민감한 개인정보 문제를 발생시킬 수 있다는 것이다.

이번 ETRI연구진의 개발한 기술은 콜센터 고객음성을 실시간 텍스트로 바꿔 고객의 음성DB를 저장, 빅데이터로 분석이 가능하다.

'자연어 음성인식 및 핵심어 검출기술'로 자연스럽게 발성한 음성을 인식해 문자로 변환하거나 특정 단어를 자동 추출해주는 등 콜센터 발화특성에 최적화 돼 있다. 이로써 고객의 연령, 성별에 따른 관심분야 파악과 고객의 성향까지 분석이 가능하다.

연구팀에 의하면 개발된 기술은 외산 기술과의 비교테스트에서 10% 이상의 우수한 성능 결과를 얻었다.

하지만 콜센터 녹취데이터와 같은 대화체 음성의 비정형 특성으로 인해 인식 성공률이 70% ~ 80% 대에 머무르고 있기 때문에 추가 기술개발이 필요하다.

이번 연구는 미래창조과학부 '모바일 플랫폼 기반 대화 모델 적용 자연어 음성 인터페이스 기술 개발'사업의 일환으로 개발됐으며 특허 6건, 논문 10건, 기술이전 6건을 완료했다.

이윤근 자동통역인공지능연구센터장은 "음성인식 기술은 음성검색을 시작으로 SMS, 콜센터 녹취데이터용 음성인식, 자동통역, 영어학습, 내비게이션 등으로 점차 적용 영역이 넓어지고 있다"면서 "세계 음성인식 시장 규모는 2017년 대략 167억 달로 규모로 예상되며 이 중, 콜센터 음성인식 시장규모는 약 4억 달러 규모"라고 설명했다.

저작권자 © 헬로디디 무단전재 및 재배포 금지