ETRI, 통신량 줄여 AI 학습 속도 늘린 '고속처리 기술' 개발
해외 기업 독점한 AI 컴퓨팅 인프라 시장에 도전장

국내 연구진의 기술로 인공지능(AI)의 학습시간이 줄어들 전망이다. 해외 기업이 독점하고 있는 AI 컴퓨팅 인프라 시장에서 이룬 성과라 더욱 주목할만하다.

ETRI(원장 김명준)는 딥러닝 분산 학습에 최적화된 고속 처리 기술을 개발했다고 10일 밝혔다. 이 기술을 적용하면 학습에 일주일이 필요했던 AI 모델이 같은 환경에서 1~2일 만에 학습할 수 있다. 최대 4배 효율을 내는 셈이다.

딥러닝은 컴퓨터가 사람처럼 생각하고 배우게 만드는 기술이다. 하지만 아무리 컴퓨터라도 대규모 영상, 이미지, 음성 등 데이터나 모델을 익히려면 오랜 시간이 걸린다. 따라서 '분산학습'이 주로 사용된다. 여러 대 컴퓨터로 동시에 공부를 시켜 학습 분량을 분담하고 학습시간을 줄이는 기술이다. 

그러나 이 기술도 대용량 모델을 동시에 실행하면 통신 병목현상이 발생한다. 컴퓨터들 사이에 통신량이 많다 보니 특정 지점에서 성능이나 용량이 저하되는 현상이 나타난다.

ETRI 연구팀은 '메모리 박스(Memory BoxTM)'라는 공유기억장치를 개발해 통신 병목현상을 해소했다. 자연히 학습시간도 단축됐다. 메모리 박스는 컴퓨터들 중간에 위치해 각 컴퓨터가 학습한 내용을 공유하게 하며 통신량을 줄여준다. 일종의 가상 공유 메모리 역할이다.

이 기술을 이용해 1000개 종류 이미지 128만 장을 분류하는 모델에 1만 번 반복 학습을 시킨 결과, 학습 완료까지 7분 31초가 걸렸다. 기존 서버 방식에서는 16분 23초다. 연구팀의 기술을 사용하기 위해 대대적인 장비 교체가 필요 없는 것도 장점이다. 하드웨어와 소프트웨어 형태가 모두 제공돼 수요자 맞춤형 기술이전도 가능하다.

연구팀은 '딥러닝 대시보드'도 개발했다. 국내 개발자들이 딥러닝 연구를 쉽게 할 수 있는 AI 컴퓨팅 환경을 마련하기 위해서다.

그동안 아마존, 구글, MS 등 글로벌 IT 기업들은 자사 소스코드를 공개하거나 대규모 컴퓨팅 자원을 클라우드 형태로 제공했다. 이 방식으로 개발자들을 유인하고 AI 컴퓨팅 인프라 시장의 점유율을 높여왔다. AI를 연구하는 국내 기업이나 기관들은 외국 기업들의 서비스에 의존하거나 큰 비용을 들여 자체 서버를 구축해야 했다.

ETRI가 개발한 대시보드는 학습시간은 물론 모델 개발 시간도 줄인다. 그래픽 기반 개발 환경이어서 개발자들이 코드를 일일이 입력할 필요가 없다. AI 개발에 자주 쓰이는 도구들도 지원된다. 

이 기술은 해상도가 높은 의료 영상과 방대한 이미지를 분석하는 등 딥러닝·AI가 접목될 다양한 분야에서 쓰일 것으로 기대된다. 컴퓨팅 환경이 열악한 중소기업, 학교, 스타트업은 개발 시간과 비용을 절약할 수 있다.

ETRI의 기술은 가전 전시회 'IFA 2019'에서 주목을 받았다. 연구팀의 딥러닝 고속 처리 시스템 기술을 이전받은 2개 중소기업은 연구소기업 설립을 추진 중이다. 내년에 상용화하는 것이 연구팀의 목표다.

최완 ETRI 인공지능연구소 책임연구원은 "글로벌 기업이 독식하고 있는 AI 컴퓨팅 인프라 시장을 우리 기술로 대체하고 고난이도 딥러닝 기술과 독자적인 인공지능 슈퍼컴퓨팅 시스템 개발에 도움이 되길 바란다"고 말했다.

이번 기술 개발에 참여한 ETRI 연구진. (왼쪽부터) 우영춘 책임연구원, 최완 책임연구원, 박유미 클라우드기반SW연구실장, 안신영 책임연구원, 임은지 책임연구원, 최용석 책임연구원. <사진=ETRI 제공>
이번 기술 개발에 참여한 ETRI 연구진. (왼쪽부터) 우영춘 책임연구원, 최완 책임연구원, 박유미 클라우드기반SW연구실장, 안신영 책임연구원, 임은지 책임연구원, 최용석 책임연구원. <사진=ETRI 제공>
저작권자 © 헬로디디 무단전재 및 재배포 금지