광고 창닫기

AI 딥러닝 데이터, 빠르고 방대하게 확보하려면?

18일 대덕테크비즈센터서 'AI학술세미나' 개최
신호욱 셀렉트스타 대표, "'크라우드 소싱'으로 세상 모든 데이터 다룰 것"
18일 대덕테크비즈센터에서 열린 AI학술세미나에서 신호욱 셀렉트스타 대표가 발표로 나서 데이터 수집 방법에 대해 설명했다. <사진 = 홍성택 기자>18일 대덕테크비즈센터에서 열린 AI학술세미나에서 신호욱 셀렉트스타 대표가 발표로 나서 데이터 수집 방법에 대해 설명했다. <사진 = 홍성택 기자>

인공지능(AI) 성능을 높이기 위한 딥러닝 데이터 확보에 기업들이 어려움을 겪고 있는 가운데, '크라우드 소싱(crowd sourcing)'으로 빠른 시간 많은 양의 데이터 수집이 가능한 플랫폼을 구축한 기업이 있다. 바로 셀렉트스타 얘기다.  

지난 18일 대덕테크비즈센터에서 열린 'AI학술세미나'에서는 60여명이 참석한 가운데 신호욱 셀렉트스타 대표가 강연에 나서 데이터 수집 방법과 기업 비전을 설명했다. 이날 행사에는 대전과학고등학교 학생 15명이 참석해 신 대표 창업스토리에 질문 공세를 펼치며 관심을 표했다.

셀렉트스타는 지난해 11월 KAIST 학부생들이 모여 창업을 이룬 데이터 수집·가공 플랫폼 기업이다. 대중들의 참여로 해결책을 얻는 '크라우드 소싱' 방식을 이용해 수익을 창출하고 있다. 셀렉트스타만의 자체 어플리케이션(앱)으로 사용자들에게 과제를 던져주고 필요한 데이터를 사용자들이 모아 업로드를 하는 방식이다. 

데이터를 업로드한 사용자들에게는 양과 정확도에 따라 캐시(현금)이 차등적으로 지급된다. 수집된 음성·영상·이미지 데이터들은 셀렉트스타에서 가공을 거쳐 기업들에게 전달된다. 

신 대표는 "많은 기업들이 데이터 수집에 있어서 비용, 인력, 시간 문제를 겪고 있다. 이러한 문제점을 해결하고자 사업을 시작하게 됐다"면서 "자체 플랫폼을 통해 기업입장에서는 양질의 데이터를 빠르게 모을 수 있고, 사용자들 입장에서는 매력적인 보상을 느낄 수 있다"고 말했다. 

셀렉트스타는 현재까지 국내 7000명, 필리핀 1만7000명의 사용자를 보유하고 있다. 창업한 지 1년이 채 안 됐지만, 올해 매출액은 10억원을 돌파했다. 

신호욱 대표는 반자동 레이블링 시스템 기술 개발로 더 많은 데이터를 더 빠르게 수집하고 모을 수 있는 시스템 개발을 추진하고 있다고 설명했다. <사진 = 홍성택 기자>신호욱 대표는 반자동 레이블링 시스템 기술 개발로 더 많은 데이터를 더 빠르게 수집하고 모을 수 있는 시스템 개발을 추진하고 있다고 설명했다. <사진 = 홍성택 기자>
그는 "AI 딥러닝의 활용분야가 넓어지며 기업 또는 연구자가 원하는 특정 데이터가 필요해졌고, 사업 방향이 그러한 취지와 잘 맞아 단기간 빠른 성장을 할 수 있었다"고 설명했다. 

크라우드 소싱 기반으로 동시에 많은 사용자가 참여해 빠른 시간 안에 방대한 양의 데이터를 확보할 수 있지만, 여전히 데이터 가공 시간이 오래 걸린다는 문제점은 있다. 이를 위해 신 대표는 '반자동 레이블링 시스템' 기술 개발을 계획하고 있다. 

반자동 레이블링 시스템이란 AI가 일차적으로 데이터를 스스로 가공(레이블링)한 후, 사용자가 약간의 수정을 거치는 과정을 말한다. 이 시스템을 도입하면 수작업 레이블링 대비 약 60%까지 가공 작업 시간을 절감할 수 있다. 

신 대표는 "2020년 안으로 생산성과 작업 효율을 높일 수 있는 반자동 레이블링 시스템 개발을 목표로 하고 있다"면서 "많은 사용자들이 더 쉽게 데이터를 모으고 가공할 수 있도록 해 더 많은 데이터를 생산하도록 할 것"이라고 포부를 밝혔다.

AI학술세미나는 '혁신네트워크 AI프렌즈'에서 멤버십 모임과 함께 격주로 진행하고 있는 행사다. AI멤버십에 등록하면 모임과 행사일정 등을 안내받을 수 있다. 멤버십 가입과 세미나 일정 확인·신청은 페이스북 'AI프렌즈' 페이지에서 할 수 있다.
홍성택 기자의 다른 기사 더보기
독자의견
로그인 독자분들의 소중한 의견은 과학과 국민을 잇는 밑거름이 됩니다
0/ 300자