3일 TBC서 AI학술세미나 개최···머신러닝의 한 분야 'Anomaly detection' 소개
최진혁 인포리언스 대표 "스스로 데이터 해석하는 프로그램 만들어갈 것"

3일 열린 AI학술세미나에서 최진혁 대표가 'Anomaly detection'을 설명했다. <사진 = 홍성택 기자>
3일 열린 AI학술세미나에서 최진혁 대표가 'Anomaly detection'을 설명했다. <사진 = 홍성택 기자>
네트워크를 타고 흐르는 각각의 데이터들은 나름의 패턴을 가지고 있다. 이러한 데이터 흐름과 패턴을 분석할 수만 있다면 이상이나 위험을 감지할 수 있고, 더 나아가서는 미래 패턴까지 예측이 가능하다.

이를 가능하게 하는 것이 바로 '머신러닝(기계학습)'의 한 분야인 'Anomaly detection(이상탐지)'이다.  

지난 3일 대전테크비즈센터에서 열린 AI학술세미나에서는 최진혁 인포리언스 대표가 'Pattern detection & Interpretation'을 주제로 발표에 나서 데이터 이상탐지에 대한 설명과 관련 연구를 공유했다.

최 대표는 "4차 산업혁명이 도래하고 데이터의 양이 폭발적으로 증가함에 따라 데이터에 대한 효율적 관리, 사용의 필요성이 대두됐다"면서 "이를 위해 데이터에 어떤 패턴이 숨어져 있는지, 그것을 해석하는 것이 가장 기본적인 일"이라고 말했다. 

데이터 분석에서 가장 주목받는 분야는 '딥러닝(Deep learning)'과 'Anomaly detection'이다. 데이터 이상감지에 있어 딥러닝은 정상 데이터와 비정상 데이터를 모두 학습하고, 학습 데이터 내에서 정확도가 높은 비율로 이상을 감지한다. 반면, Anomaly detection은 정상 데이터만을 학습, 학습 데이터 이외의 새로운 데이터가 들어와도 그것의 이상이나 정보를 파악할 수 있다.  
최 대표가 말하는 Anomaly detection을 통한 데이터 분석에서 가장 중요한 것은 데이터의 '배경 지식'이다.

가령, 한 가정에서 거실 온도가 아침 10시마다 일정하게 낮아지는 패턴이 항상 나타난다고 해보자. 이 상황의 데이터를 분석할 때 어떤 경우는 '싼 기계를 써서 데이터가 튄다'라는 분석과 또 다른 경우에는 '전력량 통계를 볼 때, 아침마다 보일러를 끄기 때문에 온도가 낮아진다'라는 분석이 나올 수 있다. 

전자는 데이터에 대한 사전 정보가 없기 때문에 정확하지 않은 분석이 나온 반면, 후자는 그 가정의 일상생활에 대한 배경 지식이 있었기 때문에 정확한 분석이 가능했다는 것이 최 대표의 말이다. 

그는 "데이터에 대해 얼마나 알고 있느냐가 학습 모델의 능력을 좌우한다"면서 "데이터를 분석하기 위한 기술보다는 데이터에 대한 정보와 도메인을 확보하기 위해 노력해야 한다"고 말했다. 

최진혁 대표는 코딥을 개발했다. 코딥은 사용자와의 피드백 과정을 통해 학습 능력을 발전시켜 나가며 배경지식을 쌓고 분석 정확도를 높인다. <사진 = 홍성택 기자>
최진혁 대표는 코딥을 개발했다. 코딥은 사용자와의 피드백 과정을 통해 학습 능력을 발전시켜 나가며 배경지식을 쌓고 분석 정확도를 높인다. <사진 = 홍성택 기자>
최 대표는 누구나 데이터 패턴을 분석할 수 있도록 '코딥(Codip)'이라는 시스템을 개발했다. 코딥은 1차적으로 데이터 소스를 스스로 분석하고 그 결과를 사용자에게 피드백 받는다. 여러번의 반복 과정을 통해 코딥은 학습 능력을 발전시키고 데이터에 대한 배경지식을 쌓음으로써 분석 정확도를 빠르게 높일 수 있다. 

최 대표는 "아직은 개발단계에 있지만 언젠가는 사람의 행동 패턴, 환경과 상황의 변화과정도 탐지할 수 있게 될 것"이라면서 "데이터를 스스로 해석해서 사람들에게 알려주는 유익한 시스템이 됐으면 한다"라고 말했다.  

한편, AI학술세미나는 '혁신네트워크: AI프렌즈'에서 AI멤버십 모임과 함께 격주로 진행하고 있는 행사다. AI멤버십에 등록하면 모임과 행사일정 등을 안내받을 수 있다. 멤버십 가입과 세미나 일정 확인 및 신청은 페이스북 'AI프렌즈' 페이지에서 할 수 있다.

저작권자 © 헬로디디 무단전재 및 재배포 금지