3일 TBC서 AI학술세미나 개최···머신러닝의 한 분야 'Anomaly detection' 소개
최진혁 인포리언스 대표 "스스로 데이터 해석하는 프로그램 만들어갈 것"
이를 가능하게 하는 것이 바로 '머신러닝(기계학습)'의 한 분야인 'Anomaly detection(이상탐지)'이다.
지난 3일 대전테크비즈센터에서 열린 AI학술세미나에서는 최진혁 인포리언스 대표가 'Pattern detection & Interpretation'을 주제로 발표에 나서 데이터 이상탐지에 대한 설명과 관련 연구를 공유했다.
최 대표는 "4차 산업혁명이 도래하고 데이터의 양이 폭발적으로 증가함에 따라 데이터에 대한 효율적 관리, 사용의 필요성이 대두됐다"면서 "이를 위해 데이터에 어떤 패턴이 숨어져 있는지, 그것을 해석하는 것이 가장 기본적인 일"이라고 말했다.
데이터 분석에서 가장 주목받는 분야는 '딥러닝(Deep learning)'과 'Anomaly detection'이다. 데이터 이상감지에 있어 딥러닝은 정상 데이터와 비정상 데이터를 모두 학습하고, 학습 데이터 내에서 정확도가 높은 비율로 이상을 감지한다. 반면, Anomaly detection은 정상 데이터만을 학습, 학습 데이터 이외의 새로운 데이터가 들어와도 그것의 이상이나 정보를 파악할 수 있다.
최 대표가 말하는 Anomaly detection을 통한 데이터 분석에서 가장 중요한 것은 데이터의 '배경 지식'이다.
가령, 한 가정에서 거실 온도가 아침 10시마다 일정하게 낮아지는 패턴이 항상 나타난다고 해보자. 이 상황의 데이터를 분석할 때 어떤 경우는 '싼 기계를 써서 데이터가 튄다'라는 분석과 또 다른 경우에는 '전력량 통계를 볼 때, 아침마다 보일러를 끄기 때문에 온도가 낮아진다'라는 분석이 나올 수 있다.
전자는 데이터에 대한 사전 정보가 없기 때문에 정확하지 않은 분석이 나온 반면, 후자는 그 가정의 일상생활에 대한 배경 지식이 있었기 때문에 정확한 분석이 가능했다는 것이 최 대표의 말이다.
그는 "데이터에 대해 얼마나 알고 있느냐가 학습 모델의 능력을 좌우한다"면서 "데이터를 분석하기 위한 기술보다는 데이터에 대한 정보와 도메인을 확보하기 위해 노력해야 한다"고 말했다.
최 대표는 "아직은 개발단계에 있지만 언젠가는 사람의 행동 패턴, 환경과 상황의 변화과정도 탐지할 수 있게 될 것"이라면서 "데이터를 스스로 해석해서 사람들에게 알려주는 유익한 시스템이 됐으면 한다"라고 말했다.
한편, AI학술세미나는 '혁신네트워크: AI프렌즈'에서 AI멤버십 모임과 함께 격주로 진행하고 있는 행사다. AI멤버십에 등록하면 모임과 행사일정 등을 안내받을 수 있다. 멤버십 가입과 세미나 일정 확인 및 신청은 페이스북 'AI프렌즈' 페이지에서 할 수 있다.
댓글 정렬