요즘 TV에 "화장품은 죄가 없어요~"라는 광고가 있다. 얼굴에 여드름이 난 여학생이 거울을 보며 "엄마 화장품을 써서 그러나?"하자 이를 몰래 듣던 엄마가 얼굴에 발랐던 화장품을 얼른 닦아내어 다시 화장품 통 속에 집어넣을 때 나오는 문구이다. 요지는 화장품이 문제가 아니라 장 속 유해균이 문제라는 것이다.

빅데이터의 위험성에 대한 이야기가 심심치 않게 지면을 장식하고 있다. 더구나 빅데이터가 세상에서 빛을 발하는 데 가장 큰 기여를 한 Google의 슈미트 회장은 지난 4월 펴낸 '새로운 디지털 시대'라는 책에서 대용량 데이터를 수집·분석하여 감시하는 '빅데이터 사찰'이 자유 사회에 위협이 된다고 강조한 바 있다.

이러한 우려는 최근 미국국가안보국(NSA)의 프리즘 스캔들을 계기로 더욱 증폭되고 있다. 프리즘 시스템은 인터넷과 통신회사의 중앙 서버에 접속해 사용자의 정보를 추적할 수 있도록 도와주는 프로그램으로 2007년 만들어졌다.

NSA는 통화 내역과 인터넷 사용 내용 등 개인 정보를 무차별적으로 수집해왔을 뿐 아니라, 정보 수집을 위해 AT&T 등의 통신 기업은 물론 구글, 페이스북, 스카이프, 애플, 야후 등 기업까지 동원하고 있었다는 점에서 큰 충격을 주었다.

미국 정부는 정보 수집의 사실은 인정하나 테러 방지 등을 위해서만 사용하였고, 개인의 사생활은 침해하지 않았다고 주장하고 있으나, 지난 해 오바마 대통령이 매일 받는 일일 브리핑의 일곱 번 중 한 번이 프리즘 관련 정보 보고였다는 점에서 우려할 만 한 상황이라는 것이 워싱턴포스트의 분석이다.

여기에 프랑스 정보당국도 미국 NSA의 프리즘과 흡사한 형태로 수년간 개인 전화와 컴퓨터 자료 등 각종 전자통신정보를 감시하고 저장해 왔다는 폭로가 나왔다. 차제에 빅데이터라는 기술 자체를 재점검해 보아야 한다는 빅데이터 무용론마저 고개를 들고 있다.

삼성경제연구원의 채승병 수석연구원은 빅데이터의 위험성을 지적하는 질문에 대해 다음과 같이 답한 바 있다.

"빅데이터를 흔히 21세기 원유라고 하는데, 석유가 처음 발견되었을 때에도 인류는 그것을 어디에 사용하여야 할 지 몰랐다. 정제하여 휘발유를 만들어서 그것을 세탁하는 데 썼는데 종종 폭발사고가 벌어질 정도로 위험했다. 그런데 그 '폭발력'을 누군가는 내연기관에 적합한 연료로 생각했다."

데이터의 위험성만 보고 사용하기를 포기한다면 빅데이터 시대의 낙오자가 될 것이라는 이야기다.

빅데이터는 기본적으로 '입수 가능한 모든 유형의 데이터'를 대상으로 한다. 여기에는 개인 정보도 물론 포함된다. 정부가 추진하고 있는 정부 3.0에서도 공개 가능한 정부의 모든 데이터를 공개하겠다고 한다. 그렇다면 어떻게 개인 정보의 무분별한 유출이나 빅브라더의 탄생을 경계하면서 빅데이터 시대의 주역이 될 수 있을까?

Intel의 보안담당 그룹 CTO인 Andy Thurai는 블로그에서 빅데이터의 효율성을 잃지 않으면서 데이터의 보안성을 관리하기 위한 몇 가지 유용한 기술적 조언을 하고 있다.

▲빅데이터 소스에 접근할 수 있는 권한을 철저히 통제하라 ▲전체 데이터를 암호화 하지 말고, 민감한 일부 데이터를 암호화하라 ▲신분증 번호나, 계좌 번호, 의료 기록, 중요한 기업 비밀 등은 매우 위험하므로 해당 정보가 개인 또는 소유 기업과 연결되지 못하도록 다음과 같은 보호 조치가 필요하다. 이를 위해서는 원래의 데이터로 돌아가지 못하도록 철저히 편집한다. 또 민감한 데이터는 임의화(anonymize)시켜 소유자 정보를 완전히 삭제하고 풀기 매우 어려운 암호화 방법을 채택한다. ▲데이터와 접근 제어에 대한 권한을 함께 고려하라. 데이터에 대한 접근은 정밀하게 제어되어야 한다 ▲노출된 API를 보호하라. 이를 위해 Hadoop cluster 앞단에 API 보안 게이트웨이를 설치하는 것이 좋다 ▲데이터 이용자의 패턴을 주시하고, 이용 기록을 분석하라.

그러나 이러한 기술적인 방비로 개인 정보의 무분별한 유출은 막을 수 있겠지만, 개인의 동의 없이 수집된 정보가 남용될 가능성은 여전히 남아있다. 에릭 슈미트는 빅데이터 시대에 등장할 수 있는 '빅 브라더'의 폭정을 막기 위한 유일한 대책은 법적인 제도를 강화하고 시민사회가 이런 권력이 남용될 잠재적 가능성에 대해 적극적이고 현명하게 대처하는 자세를 유지하는 것이라는 결론을 내리고 있다.

기술은 죄가 없다. 이것을 이용하는 사람들이 얼마나 현명하게 위험에 대비하고 준비하는가가 관건이다. 빅데이터 시대를 맞아 정부와 기업 및 대학들은 많은 투자를 통해 기술선점에 나서는 한편, 빅데이터의 위험요소에 대한 분석과 이에 대한 철저한 대비, 그리고 법과 제도의 정책적인 보완을 함께 해 나가야 하겠다.

현재는 정보의 홍수시대입니다. IDC의 '디지털유니버스 보고서'에 의하면 올 한해동안 생성되어 유통된 디지털 데이터의 양은 2.8 제타바이트에 달한다고 합니다. 1제타바이트를 책으로 만들어 쌓으면 지구에서 태양까지 1억5000만km를 37번 왕복할 수 있는 양이니 그 규모가 얼마나 큰지 짐작할 수 있을 것입니다.

'한선화의 정보 프리즘'에서는 전세계에서 일어나는 흥미로운 사건, 사실을 데이터를 통해 재조명 해줄 예정입니다. 한 박사는 투명하게 보이는 햇빛이 프리즘을 통과하면 아름다운 무지개로 바뀌듯이 사물과 사건을 보는 또 다른 창이 되길 기대하고 있습니다.

한선화 박사는 한양대학교 화학공학과, 성균관대학교 정보공학과를 졸업하고, 카이스트에서 전산학을 전공했습니다. 1997년부터 한국과학기술정보연구원에서 근무하며 국내외 과학기술 정보와 관련 정보기술 개발을 총괄하는 정보통입니다. 현재 국가과학기술위원회 첨단융합분과 전문위원으로 활동 중이며, 대한여성과학기술인회 부회장, 과실연 대전·충청지역 대표 등 활발한 대외 활동도 겸하고 있습니다.

 

 

저작권자 © 헬로디디 무단전재 및 재배포 금지