DGIST, 구글 검색 방식의 빅데이터 기술 적용···신약 개발 등 도움
김민수 교수 "전 세계 생명정보 소프트웨어 시장서 선도 기대" 

김민수 정보통신융합공학전공 김민수 교수(왼쪽), 구재형 뇌·인지과학전공 교수.<사진=DGIST 제공>
김민수 정보통신융합공학전공 김민수 교수(왼쪽), 구재형 뇌·인지과학전공 교수.<사진=DGIST 제공>
국내연구진이 빅데이터 기술을 적용한 '올리고뉴클레오티드 설계 기술'을 개발해 화제다. 

올리고뉴클레오티드(Oligonucleotide)는 A·C·T·G 4가지 뉴클레오티드로 구성된 단일 나선의 짧은 염기서열로, 유전자 진단과 신약 개발 등에 필수적으로 쓰인다.

DGIST(대구경북과학기술원·총장 신성철)는 김민수 정보통신융합공학전공 교수와 구재형 뇌·인지과학전공 교수 융합연구팀이 구글 검색 방식의 빅데이터 기술을 적용해 정밀하고 빠른 성능을 나타내는 올리고뉴클레오티드 설계 기술(MRPrimerW)을 개발했다고 23일 밝혔다.

이 기술은 사람이나 동식물의 전체 유전자 데이터베이스에 존재하는 모든 후보 올리고뉴클레오티드들에 맵리듀스 기반 복잡 알고리즘을 적용해 특이성을 갖는 올리고뉴클레오티드들만을 골라 1차 저장한다. 

선별한 올리고뉴클레오티드들을 다시 색인 구조로 변환해 2차 결과를 서버에 저장함으로써 검색엔진 구글에서 원하는 정보를 검색하는 것처럼 사용자가 입력한 설계 조건과 목표 유전자에 부합하는 최적의 올리고뉴클레오티드를 정확하고 초고속으로 설계한다. 

특이성을 완벽하게 만족하는 올리고뉴클레오티드를 찾기 위해서는 이론적으로 하나의 목표 유전자에 대해 약 30억번, 유전체 데이터베이스의 모든 유전자들에 대해서는 약 900경(10의 16승)번의 비교연산이 필요하기 때문에 특이성을 완벽하게 만족하는 올리고뉴클레오티드를 설계하는 일은 난해한 문제로 알려져 있다.

연구팀은 지난해 맵리듀스 기반의 복잡 알고리즘을 통해 종(種) 전체 유전자 데이터베이스에 존재하는 특이성을 만족하는 모든 올리고뉴클레오티드들을 효율적으로 찾아내는 'MRPrimer' 기술을 세계 최초로 개발했다.

그러나 이 기술은 사용자가 설계 조건을 변경할 때마다 수십 시간이 걸리는 대규모 분산 컴퓨팅을 수행해야 하는 단점이 있었다. 이에 연구팀은 작년에 개발한 기술의 단점을 보안해 'MRPrimerW' 기술을 만든 것.  

연구팀은 MRPrimerW 기술을 적용하면 유전자 기반의 암 진단, 유전자 변형농산물(GMO) 탐지, 신종 바이러스 탐지 등 유전자 진단에 사용되는 올리고뉴클레오티드를 정밀하게 설계할 수 있으며 올리고뉴클레오티드 기반의 바이오 신약 개발에도 사용할 수 있을 것으로 내다보고 있다. 

김민수 교수는 "MRPrimerW 기술은 빅데이터 분석 기술을 유전자 데이터에 가장 효과적으로 적용한 사례 가운데 하나로 평가받고 있다"며 "앞으로 전 세계 생명정보 소프트웨어 시장에서 우리나라가 해당 기술 분야를 선도하기 위해 지속적으로 노력하겠다"고 밝혔다.

한편 이번 연구 성과는 생물과학 분야 세계적 권위의 국제학술지 '뉴클레익 액시드 리서치(Nucleic Acids Research)' 온라인판 5월 6일자에 게재됐다. 
 

저작권자 © 헬로디디 무단전재 및 재배포 금지