김태형 테라젠이텍스 이사
유전체 디코딩/인코딩의 원천기술을 가진 하버드의대의 조지 처치(George Church)와 그의 제자 데니스 글리신(Dennis Grishin), 그리고 구글에서 일했던 카말 오바드(Kamal Obbad)가 공동 설립한 스타트업 '네불라 지노믹스(Nebula Genomics)’가 최근 새로운 서비스를 론칭했다. 개인의 유전체 데이터를 필요로 하는 구매자가 그 대가를 개인에게 지급하고 개인은 암호화된 유전체 데이터를 안전하게 제공하는 서비스다. 특히 유전체 데이터 제공의 대가로 개인은 네불라가 발행한 디지털 토큰을 받고 원하면 현금으로 교환하는 방식이라는 점이 주목할만하다.
이 서비스의 핵심기술은 최근 선풍적으로 이슈화된 비트코인(Bitcoin)으로 유명해진 블록체인(Block chain)에 기반한 것으로 구현된 플랫폼은 누군가 변경하기 매우 어려운 '블록(Blocks)'이 확장된 체인에 트랜젝션을 기록하는 분산 컴퓨팅 시스템이다. 즉, 해커가 하나의 블록에 접근해 조작하려면 링크된 모든 블록을 모두 조작해야만 가능하기 때문에 이는 매우 어려운 작업이며 거의 불가능하다는 것이다. 이러한 장점을 잘 활용해 사람들이 자신의 헬스 레코드에 대한 통제권을 잃지 않고 안전하게 데이터를 제공할 수 있다는 것이다. 실제로 이 블록체인 기술은 의료 데이터의 공유를 위해 적용되기 시작해 IBM 조사에 따르면 2017년 한 해 동안만 약 200여 개의 헬스케어 관련 회사 중에 16%가 블록체인 기술을 적용한 데이터 공유 서비스를 준비하고 있다고 발표하기도 했다.
최근에 급속도로 발전한 인공지능 기술을 적용하여 수십만~수백만 건의 개인 의료 데이터에 접근해 훈련할 수 있다면 의사가 진단하는 것 보다 더 병을 잘 진단하거나 치료에 적합한 제안을 할 수 있을 것이란 기대가 나오고 있다. 하지만 이를 구현하기 위해서는 어떻게 사생활 침해없이 안전하게 개인의 의료데이터에 접근하느냐가 관건인데 블록체인 기술의 의료분야 응용은 희소식이 아닐 수가 없다. 전세계 거의 모든 국가가 이미 사생활 보호법 및 개인정보 보호법을 제정해 이런 민감한 의료정보에 대해서 연구자 및 기술 기반의 회사들의 접근에 대해 큰 제약을 두고 있기 때문이다.
실제, 2016년에 발생한 영국 국립 보건 서비스(NHS)는 적합한 동의절차 없이 160만 명의 환자 정보를 구글의 자회사인 딥마인드(DeepMind)에 제공해 큰 논란이 된 적도 있었다. (여기에는 환자의 이름과 성병 유무 정보까지 포함되어 있었다.)
2001년 인간유전체 지도가 완성된 이후 개인이 유전체를 확보하는데 들어가는 비용은 계속 낮아져 10년 전에는 100억원 정도 지불해야 했지만 지금은 100만원이면 가능하게 되었다. 이 비용도 앞으로 3~5년안에 10만원까지 지속적으로 낮아질 것으로 보고 있다. 이런 유전체 해독 기술의 발전에 힘입어 23andMe와 Ancestry 같은 회사가 서비스하는 DTC(Direct To Customer) 유전자 검사 서비스가 현재 약 1200만명이 서비스를 받았으며 그 수는 기하급수적으로 증가되고 있는 상황이다.
사실 이들 서비스를 자세히 들여다보면 뭔가 도움이 될 것 같으면서도 실질적으로는 나의 건강관리에 크게 도움이 되지 못하고 있다. 이를 보완하기 위해 계속해서 대규모의 유전체 및 표현형/임상 데이터베이스를 활용한 연구가 진행중에 있으나 아직 사생활 침해 및 개인정보 유출 위험에 완벽히 안전하지 못한 것이 현실이다. 실제 대규모 유전체 연구 중의 하나인 eMERGE 네트워크 유전체 연구그룹에서는 참여자 1만3000명을 대상으로 설문을 해보니 그 중 86% 정도는 자신의 유전정보를 연구자가 잘못 사용할 수 있는 가능성에 대해서 그리고 약 50% 정도는 사생활 침해 가능성에 대해서 걱정을 했다는 설문 결과도 있다.
게다가 23andMe 같은 회사는 자신들이 개인으로부터 확보한 유전체 데이터를 소유하고 있으면서 데이터를 자신들의 목적에 따라 연구자에게 제공하거나 제약사 및 회사에 수백만 달러에 판매하고 있으나 사용자 입장에서는 어떤 인센티브도 존재하지 않아 이들 1200만명 중 과학 연구에 자발적으로 참여하는 사람들은 극히 드문 것이 현실이다.
개인 유전체 분야의 잠재력은 많은 사람들이 자신의 유전체 정보를 확보함으로써 미래에 자신에게 닥칠 수도 있는 질병의 위험에 대해서 예방하거나 개선방법을 찾는 것과 함께 이 데이터들이 수십만~수백만 개가 축적되어 기존의 질병의 진단 및 치료제 개발에도 이용될 수 있다는 것이다.
여기에 네불라는 블록체인 기반의 유전체 데이터 공유 및 분석 플랫폼을 제공해 소비자가 자신의 유전체 데이터를 자신만 소유하게 되고 자신의 통제하에 원하면 안전하게 연구목적으로 또는 데이터가 필요로 하는 연구자나 기업에 판매할 수 있게 중개하는 역할을 하겠다는 것이다. 또 전장 유전체 해독(WGS, Whole genome sequencing) 및 전장 엑솜 해독(WES, Whole exam sequencing)을 제공함으로써 제노타입 정보만 제공하는 기존 회사들과 차별화를 꾀했다(전장 유전체는 약 3Gb 의 23쌍 염색체 정보, 전장 엑솜은 단백질을 만드는 중요 유전자 정보, 제노타입은 특정 변이 정보만을 확인 하는 단위).
많은 사람들이 개인정보 유출에 대한 위험성 때문에 자신의 유전체 데이터를 가지는 것을 꺼려했지만 이처럼 자신의 데이터를 암호화해 안전하게 연구자나 제약회사와 같은 기업에 판매할 수 있는 조건이 갖추어진다면 당장 희귀질환 연구와 이들 치료법을 개발하는데 크게 도움이 될 것으로 보인다. 또 자신의 데이터를 팔기를 원하지 않는 사람들은 데이터를 공유하지 않고 자신의 데이터를 확인하는 목적으로도 서비스가 가능하며, 유전체 정보를 가진 사람이 가지고 있는 키코드를 사용하여 모든 거래를 기록할 수 있어 구매 및 판매된 모든 유전체 데이터들은 블록체인에 기록된다.
그리고 네불라에서 발행하는 토큰은 비트코인이나 다른 암호화 화폐 같이 가치가 축적되거나 올라가는 것이 아닌 데이터 거래를 위한 도구로만으로 활용될 가능성이 높다고 발표해 가치가 크게 오르락내리락 하고 있는 암호화 화폐로의 비트코인보다는 거래가 추적 가능하고 안전하게 자신의 데이터를 분산 장부에 보관하는 블록체인의 본연의 기술에 집중할 것으로 보인다.
이 토큰이 비트코인처럼 거래되지는 않지만 시퀀싱 비용이 낮아짐에 따라 토큰의 가치도 떨어질 수도 있고 데이터 구매자가 많이 늘어나면 그 가치도 같이 올라갈 수 있는 부분은 분명히 있어 보인다. 결국은 시퀀싱 비용이 감소하면 더 많은 사용자들이 데이터를 확보하게 되고 더 많은 구매자가 이들 데이터를 활용하고자 할 테니 더 큰 규모로 성장할 가능성은 분명히 있어 보인다.
데이터 구매자는 데이터를 직접적으로 소유할 수 없으며 단지 대출하는 형태로 일시적으로 접근해 데이터를 사용해 분석하고 결과를 얻을 수 있지만 실제로는 입력된 유전체 코드 정보를 볼 수 없도록 한 특정 암호화 기술을 사용하고 있으며 계산 및 분석이 모두 끝나면 정보에 대한 접근도 모두 차단된다. 이것과 관련하여 개략적인 네불라의 블록체인 기반의 유전체 암호화 및 공유 관련 개략적인 기술 백서 문서(white paper)를 공개하기도 했다.
간단하게 데이터의 제공 및 구매과정을 소개하자면 다음과 같다. 개인들은 처음에 네불라로부터 토큰을 구입해 유전체를 해독해 확보하고 익명으로 네불라 네트워크를 통해 자신의 유전체 데이터를 공유하고 회사가 요청하는 설문조사를 마치면, 회사는 개인에게 약속한 토큰을 지불하며 개인은 이 토큰을 현금화할 수 있다. 구매자는 데이터에 따라 같은 가치의 토큰 및 차등을 주어 토큰을 지불하겠다고 할 수 있으며 설문 참여자가 데이터 구매자에 맞는 데이터를 제공한다면 높은 토큰 보상이 지급되며 그렇지 않다면 낮은 가치의 토큰 보상을 받게 될 것이며 거짓으로 응답을 할 경우 보상받지 못하게 되는 시스템으로 지불 시스템이 구축되어 있다.
모든 개인 식별 정보는 사용자가 제어하며 키코드, 장비 및 사용자 이름을 안전하게 관리하기 위해 블록체인을 사용하며, 사용자가 로그인을 하면 모두 익명으로 표시되며 앱 사용에 키코드를 사용할 수 있고 언제 어디서든 확인될 수가 있다. 키코드는 서명 및 암호화용이며 장치를 추가하거나 제거해야 할 때 변경이 가능하게 되어 있다.
네불라 프레임웍에서 데이터 구매를 원하는 회사가 특정 개인의 유전체 데이터를 사용하고자 요청하고 개인이 허가를 하게 되면 보안 기능이 추가적으로 작동되는데 이때 적용되는 기술은 개인의 유전체 데이터 구매 관련해 기록되는 특수 계산 서버를 통해 민감한 개인 데이터를 보호하기 위해 인텔의 SGX(Software Guard Extensions) 기술이 적용된다.
네불라는 6억원 정도의 펀딩을 확보했으며 추가 펀딩과 수개월 내에 몇몇 제약회사와 제휴해 6개월 안에 첫 정식 서비스를 진행하겠다고 발표했다. 네불라 이외에도 루나디엔에이(LunaDNA), 엔크립진(EncrypGen)과 같은 회사들이 암호화 기술을 이용해 유전체 데이터를 공유하는 모델로 연구자들이 접근할 수 있게 하고 있다.
이런 시도는 헬스케어와 유전체 기반의 과학연구의 근본적인 틀의 변화를 가져올 것으로 예상된다. 유전체 데이터 및 의료 정보의 활용에 있어 블록체인 기술의 접목은 신의 한 수가 될 것으로 보인다.
출처
- https://www.nature.com/articles/d41586-018-02641-7
- https://www.nebulagenomics.io/assets/documents/NEBULA_whitepaper_v4.52.pdf
- https://www.wired.com/story/guide-blockchain/?mbid=BottomRelatedStories
- http://www.thecrimson.com/article/2018/3/5/nebula-genomics-founded/
- https://www.wired.com/story/solve-genomics-with-blockchain/
- https://www.sciencedirect.com/science/article/pii/S0002929717300216
- https://www-01.ibm.com/common/ssi/cgi-bin/ssialias?htmlfid=GBE03790USEN
- https://techcrunch.com/2018/02/08/human-sequencing-pioneer-george-church-wants-to-give-you-the-power-to-sell-your-dna-on-the-blockchain/
- https://blockexplorer.com/news/nebula-genomics-blockchain-based-dna-data-sharing-and-analysis-platform/
- http://www.thecrimson.com/article/2018/3/5/nebula-genomics-founded/