바이오스펙테이터 이은아 기자
빅데이터가 제4차 산업혁명의 물결을 타고 국내 제약산업에도 침투하고 있다. 제약산업에서 빅데이터는 신약 후보물질 탐색부터 판매, 마케팅까지 제약산업 가치사슬과 연계된 모든 데이터를 일컫는다. 논문과 특허, 유전자 정보, 라이프로그, 임상시험 결과, 환자데이터, 제품데이터 등이 해당된다. 쏟아지는 방대한 데이터를 어떻게 축적하고 활용하느냐에 따라 향후 제약산업 성공 여부가 달려있다는 주장도 제기되고 있다.
지난 27일 제약산업에서 빅데이터 활용방안과 발전방향을 모색하기 위해 서울 중구 코리아나 호텔에서 ‘Pharma 4.0 미래 전략 포럼’이 개최됐다.
◇ 인공지능으로 신약후보물질 확보 6개월로 단축
김영훈 파미노젠 대표는 “인공지능(AI) 기반으로 빅데이터를 활용하면 타깃을 선정해 신약 후보물질 발굴까지 걸리는 기간을 5년에서 6개월로 단축시킬 수 있다”고 설명했다. 기존에 신약 후보물질을 도출하기 위해서는 무작위로 여러 화합물을 스크리닝 하거나 논문과 특허 자료를 찾아보면서 수많은 시행착오를 거쳐야했지만 인공지능을 활용하면 개발기간을 획기적으로 단축시킬 수 있게된다.
김 대표는 “신약개발 과정에서 비임상과 임상시험 단계는 정규화된 프로토콜로 소요기간을 단축하기 어렵다”면서 “개발 초기인 후보물질도출과 약물최적화 단계에서 시행착오를 줄이는 것이 신약개발의 경쟁력”이라고 말했다. 인공지능과 빅데이터를 통해 효율적인 후보물질 확보전략이 필요하다는 해석이다.
그는 “AI로 합리적이고 신속한 의사결정으로 개발기간 뿐만 아니라 비용도 최소화시킬 수 있다”고 자신했다.
인공지능은 정보를 통해 학습되면 전문가처럼 판단과 정의를 스스로 내린다. 제약산업에서 인공지능은 질환 단백질, 약물구조 활성, 약물의 체내 약동학, 독성학 연구결과, 유전체 정보 등 데이터를 통해 5000가지 이상 표현자 정보의 조합으로 학습시키고 최종적으로 후보 약물의 기능과 효력을 판단할 수 있도록 응용된다.
인공지능 기반 빅데이터는 약물재창출에도 활용된다. 학습된 인공지능으로 화합물을 구조적으로 접근해 해당 약물의 활성과 대사활성을 예측할 수 있다. 결과적으로 다양한 표적과 적응증에서 효력을 나타낼 수 있다는 판단도 가능하게 된다. 약물로 개발 가능한 천연물 추출 화합물도 발굴할 수 있다. 식물의 특징, 질병, 성분, 타깃 등의 정보를 디지털화하고 분류한다면 가능한 일이다.
김 대표는 “현재까지 알려진 질병 타깃 수만 2600여개이고, 구매 가능한 화합물의 수도 200억 개다. 전체 데이터 세트에서 같은 데이터를 어떻게 자르고 입력하는지에 관한 노하우가 곧 인공지능의 성능을 결정하게 될 것”이라고 조언했다.
◇ 의약품 개발, 허가, 마케팅 전략 패러다임 전환될 것
실제 진료·처방 데이터를 활용해 제약회사의 영업 및 마케팅 전략수립도 가능하다. 건강보험이 적용된 진료와 처방의 적정성을 평가하는 건강보험심사평가원(심평원)에는 연간 4600만명의 9억건의 진료 명세서가 축적돼 있다.
이홍기 코아제타 대표는 “우리나라는 EMR 데이터와 건강보험 청구내역 데이터가 잘 정형화 돼있어 이를 활용하면 산업적, 상업적으로 의미가 크다”면서 “실제 근거 중심 빅데이터로 신약 연구개발, 마케팅, 영업전략 수립이 가능하다”고 말했다. 근거 중심의 경영으로 제약산업의 새로운 패러다임이 전환될 수 있다는 점을 시사한다.
코아제타는 심평원이 제공하는 대량의 전수데이터를 36단계 층화로 나눠 전체의 3%에 해당하는 145만명의 진료·처방 데이터를 표본추출해 제약사들이 원하는 정보로 재가공해 서비스를 제공한다.
그는 “제약사에서 알고싶어 하는 정보는 환자가 어떤 질환으로 어떻게 진료 받았는가이다”면서 “근거 중심의 데이터를 활용해 기존에는 알 수 없었던 항암제와 바이오의약품 같은 원내 처방 정보도 알 수 있다”고 말했다.
실제 처방기록에 근거한 데이터이므로 특정 약물에 대한 처방 유지율도 분석할 수 있다. 지역별, 환자 특성별 처방실적을 통해 효율적인 영업·마케팅 전략 수립도 가능하다.
처방 데이터는 신규 복합제 발굴에도 이용된다. 당뇨, 고지혈증, 고혈압 등 동반질환이 있는 경우 다양한 병용처방시 개선되지 않는 수치를 파악해 필요한 신약 시장성도 파악할 수 있다. 환자의 혈압, 혈당 LDL 수치 등의 추이분석도 가능해 약물 조합의 유용성과 부작용도 모니터링 할 수 있다.
이 대표는 “데이터 신뢰도가 극대화되면 신약개발과 마케팅 전략 뿐만아니라 신약 허가 과정도 바뀔 수 있다”고 자신했다. 신규 복합제의 경우 기존 약물들로부터 실제 환자에서 효능과 부작용 데이터를 사전에 분석·평가할 수 있기 때문에 불필요한 임상시험을 최소화 할 수 있다는 설명이다. 나아가 막대한 비용이 드는 임상3상 시험 없이 개별 약제와 임상1상 시험에서 PK 동등성을 입증한다면 신규복합제가 허가될 가능성도 있다.
그는 “인공지능과 머신러닝으로 근거 중심의 빅데이터를 분석하면 의약품 개발, 허가의 패러다임이 전환될 것”이라며 “앞으로 산업계에서 실질적으로 사용할 수 있는 공공컨텐츠를 만드는게 새로운 빅데이터 비즈니스의 핵심이다”고 덧붙였다.
이어서 빅데이터 활용을 위한 당면과제에 대해서도 설명했다. 그는 “빅데이터를 활용한 서비스를 만들 때 데이터의 오류를 잡아내고 완결성을 갖추는 부분이 가장 어렵다”면서 “빅데이터와 제약산업 모두에 대한 이해도가 깊은 전문인력이 부족하고, EMR(전자의무기록) 데이터의 표준화 구축에 대한 제도적 지원이 필요하다”고 제언했다.