바이오스펙테이터 노신영 기자
인공지능(AI) 기술의 수요는 제약과 의료부문에서 점점 높아지고 있다. 이러한 AI 모델들의 학습을 위해서는 풍부한 데이터를 확보하는 것이 가장 중요한 관건이며 이로 인해 자유로운 데이터 공유에 대한 수요도 덩달아 증가하는 추세다. 그러나 반대로 데이터의 민감성, 프라이버시에 대한 높아진 사회적 요구는 이를 방해하는 장애물로 작용하고 있다. 일반인의 개인정보가 포함되거나, 데이터 유출 우려 등은 데이터 공유를 어렵게 만드는 요인이다. 때문에 데이터를 서로 공유하거나 노출하지 않으면서 AI모델의 학습을 진행할 수 있는 '연합학습(Federal Learning)' 기술이 대안으로 떠오르고 있다.
이같은 가운데 예종철 카이스트 교수는 지난 19일 서울 소공동 롯데호텔에서 개최된 ‘제약바이오 AI혁신포럼’에서 연합학습(Federal Learning, FL) 기술과 의료데이터 기반의 활용 사례를 소개했다.
의료 데이터는 환자를 특정할 수 있는 정보를 다루기 때문에 데이터를 공유하는데 훨씬 민감할 수밖에 없다. 예를 들어 진단을 위한 뇌 엑스레이(X-ray) 사진이나 자기공명영상(MRI) 자료 등의 경우 데이터에 환자의 얼굴, 신체정보 등이 그대로 노출되기 때문에 원천적으로 가명화, 익명화가 어렵다.
의료계에서는 이를 극복하기 위해 환자정보, 의료차트 등 독립적으로 수집된 병원자료를 공통데이터모델(Common Data Model, CDM)이라는 통일된 형태로 변환해 공유하고 있다. CDM는 피더넷(FeederNet)이라는 플랫폼을 통해 관리되고 있으며, 수집된 데이터를 토대로 통계분석, 빅데이터 기반 AI연구 등을 빠르게 수행할 수 있다.... <계속>