바이오스펙테이터 김성민 기자
인공지능(AI) 기반 암 영상진단 기술이 전문의보다 유방촬영술 기반의 유방암 선별검사에서 더 우수한 성적을 낼 수 있을까? 현재 상용화된 인공지능(AI) 기반 유방암 진단 분석 솔루션의 성능을 직접 비교한 연구 결과가 첫 발표됐다. 주목할 부분으로 국내 기업 루닛(Lunit)의 제품이 가장 높은 성능을 보였으며, AI 분석 기술과 전문의의 판독이 합쳐졌을 때 가장 많은 유방암 양성 케이스를 찾을 수 있었다.
이번 연구를 주도한 기관은 스웨덴 왕립 카롤린스카 연구소(Karolinska Institute)의 프레드릭 스트랜드(Fredrik Strand) 박사 연구로 외부 기관에서 독립적으로 진행한 결과라는데 의미가 있다. 카롤린스카 연구소는 노벨 생리학상, 노벨 의학상을 선정하는 노벨위원회로도 잘 알려져 있다.
해당 연구 내용은 지난 27일 미국의학협회 종양학 학술지(JAMA Oncology)에 발표됐다(doi: 10.1001/jamaoncol.2020.3321). JAMA Oncology는 암분야 세계 최고 수준의 의학 저널이다.
이번 논문에서는 유방촬영술을 이용한 유방암 선별검사에 있어 인공지능이 유방암을 얼마나 정확히 분석해내는지를 연구했다. 여러 개의 유방촬영술 AI 진단 알고리즘을 독립적으로 평가한 첫 연구이며, 루닛을 비롯해 상용화된 3개 기업의 알고리즘이 분석에 포함됐다.
이번 연구를 총괄한 프레드릭 스트랜드 박사는 “현재 상용화된 AI 알고리즘이 얼마나 정확한 유방 영상 진단을 할 수 있는지 확인한 의미있는 연구였다”며 “루닛과 같이 높은 정확도를 보이는 알고리즘의 경우, 향후 전향적 임상시험에서 독립적인 판독을 할 수 있는 가능성도 있을 것”이라고 밝혔다.
연구는 지난 2008년부터 2015년까지의 검진 대상자 영상을 기반으로 진행된 본 연구는 8805개의 유방촬영술 데이터를 대상으로 했다. 총 8년간 축적된 실제 검진 데이터를 활용한 연구라는 점은 연구 결과의 신뢰성을 보다 높일 수 있는 요소 중 하나다. 서범석 루닛 대표는 “연구를 주도한 프레드릭 스트랜드 박사와 2017년부터 본 연구에 대한 구체적인 논의를 시작했으며, 루닛 알고리즘을 활용해 연구할 수 있게끔 알고리즘을 제공해왔다"고 설명했다.
이 중 알고리즘 AI-1(루닛)은 정확도(AUC) 지수에서 0.956을 기록해 다른 알고리즘보다 통계적으로 유의미한(p<0.001) 차이를 보이며, 가장 우수한 알고리즘으로 입증되었다.
유방암 환자를 정확하게 찾아내는 민감도(sensitivity) 지표에서도 루닛 제품은 다른 알고리즘과 큰 격차를 보였다. 연구에 따르면 AI-1(루닛) 알고리즘의 민감도는 81.9%로, 각각 67%, 67.4%를 기록한 다른 두 개의 알고리즘과 비교해 월등히 우수한 성적을 보였다. 특히 이중판독 환경에서 1차 판독의들이 기록한 77.4% 보다도 높은 수치였다.
루닛 알고리즘과 1차 판독의의 판독 결과를 결합했을 때 가장 높은 민감도가 나타났으며(88.6%), 특이도(specificity)는 93.0%였다. 이는 영상의학과 전문의가 두 차례에 걸쳐 판독한 수치(80.1%)보다 높은 수치다.
한편 해당 AI ‘루닛 인사이트 MMG(Lunit INSIGHT MMG)’ 제품은 식약처 허가 및 유럽 CE 인증을 획득해 국내외 헬스케어 기관 등에서 사용되고 있다.