바이오스펙테이터 노신영 기자
구글(Google)의 인공지능(AI) 프로그램 개발회사 딥마인드(Deep Mind)가 지난 22일(현지시간) 2만개 인간 단백질과 대장균, 효모, 초파리, 마우스 등 20종 유기체를 포함하는 35만개 단백질 구조의 데이터베이스, ‘알파폴드 단백질 구조 데이터베이스(AlphaFold Protein Structure Database)’를 공개했다.
단백질은 특정 아미노산 사이의 상호작용과 ‘접힘(folding)’을 통해 고유의 3차원 구조를 이루며, 이 구조를 기반으로 단백질의 기능과 작용기전이 결정된다. 그러나 아미노산 서열만으로 단백질의 구조를 예측하기에는 아미노산의 개수만큼 많은 상호작용 경우의 수가 존재해, 단백질의 3차원 구조를 계산하고 파악하는데 많은 시간과 비용이 필요했다. 때문에 현재까지 알려진 2억개가 넘는 단백질 중에서도 구조가 해명된 것은 극히 일부에 불과하다.
이러한 구조생물학적 난제인 ‘단백질 접힘 문제(protein folding problem)’를 해결하기 위해 개발된 AI가 바로 딥마인드의 ‘알파폴드(AlphaFold)’다. 딥마인드는 단백질 정보은행(Protein Data Bank, PDB)의 17만개 데이터베이스를 토대로 단백질의 아미노산 서열과 구조에 대한 딥러닝을 진행했으며, 이를 통해 아미노산 서열만으로 단백질의 구조를 거의 정확하게 예측할 수 있다고 설명했다.
딥마인드는 지난 15일 국제학술지 네이처(Nature)에 단백질 구조 예측 AI 프로그램 알파폴드의 연구논문을 게재했으며, 관련 소스코드를 공개했다(doi:10.1038/s41586-021-03819-2). 그 후 지난 22일, 딥마인드는 알파폴드를 활용해 예측한 단백질 3차원 구조 데이터베이스를 공개했다.... <계속>