남궁석 SLMS(Secret Lab of Mad Scientist) 대표
2020년 CASP14에 참가한 참가자 중에는 다른 참가자들과 비교하기 힘들 정도의 정확도로 단백질 구조를 예측한 참가그룹이 있었다. CASP14에 참가한 다른 참가자, 심지어 CASP13의 알파폴드의 단백질 구조 예측 결과는 실험적으로 결정된 구조와는 상당한 수준의 오차를 가지고 있던 것이 보통이었다.
그러나 이 정체불명의 참가자의 예측 결과는 실험적으로 결정된 구조와 탄소 골격 기준으로 1옹스트롬 이내의 오차를 보였고 이것은 실험적인 구조 결정에서 나타나는 수준과 크게 다르지 않은 결과였다. 즉 CASP14에 참가한 참가자 중에는 아직 구조가 알려지지 않은 단백질을 실험 결과에 비견할 수준으로 예측할 수 있는 참가자가 있었다는 것이고, 대회 관계자들은 딥마인드의 알파폴드 신 버전으로 예상하였다.
2020년 12월 CASP14의 결과가 공개되었고, 예상대로 그 예측의 주인공은 딥마인드의 새로운 단백질 구조 예측 시스템인 알파폴드2였다. 알파폴드2는 CASP13과 마찬가지로 다른 경쟁그룹보다 훨씬 정확한 예측을 보였다. 그러나 알파폴드2의 예측 수준은 다른 경쟁 그룹과 차원을 달리하였다.
예측 결과를 표준점수로 환산한 종합 점수에서 알파폴드2는 244.02점을 기록하여 1위를 기록하였다. 그 다음의 두 그룹은 워싱턴대 베이커 연구실과 미시건대 장 연구실의 예측 시스템으로서 각각 90.82점과 88.96점을 기록하였다. 다른 대부분의 경쟁 그룹이 90점 내외의 점수를 기록하는 경쟁에서 혼자 244점이라는 압도적인 점수를 얻은 것이다. 100m 경주의 예를 들자면 다른 참가선수들이 11-12초 대 정도를 기록하는 상황에서 혼자 9초대의 세계 신기록을 수립하는 수준의 격차를 보여준 셈이다.
이들의 예측을 실험 구조와의 차이로 비교하면 더욱 그 차이가 명확해졌다. 알파폴드2의 예측 구조를 실험 구조와 비교하면 예측 구조와 실험 구조의 단백질 골격간의 거리의 차이는 0.96 옹스트롬(신뢰구간 0.85-1.16 옹스트롬) 정도의 차이였고, 이는 그 다음으로 정확한 예측의 경우 2.8 옹스트롬(신뢰구간 2.7-4.0 옹스트롬) 정도의 오차를 보인 것에 비해서 현격한 차이를 가지고 있었다. 이를 조금 더 쉽게 설명한다면, 알파폴드 2를 제외한 다른 그룹의 예측은 대략적으로 단백질 구조의 생김새는 닮게 묘사하였지만 세부적인 디테일로 들어가면 상당한 오차가 있는 수준이지만, 알파폴드2의 예측은 실험적으로 규명된 구조의 예측과 거의 차이나지 않는 정밀도였다. 특히 단백질의 전체적인 구조뿐만 아니라 개별적인 아미노산의 사이드 체인까지 실험 구조와 거의 차이나지 않을 정도로 정확히 예측이 가능했다.... <계속>