AI 신약 설계, 물리학 계산 반영해 예측 정확도 향상

Photo of author

By 사이언스웨이브

AI는 이제 단백질 구조를 예측하고 신약 후보를 제안하는 단계에 이르렀다. 하지만 데이터에만 의존한 모델은 종종 실제 화학 법칙과 맞지 않는 구조를 예측한다. 단백질 구조 예측 시스템 알파폴드(AlphaFold) 역시 훈련 데이터에서 벗어난 분자에 대해 물리적으로 불가능한 형태를 제시한 사례가 있다. 통계적 패턴 학습만으로는 분자의 안정성과 물리적 타당성을 보장하기 어렵기 때문이다.

이 한계를 해결하기 위해 미국 캘리포니아공과대(칼텍)의 애니마 아난드쿠마르(Anima Anandkumar) 연구진은 물리학의 기본 원리를 학습 과정에 통합한 신약 설계 AI ‘뉴클리어스디프(NucleusDiff)’를 개발했다.

이 모델은 데이터 중심 접근에 물리적 제약을 더해, 예측된 분자 구조가 실제 화학적으로 가능한 범위 안에 있도록 설계됐다. 연구 결과는 미국국립과학원회보(PNAS) 특별호 ‘화학에서의 머신러닝(Machine Learning in Chemistry)’에 게재됐다.

이 그림은 AI 모델 NucleusDiff가 분자 구조를 예측하는 과정을 단계별로 단순화해 보여준다. A는 원자핵을 중심으로 전자 구름이 형성된 단일 원자를, B는 여러 원자가 결합해 전자 구름이 겹치며 형성된 분자 전체의 윤곽, 즉 매니폴드를 나타낸다. C에서는 이 매니폴드 위에 격자점(mesh point)을 두어 원자 간 거리와 반발력을 계산하고, 비물리적인 충돌을 피한다. D는 NucleusDiff의 작동 흐름으로, 전자 구름과 원자핵을 확산(diffuse)시킨 뒤 노이즈 제거(denoise) 단계를 통해 실제 가능한 분자 구조로 수렴시키는 과정을 보여준다. 결국 분자 내부의 전자 분포와 공간 제약을 함께 고려해, 물리적으로 가능한 범위 내에서 안정적인 신약 후보 구조를 예측한다. [사진=Caltech / PNAS]

물리 제약으로 비현실적 예측 제거

NucleusDiff는 단백질 표적과 결합할 분자(리간드)의 3차원 구조를 예측할 때, 원자 간 거리를 엄격히 제약해 비물리적 충돌을 원천적으로 차단한다. 기존 모델들이 결합 친화도 데이터에만 의존해 원자 간 반발력이나 거리 한계를 고려하지 못한 반면, NucleusDiff는 학습 과정에 직접 물리적 제약 함수를 포함시켜 분자 구조가 화학적으로 가능한 범위 안에서만 생성되도록 했다.

모든 원자 쌍을 계산하지 않고, 전자 밀도를 근사한 매니폴드(manifold)를 설정해 그 표면의 기준점에서 거리 조건을 평가함으로써 계산 효율을 유지했다. 이 방식은 불필요한 연산을 줄이면서 구조의 공간적 일관성을 확보해, 예측된 결합 형태가 실제 실험 데이터에 근접하도록 개선했다. 결과적으로 모델은 기존 딥러닝보다 결합 예측의 정밀도가 높고, 원자 충돌은 거의 관찰되지 않았다.

AI가 분자 구조를 예측할 때 원자 간 거리 제약을 적용하는 과정을 시각화한 이미지. 반투명한 분자 구조 위에 원자핵과 전자 구름이 겹쳐 있으며, 격자점(mesh point)과 데이터 흐름선을 통해 물리적 거리 계산이 표현돼 있다. [사진=Midjourney 생성 이미지]

신뢰 가능한 AI, 물리학에서 답을 찾다

연구진은 약 10만 개의 단백질–리간드 복합체를 포함한 CrossDocked2020 데이터셋으로 NucleusDiff를 학습시켰다. 100개의 복합체를 대상으로 검증한 결과, 기존 모델보다 결합 친화도 예측이 정밀했고 원자 충돌 발생률은 거의 0에 수렴했다. 코로나19 치료제 표적 단백질인 3CL 프로테아제(3CL protease)에 대한 추가 실험에서도 충돌률이 기존 대비 약 3분의 2 수준으로 줄었다.

이번 연구는 칼텍의 ‘AI4Science’ 프로젝트의 일환으로, 데이터 중심의 인공지능에 물리학적 제약을 결합하려는 시도의 하나다. 아난드쿠마르는 “머신러닝은 훈련 데이터 안에서는 정밀하지만, 새로운 영역에서는 불안정하다”며 “물리학의 원리를 결합하면 완전히 새로운 분자 설계에서도 훨씬 신뢰할 수 있는 결과를 얻을 수 있다”고 설명했다. AI가 단순한 패턴 인식에서 벗어나 실제 자연 법칙을 학습하기 시작했다는 점에서, 이번 연구는 과학적 인공지능의 방향 전환을 보여준다.

김지윤 기자/ hello@sciencewave.kr

참조 논문: Shengchao Liu et al, Manifold-constrained nucleus-level denoising diffusion model for structure-based drug design, Proceedings of the National Academy of Sciences (2025). DOI: 10.1073/pnas.2415666122

자료: Proceedings of the National Academy of Sciences /  California Institute of Technology 


Science Wave에서 더 알아보기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

댓글 남기기

Science Wave에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기