AI 핵전쟁 위험 경고, 미군 중동 공습 투입된 AI의 위험한 선택 시나리오

Photo of author

By 사이언스웨이브

최근 미군이 중동 내 보복 공습 과정에서 표적 식별을 위해 인공지능을 투입했다는 소식이 전해지면서, 군사 분야의 기술 도입이 실제 AI 핵전쟁 위협으로 이어질 수 있다는 연구 결과가 큰 주목을 받고 있습니다. 조지아 공과대학교와 스탠퍼드 대학교 공동 연구진은 시뮬레이션을 통해 AI가 외교적 위기 상황에서 인간보다 훨씬 공격적인 결정을 내리며, 최악의 경우 AI 핵전쟁 시나리오를 현실화할 수 있다는 구체적인 증거를 제시했습니다.

출처: Unsplash/CC0 퍼블릭 도메인

8개 국가의 가상 전쟁: 협상보다 ‘선제공격’ 택한 AI 지도자들

연구진은 8개의 가상 국가가 존재하는 환경에서 GPT-4, Llama 2, Claude 등 5가지 주요 대규모 언어 모델(LLM)을 국가 지도자로 설정하고 21번의 독립적인 게임 시나리오를 진행했습니다. 실험 결과, 모든 AI 모델은 갈등 상황에서 군사적 역량을 급격히 강화하고 예측하기 어려운 방식으로 전쟁 수위를 높이는 행동을 보였습니다. 특히 인간 지도자라면 선택하기 힘든 급진적인 선제공격 옵션을 AI는 갈등 초기 단계에서 빈번하게 선택하며 게임 내 상황을 순식간에 악화시켰습니다.

“핵무기를 가졌으니 사용해야 한다” AI가 내놓은 충격적 논리

시뮬레이션 과정에서 일부 AI 모델이 핵 공격을 결정하며 내놓은 설명은 더욱 충격적입니다. GPT-4 기반의 한 AI 에이전트는 핵 공격을 감행한 후 그 이유에 대해 “우리는 핵무기를 가졌으며, 그것을 사용하고 싶다(we have it, let’s use it)” 혹은 “많은 국가가 핵무기를 보유하고 있으니, 우리가 먼저 사용하는 것이 평화를 되찾는 길이다”라는 식의 논리를 전개했습니다. 이는 AI가 핵무기의 파괴적 결과에 대한 윤리적 판단보다는 단순히 보유한 수단을 최우선으로 활용하려는 경향이 있음을 보여줍니다.

[사진=Midjourney 생성 이미지]

예측 불가능한 알고리즘: 상황에 따라 급변하는 AI의 행동

이번 연구는 AI 모델이 특정 상황에서 얼마나 일관성 없게 행동할 수 있는지도 보여주었습니다. 연구진은 동일한 모델이라도 상황의 미묘한 변화에 따라 매우 다른 결정을 내린다는 점을 발견했습니다. 이는 군사적 위기 상황에서 AI의 행동을 인간이 미리 예측하거나 통제하는 것이 얼마나 어려운지를 시사합니다. AI 에이전트들은 갈등을 완화하기 위한 외교적 제안보다는 군사 장비를 증강하거나 적대적인 태도를 취하는 방향으로 알고리즘이 편향되어 작동하는 모습을 보였습니다.

21번의 실험이 남긴 교훈: AI의 행동을 항상 예측할 수 없다

비록 이 실험은 단 21개의 게임으로 제한되었지만, 연구자는 논문에서 지적했듯이 “한 상황에서 안전하게 통제된 것처럼 보이는 모델도 다른 상황에서는 매우 다르게 행동할 수 있다”며 인공지능의 행동을 항상 예측할 수 없다는 점을 일깨워주는 유익한 연구 결과라고 결론지었습니다. 실제 전장에서의 표적 식별을 넘어 전략적 의사결정까지 AI에 맡길 경우, 인류는 통제 불가능한 확전의 위험에 직면할 수 있다는 경고입니다.


[알아두면 좋은 용어]

  • LLM 에이전트: 대규모 언어 모델을 특정 역할(예: 국가 지도자)을 수행하도록 설정한 가상의 행위자입니다.

손동민 기자 / hello@sciencewave.kr

자료: arXiv.org

제공: 사이언스웨이브 (https://sciencewave.kr)


Science Wave에서 더 알아보기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

댓글 남기기

Science Wave에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기