- KAIST·국보연, 98.5% 확률로 식별하는 ‘XDAC’ 개발
생성형 인공지능(AI)의 발전으로 온라인 댓글을 이용한 여론 조작 우려가 커지는 가운데, KAIST 연구진이 한국어 댓글을 대상으로 한 AI 생성 여부 탐지 기술을 개발했다.
KAIST 전기및전자공학부 김용대 교수 연구팀은 23일 국가보안기술연구소와 협력해 한국어 AI 댓글 탐지 기술 ‘XDAC’를 개발했다고 밝혔다. 기존 탐지 기술은 주로 영어 기반의 장문 텍스트에 초점을 맞춰, 짧고 구어체가 많은 한국어 댓글에는 한계가 있었다.
연구진은 AI가 작성한 댓글과 사람이 작성한 댓글을 비교 분석한 결과, 인간 평가자 4명이 210개 댓글을 판별한 실험에서 AI 댓글의 67%를 사람이 쓴 것으로 착각했다고 밝혔다. 반대로 사람 작성 댓글을 제대로 구별해 낸 비율은 73%에 불과했다. AI 댓글은 문장 유창성이나 기사 맥락과의 관련성 측면에서 오히려 사람 댓글보다 높은 평가를 받기도 했다.
연구팀은 GPT-4o를 포함해 총 14종의 대규모 언어 모델(LLM)을 활용해 AI 댓글 생성 프레임워크 ‘XDAC’를 구성하고, 이 과정에서 수집된 일부 데이터를 벤치마크용으로 공개했다. 분석 결과, AI 댓글은 ‘∼것 같다’, ‘∼에 대해’와 같은 정형 표현과 접속어를 자주 사용하며, 특수문자는 이모지에 편중돼 있고 줄바꿈이나 공백 등 서식 문자는 거의 쓰지 않는 특징을 보였다.
반면 사람의 댓글은 ‘ㅋㅋㅋㅋ’, ‘ㅠㅠ’, ‘♡’와 같은 반복 문자와 한국어 자음 기반 특수기호를 다양하게 활용하며, 형식보다 감정 표현이 두드러졌다. 실제로 반복 문자를 쓰는 비율은 사람 댓글이 52%로, AI 댓글(12%)보다 4배 이상 높았다.
연구팀은 이러한 패턴을 모델에 학습시켜 댓글의 형식·내용적 특징을 정밀 분석하고, 최종적으로 98.5%의 정확도로 AI 댓글을 탐지할 수 있는 기술을 확보했다. 작성한 AI 모델의 종류까지 84.3% 확률로 식별 가능하다고 설명했다.
KAIST 고우영 선임연구원은 “댓글 작성 시각, 계정 정보, IP 등 메타데이터까지 결합하면 탐지 성능은 더 높아진다”며 “향후 AI를 이용한 여론 조작을 실질적으로 차단하는 데 기여할 수 있을 것”이라고 밝혔다.
김지윤 기자/ hello@sciencewave.kr
Science Wave에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.


