딥페이크 기술이 멸종위기종 보호 현장에 새로운 도구로 등장했다. 가짜 이미지를 만드는 기술이지만, 이를 활용해 부족한 연구 자료를 보충하고 희귀종 탐지 능력을 높이는 방식으로 보전에 기여할 수 있게 됐다.
최근 듀크대 연구팀은 개체 수가 400마리도 채 되지 않는 북대서양참고래처럼 영상 자료가 턱없이 부족한 종을 위해, 인공지능이 만든 합성 이미지를 학습 데이터에 보충하는 방안을 시험했다. 드론과 위성 촬영 영상에서 희귀종을 더 신속하고 정확하게 찾아내는 AI 탐지 모델의 성능을 높이는 것이 목표다.
데이터 부족을 메우는 합성 이미지
드론과 위성의 해상도와 촬영 빈도가 크게 향상되면서, 생태계 관측 데이터는 폭발적으로 늘고 있다. 하지만 AI가 특정 종을 인식하려면 다양한 환경과 각도에서 촬영된 대량의 예시 이미지가 필요하다. 흔한 종은 자료 확보가 쉽지만, 접근이 어려운 서식지나 극소수 개체만 남은 종은 여전히 데이터 부족 문제가 심각하다. 듀크대 해양로보틱스·원격탐사 연구실의 데이브 존스턴 소장은 “자료가 부족하면 모델의 탐지 정확도도 떨어진다”며 데이터 확충의 필요성을 강조했다.
연구를 이끈 헨리 선(Henry Sun)은 데이터 보강(data augmentation) 기법을 적용해, AI 합성 이미지로 실제 촬영 자료의 양과 다양성을 보완하는 실험을 진행했다. 이 연구는 캐나다우주국, 캐나다 수산해양부, 뉴브런즈윅대, 환경컨설팅그룹 해트필드 컨설턴츠(Hatfield Consultants) 등이 참여하는 참고래 위성 탐지 국제 프로젝트의 일부다.
합성 데이터의 가능성과 한계
연구팀은 이미지 생성에 ‘확산 모델(diffusion model)’을 활용했다. 이는 텍스트 설명, 예시 이미지, 혹은 둘을 함께 입력하면 해당 조건에 맞는 이미지를 만들어내는 최신 AI 기술이다. 선 팀은 텍스트 프롬프트만 사용한 경우, 이미지 프롬프트를 사용한 경우, 그리고 두 가지를 결합해 특정 작업에 맞게 모델을 미세 조정(fine-tuning)한 경우를 비교했다.
그 결과, 단순 프롬프트로 생성한 이미지는 지느러미가 여러 개 달리거나 몸이 합쳐진 형태 등 해부학적으로 부정확한 오류가 종종 나타났다. 반면 미세 조정 모델은 이러한 문제를 크게 줄였고, 구글 이미지 역검색 실험에서도 북대서양참고래와 혹등고래를 대부분 정확히 구분했다. 연구팀은 앞으로 이 합성 이미지가 실제 AI 탐지 모델의 성능을 얼마나 개선하는지 검증할 계획이다.
기술적 성과와 함께 윤리적 고려도 필요하다. 연구에 참여한 홀리 홀리스턴(영국 남극조사단·케임브리지대)은 “생성형 AI는 에너지와 물 사용량이 크기 때문에, 데이터 생성은 분명한 연구 목적이 있을 때만 제한적으로 활용해야 한다”고 말했다. 예를 들어 새끼 개체 자료가 극도로 부족한 경우처럼 데이터 불균형을 해소할 필요가 있을 때에만 합성 데이터를 추가하는 것이 바람직하다는 것이다.
선은 올해 가을부터 듀크 해양연구소 박사과정에 진학해 연구 대상을 고래에서 성게로 옮기지만, AI 활용 역량을 자연과학자들에게 확산하는 활동을 이어갈 계획이다. 존스턴 소장은 “컴퓨터과학과 환경과학의 접점은 앞으로 더 넓어질 것이며, 이런 융합이 멸종위기종 보호의 새로운 해법이 될 수 있다”고 말했다.
김지윤 기자/ hello@sciencewave.kr
참고 논문: Kasim Rafiq et al, Generative AI as a tool to accelerate the field of ecology, Nature Ecology & Evolution (2025). DOI: 10.1038/s41559-024-02623-1
자료: Nature , Nature Ecology & Evolution
Science Wave에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.


