- 실시간 재난복구·4중 백업 체계로 보존 가능
9월 26일 밤 대전 국가정보자원관리원 전산실에서 화재가 발생해 정부 주요 업무 시스템 647개가 동시에 중단됐다. 데이터는 실시간 재난복구(DR) 체계에 따라 백업돼 소실 위험은 크지 않은 것으로 파악됐지만, 서비스는 장시간 정상화되지 않았다. 이번 사태는 국가 전산망이 데이터 보존 능력은 갖추고도 서비스 연속성에는 취약하다는 사실을 드러냈다.
국정자원이 운영하는 프라이빗 클라우드 ‘G-클라우드 존’은 최대 4중화 백업을 지원해 서버가 손상되더라도 외부 저장소에서 데이터를 복원할 수 있다. 그러나 데이터 보존과 서비스 연속성은 별개의 문제다. 전원 차단, 장비 점검, 애플리케이션 재기동, 연계 시스템 동기화가 완료되지 않는 한 서비스는 작동하지 않는다. 실시간 백업이 곧바로 무중단 복구를 의미하지 않는다는 점이 확인됐다.

이번 장애는 정부24, 주민등록, 민원 처리, 우체국 금융 등 국민 생활과 직결된 서비스에 직접적 차질을 가져왔다. 데이터가 보존돼 있더라도 국민이 이용할 수 없는 상태라면 행정은 정지된 것이나 다름없다. 단일 거점의 장애가 국가 행정 전반을 중단시킬 수 있다는 사실이 드러났다.
화재 원인으로는 무정전전원장치의 리튬이온 배터리 발화 가능성이 제기됐다. 리튬이온 배터리는 효율성이 높지만 화재 위험도 크다. 대규모 데이터센터에서 사용되는 만큼 안전 설계와 관리 체계의 적정성은 검증이 필요하다. 행정안전부는 대전·대구·광주 3개 센터에 재해복구 체계를 갖췄다고 밝혔지만, 일부는 저장소만 보유하거나 제한적인 백업만 운영하는 수준에 그친 것으로 알려졌다. 이 때문에 ‘실시간 복구’라는 설명은 저장소 차원에 국한됐으며, 서비스 무중단 전환과는 거리가 있었다.

반복되는 대형 장애, 공공 민간 근본적 대책 없어
이번 화재는 국내에서 반복돼 온 다른 대형 장애와도 닮아 있다. 2018년 KT 아현지사 화재는 지하 통신구에서 불이 나면서 서울 서북권 일대의 인터넷과 유·무선 통신이 동시에 끊겼다. 이로 인해 카드 결제와 은행 업무가 중단되고, 소상공인의 영업에도 직접적 피해가 발생했다. 당시에도 단일 거점 장애가 광범위한 생활·경제 기능을 정지시켰다는 점에서 사회적 충격이 컸다.
2022년 SK C&C 판교 데이터센터 화재 역시 유사한 양상을 보였다. 해당 센터는 카카오와 네이버 등 국내 주요 인터넷 플랫폼이 입주해 있었는데, 화재로 냉각 설비와 전력 공급이 중단되면서 카카오톡, 카카오페이, 카카오T 등 일상 생활 기반 서비스가 수 시간 이상 마비됐다. 메신저, 결제, 교통, 콘텐츠 서비스가 동시에 멈추자 국민 다수가 직접 불편을 겪었고, 국회와 정부 차원의 대책 논의로 이어졌다.
이번 국가정보자원관리원 화재도 마찬가지다. 단일 시설의 장애가 곧 전국적 행정망의 중단으로 직결됐고, 국민 생활 전반에 파급 효과가 나타났다. KT 아현, SK C&C 판교, 그리고 이번 국정자원까지, 대형 인프라가 화재와 같은 단일 사고에 취약하다는 사실은 여러 차례 확인됐지만, 공공과 민간 모두 근본적 개선책을 마련하지 못했다는 점이 공통적이다.
해외 사례와 비교하면 차이는 더욱 뚜렷하다. 구글, 아마존웹서비스(AWS) 등 글로벌 클라우드 사업자는 하나의 지역(region) 안에서도 여러 가용영역(Availability Zone, AZ)을 물리적으로 분리해 운영한다. 예를 들어 동일한 서비스가 2개 이상의 데이터센터에서 동시에 활성화(액티브-액티브) 상태로 돌아가도록 설계돼, 한 거점이 정전이나 화재로 마비되더라도 다른 거점이 곧바로 업무를 이어받는다. 이 구조는 단순히 데이터 저장소만 복제하는 수준이 아니라, 애플리케이션 서버, 네트워크, 로드밸런싱까지 이중화해 서비스가 끊기지 않는 것이 특징이다.

반면 국내 공공 전산망은 대부분 스토리지(저장소) 중심의 이중화에 머물러 있다. 데이터가 복제돼 있더라도 애플리케이션과 네트워크 계층까지 즉시 전환되지 않기 때문에, 실제 장애 상황에서는 ‘데이터는 안전하지만 서비스는 멈추는’ 현상이 반복된다. 이번 화재에서 드러난 구조적 한계도 바로 이 지점이다.
이번 사태는 데이터 백업 체계만으로는 서비스 안정성을 확보할 수 없다는 점을 분명히 했다. 국가 전산망은 단일 장애에 취약하며, 위기 상황에서도 끊김 없는 서비스를 제공하기 위한 무중단 복구 체계가 필요하다.
한편 30일 현재 윤호중 중앙재난안전대책본부장(행정안전부 장관)에 따르면 현재 46개 (행정정보) 서비스가 정상화됐다”며 “국민이 많이 이용하는 정부24와 우체국 금융서비스도 재가동했다.
또한 정부 행정정보시스템 647개가 순차적으로 재가동되면서 복구 서비스가 계속 늘고 있다. 하지만, 주요 정보시스템 96개가 전소된 전산실 내 있었고, 대구센터로 이전해 재가동까지는 약 2주간의 시간이 걸릴 것으로 전망돼 전체 서비스 정상화까지는 상당한 시간이 필요할 것으로 보인다.
김지윤 기자/ hello@sciencewave.kr
Science Wave에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.