아직도 마비 원인 모른다? ‘공공행정망 셧다운’ 올해만 세 번째, 디지털 플랫폼 정부의 민낯

160X600_GIAI_AIDSNote
전국 대혼란 일으킨 ‘행정망 마비’, 사흘 만에 전산망 복구
마비 원인도 못 찾는데 재발 막을 수 있겠나, 국민 불안 가중
'디지털 강국' 수식어 무색, 서버 이중화 및 백업 체계 재정비해야
이상민 행정안전부 장관이 19일 오전 대전 국가정보자원관리원을 방문해 정부 행정 전산망 오류 사태 복구 상황을 점검하고 있다/사진=행정안전부

사흘간 마비됐던 정부 행정전산망이 정상화되면서 전국 관공서에서는 20일부터 민원 업무가 재개됐지만, 정부가 여전히 전산 장애의 명확한 원인을 파악하지 못하고 있어 언제든 셧다운이 다시 발생할 수 있다는 우려가 커지고 있다.

마비 원인 오리무중, 일부 시스템은 여전히 불안정

20일 행정안전부는 전국 지방 행정전산망이 다시 정상화돼 민원 서비스가 재개됐다고 밝혔다. 하지만 전산망 장애를 복구한 뒤에도 민원서류 발급 등 대국민 서비스를 마비시킨 원인이 무엇인지는 아직도 파악하지 못했다. 단지 새올 지방 행정시스템에 접속하는 인증시스템(GPKI)의 네트워크 장비(L4스위치)에 이상이 있는 것으로 확인돼 교체했더니 정상화됐다고만 했다. 심지어 오류 당일은 장비를 교체해도 소용이 없었는데, 그다음 날 같은 장비를 바꿨더니 안정화됐다고 설명해 불신을 키우고 있다.

일단 이번 사태의 ‘스모킹건’인 L4스위치 2개는 교체했지만 하드웨어(HW)의 문제인지 소프트웨어(SW)의 문제인지는 오리무중인 상태다. 행안부 관계자는 “L4스위치가 최소 5,000개 이상으로 수만 대의 서버에 있기 때문에 (교체·점검을) 1년 내내 해야 한다”고 전했다. 그러나 주민센터에서 공무원이 신원 인증을 할 경우 해당 정보가 L4스위치를 거쳐 인증시스템에 전달될 만큼 새올 시스템의 핵심 장비란 점에서 문제가 심각하다.

게다가 일부 시스템은 여전히 불안정한 상태다. 20일 오전 9시 전국 민원 업무가 재개된 지 약 5분 만에 차세대 통합운영관리시스템(nTOPS)이 30여 분 동안 장애를 일으킨 것이다. nTOPS는 자산·장애 등 모든 운영 업무를 수행하는 관리시스템으로, 공교롭게도 행안부가 행정 전산망 장애 원인으로 지목한 L4스위치가 있는 국가정보자원관리원(국자원) 내에 함께 위치해 있다. 정부24 서비스도 완전히 복구되지 않았다. 일부 지역에서 사용자가 신청한 목록 외의 문서가 출력되는 등 오류가 발생한 것으로 나타났다.

사진=정부24 홈페이지 캡처

행정망 마비의 스모킹건 ‘L4스위치’

이번 사태는 부실한 행정관리 시스템의 민낯을 가감 없이 보여준다. 사태의 직접적 원인은 국자원이 16일 진행한 대전통합전산센터 서버 보안 패치 업데이트 작업에서 시작됐다. 16일 L4스위치의 보안패치가 업데이트된 이후 다음날 아침 8시 40분쯤부터 행정 전산망이 먹통이 됐다. 

네트워크 스위치는 네트워크 연결을 위해 사용하는 통신 장비로 보통 여러 대의 장비를 사용할 때, 보다 효율적인 데이터 전송을 위해 사용한다. 통상 사용하는 OSI 7계층(네트워크 충돌 문제 완화를 위해 ISO가 만든 표준)에 따라 L1부터 L7까지 구분하며, 이 중 L4스위치부터는 통신의 품질을 판단해 분배하는 ‘로드 밸런서(네트워크 트래픽 부하 분산)’ 기능도 수행한다. 보통 네트워크 스위치의 업데이트는 대부분 재부팅을 통해 시스템을 다시 구동해야 완벽하게 마무리가 되는 만큼, 제품이 꺼졌을 때 발생할 수 있는 각종 문제를 최소화하기 위해 스위치가 꺼져도 상관이 없는 시간대에 진행한다. 휴일이 아닌 평일에 업데이트했다는 사실 자체도 납득할 수 없지만 작업 후 테스트를 제대로 했는지도 의문이라는 비판이 나오는 이유다.

또한 업데이트 작업 자체도 이같은 문제에 대비하기 위해 1대씩 작업한다. 특히나 앞서 언급했듯 L4스위치는 서버의 앞단에서 네트워크 부하를 분산하는 역할을 하기 때문에 서버 1대당 스위치 1대를 사용하는 경우가 많은데, 업데이트를 할 때도 스위치 1대씩 진행하는 게 정석이다. 한 번에 여러 대를 업데이트할 경우 문제 발생 시 빠른 대처가 불가능한 것은 물론, 어떤 장비가 문제를 일으켰는지 파악하기도 어렵기 때문이다. 이에 전문가들은 단순히 스위치 문제만으로 3~4일씩이나 문제가 지속될 수는 없다고 입을 모은다. 더욱이 스위치 장비에 문제가 발생해 롤백 및 백업 제품으로 교체를 했음에도 바로 해결이 안 됐다면, 처음엔 스위치 문제였을지 몰라도 이후에는 스위치 문제만이 아니었을 것이라고 지적한다. 게다가 이번에 문제가 된 시스템은 2007년 지자체에 보급한 후 15년 이상 정비하지 않은 탓에 이 지경까지 이르렀다. 정부는 부랴부랴 차세대 시스템 구축에 나섰지만 새 시스템을 선보이려면 몇 년을 더 기다려야 할지도 모르는 형국이다.

‘전산망 관리 부실 문제’ 도마에

정부 행정 전산망의 마비는 올해 들어서만 세 번째다. 지난 3월 법원 전산망이 마비되면서 일부 소송 일정이 미뤄졌고 사건 검색, 전자 소송 등 사법 서비스가 전면 중단됐다. 지난 6월엔 4세대 초·중·고교 교육 행정 정보 시스템인 나이스(NEIS)가 개통하자마자 오류를 일으켜 일부 학교에서 기말고사 문항이 유출되는 등 학교 현장에 대혼란이 빚어지기도 했다. 공공 전산망 오류가 잇따르고 있음에도 정부는 여전히 이렇다 할 대책을 내놓지 못하고 있다.

정부의 전산망 관리 부실 문제도 도마에 올랐다. 비상 상황에 대응하기 위한 ‘시스템 이중화’가 제대로 작동하지 않았다는 비판이다. 실제로 이번 사태는 이원화한 전산망 장비가 동시에 문제를 일으키면서 복구가 지연된 측면이 크다. 이와 관련해 김승주 고려대 정보보호대학원 교수는 “(데이터) 이중화·이원화가 충분했나. 우리가 카카오도 이중화·이원화가 돼 있었지만 충분하게 안 돼 있는 걸 가지고 나무랐던 것”이라며 “카카오 때 막 몰아세웠듯이 과연 카카오에 적용한 기준만큼 이중화·이원화가 철저히 돼 있었느냐를 따져봐야 한다”고 지적했다.

지난해 10월 정부는 ‘카카오 먹통’ 사태가 일어나자 카카오에 대한 감시·조사를 대폭 강화하겠다며 ‘카카오먹통방지법’까지 제정했으나, 행정망 오류에 대해선 소극적으로 대처하고 있는 모양새다. 심지어 지난 15일 대통령실이 카카오 먹통 사태 1년을 맞아 ‘사이버 안보상황 점검회의’를 한 직후에 터져 비판이 거세다. 특히 이번 사태는 정부가 행정서비스 통합플랫폼을 구축하는 와중에 벌어졌다는 점에서 불안이 더욱 크다. 현재 정부24에서는 단순 링크만 제공해 개별 사이트에서 다시 로그인해야 하는 서비스가 1,500종에 이르는데 2026년에는 모두 행정서비스 통합플랫폼에서 제공할 방침이다. 모든 정보 자원과 데이터를 하나로 합쳐 디지털 플랫폼 정부를 구현하겠다는 건데, 만에 하나 한 곳이 삐끗해 전체가 마비되는 유사 사태가 벌어지면 그 피해는 고스란히 국민에게 돌아간다.

역대 정부는 디지털 플랫폼 정부를 핵심 국정과제로 내세우며 각종 공공 전산망 운영 예산을 늘려 행정 전산화를 추진해 왔다. 하지만 이번 사태로 ‘최첨단 전자 정부’, ‘디지털 강국’이라는 수식어가 무색해졌다. 이번 사태는 근본적으로 정부의 총체적 관리 부실에서 비롯된 만큼 철저한 원인 조사는 물론, 데이터 등 소프트웨어와 서버 이중화, 백업 체계 등을 종합적으로 다시 들여다보는 등 신속한 복구 대응 체계를 마련해야 한다. 과거와 같이 행정 전산망의 유지·보수를 맡고 있는 외주업체에 책임을 전가하는 식의 해결로는 땅에 떨어진 신뢰를 회복하기 어렵다.

관련기사