[뉴스토마토 배한님 기자] 지난달 25일 발생한 KT의 통신 장애와 같이 네트워크 중앙부(코어망)에서 장애가 발생했을 때, 타사 망과 연결하는 '통신 로밍 시스템'을 적용하는 것은 비효율적이라는 의견이 나왔다. 로밍을 위해 통신 사업자가 전국 네트워크망을 2, 3개씩 갖는 것은 현실적으로 힘들다는 이유에서다. 정부와 통신업계, 전문가들은 궁극적으로 전국망이 마비되지 않도록 갖춰진 시스템이 실제 작동할 방안을 마련하는 것이 먼저라고 강조했다.
2일 서울 용산구 한국정보통신공사협회에서 열린 네트워크 안전성 TF 제1차 회의. 사진/배한님 기자
과학기술정보통신부(과기정통부)는 2일 서울 용산구 한국정보통신공사협회에서 KT의 대규모 네트워크 장애를 계기로 통신 장애 재발 방지 대책 등을 위해 출범한 '네트워크 안정성 대책 TF' 1차 회의를 열었다.
TF는 오는 12월 초까지 이번 네트워크 장애 사태의 원인분석 과정에서 드러난 네트워크 관리·운용의 문제점 등에 따른 관리적·기술적·구조적 대책 등 '네트워크 안정성 확보방안'을 만들 계획이다.
이날 회의에서 참석자들은 전국 단위의 '통신 로밍 시스템'을 구축하는 것은 비효율적이라는 데 동의했다. 통신 로밍 시스템은 네트워크에 문제가 발생했을 때 타사 네트워크에 연결해 사용할 수 있는 시스템이다. 지난 2018년 KT 아현국사 화재를 계기로 마련돼 지난해 6월부터 현장에 적용할 수 있게 됐다. 그러나 이 로밍 시스템은 특정 기지국 단위와 같이 통신망 끝단에서 발생한 '액세스 네트워크 장애'에만 적용할 수 있다. 코어망이 마비되는 이번 KT 통신 장애에서 무용지물이었다.
통신 로밍 시스템은 일부 지역에서 장기간 이어지는 통신 장애에는 적합하지만, 전국 단위의 단기간 장애에 적용하기에는 무리가 있다. 허성욱 실장은 "이런 상황에서 로밍을 하려면 사업자가 전국망을 3개 들고 있어야 한다"며 "현실적으로 힘들다"고 설명했다. 허 실장은 "현재의 로밍 시스템을 개선할 방법이 없겠느냐, 이건 한 번 찾아본다는 이야기를 했다"고 덧붙였다.
TF 참석자들은 근본적으로 통신 장애가 전국으로 퍼지지 않도록 할 방안을 마련하기로 했다. 지난 아현국사 화재 이후 마련한 네트워크 안정성 시스템이 실제로 작동하는지 모니터링하는 방안과 통신 장애가 전국으로 자동 확산되지 않도록 할 기술적 대안을 찾는 것이다. 아울러 네트워크가 MEC(Mobile Edge Computing)나 소프트웨어 중심으로 진화하는 상황에서 기간망을 중심으로 한 현 체계가 적합한지도 살펴볼 예정이다.
허 실장은 "아현 화재를 한 번 짚어봤을 때 이번 사태는 (매뉴얼이나 시스템이) 부족하다는 부분보다 현장에서 작동하지 않았다는 게 제일 컸다"며 "(이 부분에서) 각 사업자마다 갖고 있는 노하우나 장점을 공유했다"고 말했다.
사업자들은 사전에 검증된 명령어가 아니면 작업이 불가능하거나, 이 작업을 실제로 수행할 때 팀장급 이상의 관리자가 현장에 없으면 진행할 수 없게 하는 등 각자 이용하고 있는 네트워크 안정화 방안을 공유했다.
허 실장은 "KT 입장에서는 지금까지 안전성보다는 효율적인 부분이나 망 최적화를 많이 하다 보니 실제로 (안전을) 놓친 부분도 있어 많이들 반성했다"고 했다.
TF는 오는 12월 초까지 운영될 예정이다. TF에서 마련할 네트워크 안정성 대책이 가이드라인이나 법제화 등 어느 정도 수준이 될지는 향후 논의가 필요하다. 허 실장은 "지금까지 통신정책 철학이 네트워크를 우리나라만큼 잘하는 곳이 없다며 믿고 맡기는 방식이었는데, 이제 어디까지 제도화할 거냐는 게 정부의 고민이다"며 "모든 것을 제도화하지는 않을 거고 선별적으로 고르게 될 것"이라고 설명했다.
배한님 기자 bhn@etomato.com