서울시, 불법대부·다단계 잡는 AI 수사관 도입

온라인 불법 콘텐츠 수집 후 판별…정확도 82→90%

입력 : 2018-08-22 오후 12:13:22
[뉴스토마토 신태현 기자] 서울시가 국내 최초로 인터넷 불법 대부업 및 다단계 광고 등 민생범죄 수사에 인공지능(AI) 기술을 도입한다.
 
서울시는 연말까지 불법 대부업, 다단계, 부동산 불법 거래, 상표권 침해행위 등 5개 민생범죄 분야 수사에 AI를 적용한다고 22일 밝혔다. 내년부터는 수사 분야를 점차 확대한다.
 
이른바 'AI 수사관'은 빅데이터 기술을 이용해 SNS·블로그 등 온라인 콘텐츠 중 불법이 의심되는 게시글과 이미지를 실시간 수집·저장한다. 이후 불법광고에서 자주 발견되는 패턴 등을 학습해 정상적인 게시물과 불법 게시물을 자동 분류한다.
 
AI를 수사에 적용하는 이유는 민생범죄가 늘어나면서 불법 온라인 광고물도 덩달아 증가하기 때문이다. 민생범죄 형사입건 수치는 지난 2014년 993건에서 작년 1423건으로 증가세다. 이에 따라, 적발을 피하기 위해 한글을 파괴하거나 은어·신조어·기호 등을 활용하는 불법 온라인 광고물도 늘어나 수사에 어려움을 끼치고 있다. 인터넷 특성상 검색이 어렵고 생성·삭제가 쉬워 증거 수집이 쉽지 않다.
 
이에 서울시는 한글 파괴, 은어·기호 등 검색 회피 패턴을 찾아내는 알고리즘을 개발할 계획이다. 또 글자뿐 아니라 이미지를 분석해 불법 정보를 추출하는 기술도 추가 도입한다.
 
AI가 수사하면, 수사관이 일일이 인터넷 사이트를 방문·검색해서 게시물의 불법성을 판단하는 방식에서 벗어날 수 있게 된다. 단순 반복 업무에서 벗어난 수사관은 불법 현장 단속이나 용의자 검거 등 오프라인 활동에 더 집중할 여유가 생긴다.
 
한편 앞서 5~7월 서울시는 수사 영역에 AI를 적용하는 시범사업을 불법 다단계·방문판매 분야를 대상으로 실시했다. 시범사업은 입력 데이터의 패턴을 학습해 미지의 데이터의 미래 값을 예측하는 ‘머신러닝’ 기법을 활용해 알고리즘을 개발하는 방식이었다. 여기에 베테랑 수사관들이 불법 사례 데이터를 기계에 학습시키는 ‘지도학습’ 기법도 더해졌다.
 
시범사업 결과 AI 알고리즘의 분류 정확도는 82%였다. 분류 정확도는 인간 수사관이 작성한 정답지 대비 학습 알고리즘이 예측한 값의 비율이다. 즉 사람이 불법 콘텐츠 100개를 찾아낼 때 AI 알고리즘은 82개 예측한 셈이다. 다만, 전체 정확도는 인간 수사관이 앞섰지만, AI가 더 정확한 부분도 있었다. ‘대출’→‘머출’, ‘명작’→‘띵작’처럼 자·모음의 유사성을 이용하는 일명 ‘야민정음’ 등 기존 수사관이 인지 못한 새로운 키워드를 발견했다. 인간 수사관들도 야민정음이나 파자 등 한글 파괴 수법들의 존재 자체는 알지만 수많은 예시를 모두 걸러낼 수 없었는데, AI는 판별할 수 있었다.
 
서울시는 알고리즘 정확도를 90% 이상으로 끌어올리며, 인간의 손이 덜 가고 기계가 스스로 더 판단하는 '준지도학습' 기법도 적용할 계획이다.
 
김태균 서울시 정보기획관은 “민생범죄로부터의 시민의 안전을 달성하기 위해 인공지능을 수사에 활용한 최초 사례”라며 “앞으로 인터넷상의 잘못된 정보로 피해받는 시민을 보호하기 위해 4차 산업혁명 기술을 적극 활용하고 스마트도시 행정서비스를 선도하는데 최선을 다하겠다”고 말했다.
 
지난 2월26일 스페인 바르셀로나에서 ‘모바일 월드 콩그레스 2018’이 열리는 가운데, 외국인 관람객이 한글과컴퓨터그룹 전시장을 방문해 한글과컴퓨터그룹과 서울시 등이 만든 스마트시티 플랫폼 설명을 듣고 있다. 사진/뉴시스
 
신태현 기자 htenglish@etomato.com
 
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지
신태현 기자
SNS 계정 : 메일 페이스북