60만 개인정보 무단활용 '이루다', 1억 과징금·과태료 철퇴

이루다 개발 활용된 카톡 대화 94억건 비식별 조치 없어
AI기업 개인정보처리 제재 첫 사례…개인정보위, AI서비스 자율점검표 준비

입력 : 2021-04-28 오후 4:04:09
[뉴스토마토 김동현 기자] 인공지능(AI) 챗봇 '이루다'가 60만 이용자의 개인정보를 암호화 조치 없이 개발된 것으로 나타났다. 개인정보보호위원회는 1억원의 과징금·과태료 처분을 결정했다. AI 기술 기업의 개인정보 처리를 제재한 첫 사례다.
 
개인정보위는 28일 전체회의를 열고 이루다 개발사 스캐터랩에 총 1억330만원의 과징금과 과태료를 부과했다. 구체적으로 △개인정보를 수집하며 정보주체에게 명확하게 인지할 수 있도록 알리고 동의를 받지 않은 행위 △법정대리인의 동의 없이 만 14세 미만 아동의 개인정보를 수집한 행위 △성생활 등에 관한 정보를 처리하며 별도 동의를 받지 않은 행위 등이 이번 처분의 근거가 됐다.
 
올초 혐오 표현 등이 논란이 되며 서비스를 중단한 AI 챗봇 '이루다'. 사진/스캐터랩
 
스캐터랩은 자사 앱 서비스인 '텍스트앳'과 '연애의과학'에서 수집한 카카오톡 대화를 페이스북 이용자 대상의 챗봇 서비스인 이루다의 AI 개발·운영에 이용했다. 개인정보위 조사 결과, 개발사는 이루다 알고리즘 학습 과정에서 카카오톡 대화에 포함된 이름·휴대전화번호·주소 등 개인정보를 삭제하거나 암호화하는 등 조치를 하지 않았다. 이 과정에서 활용된 정보만 60만 이용자의 카카오톡 대화문장 94억여건이었다. 또한 운영 과정에서는 20대 여성의 카카오톡 대화문장 약 1억 건을 응답 DB로 구축해 이루다가 이중 한 문장을 선택해 발화하게 했다.
 
배상호 개인정보위 조사2과장은 "이루다 학습DB에는 이용자 식별 정보에 대해선 가명처리를 잘했지만, 카카오톡 대화 내용은 일절 가명처리 하지 않았다"며 "응답 DB도 카카오톡 대화 내용을 변형 없이 그대로 발화 시켜 개인정보(위반)에 해당한다"고 말했다. 카카오톡 대화 내용이 DB에 그대로 담겨 이를 연애의과학 서비스 등과 비교하면 누가 발화했는지 회원정보를 분석할 수 있다는 설명이다.
 
윤종인 개인정보위 위원장이 28일 열린 7회 전체회를 진행하고 있다. 사진/개인정보위
 
이와 더불어 개인정보위는 스캐터랩이 이용자 대화를 활용하는 과정에서 이용자 동의를 제대로 받지 않은 것으로 판단했다. 텍스트앳과 연애의과학 개인정보처리방침에 '신규 서비스 개발'을 포함한 것만으로 이용자 동의를 받은 것으로 보기 어렵다는 설명이다. 신규 서비스 개발이라는 언급만으로 이용자가 이루다 개발과 운영에 카카오톡 대화가 이용될 것으로 예상하기 어렵다는 입장이다. 또한 스캐터랩이 개발자 코드 공유·협업 사이트 '깃허브'에 이름 22건, 지명정보 34건, 성별·대화 상대방과의 관계 등이 포함된 카카오톡 대화문장 1431건과 함께 AI 모델을 게시한 것에 대해서도 개인정보보호법을 위반한 것으로 판단했다.
 
개인정보위는 향후 AI 기술 기업이 개발 과정에서 이용할 수 있는 'AI 서비스의 개인정보보호 자율점검표'를 공개할 예정이다. 윤종인 개인정보위 위원장은 "이번 사건은 기업이 특정 서비스에서 수집한 정보를 다른 서비스에 무분별하게 이용하는 것이 허용되지 않고, 개인정보 처리에 대해 정보주체가 명확하게 인지할 수 있도록 알리고 동의를 받아야 한다는 것을 분명히 했다는 점에서 의미가 있다"고 밝혔다.
 
김동현 기자 esc@etomato.com
 
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지
김동현 기자