과기부, 'AI 데이터 품질 표준안' 국내외 표준화 추진

올 연말 'AI 데이터 품질관리 가이드' 배포 계획

입력 : 2020-10-05 오후 12:00:00
[뉴스토마토 김동현 기자] 과학기술정보통신부는 디지털 뉴딜 '데이터 댐'의 자원인 인공지능(AI) 데이터 관련 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발하고, 이를 국제표준화로 추진한다고 5일 밝혔다.
 
한국정보통신기술협회(TTA) 단체표준으로 만들기 위해 오는 6일 한국정보통신기술협회 내 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식 제안한다. 단체표준은 관련 전문가 등의 의견 수렴 절차를 거쳐 내년 6월에 최종 채택·확정할 전망이다. 관련 내용을 국제표준화 성과로도 이어질 수 있도록 추진할 계획이다.
 
이번 표준안은 AI 데이터의 품질을 "인공지능 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보해 사용자에게 유용한 가치를 줄 수 있는 수준"으로 정의했다. 세계적으로 데이터 품질이 높지 않은 상황에서, AI 데이터 품질에 대한 방법론이 정립되지 않은 점을 고려했다. 지난 4월 한국이 '인공지능 국제표준화회의(ISO·IEC JTC1·SC42)'에 AI 데이터(딥러닝) 품질 관련 사항을 신규 과제로 제안해 채택되는 등 관련 논의는 현재 초기단계 수준이다.
 
인공지능 데이터 품질 개념도. 사진/과기정통부
 
이에 TTA와 한국정보화진흥원(NIA)을 통해 개발된 '인공지능 학습용 데이터 구축 및 품질관리 공통기준'을 해외사례 분석, 인공지능 및 품질관리 전문가 자문 등을 거쳐 보완·구체화해 표준안을 개발했다. 표준안은 자연어처리, 자율자동차, 의료, 농축수산, 제조 등 다양한 분야에서 공통으로 적용 가능한 '범용 표준' 형태로 개발됐다. 데이터 품질을 체계적으로 확보하고 상호호환성을 높일 수 있도록 데이터 수집·정제·가공·품질검증·활용 등 전주기 단계별로 필요한 표준절차와 품질 요구사항 등을 정의하고 기본적인 데이터 규격을 담았다.
 
과기정통부는 이번에 개발된 표준안을 한국정보통신기술협회 내 단체 표준화 기구의 산·학·연 전문가 의견수렴을 거쳐 단체 표준화를 추진한다. 관련 사항을 국립전파연구원 등을 통해 인공지능 국제표준화회의에 제안하는 등 국제표준화 성과로도 이어지게 할 계획이다. 올 연말까지 표준안을 바탕으로 '인공지능 데이터 품질관리 가이드'를 개발·배포할 계획이다.
 
김동현 기자 esc@etomato.com
 
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지
김동현 기자