[뉴스토마토 심수진기자] 4차 산업혁명시대를 맞아 인공지능(AI)과 같은 핵심기술 선점을 위한 기업, 국가간의 경쟁이 뜨겁다. 인공지능 기술 구현에 필수적인 데이터의 중요성도 높아지고 있는 가운데 솔트룩스(대표 이경일)가 인공지능 산업 발전을 위해 지난 20년간 축적해 온 80억 건의 데이터를 단계적으로 개방하기로 했다. 이번에 개방되는 데이터는 오픈데이터와 소셜 데이터뿐만 아니라 방대한 언어자원과 지식베이스가 포함된 아시아 최대 규모로 인공지능 산업에 숨통을 틔워줄 수 있을 것으로 기대된다.
최근 인공지능 붐이 일며 강력한 알고리즘들이 오픈소스로 개방되고 있지만 실용적 인공지능시스템 구현을 위해 필수적인 데이터 확보는 아직도 매우 어려운 실정이다. 특히 기계학습과 딥러닝을 위한 고품질 데이터 구축을 위해서는 막대한 비용과 오랜 기간의 투자가 필요해 국내 중소/스타트업 기업에게 데이터의 확보는 가장 큰 고충이었다.
우리나라의 경우 데이터 축적과 공유/활용 수준은 매우 뒤처져있다. 언어지능 구현에 필수적인 위키백과 기준으로 보면 한국은 전 세계 국가 중 27위로 베트남(7위)과 중국(9위)보다 낮은 수준이다.
이처럼 열악한 상황에서도 솔트룩스는 인공지능 원천기술 개발을 위해 지난 20년간 데이터를 자체 구축하고 외부 지식을 수집·정제하기 위해 많은 노력을 기울여왔다. 이를 통해 주요 산업별 오픈데이터와 동계 지표 및 소셜 빅데이터, 다국어 언어자원 등 80억 건 이상의 정제된 빅데이터를 확보하고 있으며 초대규모 데이터 클라우드인 BigO(빅오)를 통해 전 세계로부터 매일 500만건 이상의 데이터를 수집·실시간 분석을 수행하고 있다.
솔트룩스는 오는 11월 데이터 포털과 이를 활용하기 위한 Open API를 RESTful형식으로 개방한다. 이를 통해 여러 전문기업과의 파트너십 체결과 세계 시장에서의 공통 경쟁력 조기 확보를 기대하고 있다.
이경일 솔트룩스 대표이사는 "자사의 핵심 자산인 데이터 개방을 결정하기까지 많은 고민이 있었고 용기도 필요했다"며 "우리는 이번 결정을 통해 더 늦기 전에 해외 선도기업과 경쟁할 수 있는 국내 인공지능 생태계가 마련될 수 있기를 기대한다"고 밝혔다. 그는 이어 "국내의 실력 있는 스타트업과 협력해 해외 진출 및 세계적 기업으로 도약하기 위한 교두보를 마련하고 미래 지능정보 사회 구현에 기여할 수 있도록 노력하겠다"고 덧붙였다.
심수진 기자 lmwssj0728@etomato.com