취재 | 한국의 공공데이터 들여다보기

지난 17일(금), ‘범정부 데이터 분석시스템’이 전 중앙부처와 지자체를 대상으로 서비스를 개시했다. 이로써 모든 부처와 공공기관이 별도의 분석시스템 구축 없이도 ‘인터넷 자원 공유’(클라우드)를 기반으로 다양한 데이터 분석 자원과 환경을 업무에 활용할 수 있게 됐다. 공공데이터가 데이터 기반 행정의 디딤돌로 거듭나기 위해서는 어떻게 나아가야 할까.

 

공공데이터는 어떻게 쓰이나

공공데이터는 공공기관이 만들어내는 모든 공적인 자료나 정보를 일컫는다. 이는 경제, 지리, 조세, 치안, 교통 등 국민 생활 전반에 걸쳐 생성되기에 실질적 활용도가 매우 높다. 대표적 예시로 행정안전부(행안부)가 아파트의 전용 면적, 인구 현황 등을 분석해 초등학생의 돌봄 수요를 미리 파악하고 돌봄센터를 설치하도록 한 것을 들 수 있다. 성욱준 교수(서울과학기술대 IT정책전문대학원)는 “심야 버스 노선 역시 공공데이터를 기반으로 구축하는 것”이라며 “공공데이터는 사람들이 체감하는 영역에서 주로 활용된다”라고 밝혔다. 엄석진 교수(행정대학원)는 “공공데이터의 기대효과는 정부가 제공하는 데이터를 바탕으로 시민이나 민간이 정부가 제공하지 못하는 서비스를 제공할 수 있다는 것”이라고 설명했다.

올해는 공공데이터법이 시행되고 공공데이터전략위원회가 발족한 지 10주년이 되는 해다. 정부 차원의 ‘공공데이터포털’과 ‘서울열린데이터광장’은 공공데이터를 찾아볼 수 있는 대표적 사이트며, 이번에 출범한 범정부 데이터분석시스템은 공공데이터를 발전시킨 성과 중 하나다. 행안부 발표 자료에 따르면, 이번 시스템은 다양한 데이터 분석 도구 및 모델 제공을 통해 일반 사용자부터 데이터 분석 전문가까지 맞춤형 분석을 가능하게 했다.

 

공공데이터: 데이터 사일로 해결의 열쇠

아울러 공공데이터를 통해 부처 간 정보의 가림막을 뜻하는 데이터 사일로의 돌파구를 찾을 수 있을 것으로 예상된다. 성욱준 교수는 데이터 사일로에 대해 “식사를 제공해야 하는 차상위 계층 아동의 수를 파악할 때 부모 소득과 고용 여부, 의료 보험, 가족 관계 등을 고려해야 하는데, 이 모든 데이터가 각각 국세청, 고용노동부, 복지부에 흩어져 있기에 인원 파악 과정이 복잡하다”라고 예시를 들었다. 이에 범정부 데이터 분석시스템을 통해 정보 공유가 활성화되면 데이터 비대칭성을 완화할 수 있다는 기대가 나오고 있는 것이다.

다만 여전히 미결 과제가 남아있다. 권헌영 교수(고려대 정보보호대학원)는 “데이터가 존재한다는 사실을 알고 있다고 해도 데이터 제공은 의무가 아니다”라며 “이 때문에 데이터를 받지 못하는 경우가 있어 데이터 기반 행정이 적극적으로 이뤄지기 어렵다”라고 밝혔다. 엄석진 교수는 “근본적으로는 관료제의 역기능 중 하나인, 자신이 속한 부서나 집단이 최고라는 식의 할거주의가 해결돼야 한다”라고 설명했다. 그는 이어 “공공 부문의 경우 데이터를 공개하고 활용했을 때 나타날 수 있는 문제의 책임 소재를 묻기가 어려워 데이터 사일로가 오히려 해소되기 어려워질 수도 있다”라며 역효과를 우려하기도 했다.

이에 범정부 데이터 분석시스템이 존재한다는 것만으로는 데이터 사일로를 해결하기 어렵기에, 근본적으로는 데이터 거버넌스를 구축하는 것이 필요하다고 전문가들은 입을 모은다. 데이터 거버넌스는 데이터 사용 시 규칙·제도·권한을 정해 데이터 이용을 활성화할 수 있는 기반이 되기 때문이다. 정부에서 지속적으로 꾸려온 공공데이터전략위원회에서 공공데이터 혁신전략을 논의하는 것 또한 그 노력의 일환이다. 엄석진 교수는 “각 부처가 데이터를 자율적으로 공개하고 협력하게 유도하는 거버넌스가 필요하다”라고 강조했다. 권헌영 교수는 “데이터 옵트 아웃* 방식이 도입돼, 법적 문제가 발생할 가능성이 존재하는 예외적인 경우를 제외하고는 전 부처가 모든 데이터를 공유해야 한다”라고 견해를 피력했다. 범정부 데이터 분석시스템이 정착할 이듬해까지 거버넌스와 관련된 협의도 활발히 이뤄져야 할 필요성이 대두된다.

 

공공데이터의 민간 활용을 위해서는

공공데이터의 실용성과 양적 확대에도 불구하고, 민간 부문의 공공데이터 활용 및 사업화 유도가 부족한 실정 또한 아쉬움으로 지적된다. 권헌영 교수는 “민간에서 제공하는 서비스나 플랫폼은 국민에게 훨씬 친숙할뿐더러, 민간에서는 관련 시스템 및 서비스 개발을 보다 효율적으로 이룩할 수 있다”라며 공공데이터 활용에서 민관 협력이 이뤄질 필요성을 환기했다.

나아가, 민간에서 정확한 데이터를 기반으로 서비스를 개발할 수 있도록, 데이터의 최신성, 정확성, 상호연계성 등을 확보해 공공데이터의 품질을 제고해야 한다는 목소리도 있다. 서울열린데이터광장 박수진 사무관은 “기존에는 품질보다 개방에 초점을 두고 데이터를 확보하는 데 주력했다면, 지금은 품질 관리에 중점을 두고 있다”라고 설명했다. 서울열린데이터광장에서는 데이터 개방뿐만 아니라, 필요에 따라 데이터 공개를 종료함으로써 데이터 품질을 보다 철저히 감독하고 있다. 박수진 사무관은 “데이터 개방은 일반적으로 서울시 각 부처 또는 기관, 혹은 시민의 개방 요청이 있는 경우에 이뤄지며, 제공 부서에서 데이터를 관리 또는 생산하지 않는 등의 사유로 종료를 원하거나 데이터 품질이 낮아져 개선이 어려운 경우 개방을 종료한다”라고 설명했다. 이처럼 이미 공개된 공공데이터를 다시 점검함으로써 민간이 신뢰할 수 있는 정보를 제공하기 위한 노력이 강화돼야 한다.

무엇보다 공공데이터 제공 방식이 개선돼야 한다. 엄석진 교수는 “그간 공공데이터는 수요자를 고려하지 않고 공급자의 편의대로 제공되는 경우가 많았다”라고 밝혔다. 이에 유관 기관에서는 공공데이터를 제공할 때 수요자의 편의를 적극적으로 반영할 수 있는 방안을 고민하고 있다. 공공데이터본부 공공데이터개방활용팀 최진혁 책임은 “같은 종류의 데이터라도 기관별로 제공하는 데이터의 칼럼(column)이 달라, 활용자의 입장에서는 또 다른 전처리 작업이 필요하다”라며 “공공데이터가 잘 구축돼 있더라도 이를 활용하기 어렵게 만든다는 점에서 번거롭고 실효적이지 못하다”라고 짚었다. 그는 이어 “이런 문제를 해결하기 위해 표준데이터*라는 이름의 데이터 개방을 유도하고 있으며 매해 약 20~30개 정도씩 표준데이터를 지정하고 있다”라고 밝혔다.

공공데이터는 행정 혁신을 이룰 수 있을 뿐 아니라 민간 차원에서의 데이터 사업을 확장하는 기반이 된다. 표준데이터 지정의 가속화 등을 이루는 등 실생활에 유용한 인프라를 구축하기 위한 움직임이 늘어나길 바란다.

*옵트 아웃: 당사자가 자신의 데이터 수집을 허용하지 않는다고 명시할 때 정보 수집이 금지되는 것을 의미함.

*표준데이터: 정보 시스템에서 사용되는 용어 및 도메인, 코드, 기타 데이터 관련 요소에 대해 공통된 형식과 내용으로 정의해 사용하는 데이터.

저작권자 © 대학신문 무단전재 및 재배포 금지