데이터를 다루는 것을 업으로 삼고 있는 사람으로서 1923호 ‘정부 3.0과 정보공개, 우리나라가 나아가야 할 방향은’이란 기사를 흥미롭게 읽었다. 4월 28일에 비정부 단체 ‘투명사회를 위한 정보공개센터’에서 주최한 오픈데이터 관련 세미나의 내용을 전한 이 기사는 이 단체의 장인 김유승 소장의 목소리를 상세하게 전달하고 있다. 구체적으로는 △정부의 정보공개 범위 확대 현황 △공공데이터 제공 및 이용 방법에 대한 원칙 확립 필요성 △시민 주도 오픈 데이터의 필요성 및 현황 △오픈데이터의 신뢰성 문제 △정보공개의 수혜가 시민들에게 돌아가도록 보장하는 장치의 필요성 등으로 요약된다. 모두 공공데이터에 관심이 있는 사람이라면 공감할 만한 주제들이다.

다만, 김유승 소장으로 발화 주체가 명시된 앞 내용에 비해 세미나에 참여한 다른 구성원(기사에는 이 단체 소속 연구원들과 현직 기자 등이 참석했다고 기술돼 있다)들의 목소리는 잘 드러나지 않아 아쉬웠다. “~소개됐다”라는 문장으로 정리된 내용들은 다른 참여자들의 발표로 추정되는데, 그렇다면 발표의 주체를 명확히 해 두는 편이 기사의 현장감을 높이는 데 도움이 되지 않았을까 한다. 같은 관점에서 기사에 소개된 정부 공공데이터 포털이나 Represent API, Citizen Budget 등의 온라인 주소를 안내해 줬으면 관심있는 독자들에 대한 정보 제공이라는 면에서 더욱 좋았을 것 같다.

김 소장의 목소리로 대변된 세미나의 주제 각각에 대해 비판적으로 접근하는 것은 현장 정보의 전달이라는 해당 기사 본래의 범위를 넘어서는 것으로 생각되기는 하지만, 이 지면을 빌어 기사의 ‘공공정부와 정부’ 단락에 한해 몇 가지만 언급하고자 한다. 한국 정부는 기사에서 소개된 대로 유엔 전자정부 개발지수에서 2012년과 2014년에 걸쳐 1위를 차지했으며(실은 2010년에도 1위를 차지해 3회 연속 1위를 달성했다), 2015년 경제협력개발기구(OECD) 발표 공공데이터 개방지수에서도 1위를 차지했다. 그러나 주로 공개된 데이터의 양에 기반한 이들 지수에 비해 데이터 품질에 주목하는 2015년 세계 공공데이터 지수(Global Open Data Index)에서는 122개국 중 23위에 그치는 데 머물러 있다. 우리나라의 많은 분야에서 나타나듯 양적인 성장에 치중해 질적인 변화는 이뤄내지 못하고 있음을 알 수 있다.

월드와이드웹의 창시자이자 최근 오픈데이터 운동을 이끌고 있는 팀 버너스 리 경의 철학에 따르면, 데이터의 가치는 다른 데이터와의 연결에 있으며, 이를 위해 오픈데이터는 가공되지 않은 1차 자료(raw data)의 형태로, 컴퓨터에서 직접 접근이 가능한 주소(uniform resource locator, URI)를 가지고, 기계 판독이 가능한(machine readable), 공개된 파일 형식으로 제공되는 편이 좋다. 이렇게 공개된 데이터는 검색엔진에서 직접 찾아볼 수 있으며, 컴퓨터 프로그램이 직접 내려받아 다른 자료와 연결해 분석, 새로운 가치를 만들어 낼 수 있다. 하지만 정부 공공데이터 포털이나 서울시 열린데이터 광장 등에서 제공되는 데이터는 분류 기준이 명확하지 않으며, 원하는 자료를 찾기 어렵고, 대부분 URI가 제공되지 않아 수동으로 내려받아야 한다. 이런 점에서 기사의 “‘raw data’의 경우 개발자들에게는 유용하지만 일반 시민들에게는 그 활용도가 매우 낮다는 문제점이 있다”는 언급에 대해서는, 활용도는 1차 자료를 분석 및 가공이 쉽도록 제공하는 데서 나오며, ‘정부 3.0’을 표방하는 한국 정부의 1차 자료 공개 현실이 개발자들에게도 그다지 유용하지 않다는 점을 지적하고 싶다. ‘일반 시민의 활용도’는 개개인의 필요에 따라 그 요구가 천차만별로 달라질 수 있으므로, 이러한 수요에 대해 정부가 일일이 자료를 가공해서 서비스하는 것은 비효율적이다. 정부는 1차 자료의 품질과 기술적 접근성을 높이는 데 주력하고, 이를 활용한 2차 자료의 생성 및 활용은 민간에 맡기는 방식이 오픈데이터의 철학에도 부합하고, 현실적으로도 더 효과적이라고 생각한다.

마지막으로, 오픈데이터에 관심있는 독자들에게 앞 문단에서 언급한 버너스 리 경의 2009년 TED 강연인 ‘차세대 웹에 대하여’를 시청해 볼 것을 권한다. 한글 자막도 제공되니 불편 없이 볼 수 있을 것이다. 16분이 부담스럽다면 같은 이의 2010년 TED 6분 강연 ‘오픈데이터가 세계에 퍼진 해’는 어떨까?

 

 

 

원중호
통계학과 교수

저작권자 © 대학신문 무단전재 및 재배포 금지