활용 못하고 쌓이기만 하는 `공공데이터`
1만6880개 데이터 중 88% 재가공 필요한 파일데이터 프로그램 있어야 확인 가능
시각화·실시간 정보에 집중… 활용도 향상 방안 마련해야
이형근 기자 bass007@dt.co.kr | 입력: 2016-04-19 18:08 [2016년 04월 20일자 14면 기사]
경제신문 디지털타임즈
개방된 공공데이터의 대부분이 재가공이 필요한 파일데이터 형태로 확인돼, 정부 취지에 맞게 활용성을 높이기 위한 형태로 변화가 필요하다는 지적이다.
19일 정부가 운영하는 공공데이터포털(www.data.go.kr)의 데이터를 종류별로 구분한 결과 전체 1만6880개 데이터 중 88.5%(1만4939개)가 재가공이 필요한 파일데이터로 확인됐다. 파일 종류도 엑셀, CSV(Comma-Separated Values) 등 별도 프로그램이 설치돼야 확인할 수 있는 형태다.
소프트웨어(SW)에 연동해 활용할 수 있는 응용프로그래밍인터페이스(API)는 1931개로 전체 11.43%에 불과한 것으로 나타났다. 데이터 전문가들은 정부 3.0 일환으로 추진하고 있는 공공데이터 개방 정책에 따라 규모 면에서 많은 데이터가 쌓이고 있지만, 데이터를 바로 활용할 수 없는 방식으로 제공돼 활용면에서는 기대에 못 미친다는 지적이다.
정부부처와 지방자치단체들이 지난해 연말부터 데이터 개방에 경쟁적으로 나서고 있지만, 데이터에 일관된 기준이 없기 때문에 활용이 제한된다는 것이다. 이에 데이터 업계서는 공개데이터포털 취지에 맞춰 사업화나 활용성을 높이기 위해서는 공개되는 데이터 파일 형태나 방식에 대해 가이드라인이 필요하다고 주장하고 있다.
한 국내 데이터업계 관계자는 "공공데이터포털에 파일 형태로 올라온 데이터를 활용하기 위해서는 데이터 가공과 정제가 필요한데 비용과 시간이 추가로 든다"며 "데이터 가치에 따라서 활용성을 높일 수 있도록 기준을 제시해야 할 것"이라고 말했다.
공공데이터 활용성을 높이는 방안으로는 △중요한 데이터는 링크드 오픈데이터(Linked Open Data, LOD)로 변환해 활용성을 높이는 방법, △문서 데이터를 내려받을 필요 없이 바로 시각화 데이터로 변환해서 보여주는 방법 등이 제시되고 있다. LOD는 데이터에 유일한 식별자를 부여해 웹상에서 활용할 수 있게 하는 것으로, 공공데이터를 특정 부문에서만 활용하는 것이 아니라 각 공공데이터를 웹으로 연결할 수 있어 활용성을 극대화 할 수 있는 것이 장점이다. 인터넷을 만든 월드와이드웹컨소시엄(W3C)이 주축이 돼 표준을 제정하고 있기 때문에 호환성도 높다.
시각화는 복잡한 데이터를 쉽게 표현할 수 있게 한다. 인구비율, 토지 정보 등을 숫자가 아닌 그림이나 그래프, 도형으로 보여줘 비전문가라도 쉽게 데이터 의미를 알 수 있는 것이 장점이다. 일반 사용자 경우 대부분 데이터 개략적인 의미를 파악하고 싶어 하기 때문에, 문자로 된 정보보다 시각화 정보가 편리하다.
한 데이터 전문가는 "앞으로 공공데이터 정책은 데이터의 양보다 질과 활용성에 집중해야 한다"며 "싱가포르 경우 공공데이터 개방을 시각화와 실시간 정보에 집중해 활용성을 높이는 부분을 참고할 필요가 있다"고 말했다.
이형근기자 bass007@dt.co.kr
19일 정부가 운영하는 공공데이터포털(www.data.go.kr)의 데이터를 종류별로 구분한 결과 전체 1만6880개 데이터 중 88.5%(1만4939개)가 재가공이 필요한 파일데이터로 확인됐다. 파일 종류도 엑셀, CSV(Comma-Separated Values) 등 별도 프로그램이 설치돼야 확인할 수 있는 형태다.
소프트웨어(SW)에 연동해 활용할 수 있는 응용프로그래밍인터페이스(API)는 1931개로 전체 11.43%에 불과한 것으로 나타났다. 데이터 전문가들은 정부 3.0 일환으로 추진하고 있는 공공데이터 개방 정책에 따라 규모 면에서 많은 데이터가 쌓이고 있지만, 데이터를 바로 활용할 수 없는 방식으로 제공돼 활용면에서는 기대에 못 미친다는 지적이다.
정부부처와 지방자치단체들이 지난해 연말부터 데이터 개방에 경쟁적으로 나서고 있지만, 데이터에 일관된 기준이 없기 때문에 활용이 제한된다는 것이다. 이에 데이터 업계서는 공개데이터포털 취지에 맞춰 사업화나 활용성을 높이기 위해서는 공개되는 데이터 파일 형태나 방식에 대해 가이드라인이 필요하다고 주장하고 있다.
한 국내 데이터업계 관계자는 "공공데이터포털에 파일 형태로 올라온 데이터를 활용하기 위해서는 데이터 가공과 정제가 필요한데 비용과 시간이 추가로 든다"며 "데이터 가치에 따라서 활용성을 높일 수 있도록 기준을 제시해야 할 것"이라고 말했다.
공공데이터 활용성을 높이는 방안으로는 △중요한 데이터는 링크드 오픈데이터(Linked Open Data, LOD)로 변환해 활용성을 높이는 방법, △문서 데이터를 내려받을 필요 없이 바로 시각화 데이터로 변환해서 보여주는 방법 등이 제시되고 있다. LOD는 데이터에 유일한 식별자를 부여해 웹상에서 활용할 수 있게 하는 것으로, 공공데이터를 특정 부문에서만 활용하는 것이 아니라 각 공공데이터를 웹으로 연결할 수 있어 활용성을 극대화 할 수 있는 것이 장점이다. 인터넷을 만든 월드와이드웹컨소시엄(W3C)이 주축이 돼 표준을 제정하고 있기 때문에 호환성도 높다.
시각화는 복잡한 데이터를 쉽게 표현할 수 있게 한다. 인구비율, 토지 정보 등을 숫자가 아닌 그림이나 그래프, 도형으로 보여줘 비전문가라도 쉽게 데이터 의미를 알 수 있는 것이 장점이다. 일반 사용자 경우 대부분 데이터 개략적인 의미를 파악하고 싶어 하기 때문에, 문자로 된 정보보다 시각화 정보가 편리하다.
한 데이터 전문가는 "앞으로 공공데이터 정책은 데이터의 양보다 질과 활용성에 집중해야 한다"며 "싱가포르 경우 공공데이터 개방을 시각화와 실시간 정보에 집중해 활용성을 높이는 부분을 참고할 필요가 있다"고 말했다.
이형근기자 bass007@dt.co.kr
출처: http://www.dt.co.kr/contents.html?article_no=2016042002101460718001
댓글 없음:
댓글 쓰기