박근혜도 강조한 '창조경제 신자본', 이게 빠지면

[빅데이터-사회혁신을 꿰뚫다③]데이터 품질 향상 방안은?

등록 2015.11.25 21:15수정 2015.11.25 21:15
3
원고료로 응원
빅데이터를 향한 관심이 뜨겁다. 빅데이터가 재난 재해와 교통 문제 등 고질적인 난제를 풀고 더 나은 사회로 바꾸어 나갈 고갈되지 않는 자원으로 불린다. <오마이뉴스>는 빅데이터에서 세상을 바꿀 힘, 사회 혁신의 실마리를 찾으려 한다. 네 편의 기획 시리즈를 통해 효율적인 사회 혁신을 위한 빅데이터 활용 방안과 그 가능성을 찾아본다. [편집자말]
"빅데이터는 미래 경쟁력을 좌우하는 21세기 원유다."

미국의 시장조사기관 가트너가 빅데이터를 '미래를 바꿀 세계 10대 기술' 중 하나로 선정하면서 내놓은 말이다. 박근혜 대통령도 "'21세기의 원유'로 비유되는 빅데이터는 물적자원 없이도 창의성과 아이디어로 고부가가치와 일자리를 창출하는 창조경제의 신자본"이라고 말했다. 산업계에서는 차세대 먹거리 산업의 기반 기술로 빅데이터에 대한 관심이 뜨겁게 달아오르고 있다.

하지만 원유를 있는 그대로는 쓸 수 없다. 휘발유, 등유, 경유, 윤활유 등으로 정제해 활용하는 것처럼 빅데이터 또한 정제 작업이 필요하다. 데이터를 어떻게 요리해 빅데이터라는 보물을 만들어 낼 수 있을지가 관건이다. '구슬이 서말이라도 꿰어야 보배'라는 말처럼, 방대하고 복잡한 데이터로부터 '질' 높은 정보를 선별하고 발굴해 내는 일이 중요해지고 있다.

현실은 녹록지 않다. 정보화 선진국인 미국에서는 정부나 공공 단체가 공개한 오픈 데이터의 다운로드 숫자가 2011년 이후로 점점 줄어들고 있다. 이는 정보 개방이 곧 만능이 아니라는 것을 보여주고 있다고 풀이된다.

특히 빅데이터 개발자들, 관련 업계 사람들은 여러 가지 면에서 데이터의 부족을 지적했다. '쓸모있는 데이터가 부족하다', '일일이 수작업을 해야한다', '사용자의 욕구를 충족시켜주지 못한다'는 등의 반응이 나오고 있다.

아무리 데이터가 많아도 잘 꿰어야 보배

벤처 기업인 ‘스테이영’은 지난해 6월, 지방선거를 앞두고 ‘우리동네후보’ 애플리케이션(이하 앱)을 개발했다. 이 앱은 유권자들에게는 선거 출마자들의 정보를 제공하고, 후보자들에게는 홍보의 기회를 준다는 취지였다. ⓒ 화면캡처


벤처 기업인 '스테이영'은 지난해 6월, 지방선거를 앞두고 '우리동네후보' 애플리케이션(이하 앱)을 개발했다. 이 앱은 유권자들에게는 선거 출마자들의 정보를 제공하고, 후보자들에게는 홍보의 기회를 준다는 취지에서 시작했다.


후보자들의 데이터는 중앙선관위에 등록된 공약, 약력, 범죄 정보 등 정보를 기반으로 했다. 선전물 중심의 선거 홍보 시장에서 이 앱은 반향을 일으켰다. 안드로이드에서만 3만여 명이 다운로드 받았고, 400여 개 리뷰가 달렸다.

문제는 데이터의 형식이었다. 중앙선관위는 각 후보자가 '후보자 등의 5대 핵심공약을 'HWP'나 'PDF' 형태로 선관위에 보내면 선관위는 PDF 형태로 등록한다. 'PDF'는 데이터 검색, 복사가 어렵다. 때문에 PDF 파일로 내려받은 후, 각 후보의 공약을 다시 텍스트화가 가능한 'HTML'로 정리해야 하는 번거로움이 있었다. 선관위에다 텍스트화가 쉬운 엑셀(EXCEL) 파일을 요구했지만 쉽게 받아들여지지 않았다.

국내 포털 부동산 정보와 국토교통부의 실거래가 정보 등을 취합하는 '호갱노노'도 데이터의 정확성에 아쉬움을 나타내기도 했다. 심상민 호갱노노 대표는 "데이터의 정확성이 아쉽다"면서 "아파트 층수가 '-1'로 표기되거나 가격에 0이 하나 빠져 있기도 해서 일일이 데이터 보정 작업을 해야한다"고 말했다(관련기사: "호갱되지 않게 도와드립니다").

공공데이터와 빅데이터 분석 작업을 하는 '오픈날리지 코리아' 소속 김선호씨는 "제공되는 공공 데이터 숫자가 아무리 많다고 해도 실제 서비스에서 필요로 하는 데이터 요구사항을 모두 충족시키기는 어렵다"면서 "데이터 관련 포럼 또는 커뮤니티 등을 통해 요구 사항을 수집하는 정부나 공공기관의 노력이 필요하다"고 지적했다.

이어 김씨는 "데이터의 품질과 신뢰성 확보를 위한 정책적 변화가 필요한 시점"이라면서 "경쟁적으로 데이터 공개나 단기적 활용 사례를 기대하기보다는 중장기적 관점에서 공공기관과 커뮤니티, 기업들을 연결한 상생과 소통을 추구해야 한다"고 말했다.

서울시는 '민관산학' 장벽 허물 실험 시작

a

박원순 서울시장과 유지수 국민대 총장, 정규상 성균관대 총장, 신구 세종대 총장, 조성식 SAS코리아 대표가 9일 오후 서울 중구 서울시청 다목적홀에서 열린 '빅데이터, 사회 혁신을 꿰뚫다' 콘퍼런스에 참석해 빅데이터 캠퍼스 업무협력 협약식을 갖고 기념촬영을 하고 있다. ⓒ 유성호


이 같은 어려움을 극복하기 위해 주체들간의 협업이 강조되고 있다. 데이터를 쥐고 있는 정부와 공공기관과 이를 활용하려는 시민, 기업들이 함께 서로의 필요와 요구들을 소통하는 작업이 필요하다는 것이다.

서울시는 이미 협업을 시작했다. 서울시는 지난 9일, 국민대, 성균관대, 세종대와 소프트웨어 개발사인 SAS코리아와 함께 빅데이터 캠퍼스 업무 협약식을 열었다. 빅데이터 캠퍼스는 서울시와 민간이 보유한 데이터를 분석·융합할 수 있도록 하는 오프라인 공간이다. 캠퍼스는 내년 5월 서울 상암동 IT콤플렉스에서, 11월 서울 개포동 디지털혁신파크에서 문을 열 예정이다.

서울시는 데이터 분석에 필요한 소프트웨어와 전용 컴퓨터, 대학 빅데이터센터 전문가를 지원해 일반 시민도 데이터를 활용할 수 있게 돕는다. 국민대는 빅데이터 경영 MBA과정과 마케팅사이언스 MBA과정, 성균관대는 i-스쿨, 세종대는 빅데이터 센터를 운영하고 있다. SAS코리아는 자사에서 개발한 분석 솔루션을 제공한다. 이들의 인력과 기술로 빅데이터 활용에 혁신을 예고하고 있다.

최영훈 서울시 정보기획관은 "그동안 인적·기술적 한계에 부딪혀 쌓아만 왔던 빅데이터를 민간에 개방해 폭넓게 분석·활용하는 계기가 될 것으로 기대한다"면서 "앞으로도 빅데이터 활용을 위한 민관산학 협업 체계를 계속 확대해 나갈 것"이라고 말했다.

기계 하나면 시민이 데이터 생산·참여·소비자로

소형 대기오염도 측정기인 스마트 시티즌 키트(Smart Citizen Kit, 아래 키트)는 대표적인 시민 데이터 생산·참여·소비자 사례다. ⓒ 화면캡처


데이터 생산과 가공에 시민들의 자발적인 참여도 강조되고 있다. 시민이 직접 데이터 생산자로 참여해 데이터의 품질을 높이고 시민 참여 역량도 키울 수 있다는 것이다. 소형 대기오염도 측정기인 스마트 시티즌 키트(Smart Citizen Kit, 아래 키트)는 시민이 데이터 생산·참여·소비자가 된 대표적인 사례다.

키트는 주변 환경정보를 측정하는 하드웨어, 정보를 수집하고 공개하는 웹사이트와 오픈 API, 어디서나 접속해서 전세계 환경정보를 확인할 수 있는 앱 등 총 세 개의 기능으로 구성된 오픈소스 플랫폼이다. 키트에는 주변의 이산화질소, 이산화탄소, 온도, 습도, 빛 강도, 소음 정도를 측정할 수 있는 센서가 부착돼 있다. 시민들이 이 키트를 와이파이에 연결하고 베란다나 창가에 걸어두면 센서가 주변의 환경 정보를 수집하게 된다.

키트는 단순히 어느 지역의 오염 수준을 나타내는 기계적인 역할만 하는 것이 아니라, 환경 문제에 관심이 있는 시민 및 전문가에게 실시간 정보를 제공한다. 이를 통해서 시민들이 자기 주변의 환경에 관심을 갖게 하는 등 시민 참여 역량을 이끌어냈다고 평가 받고 있다.

이재흥 비영리IT지원센터장은 "정부와 시민사회는 역사적으로 대립하면서 시민이 정부를 감시하는 역할을 해왔다"면서 "앞으로 데이터 기반 사회 혁신에도 서로 협업하는 경험을 쌓으면서 서로의 욕구를 충족시킬 사례를 만드는 것이 중요하다"고 말했다.

○ 편집ㅣ홍현진 기자

#빅데이터 #마윈 #21세기원유 #빅데이터 캠퍼스
댓글3
이 기사가 마음에 드시나요? 좋은기사 원고료로 응원하세요
원고료로 응원하기

AD

AD

AD

인기기사

  1. 1 검찰 급했나...'휴대폰 통째 저장', 엉터리 보도자료 배포
  2. 2 "그래서 부끄러웠습니다"... 이런 대자보가 대학가에 나붙고 있다
  3. 3 [단독] 김건희 일가 부동산 재산만 '최소' 253억4873만 원
  4. 4 재판부 질문에 당황한 군인...해병대 수사외압 사건의 퍼즐
  5. 5 [동작을] '이재명' 옆에 선 류삼영 - '윤석열·한동훈' 가린 나경원
연도별 콘텐츠 보기