"지금은 도로 위의 자동차는 십초마다 데이터를 생성하고 있다. 예전에는 그걸 요금정산에만 쓰고 버렸다. 이제는 기술이 개발돼서 자동차와 소통할 수 있는 방법이 생겼다. 자동차의 데이터는 차 문제를 해결할 수 있는 실마리를 주게 된 것이다."서울시내 법인택시에는 디지털타코그래프(DTG)라는 장치가 있다. 택시를 타고 내리는 승객의 정보가 들어있는 블랙박스다. 처음에는 유류보조금 지원을 투명하게 하기 위해 만들었지만, 이제는 시민들을 위해 분석되고 있다. 바로 택시 매치메이킹 프로그램의 개발이다. 프로그램은 DTG를 분석해 시간대별, 날짜별, 위치별 택시가 가장 잘 잡히는 곳을 안내해주는 데이터를 만들게 된다.
이 작업을 하고 있는 김경서 서울시 정보기획단장을 8일 오전 서울시청 집무실에서 만나 공공기관의 빅데이터 활용 계획과 전망, 그리고 개인정보보호에 관한 쟁점에 대해 의견을 나누었다. 김 단장은 10년 넘게 다음소프트의 대표이사를 지내다 지난해 1월, 서울시 정보기획단장이 됐다.
그는 "빅데이터를 소통"이라고 정의한 박원순 서울시장의 말을 언급했다. 시민의 의견에 귀를 기울이는 소통이 이제는 사물을 향한 소통으로 바뀌고 있다는 것이다. 여기서 소통은 도시를 이루는 건물, 도로, 자동차 등의 사물이 가진 데이터를 얻어 시민들을 위해 새로운 정보를 만들어내는 과정이다.
그는 "예전에는 자동차 데이터를 요금정산에만 쓰고 버렸다"며 " 이제는 기술이 개발돼서 자동차와 소통할 수 있는 방법이 생겼다, 자동차의 데이터는 그 문제를 해결할 수 있게 됐다"고 말했다.
향후 전망을 묻자 그는 빅데이터 사업을 그만두겠다고 말했다. 이해를 못해 고개를 갸우뚱 하자 다시 풀어 설명했다. 그는 "그동안 도시 행정에 빅데이터가 어떻게 쓰일 수 있을지 우리 사회에 분위기를 환기시키기 위한 과정이었다"며 "이제 공공기관은 빅데이터 사업보다 생산에 집중해야 한다, 데이터를 더 많이 개방하고 민간이 부가가치를 만드는 방향으로 가야 한다"고 설명했다. 민간 기업이 데이터로 새로운 가치를 만들면 만들수록 시민들이 더 큰 혜택을 받는다는 것이다.
다음은 김 단장과 나눈 대화를 정리한 것이다.
"빅데이터 통해 도시의 문제 해결할 수 있겠다고 생각"- 민간 기업에서 공공기관인 서울시에 오게 된 계기는? "인구 천만의 수도 서울은 빅데이터를 활용하기 좋은 도시다. 규모와 성격에서 많은 문제들이 있을 수밖에 없는데, 빅데이터를 통해서 도시의 문제 해결할 수 있겠다고 생각했다."
- 공무원이 된 지 1년 반이 지났다. 민간과 서울시의 차이점이 있다면? "처음에 와서 의외였다. 서울시의 정보화 수준이 높았다. 서울 본청과 독립된 기관으로써 정보기획단이 생긴 지 20년이 됐다. 시민들에게 알려진 것보다 잘 돼 있었다. 기업과 비교한다면 민간은 효율에 집중한다면 행정은 느리지만 보편적인 것을 천천히 다져나간다는 차이점이 있다."
- 빅데이터를 흔히 21세기의 원유라고 말하기도 한다. 김 단장이 빅데이터를 보는 관점은? "도시에 시민만 있는 게 아니다. 생각보다 많은 부분을 차지하는 게 시설물, 건물, 도로, 자동차, 강 등이 있다. 도시의 많은 문제가 이들에게서 일어나는 경우가 많다. 교통 문제는 자동차에서, 에너지 문제는 건물에서 일어난다. 빅데이터가 개발되기 이전에는 무생물, 사람이 아닌 것들은 그냥 문제를 일으키기만 하고 문제를 풀어야 하는 대상이었다.
지금은 도로 위의 자동차는 십초마다 데이터를 생성하고 있다. 예전에는 그걸 요금정산에만 쓰고 버렸다. 이제는 기술이 개발돼서 자동차와 소통할 수 있는 방법이 생겼다. 자동차는 그 자체로 문제지만 자동차의 데이터는 그 문제를 해결할 수 있는 실마리를 주게 된 것이다. 자동차를 문제 해결의 주체로 바꿔주는 게 바로 빅데이터다. 이는 박원순 시장이 강조하는 소통과도 연관된다. 소통의 대상을 일반 시민에서 기술을 활용해 사물과의 소통으로 확대하는 것이다. 소통은 곧 사물의 정보를 활용해 데이터를 만드는 것으로 연결된다."
- 그런 사물과의 소통, 즉 빅데이터 활용을 위해서 민간에 비해서 정부와 공공기관의 노력은 더딘 것 같다. 대한민국의 공공데이터 활용 어느 수준은? "그 반대일 수 있다. 이동통신사, 카드사, 제조사가 생산 공정을 효율화 하거나 분석하는 데 빅데이터를 잘 활용하고 있다. 하지만 개인정보를 이용해서 마케팅에 활용하는 것은 쉽지 않다. 개인정보보호법 등 여러 장벽이 있다.
공공 부문의 활용도도 높다. 서울시는 이미 심야버스 노선 선정에 빅데이터를 활용했고 현재는 택시매칭 서비스, 어르신 여가시설 입지 선정, 중소상인 상권 분석 시리즈들을 준비하고 있다. 이들 정책이 발표되면 데이터에 기반한 합리적 의사 사례가 늘어난다. 박원순 시장은 자기가 쓴 <경청>에서 '빅데이터가 갈등의 해결사가 될 것'이라고 말했다. 심야버스 노선 선정 과정을 보면 실제 이 말이 맞을 수 있다."
- 정부의 빅데이터 정책에 대해 평가한다면? "아직 언급할 단계는 아닌 것 같다. 정부는 그야말로 시작 단계이기 때문에 지켜봐야할 것 같다. 미래창조과학부와 안전행정부가 기능상에 중첩되는 점도 있지만 평가할 단계는 아니다."
"앞으로 시는 빅데이터 사업을 안 할 것, 그 이유는..."
- 서울시는 어떤 방향으로 빅데이터 사업이 진행되나. "앞으로 시는 빅데이터 사업을 안 할 것이다. 무슨 말이냐면 지금까지는 우리가 진행한 것은 도시 행정에 빅데이터가 어떻게 쓰일 수 있을지 우리 사회에 분위기를 환기시키기 위한 과정이었다.
이제 공공기관은 빅데이터 사업보다 생산에 집중해야 한다. 공공기관은 이익을 추구하는 집단이 아니다. 우리는 데이터를 더 많이 개방하고 민간이 부가가치를 만드는 방향으로 가야 한다. 많은 사업자들이 빅데이터로 새로운 가치를 만들면 만들수록 시민들은 큰 혜택을 누릴 수 있다.
우리는 빅데이터를 포함한 빅데이터를 위한 IoT(Internet of Things, 생활 속 사물들을 유무선 네트워크로 연결해 정보를 공유하는 환경)에 집중하게 될 것이다. 왜냐면 지자체가 자동차 같은 사물, 대상의 데이터를 가지고 있다. 사물을 연결시키는 주체가 곧 지자체다. 내년부터는 IoT에 더 관심을 가지고 개발을 할 것이다."
- 빅데이터 활용에 개인정보보호를 어떻게 해야 할까. "정보보호가 중요하다고 생각한다. 예를 들어 예전에는 대통령 간선제였다. 지금은 간선제보다도 직선제가 더 좋다고 생각하고 있다. 빅데이터로 비유해 보면 예전에는 샘플 데이터만 봤었는데, 지금은 모두의 데이터를 다 보게 된 셈이다. 하지만 누가 누구를 찍었는지는 알 수 없다. 대략 경상도 지역에서 몇%가 몇 번 후보를 찍었는지는 용인하고 있다.
빅데이터로 설명해 보면 '몇%의 30대 남성들이 여름에 어떤 취향을 가진다', '20대 여성 몇%가 밤에는 어디에 관심이 많다', 이것까지는 허용하고 있는 것이다. 그런데 30대 남성이 아니라 한 특정 개인의 취향이 공개된다면 이것은 개인정보보호법과 상충된다.
공공 기관에서는 '누구냐'를 특정하지 않는다. 개인정보가 지워진 데이터는 합법적이다. 앞서 투표 제도를 들어 설명했던 것처럼, 더 많은 의사를 묻는 것은 좋지만 '누가 누구를 찍었냐'하는 것에 대해서는 물을 수 없다. 그런 이유로 개인정보보호는 더 보호하는 쪽으로 해야 한다."
- 예측불가능성의 시대라고 한다. 예측 자료로서 빅데이터는 참일 수 있을까. "인간은 인과관계를 찾으려고 하는 습성이 있다. 반면, 빅데이터는 데이터가 모여서 얻은 귀납적인 결론이다. 원인과 결과를 찾으려고 하는 인간의 특성상 빅데이터의 결론이 불편한 것이다. 우리는 빅데이터를 쓰지 않을 수 없다. 우리가 내기를 한다고 했을 때, 아무런 정보가 없으면 5대 5다. 빅데이터가 있어서 가능성을 5%라도 더 높일 수 있다면 그 통계를 안 쓸 이유가 없는 것이다."