메뉴 건너뛰기

close

빅데이터가 뜨고 있다. 카드 사용 내역으로 구매 패턴을 찾아내던 상업적 차원의 활용을 넘어 최근에는 시민을 위한, 시민의 빅데이터가 활용되고 있다. 교통, 의료, 재난, 범죄 등 분야도 다양하다. 정부와 자치단체의 빅데이터 활용 사례를 살펴보고 빅데이터와 관련한 쟁점을 짚어본다. [편집자말]
#.  심야버스 노선 선정


 서울시는 심야버스 노선 선정 과정에 빅데이터를 활용했다. 심야시간대 휴대전화 통화량 30억건과 심야택시 승·하차 500만건을 분석해 최종 버스 노선을 확정했다. 4개 버스, 5개 구간의 노선 변경이 이뤄졌다.
서울시는 심야버스 노선 선정 과정에 빅데이터를 활용했다. 심야시간대 휴대전화 통화량 30억건과 심야택시 승·하차 500만건을 분석해 최종 버스 노선을 확정했다. 4개 버스, 5개 구간의 노선 변경이 이뤄졌다. ⓒ 서울시

서울 시민들은 심야 대중교통 수단을 요구했다. 서울시는 심야에 지하철을 운영하기에는 비용이 너무 많이 들고 안전사고 위험도 크다고 판단해 심야버스를 운행하는 쪽으로 가닥을 잡았다. 이른바 '올빼미버스'다.

문제는 노선이었다. 새벽에 유동인구가 많은 곳에 버스를 집중적으로 배치해야 했다. 그런데 낮 시간대에는 유동인구와 버스 이용량 등의 기본 정보가 있었지만 심야 시간대에는 정보가 없었다. 여기에 빅데이터가 활용됐다. 시는 먼저 심야 시간대 휴대전화 통화량 30억건과 심야 택시 승·하차 500만 건을 분석했다. 이를 통해 4개 버스, 5개 구간의 노선 변경이 이뤄졌다.

지난해 5월, 노선 결정에 참여했던 서울시 버스정책과 이종운 주무관(현재 서울시 주차계획과 근무)은 "기본 노선에 빅데이터 정보를 응용해 버스 수요에 대한 확신을 갖고 노선을 결정하게 됐다"며 "주먹구구식 노선 선정이 아니라 입체적인 정보를 바탕으로 과학적인 검증을 했다는 점에서 시민들의 좋은 반응을 얻을 수 있었다"고 말했다. 

#. 2 자영업자 전용 스토어스토리

 스토어스토리 내 점포이력서비스 화면. 한 건물의 과거 이력과 업종별로 추정매출, 상권 평가 등을 확인할 수 있다. 이는 카드사의 6억건에 달하는 카드 사용 내역과 8억건 이상의 부동산 데이터를 분석한 것이다.
스토어스토리 내 점포이력서비스 화면. 한 건물의 과거 이력과 업종별로 추정매출, 상권 평가 등을 확인할 수 있다. 이는 카드사의 6억건에 달하는 카드 사용 내역과 8억건 이상의 부동산 데이터를 분석한 것이다. ⓒ 스토어스토리

서울 광화문역 부근에서 치킨집 개업을 준비 중인 김아무개(52)씨. 퇴직금을 모두 투자해 시작하는 사업인 만큼 신중할 수밖에 없었다. 그가 가장 중요하게 생각한 것은 입지 선정이었다. 같은 가격대의 건물 중 어디 있는 점포가 손님을 많이 끌 수 있을까. 프랜차이즈 사업 설명회도 가보고 인근 부동산도 쫓아다녔지만 쉽게 결정을 내릴 수 없었다. 

그러던 중 그는 지인의 소개로 '스토어스토리'라는 사이트를 알게 됐다. 이 누리집이 제공하는 점포이력서비스에는 그가 원하던 정보가 집약돼 있었다. 특정 건물에서 과거 어떤 업종으로 영업이 이뤄져왔는지 목록을 볼 수 있었다. 개별 업종별로 추정매출, 상권 평가까지 정리돼 있었다. 이는 카드사의 6억 건 카드 사용 내역과 8억 건 이상의 부동산 데이터를 분석해 나온 정보였다.

기업 마케팅에서 시민 가까이 온 빅데이터

빅데이터가 일상으로 스며들고 있다. 기업의 마케팅에서부터 정부 정책 결정, 유권자 심리 분석, 기후 예측 등에도 활용되고 있다. 예를 들어 버스를 타고 내리는 시간과 장소를 분석해 버스 노선의 효율성을 따지거나 이동통신 이용자들의 통화시간 분포를 통해 사람들의 활동 시간 변화를 분석한다. 잠재적 가치가 크기 때문에 정보통신기술(ICT) 시대의 새로운 금맥이라는 평가도 나온다.

빅데이터(Big data)란 숫자·문자·영상 등 '가치를 생성할 수 있는' 대규모 데이터 집합체를 말한다. 빅데이터를 분석해 얻은 '흐름' 또는 '경향성'을 상업과 공공 부문에 활용하는 것이 최근의 흐름이다.

개인 정보와 관련해, 빅데이터의 활용 범위, 대상, 방식에 대한 논란도 커지는 추세다. 어떤 방식으로 투명하게 개인 정보를 수집하고 활용해야하는지, 동의를 얻지 않은 개인 정보의 활용이 과연 정당한가라는 논쟁도 계속되고 있다. 방송통신위원회는 빅데이터와 관련한 가이드라인 제정을 논의하고 있다.

최근에는 특히 공공 부문에서 빅데이터의 활용도가 높아지고 있다. 앞서 소개한 '스토어스토리'처럼 시민들에게 유용한 정보를 제공하기 위한 사업이 벌어지고 있다. 또 서울시 심야버스 노선 선정과 결정처럼 과학적 검증 방법의 하나로 활용되고 있다. 단순히 카드 회사가 소비 심리를 잡기 위해 구매 정보를 활용하는 단계를 넘어선 것이다.

분야도 다양해지고 있다. 기후 예측은 물론 교통, 의료, 재난, 범죄, 상업 등 시민의 요구에 맞게 빅데이터 활용도가 높아지고 있다. 더구나 정부나 자치단체를 비롯한 공공기관은 시민과 관련된 주거, 생활, 복지, 교통 등 수천만 건의 정보를 수집하고 있다. 이 빅데이터를 활용해 시민들에게 더욱 나은 행정 서비스를 제공하는 것이다.

택시매칭 서비스 등 교통·의료·재난·상업 등 다양화

 서울시는 요일별, 시간대별, 택시 승하차 정보와 호우 등의 기상정보 등 약 300억 건에 달하는 빅데이터를 분석하고 있다. 오는 12월이면 시민에게 택시가 잘 잡히는 위치를 제공하고 택시 기사에게는 승객이 가장 많은 곳과 원하는 방향의 승객이 많은 위치 정보를 제공하게 된다.
서울시는 요일별, 시간대별, 택시 승하차 정보와 호우 등의 기상정보 등 약 300억 건에 달하는 빅데이터를 분석하고 있다. 오는 12월이면 시민에게 택시가 잘 잡히는 위치를 제공하고 택시 기사에게는 승객이 가장 많은 곳과 원하는 방향의 승객이 많은 위치 정보를 제공하게 된다. ⓒ 서울시

공공 부문에서는 물론 기상 분야에서 활용도가 가장 높다. 기상청의 기후예측 시스템은 빅데이터를 활용하고 있다.

교통 분야도 관련 정보의 집약도가 높아서 활용도가 높은 편이다. 교통사고 다발 지역 정보, 지역별 날씨 등을 통해 도로별 위험도를 예측하는 등 시민 교통 불편을 해소하는 데 큰 도움이 될 것으로 보인다.

서울시는 현재 요일별, 시간대별, 날씨별 택시 승하차 정보와 호우 등의 기상정보 등 약 300억 건에 달하는 빅데이터를 분석하고 있다. 이를 통해서 시민에게는 택시가 잘 잡히는 위치를 제공하고 택시 기사에게는 승객이 가장 많은 곳과 원하는 방향의 승객이 많은 위치 정보를 제공하게 된다. 오는 12월이면 민간 회사가 어플리케이션 또는 웹 형태의 플랫폼을 갖추게 돼 상용화될 것으로 보인다. 

의료 분야에도 빅데이터가 활용되고 있다. 식약처는 약물 부작용 예방 플랫폼을 준비하고 있다. 특정 의약품에 대한 부작용 정보, 의약품 정보(성분, 주의사항), 처방 내역을 분석해 부작용 환자와의 상관관계를 유출해내 복용시 부작용을 최소화한다. 국민건강보험공단은 국민건강 주의 예보를 활용하고 있다. 건강보험 데이터베이스와 SNS 분석 정보를 융합하여 눈병, 독감, 식중독 등 감염병 발생 예측 모델을 개발하고 있다.

대한민국 공공기관의 빅데이터 활용 수준은?
올해부터 박차... 걸음마 단계
박근혜 정부가 출범하면서 내세운 '정부 3.0'은 공공 정보를 개방하고 국민 맞춤형 서비스를 제공하기 위한 패러다임이다. '정부 3.0'의 10개 추진 과제 항목 중 "빅데이터를 활용한 과학적 행정 구현"이 빅데이터 활용의 근거가 되고 있다.

공공 부문의 빅데이터 활용은 걸음마 단계다. 지난해 12월, 미래창조과학부는 '빅데이터 산업 발전전략'을 발표하며 5000여명의 전문 인력을 키우고, 의료·건강, 과학기술, 정보보안, 제조, 소비·거래, 교통·물류 등 6대 산업분야에서 빅데이터 활용을 활성화하겠다고 밝힌 바 있다.

이어 지난 1월, 안전행정부도 공공 부문의 빅데이터 사업을 추진하기 위해 향후 5년간 97개 과제를 선정하고 올해 460억원의 예산을 투입하기로 했다. 국가 정책수립, 대국민 서비스(복지·창업지원) 및 사회현안 대응(치안·사이버 공격) 등 국정운영 전반에 빅데이터 활용이 본격화된다.

안행부와 미래창조과학부 산하 한국정보화진흥원이 빅데이터 사업을 주도하고 있으며 서울시와 부산 해운대구 등을 비롯해 각 지방자치단체들도 빅데이터 활용에 나서고 있다. 경기도의회는 지난달 8일, 전국에서 처음으로 '빅데이터 활용 조례' 제정을 추진한다고 밝히기도 했다.
재난 대비에도 쓸모가 많다. 올해 막대한 피해를 입혔던 조류인플루엔자(AI)는 확산 메커니즘 규명이 힘들어 방역이 어려웠다.

하지만 KT의 기지국 통계 데이터와 농림축산식품부의 국가동물방역통합시스템(KAHIS) 데이터를 융합해 AI의 확산이 사람·차량의 이동과 어떻게 연관이 있는지를 분석했다. 조류 농장을 출입하는 축산차량의 출입정보(GPS)를 실시간으로 수집·활용해 방역시스템을 구축, 역학조사 시간을 단축시켰다.

국립재난안전연구원은 재난 예측 시스템을 준비하고 있다. 태풍 분석 정보, 기상 정보, 지형도, 침수 예상도 등을 활용해 시간대별 침수 지역과 위험 상황을 지역별로 사전에 예측한다.

이를 통해 위험 정보를 공유하고 전파하는 데 활용할 예정이다. 산림청은 산불 예측도 나서고 있다. 산림의 종류에 따라 실시간 산악 기상 정보를 분석해 예상 지역 및 위험도를 파악해 순찰 우선순위 선정 등 예방활동에 도움을 줄 예정이다.

상업 분야에서는 '스토어스토리'외에도 대한상공회의소가 유통 빅데이터를 통한 중소상인 지원 빅데이터 사업을 준비하고 있다. 유통 빅데이터는 대형유통사의 판매정보를 분석해 지역 슈퍼마켓 등 중소상인에게 시즌별 인기상품 분석정보, 날씨/지역 맞춤형 상품추천 등의 마케팅 정보를 제공할 예정이다.

송경빈 한국정보화진흥원 빅데이터센터 수석연구원은 "'정부 3.0'과 창조경제 기조와 관련해 가장 눈에 띄는 구체적인 실행전략이 빅데이터 사업"이라며 "현재로서 공공 부문에서 다양한 시도를 하는 초기 단계이며 향후 2, 3년 후에 구체적인 성과를 낼 것으로 보인다"고 말했다.

이어 송경빈 연구원은 개인정보 보호법이 빅데이터 활용에 걸림돌이 되고 있다고 지적했다. 그는 "개인정보의 유통과 공유의 측면에서 미국과 같은 선진국에 비해 우리나라는 규제가 많다"며 "개인정보를 공유하고 유통하기 위한 제도적 개선이 필요하다"고 말했다. 또 그는 "향후 빅데이터에 대한 시민 인식이 높아져 과도한 규제가 풀리면 공공과 민간 분야에서 빅데이터 활용 가능성은 높아질 것"이라고 덧붙였다.


#빅데이터#심야버스#스토어스토리#정부 3.0#서울시
댓글2
이 기사가 마음에 드시나요? 좋은기사 원고료로 응원하세요
원고료로 응원하기


독자의견

연도별 콘텐츠 보기