내 정보 팔아 돈 버는 구글, 보상받을 수 있을까?

[갈등의 정보사회학 시리즈⑦] 빅데이터의 두 얼굴

등록 2014.04.14 18:25수정 2014.04.14 18:25
102
원고료로 응원
새롭게 우리 앞에 열린 정보사회는 지난 산업사회의 유물들과의 갈등과 투쟁으로부터 시작된다. 갈등은 불가피하다. 새로운 시대의 첫 장을 위해서는 당연히 존재해야 된다. 문제는 갈등 자체가 아니라 갈등의 본질, 논쟁의 사회적, 철학적 맥락을 이해하고 분석하는 일이다. 논쟁을 통해 정보사회를 이해한다는 것은 현실 속에서 현실에 매몰되지 않고 현실을 이해하는 방식이다. 정보사회학을 전공한 필자가 매주 하나씩 주요 쟁점들을 분석·정리해서 올린다. 독자 여러분의 논쟁적 참여를 기대한다. – 기자 말

1984년 또는 신세계의 서막

빅 데이터는 쉽게 빅 브러더(Big Brother)를 연상시킨다. 빅 브러더는 조지 오웰의 소설 <1984년>에 나오는 가공의 인물이다. 사람들은 그의 실체를 본 적이 없다. 그러나 그는 모든 것을 알고 있는 독재자다. 누구라도 그의 감시망에서 벗어날 수 없다. 조지 오웰의 이 불길한 예언이 정보 사회에 들어오면서 현실화되었고 최근 빅 데이터가 급부상하면서 사회적 주요이슈로 부각되기 시작했다.

사실 빅 데이터 도입 이전에도 빅 브러더에 의한 개인의 사생활 감시는 주요 사회문제였다. 모든 것이 컴퓨터로 처리되고 있기 때문에 개인이 움직일 때마다 그의 움직임이 파악된다. 신용카드의 사용 일시, 내역 등이 다 서버에 정장된다. 도처에 있는 CCTV를 통해 동선 역시 파악할 수 있다. 어디에서 누구와 어느 온라인 게임을 하고 있는지 실시간으로 파악된다. 이러한 정보 흐름이 빅 데이터의 도입으로 더 극대화 된다.

빅 데이터는 어떻게 활용되는가

a

우리는 우리의 의지와 상관없이 우리를 분석 대상으로 사이버 공간에 노출시킬 수밖에 없다. 그리고 그 노출의 결과는 알 수 없다. ⓒ sxc


세계경제포럼(www.weforum.org)이 발표한 2012년 떠오르는 10대 기술에 정보학 (Informatics)이 포함되면서 빅 데이터가 기술적, 사회적 주요 의제로 떠올랐다. 지식경제부의 R&D 전략기획단 역시 2012년 IT 10대 핵심기술로 빅 데이터 및 인공지능을 선정했다. 시간이 흐를수록 정보는 과도하게 생성되고 유통되고 있지만 그와 반비례하여 실제 필요한 정보, 유용한 정보를 얻기는 더 힘들어졌다는 판단과 제대로 된 정보활용의 필요성이 이전보다 더 중요시되었다는 사회적, 경제적 인식 때문이다. 빅 데이터란 무엇인가. 우선 다음의 두 기사를 보자.

"ㅋ과 ㅠ는 텍스트 메시지에서 가장 많이 사용하는 기호다. ㅋ은 남자가 여자에 비해 16.4% 많이 사용한다. ㅠ는 여자가 남자에 비해 28.9% 많이 사용하는 것으로 나타났다. 자세히 살펴보면 ㅋ은 남자와 여자 공통적으로 친한 사람과의 대화에서 출현 빈도가 15%가 낮아졌다. 가까운 관계기 때문에 예의를 차릴 필요가 없는 것이다. ㅠ는 남성의 관심 있는 그룹에서 사용빈도가 32% 늘었고, 여성은 21%가 늘었다. 애교의 표식이라는 방증이다." - <전자신문> 2013년 4월 2일자 '카카오톡 대화할 때…여자의 애교란 이런 것?'의 일부


"도요타자동차가 새로운 정보 제공 서비스인 '빅 데이터 교통 정보 서비스'를 개발해 일본 전국의 지자체나 일반 기업은 물론, 개인을 대상으로도 서비스 제공을 개시한다고 7일 밝혔다. '빅 데이터 교통 정보 서비스'는 텔레매틱스 서비스를 통해 수집·축적한 차량의 위치나 속도, 주행 상황 등의 정보를 포함한 빅 데이터를 기본으로 가공한 교통 정보나 통계 데이터 등을, 지자체나 기업에 제공해 교통 흐름 개선이나 방재 대책 등에 활용할 수 있는 지자체와 기업용 정보 제공 서비스다." - <오토헤럴드> 2013년 6월 7일자 '도요타, 빅 데이터 활용 새로운 정보 서비스 제공'의 일부

첫 번째 기사는 우리가 무심결에 사용하는 언어습관이 컴퓨터 시스템에 의하여 분석되고 그 분석 결과가 여러 가지 용도로 쉽게 활용되는 사례를 보여준다. SNS에서 오가는 텍스트나 이모티콘을 분석하면 일자 별 감정변화, 특정 상대방에 대한 호감도, 자주 쓰는 말투, 대화의 기본 패턴 등을 읽을 수 있고 그 결과가 심리 치료나 상품판매를 위한 마케팅 자료로 활용될 수 있다. 기본적으로 SNS는 개인들의 사적인 용도로 출발했지만, SNS서비스를 운영하는 회사가 서버를 갖고 있기 때문에 필요하다고 판단되면 언제든 특정 개인 또는 특정 집단의 대화 내용을 찾아 분석할 수 있다.

두 번째 기사는 자동차에 설치된 컴퓨터 시스템을 활용해 운전 중 자료들을 수집하고 채집된 데이터를 분석해 필요한 기관, 개인에게 보내 활용할 수 있게 한다는 내용이다. 이 사례 역시 특별히 정보 수집 노력을 할 필요가 없다. 자동차에 설치된 컴퓨터에 연계된 카메라를 통해 거리의 모든 정보를 실시간으로 얻을 수 있고 컴퓨터에 입력된 정보는 네트워크를 통해 서버로 바로 연결되기 때문이다. 도처에 설치되어 있고 실시간으로 작동하는 CCTV 역시 같은 시스템이다.

이 두 사례 모두 개인의 의지와 상관없이 자신의 정보가 타인에 의해 수집되고 분석되어 여러 용도로 사용되고 있는 현실을 보여준다. 위 사례 중 두 도요타 사례의 경우 개인의 의지나 노력과는 상관없다. SNS 경우, 개인 노력 여하에 따라서 데이터나 정보 제공에 인위적 통제가 가능하다고 주장할 수 있겠지만 사실상 불가능하다. 네트워크 시대에는 개인의 의지와 상관없이 누구나 정보 전달의 매개가 될 수밖에 없기 때문이다.

우리는 우리의 의지와 상관없이 우리를 분석 대상으로 사이버 공간에 노출시킬 수밖에 없다. 그리고 그 노출의 결과는 알 수 없다. 그 많은 데이터를 수집하고 분석하는 거대한 컴퓨터 시스템만 그 의도와 결과를 알 수 있다.  빅 데이터는 이렇게 우리도 모르게 우리 일상에 파고들었고 지금도 계속해서 작동되고 있다.

정보는 누구의 것인가?

데이터 또는 정보는 누구의 것인가 하는 문제는 데이터의 생성, 유통, 보관, 삭제를 포함한 모든 것들에 대한 기본적인 개념을 정리해주는 주요 질문이다. 정보화 시대 이전에는 데이터나 정보에 대한 소유 개념이 분명했다. 데이터가 생성, 유통, 보관되는 순환 과정이 제한된 소수에 의해서 수행되었고 특히 데이터 보관이 제한적으로 이루어졌기 때문이다. 데이터 보관을 위해서는 물리적 공간과 물리적 시설들이 필요했고 그것들을 위해서는 막대한 투자가 선행되어야 했기 때문에 국가 차원의 특별한 경우를 제외하고는 특정 개인이나 집단의 데이터 보관이 사실상 불가능했다.

특히 개인 차원에서 데이터가 보관, 유지되는 경우 개인의 소멸과 더불어 데이터 역시 소멸될 수밖에 없었다. 결국 사적인 데이터나 정보는 공적, 사회적 의미를 상실했고 순수하게 사적인 의미로만 존재할 수밖에 없었다. 사적인 데이터나 정보가 공적인 의미를 갖는 순간은 투표와 같은 정치적 행위나 여론조사, 마케팅용 설문조사 등에 응답할 때다. 이런 것들은 처음부터 조작적으로 진행되었기 때문에 개인들은 자신에게 나온 데이터나 정보가 특정 목적에 사용된다는 것에 동의했고 데이터의 최종 소유권은 그 사회에 귀속된다는 사실을 인정했다.

그러나 정보사회에 들어오면서 상황이 달라지기 시작했다. 정보의 순환 과정이 이전 시대와 근본적으로 달라졌기 때문이다. 특히 생성된 정보의 보관 방식에 중요한 변화가 생겼다. 사적으로 은밀하게 주고받은 데이터, 정보라 하더라도 제3자가 그 데이터를 보관하고 있고 보관된 데이터에 대한 실질적 통제권이 더 이상 개인들에게 있지 않다. 개인들은 정보를 생성할 수는 있어도 더 이상 통제할 수는 없다.

SNS를 통해 주고 받은 수많은 데이터나, 정보, 콘텐츠가 어딘가에 저장되어 있다. 또는 인터넷 쇼핑과 같은 전자 상거래를 위해 제공한 개인정보가 세계 여기저기를 떠돌고 다녀도 달리 어떻게 할 방법이 없다. 문제는 그 정보들이 본인도 모르게 여기저기서 사용되고 있다는 사실이다.

음성으로 통신을 하는 경우 제3자가 법원의 영장 없이 그 내용을 녹음하면 실정법 위반으로 법에 저촉을 받게 되지만 인터넷을 이용해 메시지를 주고받는 경우에는 사실상 그 서비스를 제공한 제3자에게 자신의 데이터가 보관된다는 사실을 전제로 한다. 개인이 SNS를 포함한 인터넷 활동을 어느 정도 절제하는 것은 가능하겠지만 근본적으로 단절할 수 없다면 서비스 제공자가 제공하는 개인정보 설정 페이지에 들어가서 자기 개인정보의 배포범위를 조정하는 노력을 끊임없이 기울여야 한다.

그러나 이 역시 쉽지 않다. 정보의 보관뿐만이 아니라 정보가 유통되는 과정 역시 개인의 의사와는 상관없이 이루어지기 때문이다. 대표적인 기업이 구글(www.google.com)이다. 구글은 G메일과 유튜브는 물론 SNS 성격의 '구글+'에다 스마트폰 OS 안드로이드까지 운영하고 있다. 활용 가능한 모든 시스템을 동원해 개인 정보를 수집, 저장, 활용하고 있다. 최근에는 거리 영상과 위치정보를 수집하고 있고 그 과정에서 무차별적으로 개인정보를 수집해 논란이 되기도 했다.

이렇게 정보의 유통과 저장 관련 시스템이 근본적으로 바뀌면서 데이터나 정보의 소유가 누구에게 있느냐 하는 문제의식이 중요해진다. 구글은 개인정보를 이용해서 막대한 수입을 올리고 있지만 정보나 콘텐츠를 제공한 개인에게는 별다른 보상 시스템이 없다. 오히려 계속 더 많은 개인 정보를 얻기 위해 시스템을 개발하고 있다.

빅 데이터, 기술결정론과 기술의 사회구성론

a

SNS를 통해 주고 받은 수많은 데이터나, 정보, 콘텐츠가 어딘가에 저장되어 있다. ⓒ sxc


이제 다른 측면에서 빅 데이터에 대한 논쟁점을 찾아보자. 우선 빅 데이터에 대한 긍정적 관점들을 분석해 보자. 빅 데이터에 대한 우호적 반응들 기저에는 기술 낙관론이나 기술 결정론적 요소가 내포되어 있다. 앞 서 언급한 빅 브러더에서는 기술 발달이 가져올 끔찍한 미래에 대한 암울한 예언이 내포되어 있지만 현재 유행하고 있는 빅 데이터에서는 일부 우려에도 불구하고 전체적으로 미래에 대한 낙관적 전망이 가득하다.

그 전망의 근거는 크게 두 가지로 분류할 수 있다.  하나는 "예측 가능성"이다. 빅 데이터는 많은 정보들을 체계적으로 분석해서 앞으로 개인과 사회가 어떻게 미래를 준비해야 하는지 알려준다. 둘째는 "기술의 진화"다. 빅 데이터 기술은 계속 진화할 것이고 더 많은 정보를 더 효율적으로 분석할 수 있을 것이라는 믿음이 도처에 산재해 있다. 이제 중요한 것은 데이터를 잘 이해, 분석하고 활용할 수 있는 기술과 그 기술을 운영할 수 있는 엔지니어다.

기술결정론은 특히 정보시대의 주요 주창자들에게 잘 찾아 볼 수 있다. SNS나 클라우드 컴퓨팅, 빅 데이터 등 새로운 개념이 등장할 때마다 거의 무비판적으로 수용된다. 일단은 사람들의 삶을 이전보다 더 편하게 해주는 몇 가지 요소들이 분명히 있기 때문이다. 이전보다 더 편하게 살 수 있다면 부작용은 작아 보인다. 이런 측면에서 보면 기술결정론은 미래에 대한 낙관론에 기초하고 있다. 긍정적인 측면에서만 본다면 기술발달이 인간의 삶을 이전보다 더 풍요롭게 만든 측면이 많기 때문이다.

반면 빅 데이터에 대한 비판적 반응들 기저에는 기술의 사회적 구성론적 요소가 내포되어 있다. 기술 자체가 변화시킬 수 있는 것은 제한적이라는 것이다. 기술이 중요한 것이 아니라 기술의 사회적 맥락이 더 중요하다. 사회를 구성하는 요소는 다양하다. 기술은 다른 사회적 요소들 예를 들어 경제적 상황, 시대정신, 환경 문제 등 여러 주요 요소들 가운데 하나일 뿐이다.

기술은 결코 중립적이지 않으며 특정 기술의 발달은 그 사회의 여러 상황을 반영한 결과다. 예를 들어 SNS가 활성화된다고 해서 사회가 이전보다 더 통합적으로 운영되지는 않는다. 좀 더 단순하게 표현하자면 사회가 더 개방적으로 진전될 수도 있고 오히려 대립이 더 격화될 가능성도 있다.

기술의 발전이 결코 예측 가능한 하나의 결론을 유도하지 않는다. 기술보다 더 중요한 것은 구성원들의 사회적 의지나 사회적 필요성이다. 기술은 사회적 구성물이기 때문이다. 기술의 사회 구성론적 입장에서 기술 결정론적 견해를 비판하자면, 빅 데이터 시대의 최고 지도자는 엔지니어가 되어야 하는데 실제로 그럴 가능성은 없다는 것이다. 빅 데이터는 하나의 참고 사항이지 종합적 판단을 위한 최적의 자료는 아니다. 오히려 그 반대로 사회적 위해 요소가 될 수도 있다.

빅 데이터를 둘러싼 논쟁에서 기술결정론과 기술의 사회적 구성론을 언급하는 또 다른 이유 중의 하나는 빅 데이터가 최종적으로 누구에게 도움이 되는가 하는 문제와 연결되어 있다. 데이터를 분석하고 활용하는 기술이 중요해지면서 최종 도출된 데이터를 활용하는 사람들은 더 많은 이익을 얻을 수 있는 반면에 그렇지 못한 사람은 오히려 정보 격차가 더 벌어질 가능성이 많다.

기술결정론적 시각에서는 정보 격차가 줄어들고 더 많은 사람에게 더 많은 정보가 공급될 것이라는 희망의 메시지를 전달하고 있지만 기술의 사회적 구성론 입장에서는 빅 데이터가 자본의 자기 확장을 위한 새로운 돌파구로 출발했고 결론 역시 자본의 자기 증식을 위한 충실한 도구로 활용될 가능성이 높다고 주장한다.
덧붙이는 글 김홍열 교수는 연세대학교에서 독문학, 국문학을 공부했고 성공회대학교에서 사회학 석사 박사 과정 후 <정보네트워크 변화에 따른 가상공간의 확장과 권력관계의 재구성>으로 학위 취득했다. 저서로는 <축제의 사회사> (2010. 한울), <디지털 시대의 공간과 권력>(2013, 한울)이 있고 현재 성공회대학교 겸임교수로 재직하면서 성공회대와 명지대에서 '과학기술의 사회학'과 '정보사회학'을 강의하고 있습니다.
#빅데이터

AD

AD

AD

인기기사

  1. 1 61세, 평생 일만 한 그가 퇴직 후 곧바로 가입한 곳
  2. 2 죽어라 택시 운전해서 월 780만원... 엄청난 반전이 있다
  3. 3 "총선 지면 대통령 퇴진" 김대중, 지니까 말 달라졌다
  4. 4 '파란 점퍼' 바꿔 입은 정치인들의 '처참한' 성적표
  5. 5 민주당은 앞으로 꽃길? 서울에서 포착된 '이상 징후'
연도별 콘텐츠 보기