검찰이 작성한 국정원의 '범죄 일람표' 2120페이지에 대해 시민들의 자발적인 디지털 문서화 협업 작업이 시작됐다. <오마이뉴스>가 27일 이미지 형태로 전문 공개한 이 자료가 전부 디지털 문서화 될 경우 시기별, 사이트별, 대상별, 내용별, 단어별 등 보다 상세하고 심층적인 분석이 가능해진다.
협업 작업은 공동 문서 편집 및 공유 기능을 제공하는 구글 드라이브에서 진행 중이며, 구글 계정이 있으면 로그인을 통해 누구나 참여할 수 있다. 28일 오후 6시 현재까지 약 100여명의 누리꾼이 이 작업장에 다녀갔으며, 속속 이미지가 텍스트로 바뀌고 있다.
* 국정원 '범죄일람표' 자발적인 디지털 문서화 작업 페이지 바로가기자발적인 작업이 시작되는 순간
시민들의 자발적인 참여는 <오마이뉴스>의 한계에서 시작됐다. 방대한 양의 문서자료를 입수하고 공개를 결정했을 때, 가용 가능한 인력 상황에서 가장 빠른 길을 찾아야 했다. 결론은 스캔을 통한 이미지화 작업이었고, 결국 작업 시작 약 24시간만인 27일 오후 7시경 전문 공개에 성공했다. 하지만 이렇게 이미지 상태로 공개하는 것은 검색과 정렬 불가능 등 한계가 뚜렸했다.
특별페이지를 통해 공개가 되자 긍정적 반응과 함께 이런 한계에 대한 지적이 나왔다. 이날 오후 8시경 트위터 사용자 @dangun76이 "<오마이뉴스>의 국정원 인터넷 공작 2120 페이지 공개 프로젝트는 예전 가디언이 50만건에 달하는 문서를 공개했던 MP's expenses를 떠올리게 하네요"라며 "다만 아쉬운 점이 있다면, 문서를 showing 하는데 그치지 않고 문서를 보고 시민들이 새로운 사실을 발견할 수 있도록 참여하는 시스템을 설계됐다면 하는 것"이라고 아쉬움을 지적하는 트윗을 날리자, @nomasumer가 아래와 같이 받았다. 둘 사이에 짧은 대화가 오갔다.
@nomasumer구글독스(구글드라이브의 예전 이름)같은 걸로 공동작업하면 금방 검색 가능한 문서로 만들 수 있을 것 같은데...@dangun76제가 제대로 이해했는지 모르겠습니다만. 저 문서를 파일로 받은 게 아닌 듯합니다. 하나하나 스캔 떠서 jpg 형태로 올린 상황인 듯하고요. 때문에 구글닥스로 넣을 수가 없지 않을까 싶네요. 뛰어난 OCR 기술(종이에 쓰여진 글자를 디지털 글자로 바꾸는 기술)이 있으면 몰라도.@nomasumer뛰어난 OCR = 인간의 눈, 멀티코어CPU = 참여하는 인원수, 2000명이 달라붙으면 몇 분만에 끝낼 수 있을 것 같은데, 준비 되면 다시 멘션 드릴께요.약 1시간 후인 오후 9시경, 이런 트윗이 올라왔다.
@nomasumer검찰이 찾아낸 국정원 인터넷 페이지 전문 문서화 작업장입니다. 많이 참여해주세요.이 트윗에는 공동 작업을 할 수 있도록 준비된 구글 드라이브의 주소가 링크되어 있었다. 시민들의 자발적인 공개 협업 프로젝트가 시작되는 순간이었다.
@nomasumer는 전화통화에서 "이미지 상태인 범죄일람표 문서를 모두 텍스트화 하면 언론이든, 네티즌이든, 여러가지 의미있는 분석을 할 수 있을 것 같아서 시작하게 됐다"면서 "많은 사람이 달라붙어서 문서를 만들수록 금방 끝날 것"이라고 말했다. 그는 "완성되면 딱 어디에 쓰겠다는 생각은 아직 없지만, 기본적으로 여러 사람이 쓸 수 있도록 공개를 제 일 목적으로 하고 있다"고 말했다.
MB 정권에서 국정원은 대통령과 여권에 유리하게 하기 위해 디지털 세상에 흔적을 남겼다. 그중 일부를 검찰이 찾아냈고, 기소했으며, 그 기록이 아날로그 형태로 세상에 공개됐다. 이제 시민들이 자발적으로 나서 그것을 다시 디지털로 바꾸는 작업을 하고 있다. 다시는 이런 일이 일어나지 않기를 바라는 마음으로.
* [전문 해설] MB 정부 결정적 시기에 심리전단은 바쁘게 움직였다* [전문 공개 특별 페이지] 검찰이 찾아낸 '국정원 인터넷 공작' 2120페이지* 시민들의 자발적인 디지털 문서화 작업 페이지 바로가기