많은 분들이 가지고 있는 의문 하나를 풀어 드리겠습니다.

'왜 한국 정치인들은 빅데이터를 활용하지 않는가?'

전 이번 6.4지방선거에서 저 의문을 직접 해결해 볼려고 아둥바둥 거렸던 경험이 있습니다.

결론적으로 말씀드리면 '안'하는게 아니라 '못'하는 것입니다.

못하는 이유는 크게 두가지인데, 첫째는 정보 수집이 어렵고, 두번째는 정보활용이 어렵다는 것입니다.

1. 정보 수집의 어렵다? 

오바마 캠프가 대선에서 빅데이터를 잘 활용한 것은 널리 알려진 사실입니다. 그런데 많은 분들이 '잘 분석해서 잘 이용했다'는 부분만 보고 있으시네요.

더 중요한 문제는 '잘 분석하고 잘 이용하기 위한 데이터를 어떻를 어떻게 수집하느냐'입니다. (빅데이터가 데이터마이닝이 아닌 빅데이터로 불리는 이유라고 생각합니다.)

오바마 캠프는 '구매 가능한 모든 상업용 데이터와 공공데이터를 비롯해 실무팀이 직접 수집한 정보까지 취합'해 활용했습니다.

여기에는 카드, 병원 기록을 비롯하여 온라인 쇼핑기록 등, 각종 라이프 사이클을 알 수 있는 정보가 포함되어 있는 것으로 알고 있습니다.

하지만 한국에서는 이런 정보를 수집할 수 없습니다. 허울뿐인 개인정보보호법은 이미 개인의 모든 정보를 홀라당 털리게 했지만, 공식적인 활동에서는 이 법이 커다란 제약이 되기 때문에 이런 정보들을 활용할 수 없습니다.

개인정보보호법으로 보호되는 양질의 정보는 활용할 수 없기 때문에, 의미있는 정보를 수집하는 유일한 방법은 앱이나 홈페이지를 통해서 혹은 지역의 조직을 통해서 개인이 직접 자신의 정보를 선거캠프에 보내게 하는 방법뿐입니다. 

중요한 점은 이렇게 자발적으로(?) 정보를 보내준 유권자는 이미 후보자의 적극 지지층이기 때문에 '적극적인 설득 작업을 하지 않아도 되는 그룹'으로 분류된다는 것입니다.

또 이렇게 모은 정보도 그 '질적인 측명에서는 현저하게 떨어진다'는 점입니다.

수집된 정보를 분석해 보면 이름, 나이, 주소, 성별, 전화번호 정도가 가장 의미있는 정보고 그 외에 유권자의 성향을 파악할 수 있는 정보가 전무하다고 할 수 있습니다. 그나마 이 정보 조차도 의미 있는 수를 모으기가 힘듭니다.

2. 정보 활용이 어렵다?

수집에 장애가 되는 부분이 '개인정보보호법'이라면, 활용에 장애가 되는 부분은 '선거법'입니다.

다년간 선거를 경험하신 분의 말을 빌리면 '대한민국 선거법은 세계에서 가장 복잡하고 까다로운 법'이라고 합니다.

선거법에는 선거기간 중 문자는 몇 번 보낼 수 있는지, 광고는 어디어디에만 해야 하는지 아주 구체적으로 나와 있습니다. 그리고 법에 명시되지 않은 곳에는 광고를 할 수 없다고 딱 못박아 놨습니다. 

이 선거법이 웃긴게 '매 선거마다 선거법이 변하고 동일한 콘텐츠라도 매체에 따라 선거법을 위반하게 될 수 있다'는 점입니다.

한 예로 언론사에는 배너광고 집행이 가능하지만(선거법상 포털은 언론사로 규정됩니다.) 법에 명시되지 않은 '페이스북'에는 광고 집행이 불가능합니다.

또 선거 당일에 투표독려 문자를 보내는 것은 선거법에 위배되지 않지만, SNS에 투표독려 글을 올리는것은 선거법에 위배됩니다.(선관위에 문의한 답변입니다)

이렇게 복잡다양한 제약을 걸어 놓은 선거법 때문에, 양질의 데이터를 가지고 의미있는 결과를 도출해도, 그걸 활용할 수 있는 방법론에서 많은 제약이 따르게 됩니다.

이 두가지 이유 때문에 한국에서는 합법적으로 빅데이터를 활용한 선거가 불가능합니다.

의문이 풀리셨기를 바랍니다.

PS. 오해의 소지가 있는 부분에 관해서 살짝 해명을 하자면, 이 글에서는 '개인정보보호법'과 '선거법'이 제약이라고 말씀 드렸지만, 이것은 어디까지나 선거에 빅데이터를 적용하기 위한 방법론에서의 제약입니다.

개인정보보호법은 '공식적'으로는 꽤난 강력하게 개인의 정보를 보호해 주고 있습니다. 정보의 활용과 도용에 의한 피해가 날로 심각해지는 시점에서 개인정보보호법은 더 강화하면 강화했지, 풀어지면 안되는 법이라고 생각합니다.

+ Recent posts