빅데이터는 거품이다

IT 2018. 8. 30. 23:10

- 데이터란 말은 20세기를 풍미했던 행태주의자들에게 금과옥조와 같은 단어였다. 그런데 데이터란 말의 약발은 80년대를 정점으로 그 힘을 잃어가고 있음. 데이터 분석만 잘 하면 사회가 움직이는 법칙을 밝혀낼 수 있다고 믿었던 행태주의 세력이 이미 쇠퇴하고 있었기 때문이다. 거의 50년을 넘게 행태주의자들이 수많은 연구를 했지만 법칙이라고 할 만한 것은 발견하지도 증명하지도 못함. 상식적으로 너무나 뻔한 종업원의 임금수준이 높으면 사기가 올라가고, 사기가 올라가면 생산성이 높아진다는 명제조차도 50년이 넘은 행태주의 연구를 통해 입증되지 못함. 조직이론가 윌리엄 스타벅은 09년도에 발표한 논문에서, 지난 100여년간 행태주의 사회과학에 있어서 지식의 축적은 거의 일어나지 않았으며, 오직 지적유행만이 반복되어 왔을 뿐이라고 비판하고 있다
- 우리 사회는 왜 이런 자격증 사회가 되었는가? 자격증 사회는 사이비와 깊은 관련이 있다. 사이비들이 너무 많다 보니, 자격증이라는 진입장벽을 만들어서 사이비를 억제하려고 하였다. 그런데 가만히 생각해보면, 자격증이라는 제도가 오히려 사이비를 양산하는 제도로 변질. 자격증이라는 제도가 사이비 집단에게 안전한 울타리를 제공하기 때문. 자격증은 없지만 본질을 꿰뚫고 있는 사람들을 차단할 수 있는 것이 자격증 제도다. 자격증이라는 울타리 안에서 보호받는 사이비들은 서로가 서로를 적당히 봐주기도 함. 사이비끼리는 치열한 경쟁이나 공격을 금기시함. 본질을 이야기하면 자신이 없기 때문이고, 본질을 갖고 싸우다 보면 사이비성이 드러나기 때문. 이렇게 사이비를 억제하려고 만든 자격증 사회가 거꾸로 사이비를 양산하고 사이비를 보호하는 울타리가 되어버린 세상. 그것이 바로 지금 우리가 살고 있는 사회 아닌가?
- 디지털 세계에서는 수천억개의 데이터를 순식간에 처리할 수 있지만, 현실세계에서는 단 한개의 돌부리에 걸려 넘어지기도 하며 단 한자루의 지팡이에 의지해서 걷기도 함. 빅데이터로 손쉽게 성공할 수 있다는 생각은 도박적 사고에 가깝다. 빅데이터 열풍은 작은 것 하나하나에 정성을 다하는 사람들을 멸시하는 풍조로 이어지기 쉬움. 대한민국의 미래는 허황된 빅데이터에 달려 있는 것이 아님. 우리의 미래는 현실세계의 작은 것 하나하나에 얼마나 많은 정성을 기울이는가에 달려 있다.
- 빅데이터가 오바마의 선거운동에서 정말로 효과적이었는가에 대한 확실한 증거는 없었다. 빅데이터 분석을 통하 맞춤형 광고가 효과적이었는가에 대한 질문에 대해 오바마 선거팀 일원이었던 아멜리아 쇼월터는 부정적 답을 내놓았다. 그녀는 맞춤형 이메일이 아니라 언제나 높은 효과를 지니는 이메일은 보편적 내용이었다고 고백. 다양한 맞춤형 광고가 아니라 폭넓은 경제적 메시지가 선거운동에 가장 효과적이었다고 회고.
- 오바마 선거팀 리더였던 하퍼리드는 빅데이터는 개똥이다라고 말하면서, 오바마의 2012년 선거운동을 빅데이터의 승리라고 이야기하는 것을 불편해 했다. 그는 선거운동에서 사용했던 정보들은 실제로 그렇게 방대한 데이터가 아니었으며, 엑셀로도 충분히 분석할 수 있는 양이었다고 말했다. 그는 맞춤형 광고에 대해서도 냉소적이었다. 유권자가 무슨 차를 타고 다니는가와 같은 데이터는 거의 활용하지 않았다고 한다. "당신은 오바마 대통령을 지지합니까?"라는 질문에 대한 응답과 같은 단순한 데이터가 훨씬 더 유용했다고 말한다.
- 우리나라 현장에서는 빅데이터가 성과를 내지 못해도, 많은 지식인들이 빅데이터 이론이 틀렸다고 생각하지 않음. 신기한 일이다. 많은 지식인들은 거꾸로 생각한다. 빅데이터는 맞는데, 우리나라 현장이 틀렸다고 생각. 미국의 학문을 수입해서 무언가 아는 척하는 지식인들에게 미국인론은 틀릴 수도 없고 틀려서도 안되는 것이다. 미국의 이론을 우리나라에 적용해서 성과를 내면 대단한 지식인으로 행세한다. 설혹 성과가 미흡하더라도 걱정할 필요는 없다. 우리나라의 현장이 잘못되었다고 비판하면 그만이기 때문이다.
- 이론과 현장이 서로 맞지 않는다면 이론이 틀린 것이다. 이것은 학자에게 있어서 기본중 기본이다. 이론의 모태는 현장이기 때문. 하지만 우리나라 많은 지식인들에게 있어서 이론의 모태는 현장이 아니라 미국이론이었다. 그들에게 미국이론은 신성불가침의 진리인 셈이다. 미국이론과 한국현장이 맞지 않으면 한국현장이 틀렸다고 쉽게 판단해버린다. 그리고 한국의 많은 지식인들은 한국의 현장을 미국의 이론에 맞게 고치려 한다. 그리고 그것을 개혁이라 여긴다. 신자유주의가 그러했고, 성과주의 제도가 그러했으며, 로스쿨 도입고 그랬다. 이제 빅데이터도 그렇게 흘러간다
- 컴퓨터 시뮬레이션 학자들은 보니니의 역설을 알고 있다. 보니니의 역설은 흔히 컴퓨터 모델이 크면 클수록 좋을 것이라고 생각하지만, 실제로는 그렇지 않다. 컴퓨터 모델이 커질수록 가치가 떨어진다는 역설이다. 이 세상의 복잡한 문제와 현상을 파악하고 해결하기 위한 방법으로 컴퓨터를 통한 모델링과 시뮬레이션이 주목을 받았다 모델링과 시뮬레이션은 20세기에 들어와 소수의 학자들에 의해 연구되기 시작. 모델링은 어떤 현상을 특정하고 명확한 목적에 맞춰 이해하기 쉬운 형식을 표현하는 것을 가리키고, 시뮬레이션은 모델링을 거쳐 만들어진 틀을 이용해 특정 대상에 대한 모의 실험을 진행하고 그것의 특성을 밝히는 과정을 말함.
- 케플러는 하늘에 떠 있는 수억개의 별들의 운행에 관한 빅데이터를 분석하여 흔히 케플러의 법칙이라고 일컬어지는 행성 운동의 법칙을 발견한 것이 아니다. 단 하나의 별, 화성의 움직임을 분석하여 케플러는 행성운동의 법칙을 발견. 페니실린을 발견한 플레밍도 마찬가지. 플레밍은 수많은 균과 시약의 상호작용을 보여주는 데이터를 분석하지 않았다. 휴가를 다녀온 플레밍은 자신이 균을 배양하던 접시에 곰팡이가 피어 있고 유독 거기에는 균이 자라지 못했다는 사실을 발견했다. 이 단 하나의 접시, 단 하나의 데이터에서 플레밍은 페니실린을 발견했다.
- 우리나라 빅데이터 유행의 특성
(1) 미국에 대한 모방이며 미국으로부터 수입
(2) 정부에 의해 주도된, 위로부터의 유행
(3) 반성과 비판이 없는 유행
- 빅데이터 유행은 지적 유행이다. 에릭 에이브러햄슨 교수는 96년 기업에서 유행하는 각종 경영기법들이 실제로는 유행에 불과하다고 주장. 그의 주장은 아마도 미국에서보다 우리나라에서 훨씬 더 설득력이 높을 것이다. 지적 유행이 확산되기 위해서는 세가지 조건이 필요.
첫째는 여유자원이 있어야 함. 지적 유행은 고급스러운 유행임. 많은 돈이 있어야 유지된다. 먹고사는 것이 급한 가난한 나라에서는 빅데이터 유행이 지속되기 어려움. 여유자원이 어느 정도 있는 사회라야 지적 유행이 확산될 수 있다. 가장 일반적인 여유자원은 정부 예산이다.
둘째, 인센티브가 필요. 정부의 여유자원을 유행에 참여하는 지식인들에게 분배해주는 인센티브 제고가 정립되어 있어야 함. 자신에게 돌아올 이익이 있어야 지식인과 기업체가 지적 유행에 뛰어든다.
셋째, 지적 풍토가 어느정도 열악해야 함. 돈을 바라보고 유행을 쫓아가는 사람들을 스마트하다고 치켜세워주는 성숙하지 못한 지적 풍토가 있을 때, 지적 유행을 부끄러워하지 않는다. 오히려 많은 사람들이 지적 유행에 편승하는 것을 자랑스러워한다. 실제로 지적유행에 편승하는 것이 출세의 지름길이 되기도 함. 지적 유행에서 멀어진 지식인들은 시대에 뒤처진 듯한 느낌이 들어 불안해하기도 함. 이렇게 천박한 지적 풍토가 조성되어 있을 때, 지적 유행은 비로소 꽃피게 된다.
- 지적 유행의 조건을 조금더 이해하기 쉽게 이야기해보자. 사기도박이 성사되려면 세가지 조건이 충족되어야 함
첫째, 돈을 주체하지 못하는 호구가 있어야 함. 호구가 돈을 잃어주어야 사기도박이 유지됨. 이것은 여유자원에 해당됨
둘째, 이 돈을 뺏어먹을 수 있는 기술자들, 즉 타짜들에게 인센티브를 주어야 함. 비록 타짜와 같은 기술을 갖고 있지 않지만 도박장소를 제공해주는 하우스 운영자들에게도 위험을 감수할 만큼의 인센티브가 주어져야 함.
셋째, 호구와 타짜를 엮어주는 바람잡이들이 있따. 바람잡이들은 호구들의 도박능력을 과도하게 칭찬해주고, 호구들에게 근거없는 자신감을 불어넣는다. 바람잡이의 역할은 천박한 지적풍도를 조성하는 일이다.
- 지적풍토에 대해 살펴보자 빅데이터 유행을 가져온 지적풍토의 저변에는 두가지 신화가 자리잡고 있음. 하나는 현대적 신화이고, 다른 하나는 오래된 신화다. 먼저 현대적인 신화를 이야기하면, 행태주의에 대한 믿음이다. 미국의 많은 지식인들은 지난 백년간 행태주의에 사로잡혀 이었다. 행태주의는 20세기 초 미국 심리학에 그 뿌리를 두고 있으며, 2차대전 이후 많은 관심을 받음. 행태주의는 사회현상 전반을 관찰이 가능한 객관적 대상으로 보며, 경험적으로 검증될 수 있는 사실을 중요시하여 계량적 분석에 중점을 둔다. 즉, 행태주의에서 강조하는 것은 사람들의 행태에 대한 데이터 분석이다. 소비자들의 행태에 대한 데이터를 분석해서, 소비자들이 무엇을 원하는지 알아내고, 미래에 어떠한 소비를 할 것인지 예측해서 더 많은 판매량을 달성하고자 한다. 이것이 미국의 경영학과 심리학을 주도하는 거대한 담론이다. 물론 이러한 행태주의를 비판하는 학자들이 있지만, 여전히 미국 지식인들의 대부분은 행태주의를 신봉한다. 행태주의에 입각해서 논문을 써야 심사통과도 잘 되고, 정부로부터 큰 프로젝트도 받을 수 있다. 이렇듯 행태주읭 대한 믿음이 강한 분위기에서 빅데이터 개념은 수비게 먹혀들었다. 빅데이터 분석을 하면 소비자들의 행동패턴을 정확하게 분석하고 예측할 수 있다고 선전하고, 행태주의에 익숙한 기업의 CEO들은 빅데이터 시스템을 경영혁신으로 받아들인다. 에이브러햄슨의 주장처럼 미국기업의 경영혁신은 대부분 유행을 따라가는 것에 불과. 빅데이터는 또 하나의 새로운 유행일 뿐이다. 빅데이터 유행을 가져온 또 다른 지적풍토는 오래된 고전적 신화로서, 큰 것에 대한 신화다. 큰 것이 이긴다는 신화는 서구인들의 마음속 깊이 자리잡고 있는 종교적 믿음이다. 큰 것에 대한 집착을 비판하면서 슈마허는 작은 것이 아름답다는 책을 내기도 했다. 이 책의 5장에서 슈마허는 이렇게 말했다.
"오늘날 거의 모든 사람이 거대주의라는 우상숭배로부터 고통을 겪는다. 그러므로 작은 것의 미덕을 고지하는 게 필요하다. 거대주의와 기계화의 경제학은 19세기적 조건과 사고방식을 그대로 이어받고 있으며, 그래서 오늘날의 실질적인 문제를 해결할 수 있는 능력은 조금도 없다."
- 큰 것이라는 우상숭배와의 싸움은 기독교의 역사이기도 했다. 기독요에서는 큰 것에 대한 숭배를 바알 신앙의 핵심으로 본다. 창세기의 바벨탑은 크고 높은 건물에 대한 우상숭배였다. 다윗과 골리앗의 싸움에서 상징적으로 드러나듯이, 하나님의 일꾼은 작고 연약한 자였으며, 그의 원수는 힘이 세고 큰 거인이었다. 하나님이 보낸 연약한 리더를 따라야 할 이스라엘 백성들은 늘 크고 센 것을 동경하곤 했다. 그것은 바로 바알숭배였으며, 하나님을 향한 죄악이었다.
- 미국은 무엇보다도 오랜기간 동안 빅데이터에 대해 준비해왔다. 그만큼 미국 사회의 현장에서 빅데이터 분석에 대한 필요성과 그 해결책이 제기되어 왔다. 미국사회는 빅데이터에 대한 최소한의 실체와 개념을 확보하고 있는 셈. 꼼꼼한 검토 없이 미국에서 유행하는 빅데이터를 수입한 우리와는 다르다. 미국 정부의 빅데이터 연구는 허황된 미래 예측에 초점을 두기보다는 과거 데이터들간의 상관관계를 분석하는 과학적 방법에 초점을 두고 있다. 이에 비해 우리는 빅데이터를 만병통치약으로 신봉하는 편에 가깝다.
- 우리의 모방적 지적유행은 자생적 지적유행보다 훨씬 위험. 모방적 지적 유행은 자생적 지적유행의 모든 문제점에 더해서 맹신이라는 독약을 하나 더 갖고 있는 셈. 자생적 지적유행에는 이를 비판하고 견제하는 지식인들이 존재. 하지만 선진국을 맹신하는 풍토에서, 선진국의 유행을 모방하는 유행을 비판하기는 어렵다. 선진국의 유행이 우리에게는 첨단이자 개혁이며 진보로 포장되기 때문. 빅데이터는 우리에게 기술 이상의 의미를 지님. 빅데이터는 우리에게 이데올로기다. 빅데이터를 비판하는 것은 지식인 사회 전체를 비판하는 것이며, 심지어는 미국을 비판하는 것이다. 우리에게는 지적 유행을 비판할 자유가 없다. 지적 유행이 스스로, 제 풀에 지펴 사그라들기만을 기다려야 한다. MB정부 때의 녹색성장이 그러했듯이.
- 분명하고 절대 변하지 않는 한가지 사실은, 빅데이터 분석을 통해 알 수 있는 것은 인과관계가 아니라 상관관계일 뿐이라는 점. 앤더슨 조차도 이를 분명히 인정하고 있다. 이것이 빅데이터 분석의 궁극적 한계다. 상관관계는 행태주의의 근원적 개념이다. 표면적 행태들 간의 상관관계를 발견하면 된다는 것이 행태주의의 근본정신이다. 심층적으로 그리고 구조적으로 행태들이 어떠한 인과관계로 연결되어 있는지는 알 수 없다는 것이다. 이러한 점에서 빅데이터와 행태주의는 본질적으로 동일한 세계관을 지님. 이 세상의 심층적 구조는 알기 힘드니, 겉으로 드러난 행동만 분석하는 것이다. 겉으로 드러난 행동이 바로 데이터다. 그런 데이터가 모아진 것이 빅데이터다. 겉으로 드러난 행동을 액면 그로대 분석하는 방법이 바로 상관관계 분석이다. 빅데이터 분석은 본질적으로 상관관계 분석인 셈이다. 그러므로 빅데이터는 본질적으로 행태주의 원리와 동일.
- 계량경제학자 전성재 교수도 이를 지적한다. "빅데이터가 경제학의 방법론을 송두리째 바꾸리라 생각하는 이들도 있는 듯하다. 하지만 빅데이터가 경제학 모델에 기반한 데이터 분석을 완전히 대체하리라 믿는 경제학자는 거의 찾기 힘들다. 데이터에만 의존하면 숨겨진 인과관계를 이해하기가 거의 불가능하기 때문이다."
- 빅데이터를 통해 미래를 예측할 수 있다는 망상은 오해와 착각에서 비롯됨. 과거에 대한 측정과 추론을 미래에 대한 예측으로 오해하는 것이다. 구글의 독감 예측이 전형적 사례. 구글의 독감 분석은 이미 과거에 이루어진 사람들 간의 대화를 관찰해서 전체 인구에서 독감환자가 몇명이나 될지 추론한 것. 미래를 예측한 것이 아니다. 비슷한 사례로 선거예측이 있다. 빅데이터 분석을 통해 SNS에서 여당 지지율을 관찰해서 전체 유권자 중 여당을 지지하는 사람이 어느 정도일지를 추론하는 것. 오바마 빅데이터팀의 예측처럼 6개월전에 추론한 지지율이 들어맞았다고 하더라도 그것은 예측이 아니라 추론이다. 6개월전의 추론이 그대로 유지되었을 뿐이다. 여론조사를 통한 선거예측이라는 것도 사실은 과거에 대한 관찰과 추론일 뿐. 그럼에도 불구하고 많은 사람들, 심지어 많은 지식인들이 미래의 선거결과를 예측하는 것으로 착각한다. 알만한 사람들이 오해의 늪에서 헤어나지 못한다.
- 빅데이터는 데이터다. 데이터는 과거의 기록일 뿐이다. 그리고 빅데이터 분석은 상관관계만을 제공한다. 이것은 아무리 복잡한 첨단기술을 갖고 온다 하더라도 변할 수 없는 것이다. 데이터가 아무리 많아도 그것이 지식이나 지혜가 될 수는 없다. 이에 비해 이론은 지적인 고민과 정제와 깨달음의 산물이다. 이론은 그 자체가 지식이다. 많은 이론이 모여 훌륭한 지혜를 제공할 수 있는 것이다. 그러나 데이터는 아니다. 그
- 인류가 등장한 이후 밤하늘에 원시인들의 머리 위로 무수히 많은 별들이 떠 있었다. 하지만 케플러의 이론이 나오기 전까지 사람들은 별들의 운행을 이해할 수 없었다. (사이먼)

'IT' 카테고리의 다른 글

알고리즘이 욕망하는 것들  (0) 2019.06.28
데이터 인문학  (0) 2019.04.07
비트코인과 블록체인  (0) 2018.08.30
시작된 미래  (0) 2018.06.24
비즈니스 블록체인  (0) 2018.06.23
Posted by dalai
,