타겟티드

IT 2020. 10. 18. 20:07

- 우리는 개인 정보 자체를 돈을 주고 구매하는 방식으로 모든 미국인에 대한 개인 정보를 수집했다. 우리는 익스피리언Experian, 액시엄Axiom, 인포그 룹Infogroup 등 가능한 모든 업체로부터 미국인들의 재정 상태, 어디에서 물건을 사는지, 얼마를 주고 사는지, 휴가를 어디로 떠나는지, 어떤 것을 읽었는지에 관한 데이터를 사들였다. 우리는 이런 데이터를 그들의 정치적 정보(공개적으로 파악되는 투표 습관)와 비교한 뒤 다시 이 데이터를 그들의 페이스북 데이터(무엇에 '좋아요'를 눌렀는지)와 맞춰보았다. 페이스북 한 곳에서만 우리 는 사용자들에 대한 570여 개의 데이터 포인트를 얻어냈다. 그리 고 이런 정보를 종합해 우리는 약 2억 4000만 명에 달하는 18세 이상의 모든 미국인에 관한 5000개가량의 데이터 포인트를 보유하게 되었다. 테일러는 이 데이터베이스의 특장점은 페이스북을 활용해 메시지를 전할 수 있다는 점이라고 말했다. 엄청난 데이터를 수집 했던 바로 그 플랫폼 사용자들에게 접근하기 위해 우리는 페이스북을 다시 이용했다.
- 미국이나 다른 모든 국가의 법률 체계에서 자기 결정권이 있는 성인을 대리하여 동의를 표명하는 것은 불법이다. 페이스북은 그래프 API를 활용해 많은 돈을 벌었다. 그리고 케임브리지 애널리티카를 포함해 4000명 이상의 개발자들은 그래프 API의 허점을 이용해 순진한 페이스북 사용자들에 대한 데이터를 수집할 수 있었다. 케임브리지 애널리티카는 항상 새로운 데이터를 수집하고 있었고 특정 시점에 사람들이 무엇에 관심을 기울이는지에 관한 데이터를 최 신 상태로 유지했다. 케임브리지 애널리티카는 날마다 미국인들에 대한 데이터를 점점 더 많이 구매하는 방식으로 데이터 세트를 보완했다. 미국인들이 '네'를 클릭하고 쿠키를 수용하거나 어떤 웹사이트에서 서비스 이용약관에 대한 동의를 누르면서 페이스북뿐 아니라 서드파티 앱들에도 개인정보를 무료로 제공한 덕분이었다. 케임브리지 애널리티카는 익스피리언 같은 기업들로부터 최신 데이터를 사들였다. 익스피리언은 사람들의 모든 활동 및 구매 이력을 통해 미국인들의 디지털 생활을 추적했다. 표면적으로는 신용 점수를 제공하기 위한 것이라고 하지만, 그 정보를 팔아 수익을 얻기 위해 가능한 한 많은 개인 정보를 수집했다. 액시엄, 마젤란, L2 Labels and Lists 등 다른 데이터 중개업자들도 똑같은 방식으로 정보를 판매했다.
- 케임브리지 애널리티카의 5단계 접근법
케임브리지의 5단계 접근법을 가능하게 한 것이 바로 이 오션 점수다. 첫째로, 케임브리지 애널리티카는 정보를 지닌 모든 사람들을 다른 어떤 홍보 회사보다 훨씬 정교하게 세분화할 수 있었다. 물론 다른 홍보 회사들도 성·인종 등 기본적인 인구학적 특성 외의 것으로 사람들을 세분화할 수 있다. 하지만 이런 회사들은 정당에 대한 친밀감이나 이슈에 대한 선호도 등 더 높은 수준의 특성을 알아볼 때 조악한 여론조사를 이용했다. 반면 케임브리지 애널리티카의 오 션 점수는 훨씬 더 미묘한 차이를 구별했기 때문에 각각의 사람들 이 정확히 어느 위치에 있는지 알 수 있었다. 케임브리지 애널리티카는 모두 32개의 유형으로 사람들을 구분 했다. 어떤 이의 개방성 점수는 그 사람이 새로운 경험을 즐기는지 아니면 전통을 중시하고 의지하는지를 알려준다. 성실성 점수는 개인이 즉흥적인 것과 계획적인 것 중 무엇을 더 선호하는지에 대한 지표이다. 외향성 점수는 어느 수준까지 다른 사람들과 관계 맺고 공동체의 일부가 될 수 있는지를 나타낸다. 타인에 대한 동의 성향은 개인이 자신의 필요보다 남의 요구를 더 중요하게 생각하는지 그렇지 않은지에 대한 지표를 제공한다. 그리고 신경과민 성향은 결정을 내릴 때 그 사람이 두려움에 의해 좌우될 가능성이 어느 정 도인지를 나타낸다. 케임브리지 애널리티카는 사람들을 분류한 다양한 하위 범주에 따라 그들이 이미 관심을 보인 문제들(예를 들면 페이스북의 '좋아요' 처럼)을 추가해 보완하는 방식으로 각각의 개별 집단을 훨씬 더 세 밀하게 분류했다. 예를 들면 메이시 백화점에서 쇼핑하는 34세의 백인 여성 두 명이 동일한 특성을 가지고 있다고 보는 것은 너무나도 단순한 접근법이다. 이런 단순한 접근법 대신 케임브리지 애널리티카의 데이터 과학자들은 사이코그래픽스 분석에 여성들의 라이프스타일 데이터, 투표 기록, 페이스북의 '좋아요' 기록, 신용 점 수 등 다른 모든 데이터를 추가하여 각각의 여성을 완전히 다른 성 향으로 구분할 수 있었다. 비슷해 보이는 사람들이 반드시 똑같은 성향을 가진 것은 아니니, 이들에게 동일한 메시지를 보내서는 안된다. 이런 개념은 케임브리지 애널리티카가 정치 홍보 분야에 등 장했을 당시 광고업계에서는 이미 널리 퍼져 있었지만, 대부분의 정치 자문가들은 이런 일을 어떻게 할 수 있는지 또는 심지어 이런 일이 가능한지조차 모르고 있었다. 케임브리지 애널리티카의 방식 은 정치 홍보계의 새로운 발견이자 승리의 수단이었다.
두 번째로 케임브리지 애널리티카는 정치 분야 및 기업 고객들 에게 '예측 알고리즘의 정확성'이라는 차별적인 혜택을 제공했다. 테일러 박사와 질레트 박사 그리고 케임브리지 애널리티카의 다른 데이터 과학자들은 지속적으로 새로운 알고리즘을 운영하면서 단 순한 사이코그래픽스 점수를 넘어 더 많은 것들을 개발했다. 이들 은 모든 미국인에게 점수를 매겼다. 예를 들면 개개인이 투표할 확 률은 얼마인지, 특정 정당에 속할 가능성은 어느 정도인지, 어떤 치 약을 좋아할 것 같은지에 관한 예측 점수를 0점에서 100점 사이로 매길 수 있었다. 케임브리지 애널리티카는 당신이 빨간 버튼 또는 파란 버튼을 클릭할 때(빨강은 공화당, 파랑은 민주당을 상징하는 색이다.) 어느 편이 기부할 가능성이 높은지, 환경 정책과 총기 소유권 가운데 어느 것을 더 듣고 싶어 할 가능성이 높은지도 알았다. 예측 점수를 통해 사람들을 다양한 집단으로 분류한 뒤 케임브리지 애널리티카는 많은 시간을 들여 '오디언스audiences'라고 불리는 사용자 집단을 반복적으로 검증하면서 정확도가 95퍼센트에 이 를 때까지 정교하게 다듬었다.
셋째, 케임브리지 애널리티카는 이런 알고리즘을 통해 배운 것을 트위터, 페이스북, 판도라(음악 스트리밍 서비스), 유튜브 등의 플랫폼 에 적용해 사람들이 어디에서 가장 많은 시간을 보내는지를 알아냈 다. 그렇다면 사람들에게 접근하기 가장 좋은 곳은 어디였을까? 우 편함으로 전달되는 종이 우편물처럼 실체가 있는 어떤 것이거나 텔 레비전 광고 또는 개인의 구글 검색 엔진 상단에 나타나는 광고가 될 수도 있다. 케임브리지 애널리티카는 구글로부터 검색어 목록을 구매해, 사용자들이 그 목록에 있는 검색어를 입력할 때 그들에게 접근할 수 있었다. 핵심 검색어를 입력할 때마다 사용자들은 자신 에게 맞추어 특별 제작된 광고나 기사에 노출됐다.
네 번째는 케임브리지 애널리티카를 다른 경쟁 업체나 전 세계 의 어느 정치 자문 회사보다 뛰어나게 만드는 단계이다. 케임브리지 애널리티카는 자체적으로 특별히 개발한 고객 응대 프로그램 을 통해 타겟 대상에 접근하고 그 효과를 검증했다. 방문 선거 운동 원과 은행의 전화 상담원을 위해 개발된 여론조사 프로그램인 '리폰Ripon’은 프로그램 사용자들이 유권자의 집을 방문하거나 전화를 걸 때 유권자의 데이터에 직접 접근할 수 있도록 했다. 데이터 시각화 툴도 유권자들이 현관문을 열거나 전화기를 들기 전에 선거 운동원들이 어떤 전략을 활용해야 하는지를 결정하는 데 도움을 주었다.
그리고 마지막 다섯 번째 단계는 '행동 기반 마이크로타겟팅' 전략이다. 선거 운동 때 케임브리지 애널리티카 직원들이 만든 동영상, 오디오, 인쇄 광고에 이르는 모든 콘텐츠는 마이크로타겟팅을 통해 확인된 타겟에게 전달됐다. 우리는 콘텐츠를 지속적으로 수정 하는 자동화 시스템을 이용해 어떻게 하면 사람들이 콘텐츠에 의미 있는 관심을 갖도록 만들 수 있는지 파악했다. 한 사람이 광고를 클 릭하고 행동하기까지 다양한 소셜미디어를 통해 광고가 30차례 전송되었으며, 그동안 광고가 20~30번 정도 바뀌었다. 이 말은, 같은 광고를 30번 노출한다 하더라도 매번 다른 형태의 광고로 변형할 수 있다는 이야기다. 이런 지식 덕분에 새로운 콘텐츠를 만드는 제 작 팀은 케임브리지 애널리티카가 동일한 사람에게 그다음 번에 무 엇인가를 전송할 때 어떻게 접근해야 하는지를 알았다.
- 미국에서 인터넷 사용자들은 제한 없이 데이터 수집을 허용하는 법 때문에 자동으로 데이터 수집에 동의 하도록 돼 있다. 미국은 프랑스나 영국처럼 개인 정보 보호 장치를 거의 갖추지 않았다. 이것의 의미는 명백했다. 미국인들에게는 유 럽 사람들 같은 심리적 부담이 없다는 것이었다. 프랑스 사람들이 독일과 다른 서유럽 사람들처럼 개인 정보의 사용에 극히 민감하 게 반응하는 것은 충분히 이해할 만했다. 법은 사람들의 동의를 받 고 데이터를 사용하도록 허용했지만 잘못된 데이터 사용의 선례들 은 끔찍한 결과를 초래했다. 나치는 유대인과 집시, 장애인과 동성 애자들에 대한 데이터를 수집해 잔인할 정도로 효율적인 홀로코스트 정책을 실행했다. 제2차 세계대전의 여파와 디지털 시대의 영향 으로, 유럽 의원들은 과거의 참사와 유사한 일이 다시 일어나지 않 도록 데이터 법을 매우 엄격하게 만들었다.
- 예전에는 페이스북에 유료 광고가 없었다. 그 당시 아무도 페이스북 으로 수익을 얻는 방법을 생각해내지 못했으므로, 페이스북이 지속발전 가능한 비즈니스 모델이 될 수 있는가에 관해 공개적으로 여 러 논쟁이 벌어졌다. '좋아요' 버튼으로 사용자들은 각자의 팔로워 에 관한 기본적인 정보를 수집할 수 있었는데, 페이스북이 얻은 것 은 그 이상이었다. 페이스북은 개별 사용자의 '좋아요'에서 수십만 건의 새로운 데이터 포인트를 얻었다. 이것은 페이스북이 수집할 수 있고 실제로 돈으로 만들 수 있는 정보였다. 2007년 페이스북은 악의 없어 보이는 따뜻한 공간이었고 위안을 주는 내용이 올라왔다. 사람들은 페이스북을 통해 친구 관계를 맺 었다. 페이스북이 사용자들의 화났음', '슬픔', '충격받았음’을 표현하는 이모티콘을 도입하기 전이어서 게시물에 대해 '싫어요.dislike' 표시를 할 방법은 없었다. 구글이 “정보에 관한 것이었다면 (...) 페이스북은 사람들과 연결하는 것이 전부였다. 이제 선거 운동 기간 이 되자 페이스북을 통해 오바마는 혐오 발언까지 받았고, 그 내용 이 아무리 충격적이더라도 우리는 사례별로 그때마다 대응할 수밖 에 없었다. 아직 부적절한 행동이나 언어를 감지하거나 댓글 쓰는 사람을 자동으로 차단하는 알고리즘이 없었기 때문이다. 오바마 상원의원의 페이스북 페이지에서 벌어진 몇 가지 일이 아직도 기억난다. 오바마 상원의원은 네거티브 전략을 거부하고 자신에 관한 독설과 인종차별 행위에 대해 다른 쪽 뺨을 내주는 자애로움을 지녔다는 사실을 나는 생생하게 기억한다. 우리는 교대로 오바마 상원의원에 대한 협박과 위협을 수집해 FBI에 신고했다.
- 케임브리지 애널리티카가 페이스북을 활용하기 시작한 2014년 중반 페이스북은 훨씬 더 혁신적인 툴들을 활용했다. 페이스북 광고 툴의 정확성은 2012년보다 크게 향상됐다. 광고를 위해 페이스북을 이용하는 방법은 두 가지가 있었다. 2015년 4월 이전에는 서드파티 앱 개발자들에게 비용을 지불한 뒤 페이스북 데이터를 얻어 접속 중인 페이스북 사용자들에게 광고할 수 있었다. 그리고 이를 통해 그 어느 때보다 사용자들에게 더 많은 것을 알릴 수 있었 다. 아니면 기업이 자체 데이터를 활용해 훨씬 혁신적인 무엇인가 를 할 수 있었다. 기업이 보유한 데이터 세트에서 광고 대상으로 삼 고 싶은 사람들을 선택한 다음, 페이스북에 돈을 지불하고 유사한 사람들을 검색해 찾아내는 것이다. 그러면 페이스북은 1만 명(또는 10만 명 또는 심지어 100만 명)의 유사한 사람들을 찾아주고, 기업은 페이스북 플랫폼을 통해 그들에게 직접 광고를 전송한다. 그래프 API의 폐쇄는 다음과 같은 의미였다. 이제 페이스북을 제 외한 어느 누구도 페이스북의 데이터로 수익 사업을 할 수 없다, 그래프 API에 접근할 수 없으니 이제 개발자들은 사용자들에게 접근 하기 위해 페이스북의 광고 툴을 사용해야 한다, 페이스북의 어떤 데이터도 더 이상 외부의 데이터 모델 개발에 사용될 수 없다. 세계 대부분의 사람들은 이렇게 생각했다. 2015년 말 가디언의 기사가 케임브리지 애널리티카와 테드 크루즈의 선거 운동을 뒤흔들었을 때 페이스북은 여전히 건재했고 모든 사용자의 데이터를 완전하게 통제하고 있다고 주장했다. 페이스북 개인 정보 보호 문제의 최대 쟁점이던 그래프 API가 4월 말 폐쇄됐으니, 이제 데이터 보안은 염려하지 않아도 된다고 말이다. 어느 누구도 알렉산드르 코건과 케임브리지 애널리티카를 비난한 것 처럼 페이스북을 비난하지 않았다. 페이스북은 세계 최고의 광고플랫폼이 되었다. 페이스북이 안전하지 않다거나 사용자들의 사생활이 침해받더라도 비난의 손길은 다른 방향을 가리킬 것이다.
- 모두가 선거 업무에 착수하면 트럼프 선거 캠프는 소셜미디어에 엄청난 돈을 쓸 것이 분명했다. 실제로 당선 이후 집계를 보면 트럼 프 캠프가 소셜미디어에 쓴 총금액은 역대적으로도 상당했다. 케임브리지 애널리티카를 통해서만 디지털 광고에 1억 달러를 지출했고, 그중 대부분이 페이스북 광고에 쓰였다. 그뿐만 아니라 다른 소셜미디어 플랫폼이 제공하는 더 높은 수준의 서비스에도 막대한 비용이 들어갔다. 소셜미디어 기업들은 종종 선거 운동에 도움이 될 새로운 툴과 서비스를 우리에게 소개했고, 새로운 기술뿐 아니라 운영 인력도 제공 했다. 페이스북, 구글, 트위터 등의 회사에서 직원이 파견되었다. (페 이스북은 트럼프 선거 운동과 관련된 이런 업무를 “부가적인 고객 서비스”라 고 불렀다. 구글은 트럼프 선거 운동에 “자문 역할”을 제공했다고 말했고 트 위터는 “무료 노동”이라고 불렀다.) 트럼프 선거 팀은 이런 도움을 두 손 들어 환영했지만 클린턴 캠프는 어떤 이유에서인지 페이스북으 로부터 이런 종류의 도움을 받지 않기로 결정했다. 트럼프 캠프는 페이스북으로부터 고도로 숙련된 인력을 오랫동안 지원받으면서 쉽게 계량화할 수 없는 엄청난 혜택을 누렸다. 페이스북에서 지원 나온 사람들은 선거 운동 관련자들과 케임브리지 애널리티카 직원들에게 '유사 타겟look-alikes'을 수집하고 맞춤 타겟custom audience'을 만드는 방법을 가르쳐주었다. 특정한 사람들 만이 볼 수 있는 콘텐츠인 이른바 '암흑 광고dark ads'를 제작하는 방법도 알려주었다. 이런 현장 지원을 통해 트럼프 선거 캠프는 새로운 툴과 기능들을 출시와 동시에 최대한 활용할 수 있었다. 트위터는 '대화형 광고Conversational Ads'라는 새로운 상품을 만들 었다. 이 광고는 광고주가 제안한 여러 개의 해시태그 리스트를 보 여주는데, 해시태그를 클릭하면 해시태그는 물론 광고도 자동으로 리트윗됐다. 이 때문에 트럼프 선거 캠프의 트윗이 리트윗되는 수가 힐러리를 확실하게 압도하는 경향을 보였다. 스냅챗Snapchat도 '웹뷰 광고WebView Ads'를 통해 새로운 기능을 강화했다. 이는 사용 자들에게 선거 운동의 지지자로 등록해달라고 요청함으로써 데이 터를 수집하는 기능을 포함하고 있었다. 트럼프 캠프는 이를 통해 지속적으로 데이터를 수집하고 타겟 유권자를 늘려갔다. 스냅챗은 거의 종일을 온라인에서 보내는 젊은이들을 겨냥한 '직접 반응Direct Response 이라는 새로운 저가 상품을 소개했다. 사진을 위쪽으로 밀 어 올리면 사용자의 이메일 주소를 입력하는 화면으로 연결되며, 이용약관상 발생하는 데이터를 모두 제공하도록 돼 있었다. 스냅챗의 웹뷰 광고와 필터도(예컨대 힐러리와 함께 감방에 갇힌 셀카 사진 필터) 큰 도움이 되었다. 구글의 공화당 팀은 사용자들이 구글을 검색했을 때 처음 노출되 는 결과를 통제하기 위해 많은 광고비를 지출했다. 사용자들의 첫 인상'을 통제하기 위한 전략이었다. 구글 키워드구매 전략은 효과가 놀라웠다. 사용자가 '트럼프' 이라크 전쟁'을 검색하면 첫 번째 검색 결과에 “거짓말쟁이 힐러리 이라크 전쟁에 찬성 투표, 잘못된 판단”이라는 배너가 있는 슈퍼 팩 링크와 함께 “힐러리 이라크 전쟁에 찬성 투표, 도널드 트럼프는 반대”가 나타났다. 사용자가 '힐러리'와 '거래'라는 검색어를 입력하면 '사기꾼 힐러리lying-crookedhillary.com 웹사이트가 최상단에 노출됐다. 우리가 유도한 검색 결과를 클릭해 열어보는 비율도 놀 라울 정도로 높았다. 구글은 매일 트럼프 선거 캠프에 키워드 목록을 판매했고 인기 있는 유튜브 채널에 언제 새로운 독점 광고를 게재할 수 있는지 알려주었다. 구글은 트럼프 선거 캠프에 검색어 활 용 시스템을 팔아 새로 유입된 지지자들이 무더기로 투표에 나서는 데 톡톡히 기여했다.
- 콘텐츠의 정교함과 방법까지 똑같지는 않았지만 AIQ의 디지털선거 운동은 케임브리지 애널리티카와 유사한 점이 상당히 많았다. 나중에 AIQ의 제안서가 유출됐는데, 케임브리지 애널리티카에서 근무했던 크리스 와일리 Chris Wylie가 우리 제안서를 거의 그대로 베낀 것으로 드러났다. AIQ의 전략은 포커스 그룹, 사이코그래픽스 모델링, 예측 알고리즘을 활용했고 온라인 퀴즈와 다양한 경연을 통해 개인 사용자들의 데이터를 수집했다. 이 모든 것은 사용자들 의 참여 동의를 받았으므로 완벽하게 합법적이었다. 브렉시트 투표 를 위해 보트리브는 사용자 데이터를 영국 유권자들의 기록과 대 조한 다음 인터넷을 통해 유포하고, 국민을 선동하기 위해 타겟 메 시지를 활용했다. 10주에 걸친 치열한 선거 운동은 온라인에서 벌 어지는 역겨운 현상을 현실 세계에도 그대로 보여주었다. 보트리 브는 유럽연합에 가입하려 협상 중인 터키 등의 국가들에 대한 거짓 정보와 가짜 뉴스를 전달했다. 이들의 광고는 유럽연합 잔류에 찬성표를 던지면 영국의 국민건강보험 제도를 고갈시키리라는 암 시를 전달함으로써 부동층 유권자들을 자극했다. 정부의 복지 정책 자금 조달에 대한 불안감을 조성하고 국경으로 몰려드는 불법 이민자들과 테러리스트들의 이미지를 내세우는 등 두려움을 조장했다.
- 트럼프 캠프 팀은 서베이몽크Survey Monk 같은 전화 및 인터넷 여 론조사 기관을 활용했다. 힐러리는 아홉 개 주에서만 여론조사를 실시했지만 우리 팀은 열여섯 개의 경합 주에서 실시했다. 그런 다 음 사람들을 트럼프 지지자와 힐러리 지지자로 양분하고 이들을 여 러 집단으로 세분했다. 첫 번째 트럼프 지지 집단은 자원봉사자'와 기부자' 그리고 집회 참가자가 될 수 있는 '핵심 트럼프 유권자' 였 다. 투표할 의지가 있지만 투표하는 것을 잊을 수도 있는 사람들은 투표 독려 집단'으로 불렸다. 트럼프 캠프 팀은 투표 독려 집단이 관심 있어 하는 쟁점에 초점을 맞춰 이들이 확실하게 투표하도록 만들 계획이었다. 그러고도 자금이 남으면 '비관여 트럼프 지지자' 에게 돈을 썼다. 힐러리 지지자들 가운데는 핵심 유권자로 분류된 사람들이 있었고 투표를 하지 말라고 설득할 경우 투표소에 나가지 않을 가능성이 있는 '투표 저지' 집단이 있었다. 트럼프 선거 캠프가 투표 방해 전략을 펼치는 동안 “사기꾼 힐러리를 타도하자"라는 목표를 내세운 슈퍼 팩은 투표 저지 집단에 초점을 맞추었다. 나는 과거에 정부와 영향력 있는 인물들이 권력을 유지하기 위해 사회 운동이나 생각의 자유, 유권자를 억압하는 것을 목격했다. 미 국에서 유권자 억압 전략은 불법이었다. 나는 트럼프 선거 캠프가 비방전과 유권자 억압을 어떻게 구분해 구사했는지 궁금했다. 일반 적으로 둘 사이에는 명백한 차이가 있지만 디지털 시대에는 어떤 일을 했는지 추적하기가 어렵다. 정부는 이제 시위를 멈추기 위해 거리에 경찰과 군대를 보낼 필요가 없다. 그 대신 사람들 손에 있는 작은 화면에 타겟 메시지를 보내는 간단한 방법으로 사람들의 생각을 바꿀 수 있었다. 그래서 프로젝트 알라모가 트럼프 선거 전략의 핵심이었고, 이를 진행시키기 위해 캠프 팀이 밤낮으로 일했다. 그 들은 최대한 오류 없는 데이터베이스를 구축하기 위해 데이터 중개상들로부터 더 많은 소셜미디어 데이터를 사들였다. 트럼프 캠프 팀은 이 모든 데이터를 어디에서 가져왔는지 얼버무렸지만, 나는 모든 데이터를 정당하게 얻은 것이라고 믿고 싶었다. 마침내 모든 데이터를 한 곳으로 가져온 뒤 데이터 모델링 과정이 시작됐다. 먼저 '기부 성향'과 같은 예측 가능한 행동을 기반으로 지지자들의 성격을 분석해 모델링했다. 이를 통해 첫 번째 프로 그램에서 트럼프 캠프의 디지털 선거 전략은 비약적으로 발전했다. 트럼프 선거 캠프는 첫 달에만 온라인으로 2400만 달러를 모금했고, 대통령 선거일까지 계속해서 매달 비슷한 금액을 거둬들였다. 두 번째 프로그램에서 트럼프 캠프 팀은 경합 주의 설득 가능한 유권자들을 세밀하게 분류하기 위해 다양한 데이터 모델을 활용했다. 샌안토니오에 있는 팀은 미국의 실리콘밸리와 그 밖에 있는 핵심 기술 기업, 데이터 중개상들과 공생 관계'를 구축했다. 샌안토니오 팀은 데이터베이스에 포함된 모든 주, 카운티, 시, 동네, 개인들을 각각의 중요한 이슈들로 세분했다. 이런 정보를 바탕으로 트럼프의 출장 일정, 집회 목표, 유세 현장에서 전달할 메시지 등 계획을 수립하는 일을 도왔다. 그들은 또 특정 성향의 대중이 모인 상태를 지도 에 색상의 농도로 표시해 보여주는 '히트 맵heat map'을 만들어 트럼프타워 선거운동본부에 있는 로라 힐거Laura Hilger에게 매일 전송했다. 그녀는 이 정보를 분석해 트럼프의 선거 유세 우선순위를 정했다. 히트맵에는 트럼프가 방문해야 하는 지역에 설득 가능한 유권 자 수가 얼마나 되는지, 정확하게 누구를 목표로 연설해야 하는지, 집회와 언론에서 다루는 핵심 이슈들이 무엇인지가 포함돼 있었다. 집회가 끝난 뒤 샌안토니오 팀은 사람들이 연설이나 연설의 일부분 에 어떻게 반응하는지를 알려주는 '설득 효과 측정persuasion measurements'과 '광고 효과 조사brand lift studies'를 실시했다. 그리고 이런 분석 정보를 광고 제작자들에게 보내 성공적인 연설의 일부분을 광고로 만들었다.데이터베이스에서 끌어낸 진정한 가치가 바로 이런 광고와 메시 지에 있었고, 이를 통해 유권자들을 상대로 한 미세한 타겟 광고가 가능해졌다. 즉 케임브리지 애널리티카의 데이터 과학자들은 유권 자를 비슷한 사람들끼리 세밀하게 분류했고, 그 개별 집단에 맞춰 수많은 다양한 광고를 만들었다. 기본 콘셉트가 동일한 수백 또는 수천 개 버전의 광고들이 개개인에게 전송되어 그들의 생각을 바꾸 어놓았다. 트럼프 선거 예산의 절반 이상이 디지털 선거 전략에 투 입됐는데, 모든 메시지가 타겟 대상에 맞는 '암흑 광고'로 정교하게 제작됐으므로 사람들 대부분은 이웃들이 어떤 메시지를 보고 있는 지 몰랐다. 케임브리지 애널리티카 팀은 각 광고마다 1만 번 이상 창의적으로 반복되는 5000개 이상의 개인 맞춤형 광고를 운영했다. 발표를 듣던 회의 참석자 중 누군가가 “그래서 우리가 그렇게 오랫 동안 여러분 소식을 못 들었던 거군요.”라고 매트에게 농담했다. 내 부 직원도 알기 어려울 만큼 광고 캠페인이 은밀하고 끈질기게 타 겟들을 공략했던 것이다. 그리고 이런 광고 전략은 매우 성공적이 었다. 디지털 광고 전략은 트럼프에 대한 호감도를 평균 3퍼센트 정 도 상승시켰다. 트럼프가 일부 주에서 매우 근소한 차이로 이겼다. 는 사실을 고려하면 이 정도의 호감도 상승은 전체 선거에 매우 큰 도움이었다. 투표 독려 운동에서 트럼프 캠프 팀은 부재자 투표 참 여를 2퍼센트 끌어올렸다. 부재자 투표를 신청하는 많은 유권자들 은 보통 부재자 투표 용지를 작성하지도 우편으로 보내주지도 않기 때문에, 이것도 상당히 큰 성공이었다.기업으로서 케임브리지 애널리티카의 강점은 훌륭한 데이터베이 스만이 아니었다. 데이터 과학자들과 새로운 데이터 모델을 개발하 는 역량도 강점이었다. 몰리는 사이펀Siphon 이라는 대시보드를 만들어 이를 데이터 과학자들과 함께 두 가지 목적으로 활용했다. 첫째 는 유권자 분석 도표를 처리하는 목적이었다. 둘째는 구글에서부터 아마존, 트위터, 유튜브, 〈뉴욕 타임스〉, 〈폭스 뉴스> 등에 이르는 매 체의 광고를 언제 어느 구역에 입찰할 것인지를 결정하는 목적이었다. 이 대시보드를 통해 트럼프 선거 캠프는 광고 효과를 실시간으로 추적할 수 있었다. 트럼프타워에 있는 재러드 쿠슈너, 스티브 배넌, 트럼프도 이 대시보드를 보면서 특정 플랫폼에서 운영되는 디 지털 광고의 효과를 실시간으로 확인했다. 광고를 클릭할 때마다 들어가는 비용, 광고 효과 등의 정보를 눈앞에서 바로 보면서 어디 에 돈을 쓸 것인지 전략적 결정을 내렸다. 대중이 알고 있는 것과 달리, 트럼프의 선거 전략은 이상한 트윗이나 모호한 연설처럼 트 럼프라는 개인의 개성에 의해 좌우되지 않았다. 모든 세부 사항이 실시간으로 기록되고 조정되었다. 더 많은 사람들에게 신선한 광고가 도달함으로써 수백만 유권자가 관심을 갖도록 말이다
- 트럼프 캠프 팀은 특정 플랫폼에서 유권자들을 트럼프 지지자도 변화시키려면 무엇이 필요한지에 관해서도 연구했다. 온라인을 기준으로 의견이 바뀌는 데 필요한 노출 횟수는 평균 5~7회인 것으로 나타났다. 즉 광고를 5~7번 정도 보게 되면 유권자들이 우리가 보내는 자료를 클릭해 열어볼 확률이 높다는 의미였다. 이런 결과는 트럼프 선거 팀이 타겟으로 정한 집단에 얼마나 오랫동안 광고를 보내고 돈은 얼마나 써야 하는지를 결정하는 데 도움이 됐다.

 

'IT' 카테고리의 다른 글

잡스의 기준  (0) 2020.11.03
디지털의 배신  (0) 2020.10.27
은밀한 설계자들  (0) 2020.09.07
AI 시대 내 일의 내일  (0) 2020.07.30
페이스북은 내가 우울증인 걸 알고 있다  (0) 2020.07.09
Posted by dalai
,