똑똑하게 생존하기

인문 2022. 7. 2. 08:49

- 철학자 해리 프랑크푸르트Harry Frankfurt는 헛소리가 널리 퍼져있음이 우리 시대의 결정적인 특징이라고 인정했다. 그의 대표적인 논문 헛소리에 관해 On Bullshit)는 이렇게 시작된다.
우리 문화의 가장 두드러진 특징 중 하나는 헛소리가 너무 많다는 것이 다. 다들 알고 있는 사실이다. 누구나 자기 몫의 헛소리를 한다. 하지만 헛소리가 무엇이고 왜 그렇게 많은지 혹은 어떤 기능을 하는지 제대로 이해하지도 못한 상태에서 이런 상황을 당연하게 여기는 경향이 있다. 그리고 그게 우리에게 의미하는 바를 성실하게 밝혀낸 평가도 부족하다. 다시 말해 제대로 된 이론이 없다.
- 거짓말은 날아가고, 진실은 절뚝거리며 그 뒤를 따라간다 
아마 헛소리 연구에서 가장 중요한 원칙은 브란돌리니의 법칙 Brandolini's law 일 것이다. 2014년 이탈리아 소프트웨어 엔지니어인 알 베르토 브란돌리니Alberto Brandolini가 만든 이 원리는 다음과 같이 말한다.
“헛소리를 반박하는 데 필요한 에너지의 양은 그런 헛소리를 생산하는 데 필요한 에너지보다 몇십 배나 많다.”
- 어느 날 저녁 늦게 워싱턴 D.C. 에 도착한 칼은 자기 전에 마실 것을 찾고 있었다. 그는 호텔 로비에서 인스턴트 코코아 한 봉지를 집어 들었다. 포장지에는 “99.9퍼센트 카페인 프리”라는 광고문이 적혀 있었다. 그는 시차에 시달리고 있었기 때문에 99.9퍼센트 카페인 프리 음료라면 커피를 대신할 신중한 대안처럼 보였다. 하지만 잠생각해 보자. 코코아 1잔에는 물이 많이 들어가긴 하지만, 카페인은 매우 강력한 약물이다. 그렇다면 99.9퍼센트 카페인 프리 음료가 정말 자기 직전에 마시고 싶은 음료일까?
커피 1잔에는 카페인이 얼마나 들어 있을 까? 공익과학센터에 따르면 스타벅스Starbucks 커피 20온스에는 카페 인이 415밀리그램 들어 있다고 한다. 이는 온스당 약 21밀리그램에 해당하는 양이다. 물 1액량 온스의 무게는 약 28그램이다. 그러므로 스타벅스 드립 커피에는 무게로 따졌을 때 약 0.075퍼센트의 카페 인이 들어 있다. 다시 말해 진한 커피도 99.9퍼센트 카페인 프리인 셈이다!* | 따라서 99.9퍼센트 카페인 프리라는 주장에 부정확하거나 위험 한 부분은 없지만, 어쨌든 무의미한 주장이다. 대부분의 일반 커피 에도 똑같은 라벨을 붙일 수 있다. 네슬레는 진실이지만, 동시에 헛 소리일 수 있는 정보를 전하는 훌륭한 예시를 보여줬다. 이게 헛소 리인 이유는 “커피 1잔에는 카페인이 1퍼센트밖에 안 들었다.” 같은 주장과 다르게 의미 있는 비교를 할 수 없도록 해놓았기 때문이다.
- 기계는 인간의 편견에서 자유롭지 않다. 그들은 공급받은 데 이터에 의지해 편견을 영속한다. 형사처벌의 경우 〈프로퍼블리카 ProPublica)와 다른 매체들은 현재 사용하는 알고리즘이 흑인 피고인을 '미래의 범죄자로 식별하는 비율이 백인 피고인보다 거의 2배나 많고 이것 때문에 재판 전 석방, 선고, 가석방 거래에도 차이가 생긴다는 사실을 증명했다. 알고리즘을 이용하는 대출자들은 흑인 신청 자와 라틴계 신청자에게 더 높은 이자를 부과한다. 아마존처럼 미국 에서 가장 큰 기업들이 사용하는 자동 채용 소프트웨어는 여성보다. 남성을 우선 선발한다. 기계가 편향된 사회에서 발생한 데이터를 기반으로 결정을 내리도록 훈련시키면, 기계들은 똑같은 편견을 배우고 영속한다. 이런 상황에서는 '머신러닝'보다 기계 세뇌라고 하는 편이 나을 수도 있다.
- 아마도 알고리즘 투명성의 가장 큰 문제는 역시 해석 가능성일 것이다. 기업들이 알고리즘의 세부 사항과 모든 특징, 매개변수까지 완전히 공개하더라도 알고리즘이 왜 그런 결정을 내리는지 여전히 이해하지 못할 수도 있다. 정부 정책이 책임을 지라고 요구하더라도 알고리즘이 뭘 하는지 충분히 설명할 수 있을 만큼 이해하지 못한다. 면 그런 정책도 별로 가치가 없다.  알고리즘 편향은 불식하기가 특히 어려울 수 있다. 정책 입안자는 인종이나 성별에 기초한 결정을 금지하는 규칙을 만들라고 요구할 수 있지만, 알고리즘에 제공된 데이터에서 해당 정보를 생략하는 것만으로는 충분하지 않은 경우가 많다. 문제는 다른 정보 조각을 함께 고려할 때 인종이나 성별과의 상관관계가 존재할 수 있다는 것이다. 일례로 다음 가정 폭력 사건이 어디서 일어날지 예측하는 기계를 만든다면 아파트의 경우 옆집에 사는 사람들이 가정 폭력 사건을 보 고할 가능성이 높기 때문에 그 기계는 단독 주택보다 아파트를 선택 할 수 있다. 그러면 이런 예측은 당신이 애초에 제거하려고 했던 인 종적 요소들을 다시 부상시킨다. 성차별을 근절하기 위해 이력서에 이름을 적지 않게 해도 기계가 계속 여성보다 남성을 더 선호하면 아마존처럼 실망할 수 있다. 왜일까? 아마존은 자사가 기존에 받은 이력서를 이용해 알고리즘을 훈련시켰는데, 이력서에는 이름 외에도 여자대학교에서 받은 학위, 여성 전문직 단체 회원 자격증, 특정 성별이 선호하는 취미 등 본인의 성별을 드러낼 수 있는 부분이 많다.
철학자들은 종종 지식을 “정당화된 참된 믿음”이라고 말한다. 뭔 가를 알려면 그것이 사실이어야 하고 우리가 그걸 믿어야 한다. 그 리고 또 자신의 믿음에 타당한 이유를 제시할 수 있어야 한다. 우리 의 새 기계 친구는 그렇지 않다. 그들은 앎의 방법이 다르며 우리가 가진 힘을 보완해 줄 수 있다. 하지만 이를 최대한 유용하게 이용하 려면 기계가 어떻게 그런 결정을 내렸는지 그리고 왜 내렸는지 알아야 한다. 사회는 어디에서 어떤 종류의 문제가 발생했을 때 이런 거래(효율을 위해 불투명성을 용인하는 것)를 허용할지 정해야 한다.
- 만약 구글의 독감 트렌드 알고리즘이 첫 2년 동안의 독감 사례만 예측해야 했다면 우리는 지금도 그것의 승리에 관한 글을 쓰고 있을 것이다. 하지만 그 기간 이후까지 예측해 보라고 하자 실패했다. 어디서 들어본 얘기 같은가? 그렇다, 과적합한 것이다. 기계가 아마 그 기간 동안의 부적절한 뉘앙스에 초점을 맞춘 것 같다. 여기에서는 과학적 방법이 도움이 될 수 있다. 이는 독감 확산을 유도하는 핵심 요소에 초집중하면서 사소한 건 무시하는 이론을 발전시키도록 고안됐다. 검색어는 핵심 요소를 잘 알려주지만, 2년 이상의 예측을 일반화하려면 이론이 필요하다. 이론이 없으면 데이터에 기반한 예측은 계속 상관관계에만 의존한다.
과감하게 블랙박스를 열어볼 때는 다음 사항도 고려해야 한다. 복잡한 알고리즘은 대부분 예측을 할 때 수십, 수백 혹은 수천 개의 변수를 사용한다. 구글 독감 트렌드는 독감 발생을 가장 잘 예측한 45개의 핵심 검색 쿼리에 의존했다. 암을 찾아내도록 설계된 머신러 닝 시스템은 1,000가지 유전자를 살펴본다. 괜찮은 얘기처럼 들릴 수도 있다. 변수를 더 추가하기만 하면 되니 말이다. 데이터가 많아지면 예측 결과도 좋아지지 않겠는가? 글쎄, 반드시 그렇지만은 않다. 변수를 많이 추가할수록 훈련 데이터도 많이 필요하다. 앞서 좋은 훈련 데이터를 얻는 비용에 관해 얘기했다. 모델에 포함하고 싶은 유전자가 1만 개 있다면, 믿을 만한 예측을 할 기회라도 얻으려 면 본보기가 될 환자를 수백만 명 찾아내야 한다.  이렇게 변수를 추가할 때 발생하는 문제를 차원의 저주라고 한 다. 블랙박스에 충분한 변수를 추가하면 결국 잘 작동하는 변수 조합을 찾게 되겠지만, 우연한 기회에 그렇게 될 수도 있다. 예측을 위해 사용하는 변수가 증가하면 실제 예측 능력과 운을 구별하기 위해 기하급수적으로 많은 데이터가 필요하다. 뉴욕 양키스의 승패 기록을 1,000개의 다른 변수가 있는 목록에 추가하면 지난 3개월간의 다우존스지수 예측 능력이 좋아진다는 사실을 알게 될지도 모른다. 그러나 곧 이런 예측 성공이 데이터가 우연히 정렬된 덕분이라는 사실을 깨닫게 될 것이다. 만약 이 변수에게 다음 3개월 동안의 지수를 예측해 달라고 요청하면 성공률이 급격하게 떨어질 것이다.
연구진은 임상의들을 돕고 건강 문제를 해결하기 위해 데이터 연구원들은 아직 진단되지 않은 췌장암을 앓는 사람들을 찾아내기 위해 빙의 검색 쿼리를 사용하고 있는데 부디 구글 독감 트렌드의 실수에서 교훈을 얻었기를 바란다. 사람들의 동의하에 합법적으로 그리고 프라이버시를 존중하면서 수집한 데이터는 세계를 이해하는 데 중요한 역할을 한다. 문제는 우리가 대규모로 데이터를 축적 할 수만 있다면 뭔가 마법 같은 일이 벌어질 거라 말하는 과대광고다. 빅데이터는 더 좋은 데이터가 아니라 그냥 더 큰 데이터라는 사실을 상기해야 한다. 그리고 당연히 자기 생각을 말하지도 않는다.
- 굿하트의 법칙을 기억하는가? “측정치가 목적이 되면 올바른 측정은 불가능하다.” 어떤 의미에서 보면 p-값에서 바로 이런 일이 일어난 것이다. 논문을 학술지에 실으려면 p-값이 0.05보다 작아야 하므로 p-값은 더는 통계적 지원의 좋은 척도로 사용되지 않는다. p값을 무시하고 과학 논문을 발표할 경우 이 값은 귀무가설을 기각하 기 위한 통계적 지원 정도를 나타내는 유용한 척도가 될 것이다. 그 러나 학술지는 p-값이 0.05 미만인 논문을 매우 선호하기 때문에 p값은 이제 원래의 목적에 부합하지 않는다.
- 대중 과학 저술은 단일 연구 결과가 과학에 미치는 의미와 관련해 근본적 오해를 불러일으키는 경우가 많고, 때로는 그걸 적극적으로 장려하는 듯한 기분도 든다. 뉴스 매체는 물론이고 심지어 교과서에서도, 과학 활동은 수집 과정이고, 과학 논문은 수집한 내용에 관한 보고서라고 자주 설명한다. 이 관점에 따르면 과학자들은 자연이 숨겨놓은 사실을 찾아내고, 밝혀진 사실은 수집가가 앨범에 우표 를 보관하듯 과학 논문으로 공개되며, 교과서는 기본적으로 그런 사실들의 모음이다.
하지만 과학은 이렇게 이뤄지지 않는다. 실험 결과는 자연에 관 한 결정적 사실이 아니다. 실험 결과에는 우연이 수반되고, 그 결과 를 적절히 평가하는 방법에도 무수한 가정이 난무한다. 실험 결과를 해석할 때는 세계가 움직이는 방식에 관한 모델과 가정이 뒤얽힌 더 복잡한 네트워크가 동원된다. 각각의 실험이나 관측치는 자연에 대 한 명확한 사실을 나타낸다기보다 어떤 특정 가설을 지지하는 주장 을 대변할 뿐이다. 우리는 여러 논문에 제시된 증거를 저울질해 가 설의 진리를 판단하는데, 모든 증거는 저마다 다른 관점에서 문제를 바라본다.

'인문' 카테고리의 다른 글

붓다와 아들러의 대화  (0) 2022.07.23
나를 내려놓으니 내가 좋아졌다  (0) 2022.07.03
다수결은 위험하다  (0) 2022.06.23
로마황제처럼 생각하는 법  (0) 2022.06.23
너 어떻게 살래  (0) 2022.06.18
Posted by dalai
,