'만물의 공식'에 해당되는 글 1건

  1. 2015.05.03 만물의 공식

만물의 공식

과학 2015. 5. 3. 16:44

 


만물의 공식

저자
루크 도멜 지음
출판사
반니 | 2014-10-25 출간
카테고리
과학
책소개
알고리즘으로부터 삶의 통찰력을 얻어야 하는 시대, 만물의 공식은...
가격비교

- 구글은 겉보기에 괴짜같으면서도 실제로는 매우 치밀하다. 구글이 괴짜기업으로 널리 알려져 있지만 그 불경한 행보는 철저하게 데이터를 기반으로 함. "구글의 복지가 지나치게 보일 때도 있다. ... 하지만 구글이 사악해지지 않기 위해서 그런 혜택을 베푼다고 생각하면 오산이다. 구글은 직원들이 복지혜택에 어떻게 반응하는지에 대해 다량의 데이터를 꼼꼼히 모니터링하고 있으며, ... 돈을 허투루 낭비하는 법이 없다." 예를 들어 구글에는 인간분석팀이라는 전담팀이 있는데 이들의 임무는 직원들의 행복을 수량화하는 것. 이를 위해 과학적으로 제작한 설문방식인 구글가이스트로 조사를 진행한 후, 최신의 독자적 알고리즘을 이용하여 결론을 이끌어냄. 몇해 전엔 보통 때보다 많은 여성이 퇴직한 일이 있었다. 그러자 인간분석팀은 데이터마이닝 도구를 이용하여 이것이 여성문제가 아니라 엄마문제임을 알아냈다. 최근에 출산한 여성은 구글을 퇴사할 확률이 평균보다 두배나 되었다. 비용대비 가장 효과적인 해결책은 출산휴가를 12주 유급휴가에서만 5개월로 연장하는 것이라는 결론이 내려짐. 문제가 파악되고 조치가 취해지자, 산모 퇴직률이 50% 감소
- 나라 로직스의 최고기술책임자 네이선 윌슨이 말한다. "인터넷은 우리가 눈으로 보고 클릭하는 상거래 수단으로 진화했으며, 이는 광고와 온갖 잡동사니를 우리에게 돌려줍니다. 저는 이 모든 상황을 모조리 바꾸기를 원합니다. 잡동사니와 소음을 없애 이용자가 원하는 것에 더 효율적으로 접근하는 방법을 마련해주고 싶습니다." 물론 문제가 있다. 이용자가 온라인 세상의 잡동사니를 없애는 데 걸리는 시간을 줄여주려면 나라의 알고리즘은 무엇을 보아야 하고 무엇을 보지 말아야 하는가에 대해 이용자를 대신하여 끊임없이 판단을 내려야 함. 이런 현상을 종종 필터거품이라고 한다. 같은 제목의 책에서 일라이 패리저는 구글을 이용하여 같은 것을 검색한 이용자 두명이 전혀 다른 결과를 얻는 과정을 보여준다. 이를테면 진보적인 사람이 웹브라우저 주소창에 BP를 입력하면 2010년 4월 멕시코만 원유유출 하고에 대한 정보가 검색되지만, 보수적인 사람이 입력하면 석유회사 BP에 대한 추자정보가 검색될 수 있음. 마찬가지로 여성이 검색창에 바그너를 입력하면 작곡가 리하르트 바그너가 검색되지만, 남성이 입력하면 페인트 회사 바그너USA가 검색될 가능성이 높음. 이렇듯 검색 알고리즘은 불편부당한 대답을 내놓도록 설계된 공식이 아니라 이미 알고 잇는 내용을 강화함으로써 우리의 개인적 신화에 알랑거릴 뿐 아니라, 기존의 세계관에 들어맞지 않는 관심사들의 중요성을 깎아내림
- 12년 8월 구글은 '전자 컨텐츠에 대한 동적 가격책정'에 대해 특허를 얻음. 이것은 동영상, 음악, 전자책, 컴퓨터 게임 등의 온라인 자료에 대해 이용자가 특정 아이템을 구입할 가능성을 알고리즘을 판단하고, 그에 따라 표시된 가격을 바꾸는 것. 제출된 문서에는 똑같은 디지털 파일에 대해 어떤 이용자에게는 다른 이용자보다 네배나 비싼 가격을 물릴 수 있다고 의기양양하게 설명하는 삽화가 들어 있음. 말하자면, 과거의 검색결과로 판단해 내가 해리포터와 트와일라잇 같은 10대용 소설에 혹한다는 사실을 구글 알고리즘이 안다면 바가지를 씌워도 헝거게임을 살 것이라고 확신할 수 있음. 반면에, 10대 마법사와 멋진 뱀파이어 이야기에 별로 흥미를 느끼지 않는 사람을 끌어들이려면 가격을 낮추어야 할 것임.
- 최근 몇 년간 이른바 정서감지라는 분야가 두각을 나타냈음. 목소리 높낮이, 표정, 심지어 인터넷 검색기록을 토대로 이용자의 정서상태를 예측하는 기술. 마이크로소프트 리서치 연구진은 사람들의 통화기록, 앱 사용내역, 현재 위치 등을 분석한 뒤에 이 측정치를 이용하여 기분을 예측. 마이크로소프트에 따르면 알고리즘이 매일의 기분을 예측하는 정확도는 66%에서 출발하여 두달간 훈련한 뒤에는 93%까지 올라간다고 함. 기분은 소비자 선호도에 큰 영향을 미치므로, 이런 정보는 마케팅에 요긴하게 쓰일 수 있음. 예를 들어, 컴퓨터나 스마트폰이 내가 심리적으로 약해졌을 때를 알아낼 수 있다고 해보자. 그런 상황에서는 내가 관심을 가진 제품의 가격을 몰래 올려도 괜찮을 것이다. 내 기분을 감지하도록 설계된 알고리즘이 내가 이런 상태에서 결국 구매하고야 말 확률이 통계적으로 높아졌다고 판단했을 것이기 때문
- 알고리즘 정렬에서 사람들은 자신이 감시당한다는 사실을 안다. 신경쓰지 않을 뿐이다. 포획의 장치와 자유의 장치는 어찌나 단단히 뒤엉켜 있는지 떼어놓기가 불가능할 정도. 프랑스 철학자 자크 엘륄은 '기술의 역사'에서 미래의 시민이 자신이 원하는 모든 것을 가질 수 있되. 자유만은 가질수 없을 것이라고 주장. 그후, 매체 역사가 프레드 터너는 이 오싹한 예언을 한층 발전시켰다. 산업시대의 공장 노동자들이 철제 감옥에 갇혀 있었다면, 오늘날의 탈산업정보 기업의 많은 노동자들은 벨벳 골드마인에 거주한다. .... 이 작업장에서는 자아실현, 명성, 집단 정체성, 인간관계, 지적 쾌락 등의 추구가 새로운 매체상품의 생산을 추동한다.
- 사랑의 예측가능성은 최고의 과학자도 풀지 못한 수수께기. 프랑스 수학자로 기계식 계산기를 발명한 파스칼은 이런 명언을 남겼다. "심장에는 이성이 알지 못하는 논리가 있다." 프랑스 작가 스탕달은 연애론 첫머리에서 "여러가지의 감정, 그 전체가 사랑의 정열이라고 불리는 감정을 간결하게 이론적으로, 예컨대 수학적으로 설명하려는" 욕망을 내비친다. 그 결과는 적어도 동료 명문장가 헨리 제임스에 따르면 "읽지 못할 지경"이었다. 문제는, 적어도 자연과학에 몸담은 사람이 보기에 자연법칙이라기보다는 사랑인 듯하다. 사랑은 외면적 현상일까? 그렇지는 않을 것이다. 영국의 정신요법 의사 데이비드 브레이저는 "사랑은 본질적으로 측정불능이다" 설상가상으로 기쁨이나 아름다움은 분석하려고 시도하는 찰나 부서져버린다고들 한다. 이국적인 새를 가까이에서보려고 하면, 새는 우리의 의도를 알아차리는 즉시 날아가버린다.
- 셰익스피어의 희곡 헨리6세에는 법조인과 불미스런 일이 있었던 사람이라면 누구나 공감할 만한 구절이 있음. 백정 딕은 잉글랜드에서 사회봉기를 일으키려는 계획을 듣다가 유토피아를 앞당길 방책을 내놓음. "우리가 제일 먼저 할 일은 모든 변호사들을 잡아 죽이는 일이다." 헨리6세가 초연된 지 500년이 다 되어가는 지금, 변호사들이 아직 죽지는 않았을지 모르지만 만물의 공식으로 인해 쓸모를 잃는 변호사들이 점차 늘고 있음. 증거개시 분야를 예를 들어 보자. 증거개시는 소성의 사전 심리절차로, 법정에서 증거로 쓰일 수 있는 자료를 쌍방이 취득하여 정리하는 행위. 예전에는 증거개시 업무를 법무법인에서 파견된 초급 변호사가 주로 담당. 이들은 엄청난 분량의 자료를 손으로 분류했음. 법무법인에는 좋은 일이었지만 막대한 비용을 부담해야 하는 의뢰인 입장에서는 달가울리 없음. 78년에는 텔레비전 스튜디오 다섯 곳이 방송업계의 거인 CBS와의 반 독점 소송에 휘말렸다. 스튜디오들은 사건과 연관된 600만건의 문서를 조회하기 위해 몇달 동안 변호사들을 고용했음.
작업이 끝나고 청구서가 날아왔다. 무려 220만불이 넘는 금액으로 오늘날 화폐가치로 800만불에 가까움. 인공지능이 발전한 오늘날에는 데이터마이닝 전자개시도구와 예측코딩 같은 기계학습 절차를 이용하여 증거개시를 수행할 수 있음. 예측코딩을 이용하면 인간변호사가 문서의 일부를 수작업으로 검토하면서 컴퓨터가 관련있는 정보와 관련없는 정보를 구별하도록 가르칠 수 있음. 그러면 알고리즘이 나머지 정보를 처리. 가장 유능한 인간 변호사들이 맡았을 때보다 시간이 3분의 1도 채 걸리지 않음. 이 시스템은 정확도 면에서 초급변호사와 법률보조원을 줄기차게 앞질렀다.
- 12년에 문화산업에서 또 다른 거대한 변화가 등장. 당시에는 좀처럼 언급되지 않았지만 그해를 기점으로 미국인들은 블루레이나 DVD와 같은 실물보다 인터넷에서 합법적으로 전송되는 영화를 더 많이 보기 시작. 한편 아마존은 킨들을 처음 출시한지 2년도 지나지 않아 고객들이 양장본과 문고본을 합친것보다 전자책을 더 많이 구입한다고 발표. 언뜻 보기에 그다지 급격한 변화로 보이지는 않음. 고객들이 영화를 보거나 책 읽은 일을 아예 중단한 것도 아니니 말이다. 다만 구매하고 소비하는 방식이 달라졌을 뿐. 비유하자면, 여전히 갭에서 쇼핑하되 부츠컷 청바지 대신 스키니진을 산다고 할 수 있을 것이다. 이 비유가 표면적으로는 비슷할지 몰라고, 이것만 가지고는 얼마나 거대한 전환이 일어났는지 이해할 수 없다. 킨들이 종이대신 스크린에서 읽는 책이라는 말로는 부족하다. 종이책과 전자책은 기술과 재료가 서로 다른 독자적 매체임.영화, 음악, 책, 그림을 컴퓨터 화면, 태블릿, 스마트폰에 표시하려면 우선 디지털 코드 형태로 변환해야 함. 애초에 이 작품을 컴퓨터로 제작했는지 여부는 상관없다. 역사상 처름으로 이 작품을 컴퓨터로 제작했는지 여부는 상관없다. 역사상 처름으로 예술품을 수학적 측면에서 기술할 수 있게 되었다. 프로그래밍하고 알고리즘으로 조작할 수 있게 된 것이다. 에너지를 운동에서 열로 전환할 수 있는 것과 마찬가지로 이제는 정보를 이 매체에서 저 매체로 쉽게 전환가능. 예를 들면, 알고리즘을 이용하여 2차원의 사진의 음영을 식별하고 이를 깊이 정보를 가진 픽셀로 변환하여 궁극적으로는 3D컴퓨터로 3차원 물체를 출력할 수 있음. 더 인상적 사례도 있따. 최근 디즈니 연구개발부에서는 이용자가 평면 터치스크린을 만지면서도 촉감이 있는 실제 물체를 만지는 것처럼 느낄수 있는 연구 프로젝트를 진행중임. 이것은 표면과 손가락 끝의 마찰감각을 인위적으로 만들어내는 햅틱 피드백 알고리즘으로 여기에 속은 뇌는 요철이나 심지어 질감을 느끼고 있다고 착각함. 디즈니 리서치의 이반 푸피레프는 이 기술을 이용하여 가상물체와의 상호작용에 현실감을 부여할 수 있다고 말함. "손가락이 터치스크린 위를 미끌어질 때 손가락 피부를 인위적으로 늘리면 뇌는 터치스크린에 진짜 돌기가 있다고 착각합니다. 완전한 평면인데 말이죠."
- 출판업자의 관심사는 텍스트보다는 고객을 이해하는 것. 과거에는 고객이 서점에서 책을 구입하여 집에 가져간 뒤에 책을 끝까지 읽었는지, 책꽂이에 꽂아두고 잊어버렸는지, 출판사에서 알 도리가 없었음. VHS테이프나 DVD도 마찬가지였음. 스타워즈를 소장한 고객이 스톰프 루퍼가 머리 부딪히는 장면을 보려고 되감기를 몇번 하는지, 원초적 본능의 유명한 다리꼬기 장면을 보려고 일시정지 버튼을 몇번 누르는지, 영화사에서는 알 방법이 전혀 없었음. 그러나 데이터를 수집하여 콘텐츠 공급자에게 전달할 수 있게 되면서, 이 모든 상황이 달라지고 있음. 예를 들어 아마존은 고객이 전자책을 얼마나 빨리 읽는지, 머리말을 한자 한자 꼼꼼히 읽거나 건너뛰는지, 심지어 어느 구절에 형광펜을 칠하는지까지 알려줌. 과학소설, 로맨스, 범죄소설을 읽는 속도가 문학소설보다 빠르며, 비문학은 문학에 비해 끝까지 읽을 가능성이 적다는 사실오 알고 있다. 이런 통찰은 창조적 판단을 낳기도 함. 13년 2월 넷플릭스는 케빈 스페이시 주연의 정치드라마 카드로 만든 집을 방영. 표면적으로 카드로 만든 집에서 가장 눈에 띄는 특징은 주문형 스트리밍 미디어 기업 넷플릭스가 쇼타임이나 HBO같은 유료 텔레비전 브랜드와 경쟁하기 위해 배급에서 제작으로 비즈니스 모델을 바꾸고 있다는 사실인 듯했다. 인터넷 이용자를 위해 오리지널 비디오 컨텐츠를 제작하는 것은 여전히 새로운 개념임. 거기에 거액의 예산을 쏟아붓는 것은 더더욱 그러함 1억불을 투자한 카드로 만든 집은 전대미문의 시도였따. 그러나 많은 사람을 놀라게 한 것은 넷플릭스의 과감한 판단이었따. 로드개터스에 있는 넷플릭스 경영진은 두 시즌, 총 26개 에피소드로 이루어진 드라마를 단 한장면도 보지 않고 제작하기로 결정. 왜 그랬을까? 그 이유는 2500만 이용자에게 데이터를 수집하고 알고리즘을 적용하여 사람들이 어떤 동영상을 보는지에 대한 추세와 상관관계를 밝혀냈기 때문. 넷플릭스는 많은 가입자가 BBC의 드라마 카드로 만든 집 시리즈를 재미있게 시청했다는 사실을 알아냈다. 근거는 에피소드를 여러번, 연달아 시청했다는 것이다. 또한 이들은 케빈스페이시가 출연한 영화를 좋아했으며, 소셜네트워크의 데이비드 핀처가 감독한 영화도 즐겨 보았음. 넷플릭스는 세가지 요소를 두루 갖춘 시리즈라면 성공확률이 굉장이 높으리라 예상했고, 예상은 적중했다.
- 지금까지, 그림은 완성되는 순간에, 사진은 인화되는 순간에, 책은 인쇄되는 순간에 위치가 고정되었다. 심지어 이런 고정성이 감상의 일부라고 주장하는 사람도 있음. 고정된 매수의 종이가 책등에 제본된다고 하는 책의 물리적 구성 때문에 독자는 미리 정해진 직선적 방법으로 즉 왼쪽에서 오른쪽으로, 앞 페이지에서 뒤 페이지로, 장에서 장으로, 앞표지에서 뒤표지를 진행하며 책을 읽음. 그리하여 책은 완성, 전체성, 종결을 지향하는 우리의 욕망에 부합한다. 그러나 만물의 공식 세계에는 영속성이나 고정성이 존재하지 않는다. 전자책, 영화, 음악은 아무렇게나 건너뛰어도 된다. 그리하여 서사는 평면화되거나 가장 기본적인 단위로 분해됨. 컴퓨터 과학자 스티븐 드로즈가 95년 논문 '구조화된 정보: 탐색, 접속, 통제'에서 주장하듯, 구조화된 정보를 이렇게 분석하더라도 보편적 진실에 가까이 갈 수는 없다. 우리가 하는 일은 "셜록 홈즈가 사물을 관찰하고 숨겨진 진실을 드러내는 것"이 아니라 "정보를 점차 작은 단위로 나누는" 것에 가깝다.
- 54년 34세의 미국인 심리학 교수 폴 밀은 제목이 좀 이상하지만 획기적인 저서를 발표. 밀의 책 '임상적 예측 대 통계적 예측: 이론적 분석과 근거 검토'는 스무개의 사례를 통해 통계 알고리즘의 예측과 전문가의 임상적 예측을 비교. 그중 한 표본 연구에서 전문 상담교사에게 대학 1학년 학생들의 기말성적을 예측하도록 함. 상담교사들은 각 학생을 45분간 면담하고 과거 성적과 여러 적성검사 결과, 학생들의 4페이지 자소서를 읽어볼 수 있었다. 이에 반해 알고리즘은 고등학교 성적과 한차례의 적성검사 결과만 참고. 그런데 14건 중 11건에서 알고리즘이 상담교사보다 학생들의 기말성적을 더 정확하게 예측. 가석방 선서 위반율에서 비행기 예비 조종사의 훈련완수에 이르는 다양한 분야에서도 같은 결과가 나옴. 20개 사례 중 19개에서 통계 알고리즘이 전문가보다 더 적은 데이터만 가지고도 더 정확한 예측을 내놓았는데, 나중에 밀은 이를 알고리즘의 완승으로 표현. 그는 "실제 이해를 바탕으로 한 자연스러운 임상적 예측이 더 뛰어나다는 임상가들의 독단적이고 자만심 가득한 주장은 지금껏 밝혀진 사실과 상충한다"고 결론 내림. 이유를 알 수 있겠지만, 이 순간부터 밀은 학계에서 따돌림을 당함. 밀의 반전문가적 태도는 03년 밀의 뉴욕타임즈 부고기사에 인용된 동료의 언급처럼, 급기야 "임상가는 수동 먼로 계산기를 가진 점원으로 대체할 수 있다"라는 극단적 주장으로 이어짐. 밀은 종잡을 수 없는 인물이었지만, 알고리즘의 예측능력에 대한 그의 견해는 이후 사실로 입증됨. 그 뒤로 약 50년간 수행된 200건의 유사연구에서 알고리즘은 약 60%의 성공률로 인간의 직관을 앞서나감. 나머지 40%에서는 통계적 예측과 임상적 예측 사이에 통계적으로 유의미한 차이가 나타나지 않았음. 그러나 알고리즘을 쓰는 편이 전문가를 고용하는 것보다 저렴하기 때문에 이 경우에도 알고리즘의 손을 들어주어야 할 것이다.
- 그 많던 일자리는 어디 갔을까? 그 모든 중간층 일자리에서 창출되던 부는 어떻게 되었을까? 이 문제에 관심을 가진 사람들을 경악시킨 것은 자동화의 무지막지한 결과였다. 속도, 효율성, 금전적 가치를 제공하는 소수의 훌륭한 알고리즘 앞에서는 무엇도 안심할 수 없다. 만물의 공식 시대에 고전을 면치 못할 산업들의 암울한 운명을 예언하는 책들이 늘고 잇음. 법학교수 브라이언 타마나하는 '로스쿨은 끝났다'에서 미국 정부 통계에 따르면 2018년 로스쿨에서 배출되는 졸업생은 45000명이나 되지만 이들을 받아줄 일자리는 25000개에 불과할 것이라 말했다. 게다가 언젠가는 이때를 좋았던 시절로 기억할 것이라고 덧붙임. 미래에는 법무법인이 신규와 경력을 막론하고 변호사를 더는 채용하지 않고 대부분의 업무를 인공지능 시스템에 맡기는 상황도 얼마든지 상상할 수 있음. 같은 맥락에서 많은 전문가들은 앞으로 10년 뒤 변호사 수가 10~40% 감소할 것이라고 전망. 에릭 브린욜프손과 매커피가 논문 '기계와의 경쟁'에서 주장하듯, 이것은 대불황이나 대침체의 결과라기 보다는 거대 구조조정의 결과다. 어떤 직업이 만물의 공식으로부터 안전한가를 판정하는 새로운 바로미터는 그 직업에 종사하는 사람들의 계층이 아니라 비용과 효율의 균형이다. 최대한 비효율적으로 돌아가도록 진화했으면서도 막대한 금액을 청구하는 직업과 분야(변호사, 회계사, 국회의원)는 자동화가 닥쳤을 때 속절없이 당할 것이다. 경제학자 시어도어 레빗이 60년 논문 '근시안적 마케팅'에서 말했듯, 모든 산업은 살아남으려면 "지금 돈을 벌어다 주는 사업을 퇴물로 만들 궁리를 해야 한다." 이것은 자동화의 증가에 따라 대체되는 직업이 노동자 계급 일자리라는 고전적 산업화 개념과 다르다. 이를테면 '인공지능의 철학'이라는 명저에서는 이렇게 말한다. "의학적 진단과 처방을 내리고, 법적, 학술적 조언을 제공하고, 논리학이나 수학의 공리를 제시하는 일은 대체로 지능을 필요로 하는 것으로 여겨진다. 그러나 교육을 얼마나 받았는지 여부와 상관없이 정상적인 성인이라면 누구나 할 수 있고 대체로 의식적 통제를 요하지 않는 일은 그렇지 않은 것으로 간주된다. 명암을 구별하는 것, 혼잡한 지형을 통과하는 경로를 찾는 것, 핀을 구멍에 넣는 것, 모국어를 말하는 것, 상식을 활용하는 것이 이에 해당한다."

'과학' 카테고리의 다른 글

우리는 이렇게 나이들어 간다  (0) 2015.05.22
센스 앤 넌센스  (0) 2015.05.22
맛이란 무엇인가  (0) 2015.04.09
단맛의 저주  (0) 2015.04.03
동물을 깨닫는다  (0) 2015.04.03
Posted by dalai
,