- 소프트웨어와 성당은 상당히 닮았다. 우리가 지어놓고 거기서 기도를 한다.
- 디지털 문화 비평가이자 게임 디자이너인 이언 보고스트는 '15년 초 '디 애틀랜틱'에 기고한 '계산의 성당'이란 제목의 글에서 소프트웨어에 대해 점점 신화적으로 접근하는 우리의 모습을 지적. 우리가 신을 알고리즘으로 대체하는 '계산적 신권정치'에 놓였다는 것.
이른바 알고리즘 문화는 물질적 현상이라기보다는 종교적 현상이며, 사람들은 과학으로 인해 종교의 영향에서 벗어났다고 말하면서도 동시에 마음속에서 신을 컴퓨터로 대체하여 간절히 빈다.
- 인류학자 브로니스와프 말리노프스키는 거의 한 세기 전에 이야기한 바와 같이 "원시 인간에게 마법은 여러 의식적 행위와 신념, 그리고 중요한 추격이나 치명적 상황이 있을 때마다 위험한 간극을 메꿔주는 확실한 정신적, 실제적 기법을 공급해주었다" 계산이 급속도로 발전하는 가운데 우리는 왠지 더욱 원시적이 되어가는 것처럼 느낀다.
- 현존하는 가장 강한 기업 상당수는 확실히 고도의 알고리즘을 문화적으로 잘 포장한 이들이다. 구글은 세계관 전체가 철저하게 알고리즘에 기반을 둔 기업의 전형적 사례로, 페이지랭크가 바로 그 알고리즘. 아마존의 혁신적 알고리즘은 계산만 하는 것이 아니라 실행계획까지 수립함으로써, 기존의 도서판매자들과의 협업으로 시작하여 결국 그들보다(나중에는 거의 모든 종류의 소비재 판매자들보다) 더 많이 판매할 방법을 찾아냈다. 페이스북은 사람들이 서로 소통할 수 있도록 세상에서 가장 성공적인 소셜 알고리즘을 개발. 이외에도 수많은 강력하고 실용적이고 수익성도 좋은 알고리즘이 지속적인 업데이트와 개선을 통해 복잡한 인간문화를 이해하고 계산해내고자 노력하는 중. 우리 대부분은 알고리즘 실용주의자들이 만든 세상에 살고 있다. 실제로 구글 같은 기업이 추구하는 목표와 스케일을 보면, 무엇이 문제인가 그리고 어떻게 해결할 것인가로 정의하는 알고리즘의 개념이 세상을 완전히 바꿀 수 있다고 믿는 것 같다. 이러한 실용주의는 나름의 변형을 통해 더욱 정교한 대응과 해답을 이끌어내기도 하고, 소통 연구가 탈러턴 길레스피가 암묵적 협상이라 칭한 것처럼 사람들로 하여금 알고리즘 시스템에 자신들을 맞추는 식으로 행동하도록 만들기도 함. 이를테면 사람드른 기계에 대고 말할 때 평소와 다르게 말하고 기계가 더 잘 이해할 수 있는 방식으로 해시태그를 업데이트하고 자신의 일에 대해 설명할 때 검색하기 쉬운 용어를 사용하려는 경향이 있다.
- 애플이 인수하기 전에는 시리가 훨씬 더 똑똑했다는 사실을 모르는 애플 유저가 많다. 시리를 처음 상품으로 개발한 스타트업이 2010년에 애플 스토어에 시리를 공개한지 수 주 만에 잡스가 그 회사 인수를 추진. 재빨리 움직인 덕에 안드로이드폰에 시리를 도입하는 목적으로 버라이즌과 계약하려는 것을 막고, 시리 팀이 이 도구를 전 세계 수백만 유저에 맞게 조정하는 과정에 착수할 수 있었으며, 이제 시리는 iOS운영체제의 핵심 인터페이슬 자리매김. 원래의 알고리즘은 수백 개의 데이터 소스와 유연하게 상호작용하면서 근처 피자맛집을 찾는 질문에 답하거나 항공편이 지연될 때 다른 교통편을 대안으로 제시하기 위해 다수의 아카이브에서 얻은 정보를 조율하도록 디자인되었다. 이러한 기능 중 일부는 시리에 다시 도입되었으나 애플과 제휴하면서 제삼자 데이터를 끌어오기 위한 계약이 어려워짐에 따라 점차 유연성이 떨어짐. 원래 버전의 시리는 때때로 욕도 하고 화도 내는 등 대화내용이 더 날카로워서, 이 부분이 잡스가 끌리게 된 부분적 이유이기도 했음. 시리는 그냥 정보를 알고 있을 뿐 아니라 알아가기도 했다.
- 현실세계의 명령을 해석하기 위한 시리의 능력은 두가지 핵심요소에 달렸다. 하나는 자연어 처리이고 다른 하나는 의미의 해석. 데이터 연결없이 시리를 사용해본 유저라면 알겠지만, 시리는 애플 서버에 연결되지 않고는 작동하지 않음. 유저가 시리에게 말을 걸 때마다 음성파일이 데이터 센터로 전송되어 음성기술 전문기업 뉘앙스에서 제공하는 분석 및 저장 서비스를 거침. 알고리즘 음성분석에서 중요한 돌파구는 복잡한 언어학적 구조, 즉 문법과 의미를 상세하게 구현하려는 노력을 버리고 말을 통계적, 확률적 문제로 다루기로 결정한 것이었다. 음성신호에서 어떤 단어가 서로 가장 빈번하게 연결되는가? 이 단어 다음에 어떤 단어가 따라올 확률이 가장 높은가? 연습용 문장으로 시험해 보거나 서비스 이용자에게 시험해 보고 그 피드백을 통해 알고리즘을 개선해 나간다. 이는 고전적 계산 실용주의자적 문제해결 방식으로, 음성언어를 다른 복잡한 시스템과 똑같이 취급하여, 언어의 늪 가운데 시험과 시행착오를 통해 유효계산 가능성 경로를 그려나가는 것이다.
- 언어를 고정된 법칙(문법)이 아니라 어느 정도 정확성을 가지고 예측할 수 있는 일련의 행동으로 인정함으로써 엔지니어는 충분한 양의 음성 데이터에 대해 통계적 음성분석을 실시하여 보편적 음성언어 모델을 만들어내고 이를 이용하여 각종 표현의 활용을 완전하게 매핑할 수 있음. 이렇게 빅데이터로 접근한다고 해도 음성언어를 정확하게 변환하는 것은 대단히 어려운 작업임. 시리의 다른 언어 버전을 공개하는 것은 유효한 기록모델 개발 여부에 달렸고, 실제로 영국식 억양, 스코틀랜드 특유의 발음, 남부 억양을 쓰는 유저의 경우 시리 사용이 원활하지 않다는 문제도 극복해야 함. 하지만 시리의 계산 백엔드가 클라우드에 기반을 두는 이상, 각각의 언어적 뉘앙스는 점점 의미 있는 통계 데이터로 축적될 것이고, 특정 단어가 반복적으로 잘못 해석되는 일련의 기록도 쌓일 것임.
- 구글을 디지털 문화의 결정권자로 바라보면, 구글이 지닌 포부는 어마어마하면서도 나름 사업적 타당성이 있다. 검색창, 지메일, 유튜브 등 기타 필수 서비스의 인터페이스는 궁극적으로 정보로 만들어진 우주에 부합하는 모델을 구성하기 위해 디자인한 기반시설을 깊숙이 감추고 있음. 구글은 2012년에 총 59개에 달하는 각기 다른 서비스의 유저정보를 통합하여 디지털 컬처의 여러 측면에 걸친 인간행동을 전체적으로 이해하려는 작업에 착수하겠다고 발표. 구글이 제공하는 다양한 서비스가 구석구석 서로 연결되어 있으므로 유저가 무엇을 하려는지에 대해 놀랍도록 정교한 모델을 개발할 수 있는 데이터는 확보되었다. 이러한 영향력에 대한 야망을 가장 잘 표현한 것은 '새로운 디지털 시대'를 저술한 에릭 슈미트다. 2010년에 슈미트 회장은 월스트리트저널과의 인터뷰에서 '대부분의 사람은 구글이 자신의 질문에 대답하기를 원하는 것이 아닙니다. 자신이 다음에 무엇을 해야할지 구글이 알려주기를 원하는 겁니다.'라고 자신의 견해를 밝힘. 알고리즘 시대에 정보에 대한 접근을 마스터한 기업에서 스타트렉 컴퓨터를 구축하고 싶어하는 기업으로의 전환을 의미하는 것이다. 기술적 지식의 축적단계에서 다음 단계로, 세계에서 가장 뛰어난 검색엔진의 형태에서 나아가 스스로 영향력을 행사하기 위한 도구와 구조를 갖춘 기술적 존재로 진화하는 것이다.
- 지식그래프가 답을 찾는 방면으로는 예술의 경지라고 한다면, 시리와 알렉사는 자연어 처리를 통한 대화쪽으로 이미 정점에 달했다. 그러나 피라미드 제일 상단에 있는 '예측'은 완전히 다른 이야기다. 이 세 용어는 백과전서의 온톨로지를 깔끔하게 재구성한다. 답을 찾는 것은 역사를 마스터하는 것이고, 대화하는 것은 이성을 마스터하는 것이며, 예측하는 것은 상상을 필요로 함. 그러나 예측을 계산적 알고리즘의 손에 맡기는 것은 완전한 지식 탐구의 더 폭넓은 기초를 흔드는 것일 수 있다. 온톨로지 계통도의 근간이 더 이상 학자와 예술가 사회에 있지 않고 주로 남성이 대다수인 엔지니어로 구성된 기업이라는 구조와 기계에 넘어간 것이다.
- 넷플릭스는 충분한 양의 고객평가와 더불어 정교하게 조율된 36쪽 짜리 가이드를 통해 1천여개의 양자, 즉 마이크로태그를 측정하여 체계적 장르 지형 속에 각 영화와 TV 프로그램의 위치를 잡아주는 식으로 모든 콘텐츠를 직접 평가 가능하다고 결론지었다. 비속어 수준, 여자 주인공 인지도, 결말의 불확실성 또는 확실성 등 각 영화와 TV 프로그램의 수십개 변수를 추적하는 방식으로 개별 영화와 TV 프로그램의 문화적 관계를 보여주는 정교한 알고리즘 모델, 계산과 문화간의 간극을 폭넓게 아우르는 모델을 만들어냈다. 넷플릭스는 (별점 다섯 개로 평가하고, 다음에 볼 작품을 순서대로 배열하는 식으로) 고객의 행동을 매우 제한했던 방식을 버리고 고객의 시청욕구에 최적화된 모델을 개발하여 유효계산가능성의 경계선을 완전히 새로 그렸다. 이 새로운 방식은 후퇴가 아니라 계산 가능한 영역을 확장하는 당찬 도약이며, 영화의 유머가 밝은 쪽인지 어두운 쪽인지 등의 복잡한 문화적 개념도 수치화할 수 있다는 선언이다. 이러한 전선의 확대를 뒷받침하는 노동은 결국 인간, 영화적 모호함 등을 단순수치로 평가하는 문화적 계산이라는 행위에 참여하는 잘 훈련된 인간의 몫이다.
- 태거가 있다는사실을 보면 계산적 효율성이라는 표면 뒤에서 컬처 머신을 뒷받침하는 인간 노동력이 블랙박스의 기어를 돌리고 있다는 것을 어렴풋이 알 수 있다. 넷플릭스는 태거들이 누구인지 비닐에 부치고 있는데, 인간이 기계를 대신한다는 것이 부끄러워서가 아니라 태거들도 블랙박스의 한 부분이기 때문. 이 하이브리드 계산 시스템, 그리고 특히 양자 이론을 다룬 36쪽짜리 가이드 내용은 회사의 귀중한 자산. 태거라는 직택은 엔터테인먼트 미디어와 테일러리즘 관리기법이 묘하게 섞여서 태거 그레그 하티에 따르면 스스로 진지하게 업무에 임하도록 하기 위해 노력해야 한다고 한다.
- 하이데거는 기술이 우주에 대해 무엇이 가능한지 그리고 무엇을 알 수 있는지에 대한 우리의 사고를 일정 틀에 집어넣으려는 경향이 있다고 주장. 망치를 보면 우리는 망치로 무엇을 두드릴 수 있는지 생각한다. 하지만 망치는 병을 따는 데도 사용할 수 있고 문이 닫히지 않도록 하는 데도 사용할 수 있으며 바람 부는 날 종이를 누르는 데도 사용할 수 있다.
- 공유경제의 중심 키워드는 상상이 아니라 신뢰다. 우버 및 공유경제를 기반으로 한 기업은 우리의 신로를 대가로 다양한 형태의 문화적, 상상적 작업을 대행함. 이들 기업이 근로자에게 요구하는 정서적 노동이 바로 그 신뢰에 부합하여 한결같이 친절한 서비스라는 브랜드 이미지를 구축함. 더 중요하게는 사람들로 하여금 알고리즘을 신뢰하라고 요구한다. 피드백과 이력검증을 통해 위험하거나 무례한 운전자를 걸러낼 것이라는 신뢰, 시스템을 통해 가장 가까이 있는 최상의 차량이 배정될 것이고 만화지도가 실제와 동일하다는 신뢰, 운전자도 공정한 대가를 받을 것이고 나도 공정한 비용을 지불할 것이라는 신뢰. 이 각각의 명제에 공감이라는 상상작업이 알고리즘에 위탁되어 있다. 우리는 택시를 어떻게 잡을지 알아볼 필요도 없고, 차량과 기사를 평가하거나 팁을 계산할 필요도 없으며, 택시 승차경험을 규정하는 소소한 관행과 공감적 순간에 얽힐 필요도 없음. 그 경험들이 갑자기 사라지는 것이 아니다. 대신 우버가 우리에게 알고리즘의 언어로 대체 공감작업을 수행하라고 요구하는 것이다. 이 작업은 일부 대놓고 요구되기도 한다. 운전자를 평가하라거나 다음 이용시 할인을 받기 위해 소셜 미디어에 경험을 공유하라거나 추가할인을 받기 위해 친구에게 서비스를 소개하라는 식이다. 다른 작업은 눈치채기 좀 더 어렵다. 서비스의 광고나 노동문화를 통해 운전자를 동료사업가, 개인주의자, 독립적 에이전트로 인정하도록 유도하는 것이 한 예다. 기업마다 이러한 인정의 각기 다른 버전을 갖고 있지만, 알고리즘에 의해 통합된 공동체를 구축하고자 한다는 점에서는 동일하다.
- 문화가 원하는 것이 무엇인가? 무한성을 이해 가능하게 만드는 것이다. 또한 항상 그런 것은 아니지만 많은 경우 질서를 창조하고자 한다. 인간으로서 어떻게 무한성을 마주하는가? 어떻게 이해불가능한 것을 이해해보고자 하는가? 목록을 통해, 분류표를 통해, 박물관의 소장품들을 통해, 그리고 백과사전을 통해서다.
백과전서파와 구글 둘 다 자신들의 프로젝트는 위계를 만드는 것이 아니라 위계를 본뜰 뿐이라고, 자신들의 지식 온톨로지는 이미 문화에 존재하는 구조를 찾기 쉽게 도와주는 보다 효과적인 지도에 불과하다고 주장할 것이다. 그렇다 하더라도, 에코가 말하는 대로 두 경우 모두 그들이 만든 구조가 순식간에 스스로 정리기제가 되어 자신들이 관찰하고자 했던 문화공간을 형성하는 결과를 낳음
- 머신러닝 연구자 페드로 도밍고스는 '마스터 알고리즘'에서 다음과 같이 이야기한다
모든 알고리즘은 인풋과 아웃풋이 있어서 데이터가 컴퓨터에 들어가면 알고리즘은 예정된 작업을 수행하고 그에 따라 결과가 도출된다. 머신러닝은 이 과정을 뒤집는다. 데이터와 결과가 들어가면 알고리즘이 바뀌어 나온다. 러너라고도 하는 러닝 알고리즘은 다른 알고리즘을 만드는 알고리즘이다.
'IT' 카테고리의 다른 글
디지털 미니멀리즘 (0) | 2019.08.05 |
---|---|
AI슈퍼파워 (0) | 2019.06.28 |
데이터 인문학 (0) | 2019.04.07 |
빅데이터는 거품이다 (0) | 2018.08.30 |
비트코인과 블록체인 (0) | 2018.08.30 |