인간 vs 기계

과학 2018. 3. 10. 15:39

- 딥러닝의 할아버지는 57년 천재 과학자 프랭크 로젠블라트가 발명한 퍼셉트론. 인공신경세포들을 적절히 연결시켜주면 논리 연산 규칙을 스스로 인식하게 됨. 기계학습의 시작이었다. 하지만 불과 몇년 후 MIT의 민스키와 페퍼트 교수는 단층 퍼셉트론으로 학습할 수 있는 정보는 지극히 한정되어 있다는 사실을 증명. 복잡한 정보를 학습하기 위해서는 다층 퍼셉트론(MLP)이 필요하지만, MLP 신경망의 수많은 시냅스를 학습시킬 수 있는 방법이 없었다. 단층 퍼셉트론의 사형선고였다. 그리고 20년 후 인지심리학자 룸멜하트와 맥클리랜드는 MLP를 효율적으로 학습시킬 수 있는 오차역전파법을 제시한다. 역전파 알고리즘은 간단하다. 3층으로 구성된 인공신경망을 상상해보자. 첫 층은 예를 들어 고양이라는 물체를 숫자를 표현한다. 고양이 사진의 픽셀값들이라고 생각하면 된다. 마지막 층 신경세포는 전체 MLP가 계산한 값을 출력한다. 물론 랜덤으로 시작하기에, 처음 결과는 틀릴 것이다. 하지만 만약 매번 선생님이 정답을 알려준다면? MLP가 계산한 '이양고'라는 오답과 선생님이 알려준 정답 '고양이'의 값차이를 계산할 수 있다. 그다음 차이값을 아래층으로 역전파해 시냅스 값을 고쳐주면 된다. 이런 식으로 수천만가지 고양이 사진을 보고, 매번 선생님의 정답을 통해 시냅스 값들을 수정한다면, 언젠가는 MLP는 고양이 전문가가 된다. 걸어다니고, 뛰어다니고, 밥을 먹는 그 어떤 모습의 고양이를 보더라도 정답을 출력한다. MLP에게 고양이 직관이 생긴 것이다. 하지만 딥러닝의 아버지격 되는 다층 퍼셉트론은 치명적 문제들을 갖고 있다. 우선 인공신경망을 3층 이상으로 올리면 점차 학습이 불가능해짐. 오차값이 깊은 층수들로 역전파되면 점점 왜곡되는 '사라지는 경사도'문제가 생김. 그런데 왜 깊은 신경망 층수가 필요할까? 간단히 설명하지만 층수가 깊을수록 더 추상적인 학습이 가능해짐. 다층 퍼셉트론의 또 다른 한계는 새로운 사실을 추론해내는 것을 어려워한다는 점. 이 같은 기존 MLP의 문제는 06년, 그리고 12년에 와서야 드디어 해결된다. 토론토대학의 제프리 힌튼 교수팀은 깊은 층수의 MLP 역시 사전학습을 통해 트레이닝시킬 수 있고, 인공신경망을 랜덤으로 죽여주면, 추론능력을 개선할 수 있다는 사실을 보여준다. 기존 인공신경망의 한계를 극복한 깊은 층수 구조의 인공신경망을 보통 딥러닝이라고 부른다.
- 뇌와 컴퓨터의 차이에 대해서는 이미 50년대 존 폰 노이만을 통해 정의가 내려졌다. 폰 노이만은 컴퓨터에서 가장 중요한 것은 분리된 CPU와 메모리라고 이야기했다. 메모리에는 기억을 가진 것처럼 정보를 심어두어야 하고 CPU는 계산을 해내는 영역이라고 말했다. 계산하는 방과 기억은 분리시켜놔야 한다는 것이 기본구조. 그 덕에 우리는 여전히 폰 노이만 기계를 사용하고 있습니다. 폰 노이만은 58년 컴퓨터와 뇌라는 책을 썼다. 이 책 내용 중에 폰 노이만은 '사실 정말 이해하고 싶었던 것은 뇌다. 근데 그것을 이해하기 위해서 컴퓨터 구조를 만들고 설계를 했는데 가만히 생각해보니까 실수한 것 같다.' 라고 썼다. 그러니까 폰 노이만은 컴퓨터를 설계할 때 뇌를 모방했다고 생각했는데 알고보니 본질적 차이가 있었음을 깨달은 거죠
- 폰 노이만 기계는 메모리와 CPU를 분리하여 작동시키는 것이 핵심. 하지만 뇌의 메모리는 컴퓨터와 완전히 다름. 컴퓨터는 망가지지만 않으면 저장된 정보를 그대로 끄집어낼 수 있음. 하지만 뇌는 절대 불가능하다. 우리가 눈을 뜨고 며칠만 돌아다니더라도 엄청난 양의 정보가 만들어짐. 이 모든 정보를 뇌에 100% 입력했다가는 정보량이 꽉 차서 뇌가 아무것도 못한다. 그래서 인간의 뇌는 각 상황에서 저장할 가치가 있는 정보와 저장할 필요가 없는 정보를 구별하여 저장. 그리고 그 구별한 정보도 압축을 한다. 아주 굵은 가지만 남겨둔다. 그리고 그 기억을 나중에 기억할 때는 내가 예전부터 알았던 이야기, 내가 들은 이야기, 남들이 나에게 보여주는 이야기, 그런 것들을 합쳐서 새롭게 이야기를 만들어서 기억함. 다시 말하면 기억한다는 것은 어디에다 정보를 저장했다가 가져오는 것이 아니고 매번 새로 만들어내는 것과 다름 없다.
- 서양철학 2500년의 프로젝트를 떠올려 보자. 그 프로젝트의 핵심은 세상을 두가지로 설명할 수 있다고 믿는 것. 기호와 규칙. 세상에서 일어나는 현상뿐만 아니고 내 머리속에서 일어나는 것을 100% 표현할 수 있는 기호들이 존재한다고 믿는 것. 내머리 안에서 일어나는 현상의 순서를 표현할 수 있는 규칙이 존재한다는 가설하에 서양철학자들이 그것을 찾으려 2500년 동안 애쓴 것. 그리고 그것을 인공지능이 시도했음. '내 머리안에서 이런 일들을 기호와 규칙으로 시뮬레이션할 수 있다면 사람하고 똑같이 지능을 만들어낼 수 있겠구나'라는 아이디어에서 시작. 그것이 불가능하다는 것을 인정하는 데 이렇게 오래 걸린 이유는 이 논의가 서양철학의 아주 본질적인 가설이기 때문. 세상을 표현하고 표현을 통해서 이해할 수 있다는 것. 여기서 표현이라는 것은 당연히 언어임. 언어는 굳이 영어, 한국어를 이야기하는 것이 아니고 기호로 표현할 수 있는 세상을 말함. 다시 말해, 표현한 기호들 간의 관계 혹은 논리적인 관계를 통해서 세상을 이해할 수 있다는 시도였다. 그런데 그렇지 않았다. 기계한테 열심히 설명을 하려고 노력을 했었는데 결국 안되었다. 인공지능 역시도 50년대부터 모든 이론과 우리가 알고 있는 모든 것을 동원하고 투자해서 인공지능시스템을 만들었음에도 실험실에서 잘되는데 진짜 현실에 나가면 다 무용지물. 전통적 인공지능은 여전히 강아지와 고양이를 구별 못함
- 우리는 현실이라는 우주에서 가장 큰 빅데이터를 통해 경허하고 학습하여 지능을 얻은 것 같다. 세상을 알게 된 것이다. 결국 우리가 보통 이야기하는 지능, 세상을 알아보는 능력은 설명을 통해서 배우는 게 아니고 경험과 학습을 통해서 배운다. 이제 사람들은 뇌가 세상을 인식하는 과정을 열심히 연구했다. 그리고 그 방법들이 20세기에 들어와 밝혀지기 시작했다.
- 뇌의 시각 정보를 프로세싱하는 신경세포망들을 논리적으로 나누다보니 뇌는 계층적 구조를 가지고 있다. 10~15층되는 구조로 차곡차곡 쌓여 있음. 한 10층에서 15층 되는 빌딩이라고 생각하면 된다. 가장 아래층은 실제로 눈에 들어오는 정보들을 가장 먼저 보는 신경세포층. 어떤 일을 하느냐면 ,이 신경세포들은 영상을 있는 그대로 분석하지 않고 영상의 가장 작은 단위, 한 픽셀과 픽셀간의 통계적 인과관계를 분석하고 학습해서 가장 압축된 표현을 만들어냄. 그 다음층에 위치한 신경세포들은 이 압축된 현상으로 압축된 표현을 이끌어냄. 현상을 만들어내면 그 현상을 2층에 있는 신경세포에 보내고 2층에 있는 신경세포는 더 이상 현실에는 관심이 없고, 1층에서 보낸 압축된 현상을 가지고 또 압축된 표현을 만든다. 압축에 압축된 표현. 이런 식으로 계속 10층, 15층까지 올리면 맨 위층의 신경세포들은 많은 변이가 있는 강아지라도 강아지로 알아볼 수 있게 됨. 다시 말해 인간의 사물인식과정은 어떻게 보면 대기업의 구조를 가졌다고 이해하면 된다.
- 딥러닝은 토론토대 제프리 힌튼, 13년부터 구글과 함께 연구. 뉴욕대의 얀 레쿤, 14년 1월부터 페이스북 인공지능 연구소장이 됨. 스탠포드 앤드류 응, 14년 4월 중국 바이도 기술담당 최고책임자로 취임. 14년도는 딥러닝의 해. 딥러닝이 갑자기 너무 잘되다 보니 지금 기업들은 너도나도 딥러닝에 달려든다. 50년 동안 풀리지 않던 문제들이 딥러닝으로 인해 3~4년만에 다 풀렸다
- 대부분 전문가들은 본인의 전문성을 직관으로 한다고 주장. 예를 들어 미국의 워렌버핏은 주식투자를 잘하는 사람이다. 이 사람에게 '어떻게 그렇게 투자를 잘하세요?'라고 물어보면 자신이 표현할 수 있는 10%의 언어로 대답을 할 것임. 책도 쓴다. 워렌 버핏의 책을 읽고 그대로 따라하면 워렌 버핏같이 수익을 낼 수 있을까? 절대 그렇게 벌지 못함. 왜냐하면 왜 수익이 나는지 정확한 이유를 워렌 버핏도 모르기 때문. 어떻게 투자하는지에 대해 표현한 10% 이외의 90%는 직감으로 투자한다고 버핏은 이야기할 것이다. 공학자로서 입장을 말하잠녀 직감은 존재하지 않음. 당연히 뇌는 무언가를 계산하고 그 일부만을 언어로 표현하는데, 언어로 표현할 수 있는 모든 걸 우리가 적분해서 합쳐서 직감이라고 이름 붙인 것. 인간의 직감, 즉 말로 표현할 수 없는 90%를 행동으로 표현한다면, 그 행동을 관찰해서 학습을 한다.
- 무인자동차는 구글이 열심히 만들고 있다. 그런데 이것도 구글의 농담 중 하나가 아닐까 의심할수도 있다. 구글은 상당히 많은 걸 하겠다고 해놓고 안한다. 구글의 비즈니스 모델. 이것은 60년도 IBM이 사용했던 비즈니스 모델과 정반대. 60년대 IBM은 자신들이 완성하지 않은 제품을 완성했다고 먼저 소개하는 비즈니스 모델을 사용. 그럼 경쟁자들은 비슷한 것들을 만들다가 포기. 어차피 IBM이 다 했기 때문. 그런데 사실은 완성되지 않았기에 5~6년후에 상용화됨. 이런 비즈니스 모델을 베이퍼 웨어라고 함. IT에서는 하드웨어, 소프트웨어, 베이퍼웨어가 있다. 그중 베이퍼웨어란 존재하지 않는 거품 같은 것을 의미. 그런데 구글은 안티베이프웨어를 만든다. 예를 들어 구글 글래스 같은 것들. 하겠다고 하고 모델과 프로토타입도 만든다. 그러면 전 세계 모든 회사가 구글이 글래스를 만드니까 우리도 하자며 거기에 다 뛰어든다. 여기서 수익이 날지는 아무도 모르는 상태에서 다른 회사들이 시작하면 구글은 그 사업에서 슬쩍 빠진다. 이런 식으로 자신들의 경쟁자들이 될 수 있는 한 모든 시간과 에너지와 자원을 낭비하게 만든다. 어쨌든 구글이 자원이 가장 많기 때문. 결국 삼성이나 소니가 구글글래스에 모든 자원을 투자하는 동안 구글은 인공지능에 집중. 구글만이 동시에 다 할 수 있는 자원을 갖고 있기 때문. 그래서 혹시 무인자동차도 그런 베이퍼웨어가 아닐까 하는 의구심을 가질수도 있음. 구글은 이걸 두고 구글의 농담이라 부름. 가끔 실리콘 밸리에 가면 '너희도 로봇을 만든다며? 너희도 구글의 농담에 빠졌구나'라고 놀린다. 무인자동차도 구글의 농담일까? 아마 무인자동차는 아닐 것. 구글은 무인자동차를 개발하는 것뿐 아니라 존 크라픽을 영입.
- 운전자가 사라지고 모든 사람이 승객이 도면 멀미 문제가 생길 것임. 무인자동차는 엄청난 멀미를 일으킬 것으로 예상됨. 멀미는 예측코드에서 생긴다고 알려져 있다. 예측코드란 인간이 행동을 할 때 실시간으로 계산할 수 없으므로 뇌는 예측해서 행동을 명령함. 세상이 변하는 속도에 비해 뇌의 계산속도가 못 미치기 때문. 예를 들어 컵이 있을 때 로봇에게 '이거 들어'라고 명령하면 로봇은 손으로 잡은 후 들기 전에 무게를 측정. 그 다음에 든다. 그래서 로봇의 행동은 느리다. 그런데 사람에게 '들어'하면 그냥 든다. 인간은 물건을 보면 얼마나 무거울지 경험을 통해 대략 알기 때문. 따라서 예측에 의해 알아서 관절이 조절되어 바로 들 수 있다. 계단을 내려갈 때 로봇은 천천히 높이를 측정해가며 내려가는데 인간은 껑충껑충 내려감. 경험에 의해 미리 관절이 조절되었기 때문. 인간의 예측코드는 생긴것보다 가벼운 것을 들 때 사람의 행동, 계단을 내려갈 때 갑자기 다른 높이의 계단이 나왔을 때 헛다리를 짚는 행동을 통해 엿볼 수 있다. 예측코드가 하는 일반적 예측 중 하나는 우리의 몸자세 예측이 있다. 귀의 달팽이관은 내 몸의 위치를 X, Y, Z로 항상 예측함. 따라서 운전자들은 멀미를 하지 않는다. 자기가 운전을 하므로 어디로 움직일지 미리 안다. 뒤에 있는 사람은 일반적으로 직진을 예측하느데 왼쪽으로 가니 일치하지 않고, 뇌가 예측했던 몸의 위치와 실제로 경험하는 위치의 차이가 생겨 멀미를 일으킴. 자동차 업계들이 광고에서 보여주듯, 무인자동차에서 컴퓨터러 문서작업하고 코딩하다간 다 멀미를 겪을 것임. 안에서 일하고 회의를 하는 이미지들은 현실성이 없다. 현재로서는 불가능할 것. 앞으로 무인자동차 세상은 세상을 이해하는 것뿐만 아니라 안에 타고 있는 사람을 이해하는 것이 중요함
- 무인자동차의 끝은 운송수단 요금의 무료화. 모빌리티에 스폰서가 가능하다면, 지금 인터넷 사용을 스폰서와 데이터로 지불하는 것처럼 이동수단도 개인의 데이터와 스폰서를 통해 무료화 가능. 근데 카카오 택시나 우버 같은 기업은 돈을 받아야 함. 중개할 만한 데이터가 없기 때문. 그런데 구글은 가능함. 다른 사람에게 돈을 받을 만큼 데이터가 충분하기 때문. 따라서 무인자동차 시대에 돈을 버는 기업은 프리미엄 자동차를 만드는 회사, 완성차를 만들 일부기업, 부품생산업체, 반도체 업계, 콘텐츠 업계임. 이런 일들은 2025년 전후로 벌어질 것임
- 크게 보면 세가지 카테고리가 사라지지 않을 것. 첫째, 사회의 중요한 판단을 하는 직업들인 판사, 최고경영자 등은 자동화할 수 없어서가 아니라 사회에서 절대 허락하지 않기 때문. 둘째, 인간의 심리, 감성하고 연결된 직업은 살아남을 것. 약한 인공지능은 인간을 이해하지 못할 거라고 상상하기 때문. 셋째, 가장 큰 카테고리는 새로운 가치를 창출하는 직업. 약한 인공지능은 분명히 딥러닝을 기반으로 만든 인공지능이다. 딥러인의 기반은 데이터. 데이터가 많이 있으면 그걸 통해서 학습을 해서 비슷한 걸 할 수 있다는 논리. 비슷한 걸 할 수 있게 되면 기계가 더 잘할 수 있다는 이야기는, 인간이 살아남을 수 있는 유일한 방법은 데이터가 없는, 존재하지 않는 데이터를 만들어내는 방법밖에 없다는 것이다.
- 실리콘밸리 연구자들은 '무슨 걱정을 그리 많이 하니? 250년전 1, 2차 산업혁명 때도 무수히 많은 직업들이 사라졌고, 인간들이 공장기계들을 부수고 난리를 피우기도 했다. 하지만 결국 해피엔딩으로 끝나지 않았나? 사라지는 직업보다 더 많은 직업들만 생기면 된다.'라고 말한다. 더 좋은 직업들은 당연히 많겠지만, 두가지 착각하는 점이 있다. 첫째, 1,2차 산업혁명 때 생긴 기계들과 그리고 앞으로 있을 산업혁명 때 나올 기계들은 본질적으로 차이가 있음. 1,2차 산업혁명 때 인류가 만든 기계들은 수동적 기계임. 기관차도 한 번 만들고 나면 쓰다가 녹슬어서 버리는 것처럼, 이 기계를 업그레이드하는 일은 인간이 했다. 안간은 더 좋은 기계를 만들고 더 좋은 서비스를 함. 더 강도높은 육체노동을 하는 것이 아니라 인간을 대신해서 육체노동을 해주는 더 좋은 세탁기를 만드는 일을 하면 된다. 인지적인 일이었기에 여전히 인간이 수작업으로 하는 일을 하면 됐던 것. 하지만 앞으로의 산업혁명은 인공지능 위주다 보니 어쩌면 기계가 스스로 업그레이드하게 될 수도 있음. 인공지능은 그냥 세탁기만 만들지 않고, 더 나은 세탁기를 설계할 것임. 두번째로 실리콘 밸리 사람들이 간과하는 것은, 과거의 산업혁명이 해피엔딩으로 끝날 수 있었던 것은 인류가 19세기에 엄청난 노력을 했기에 결국 가능했다는 것. 인류는 세가지 노력을 했다. 첫째 프랑스에서 공교육을 시작. 1차 산업혁명 때 대부분의 유럽사람들은 글을 못 읽었음. 글을 못 읽는 농부의 자녀들은 데려다 일을 시키려니 적어도 글을 읽고 계산을 할 수 있어야 했다. 이 당시에는 정말로 킬러 애플리케이션이었따. 모든 국민에게 교육을 시킨다는 것은 어마어마하게 혁신적 아이디어였음. 글을 가르쳐주고, 계산하는 방법을 가르침. 그 덕에 우리가 살아남은 것이다. 우리는 인지적 활동을 할 수 있게 됨. 둘째 독일에서 사회보장제도를 만들었다. 셋째 영국에서 세금제도가 생겼다. 이전에는 나라의 모든 수입이 농업을 통한 것이었는데, 농업이 점점 사라지니 기계에 대한 누진세 등을 만들어 산업활동을 하는 과정에서 국가가 돈을 벌 수 있는 제도를 만들었다. 이 세가지 제도로 19세기 1,2차 산업혁명은 잘 극복됨. 하지만 앞으로 닥칠 산업혁명은 지금도 벌어지고 있고, 향후 20~30년 후에도 벌어질 일이지만 인류는 아직 아무 준비를 하고 있지 않다는 것이 핵심.
- 로마 시민의 반 이상이 실질적 실업자였다. 사람들이 할 일이 없는 것. 험한 일은 노예의 몫이고, 그렇다고 이전의 중산층 들은 출세를 할 수도 없는 아주 위태로운 상황을 맞이. 국민의 대부분이 먹고 살 직업이 없고, 시간이 많으면 폭동 혹은 혁명이 일어나도 이상하지 않은 분위기. 이때 사회적 혁신을 단행함. 어느 한순가부터 로마 시민들을 국가가 먹여살리기 시작. 로마는 1년에 한사람당 돼지고기 몇킬로 그램, 와인과 올리브유 몇 리터, 밀가루 몇 포대 등 굶어죽지 않을 만큼 기본적인 것들을 나누어줌. 국가가 모든 사람을 먹여살린 것. 어차피 로마 사람들은 생산적으로 할 일이 없었다. 노예들이 다 했기 때문. 국가가 삶을 보장해준 잘 살진 못했지만 굶어죽지도 않음. 그런데 문제가 있는데, 시간이 많아진다는 것. 그래서 로마는 엔터테인먼트를 제공. 로마 대부분의 유적은 엔터테인먼트 기반의 건축물. 대표적인 것이 콜로세움. 목욕탕도 있다. 다 무료였다. 콜로세움에서는 하루에 16시간 동안 잔인한 경기를 보여줌. 즉, 대부분의 중산층이 스스로 생산적인 일을 해서 살아남을 수 없는 세상이고, 그렇게 두면 폭동이 일어나니 먹고 살게 해주었으며, 대부분의 시간을 다른 생각을 하지 못하게 엔터테인먼트를 제공
- 결국 최악의 미래 시나리오는 인공지능 기술을 가진 기업들이 기본소득을 제공해 국민을 먹여살리고, 24시간 케이블 TV가 자극적인 콘텐츠를 제공해 시선을 다른 곳을 돌리는 것. 엔터테인먼트의 역할은 실로 블루오션이다. 완전히 새로운 형태의 엔터테인먼트가 생길수도 있다. 어쩌면 사람들의 일자리가 모자라면 가짜 직업을 만드지도 모름. 사람이 하지 않아도 되지만 사람에게 시키는 것. 그렇게 되면 가짜 일자리는 생산하는 일이 아니다 보니 월급은 나라에서 지급해야 함. 지속적으로 비용을 지불해야 함. 하지만 이런 형태가 지속되면 재정에 문제가 생김. 직업이 사라질 때마다 가짜 직업을 만들어서 국가가 비용을 지불하다 보면, 어느 한순간 모두를 먹여 살려야 함. 결론적으로 아무런 해답이 없다.
- 현재 40대인 사람들은 인류의 역사상 가장 행복한 사람들. 인류역사 1만년의 혜택을 다 받고 살다가 기계에게 밀려나기 직전 은퇴함. 2,30대는 혼란의 시대를 경험하겠지만 현실적으로 아마 살아남을 것. 지금 획득한 기술은 20~30년 사이에 바로 바뀌지는 않기 때문. IT, 컴퓨터를 몰라도 우리네 아버지 세대들이 한동안 살아남을 수 있었던 것처럼 말이다.

Posted by dalai
,