- 이 책의 핵심은 지능의 진화가 수억 년에 걸쳐 다섯 번의 혁신적인 도약을 통해 이뤄졌다는 것을 강조하는 데 있다.
약 5억 5,000만 년 전, 단순한 방사대칭생물에서 좌우대칭동물이 출현하며 '조종을 통한 탐색 능력'이 발달하게 됐는데, 이는 환경을 능동적으로 탐색하고 자극에 반응하는 신경 구조의 형성을 촉진했다.
약 5억 년 전에는 초기 척추동물의 등장으로 '강화학습능력'이 부각되었다. 새로운 뇌 구조의 발달로 보상과 처벌을 통한 학습이 가능해졌으며, 이는 복잡한 행동 패턴의 습득과 환경 적웅을 가속화했다.
세 번째 혁신은 초기 포유류에서 보인 변화로, 대뇌 새겉질(신피질)의 발달과 함께 시뮬레이션 능력이 진화했다. 이는 미래 상황을 예추하고 다양한 가상의시나리오를 경험함으로써 생존 전략을 세우는 데 중요한 역할을 했다.
네 번째 혁신으로서, 영장류의 진화 과정에서는 정신화 능력이 두드러졌다. 다른 사람의 마음을 이해하고 모방하며 미래의 필요를 예측하는 능력은 사회적 상호작용과 협력을 촉진해 복잡한 사회 구조가 형성될 수 있게 했다.
마지막으로 초기 인류는 언어 능력을 통해 도구를 제작하고 지식을 세대 간에 전파할 수 있었다. 기존의 신경 구조를 재조정해서 언어학습 프로그램이 형성되었으며, 이를 통해 복잡한 개념의 전달과 문화의 축적이 가능해진 것이다.
이러한 다섯 번의 혁신적 도약은 인간 지능의 복잡성과 적웅력을 형성하는 데 결정적인 역할을 했다. 맥스 배넷은 이 다섯 번의 혁신이 신경 구조와 기능에 중요한 도약을 이뤄냈고 오늘날의 인간 지능을 탄생시킬 수 있었음을 강조한다. 이러한 발상이 독창적인 이유는 지능의 발달을 뇌의 진화적 혁신과 환경 적웅이 상호작용한 결과로 설명한다는 데 있다. 저자는 지능을 단순히 신경망의 복잡성이 증가한 결과로 보지 않고, 각 진화 시기마다 특정한 생존 도전과 환경적 요구에 맞춰 신경회로가 혁신적으로 재구성되었음을 강조한다. 특히 이러한 혁신이 무작위적이거나 일률적인 과정이 아니라, 생물학적 진화와 인지적 필요가 정교하게 맞물린 결과임을 보여준다. 이러한 접근은 지능을 이해하는 데 있어 진화적 관점과 신경과학적 메커니즘을 통합하는 새로운 시각이기에 지능 연구자들에게 신선한 통찰을 제시한다.
- 자연은 절대 권력을 가진 두 주인의 지배 아래 인간을 두었다. 바로 고통과 쾌락이다. (제러미 벤담(도덕과 입법의 원리 서설))
- 1980년대와 1990년대에는 AI 공동체에 분열이 일어났다. 한쪽에는 기호주의 진영이 있었다. 이들은 인간의 지능을 각각의 구성요소로 분해해서 AI 시스템에 우리가 가장 소중히 여기는 능력, 곧 추론 능력, 언어 능력, 문제해결 능력, 논리력 등을 채워 넣으려고 했다. 반대편에는 메사추세츠공과대학교의 로봇공학자 로드니 브룩스가 이끄는 행동주의 진영이 있었다. 이들은 기호주의 AI의 접근방식이 실패할 수밖에 없다고 생각했다. 그 이유는 다음과 같았다. "더 단순한 수준의 지능으로 많이 연습해보기 전까지는 결코 인간 수준의 지능을 어떻게 분해할 수 있는지 이해할 수없다."
브룩스의 주장은 부분적으로 진화에 바탕을 둔다. 생명이 자신의 환경을 감지하고 반웅할 수 있기까지 수십억 년이 걸렸다. 그리고 뇌를 만들어내서 운동기술과 탐색 능력이 좋아지는 데 또다시 5억 년이 걸렸다. 그리고 이 힘든 과정 끝에 드디어 언어와 논리가 등장했다. 브룩스가 보기에 감지와 운동기능이 진화하는 데 걸린 시간에 비하면 언어와 논리 기능은 눈 깜짝할 사이에 등장한 것이나 마찬가지였다. 그래서 그는 다음과 같이 결론 내렸다. "일단 존재와 반웅이라는 본질만 확보되면 언어와 이성으로 발전하는 것은 간단하다. 본질은 생명과 번식을 유지하는 데 충분한 수준으로 주변 환경을 감지하면서 역동적인 환경에서 돌아다니는 능력이다. 진화는 이런 지능을 만들어내는 데 집중적으로 시간을 쏟았다. 그것이 휠씬 어려운 일이기 때문이다."
브룩스는 이렇게 생각했다. "인간은 인간 수준의 지능이 존재한다는 사실을 보여주는 실존적 증거지만, 우리가 그 사실에서 배워야 할 교훈이 무엇인지에 대해서는 신중하게 생각해봐야 한다."
- 내적상태에 따라 자극의 감정가를 신속하게 뒤집는 뇌의 능력은 주변에서 흔히 볼 수 있다. 하루 종일 굶다가 저녁이 되어 좋아하는 음식을 한 입 물었을 때 침이 왈각 쏟아져 나오는 황율경과, 식곤중이 올 정도로 배불리 먹은후에 마지막으로 한 입 더 베어 물었을 때 느껴지는 더부룩함을 비교해보라.
좋아하는 음식이 몇 분 만에 신이 주신 선물에서 곁에 두기도 싫은 혐오의 대
상으로 바필 수 있다.
이런 현상이 일어나는 메커니즘은 비교적 단순하고 모든 좌우대칭동물이 공유하는 특성이다. 동물 세포는 건강한 양의 에너지를 섭취하면 그에 반웅해서 특정 화학물질, 예를 들어 인슐린 같은 '포만 신호'를 분비한다. 반면 충분한 양의 에너지를 확보하지 못한 경우에는 그에 반영해서 다른 종류의 화학물질, 곧 '배고품 신호'를 분비한다. 두 신호 모두 동물의 몸으로 확산되어 동물의 배고픔 수준을 몸 전체에 알린다. 선충의 감각신경세포에는 이런 신호를 감지하고 그에 따라 다르게 반응하는 수용체가 있다. 예쁜꼬마선충의 먹이 냄새를 향한 긍정적 감정가 신경세포는 배고픈 신호를 감지하면 먹이 냄새에 강하게 반웅하고, 포만 신호를 감지하면 약하게 반웅한다.
내적상태는 룸바 내부에도 존재한다. 룸바는 완충된 상태에서는 충전 스테이션에서 보내는 신호를 무시한다. 이런 상태에서는 충전 스테이션의 신호에 중립적 감정가를 갖는다고 말한다. 룹바의 내적상태가 반해서 배터리가 떨어지면 충전 스테이션에서 오는 신호에 긍정적 감정가를 갖는다.
이때 룸바는 충전 스테이션에서 보내는 신호를 무시하지 않고 배터리를 충전
하기 위해 그쪽으로 갈 것이다.
조종에는 적어도 네 가지 요소가 필요하다. 방향전환을 위한 좌우대칭 제제, 자극을 감지해서 좋은 것과 나쁜 것으로 분류하는 감정가 신경세포, 입력 신호를 종합해서 조종에 관해 단일한 결정을 내릴 수 있는 뇌, 내적상태를 바탕으로 감정가를 조절할 수 있는 능력이다. 하지만 진화는 여전히 생명체를 이리저리 바뀌보며 만지작거리고 있었다. 그렇게 헤서 초기 좌우대칭동물의 뇌에서 또 다른 기술이 등장했다. 이는 조정의 효과를 더욱 키웠다. 바로우리가 감정이라 부르는 것의 초기 형태다.
- 정동의 보편성은 우리의 직관에서도 살펴볼 수 있다. 침착, 환희, 긴장, 당황, 우울, 지루함처럼 감정을 표현하는 미묘한 단어들이 어떤 정동상태로부터 유래했는지 어렵지 않게 짐작할 수 있다. 정동의 보편성은 인체에서도 확인할 수 있다. 심박수, 호흡수, 동공 크기, 아드레날린, 혈압 등 각성 수준을 명확하게 구분하는 신경생리학적 특징이 있다. 그리고 스트레스 호르몬 수치, 도파민 수치, 특정 뇌부위의 활성화 등감정가의 수준을 구분하는 신경생리학적 특징도 있다. 분노나 공포 같은 특정 감정의 범주를 분류하는 기준은 전 세계 문화권마다 모두 다르지만 정동상태를 분류하는 기준은 꽤 보편적이다. 모든 문화권에는 감정가와 각성을 표현하는 단어가 있으며 신생아들은 보편적인 얼굴 표정과 몸짓으로 감정가와 각성을 표현한다(예를 들어 울기, 미소 짓기 등).
정동의 보편성은 인류에 국한되지 않고 동물계 전반에서 발견된다. 정동은 현대의 감정으로 싹을 타운 고대의 씨앗이다.
- 선충의 단순한 뇌에서 도파민과 세로토닌의 첫 번째 기능, 적어도 아주 초기의 기능을 엿볼 수 있다. 선충의 뇌는 자기 주변에서 먹이가 감지되면 도
파민을, 자기 내부에서 먹이를 감지하면 세로토닌을 분비한다. 도파민이 '근
처에 뭔가 좋은 것이 있음'을 알리는 화학물질이라면 세로토닌은 '민가 좋은
일이 실제로 일어나고 있음'을 알리는 화학물질이다. 도파민은 먹이를 찾아
나서게 만들고, 세로토닌은 일단 먹이를 먹고 나서 즐거움을 느끼게 해준다.
도파민과 세로토닌의 정확한 기능은 서로 다른 진화 계통을 따라 정교해졌지만 두 물질의 이런 기본적인 차이는 최초의 좌우대칭동물 이후 놀라울 정도로 잘 보존되었다. 선충, 민달팽이, 어류, 생쥐, 인간에 이르기까지 다양한 종에서 도파민은 근처에 보상이 있을 때 분비되어 각성과 추적(활용)의 정동상태를 촉발한다. 반면 세로토닌은 보상을 소비했을 때 방출되어 낮은 각성상태를 촉발하고 보상 추적 행동을 억제한다(포만). 배고플 때 음식을 보거나 매력적인 이성을 보거나 경주 막바지에 결승선이 눈에 보이면 어떤 일이 일어날까? 뇌에서 도파민이 폭발하듯 쏟아져 나온다. 오르가슴을 느끼거나 맛있는 음식을 먹거나 할 일 목록에 있는 과제를 막 마무리하는 등 원하던 것을 얻었을 때는 어떤 일이 일어날까? 뇌에서 세로토닌이 분비된다.
- 선충이 새로운 장소로 가려고 서둘러 헤엄치는 탈출의 정동상태는 부분적으로 노르에피네프린, 옥토파민, 에피네프린(아드레날린) 등 종류가 다른 신경전달물질로 속발된다. 선충, 지렁이, 달팽이, 어류, 생쥐등 다양한 종의 좌우대칭동물에서 이런 화학물질은 부정적 감정가의 자극을 받아 분비되어 그 유명한 투쟁-도피 반응을 촉발한다. 이 반응에서는 심장박동이 빨라지고 혈관이 수축하며 동공이 확장되고 수면, 번식, 소화 등의 여러 가지 값비싼 행동이 억제된다. 이 신경전달물질들은 부분적으로는 세로토닌의 효과를 직접 상쇄하는 방식으로 작동한다. 동물이 쉬고 만족할 수 있는 능력을 감소시키는 것이다.
선충이라고 해도 세상을 돌아다니려면 많은 에너지가 필요하다. 아드레날린으로 유도되는 탈출 반웅은 동물이 취할 수 있는 가장 값비싼 행동 중 하나다. 탈출 반응을 진행하는 동안 빨리 헤엄치기 위해 근육에서 막대한 에너지를 소비하기 때문이다. 그래서 진화 과정에서 에너지를 절약해 탈출 반응을 더 오래 지속시킬 비법이 고안됐다. 아드레날린26은 탈출 행동을 촉발하는 데 그치지 않고 에너지 자원을 근육에 집중하기 위해 에너지가 필요한 다른 여러 가지 활동을 중단시킨다. 몸 곳곳의 세포에서 포도당이 빠져나오고 세포 성장 과정이 중단되며 소화도 일시 정지되고 번식 과정도 멈추며 면역계도 잠잠해진다. 이를 급성 스트레스 반응이라고 한다. 부정적 감정가의 자극을 받아 몸에서 즉각적으로 나타내는 반응을 말한다.
하지만 전쟁 비용을 마련하기 위해 정부에서 적자 예산을 운영하는 것처럼 급성 스트레스 반웅에서 이런 필수적인 신체 기능을 무한정 지연시킬 수는
없다. 그래서 좌우대칭동물의 조상은 스트레스에 대한 대웅조절 반응을 진화시켰다. 전쟁이 끝났을 때를 대비해 몸을 준비시키는항스트레스 화학물질이다. 이런 항스트레스 화학물질 중 하나가 오피오이드였다.
- 학습의 시작은 미약했다. 연합을 처음으로 학습한 것은 초기 좌우대칭동물이었지만 이들은 여전히 대부분을 학습하지 못하고 있었다. 이들은 시간 간격이 몇초 이상 벌어진 사건들을 연합하는 법은 배우지 못했다. 또한 정확한 타이밍을 예측하는 법과 대상을 인식하는 법도 배울수 없었다. 세상의 패턴을 인식할 수도 없었다. 위치나 방향을 파악하는 법도 마찬가지다.
하지만 자신의 회로를 스스로 새롭게 배선하고, 사물 간의 연합을 형성하는 뇌의 능력은 인간만의 초능력이 아니라 5억 5,000만 년 전에 살았던 고대 좌우대칭동물 조상으로부터 물려받은 것이다. 이후에 얻게 된 학습의 성과, 곧 공간지도, 언어, 사물 인식, 음악 등 모든 것을 학습하는 능력은 모두 연합을 형성하는 학습 메커니즘을 토대로 구축되었다. 좌우대칭동물 이후로 이루어진 학습의 진화는 학습 메커니즘 자체를 변화시키지 않으면서 기존 시냅스 학습 메커니즘을 새롭게 적용할 방법을 찾아내는 과정이었다.
학습이 최초 뇌의 핵심 기능은 아니었다. 다만 뇌의 한 가지 특성, 곧 조종 관련 결정을 최적화할 기술일 뿐이었다. 연합, 예측, 학습은 사물의 좋고 나쁨을 변경하기 위해 등장했다. 어떤 면에서 앞으로 이어질 진화 이야기는 뇌의 한 가지 앙증맞은 특성일 뿐이었던 학습이 뇌의 핵심 기능으로 전환되는 과정에 대한 이야기가 될 것이다. 실제로 뇌의 진화에서 나타난 그다음 혁신은 새로운 형태의 훌륭한 학습이었다. 이는 감정가, 정동, 연합학습이라는 토대가 구축되어 있었기에 가능했다.
- 초기 좌우대칭동물에서 도파민은 '근처에 좋은 것이 있다'라는 신호였
다. 원함의 원시적 형태라 할 수 있다. 하지만 척추동물로 전환되는 과정에서 '근처에 좋은것이 있다'라는 신호가 정교하게 다듬어져서 원함의 상태를 촉발할 뿐아니라 정확하게 계산된 시간차학습 신호도 전달하게 됐다.
진화가 도파민이라는 신경전달물질을 재구성해서 시간차학습 신호로 만들었다는 설명은 타당하다. 원래 근처에 보상이 있음을 알리는 신호였던 도파민이 미래의 보상을 예측하는 신호로사용하기에도가장 적합했기 때문이다.
따라서 도파민은 '근처에 좋은 것이 있다'라는 신호에서 '정확히 10초후에 아주 멋진 일이 일어날 확률이 35퍼센트다'라는 신호로 바뀌었다. 최근에감지됐던 먹이에 대해 애매한 평균을 알리는 신호에서, 정교하게 측정하고꼼꼼하게 계산하며 끝없이 요동치는 '예측되는 미래 보상'을 나타내는 신호로 용도가 변경된 것이다.
- 대부분의 냄새는 여러 가지 분자로 구성된다. 당신이 집에 들어와 돼지고기 바비큐 냄새를 맡았을 때 당신의 뇌는 돼지고기 바비큐 분자를 인식한 것이 아니다. 그런 분자는 존재하지 않는다. 당신의 뇌는 후각신경세포를 활성화하는 여러 분자의 특정 조합을 인식한 것이다. 냄새는 활성화된 후각신경세포의 패턴에 해당한다. 냄새 인식은 한마디로 패턴인식일 뿐이다.
선충과 비슷했던 우리 조상의 세상을 인식하는 능력은 개별 신경세포의 감각장치로 제한되어 있었다. 이 동물은 단일 빛 자극 감지 신경세포의 활성화를 통해 빛을 인식하거나 단일 물리적 자극 감지 신경세포의 활성화를 통해 물리적 접촉을 인식했다. 이 능력은 조종하는 데는 유용했지만 바깥세상을 구체적으로 인식하는 데는 너무 제한적이었다. 사실 조종은 최초의 좌우대칭동물이 세상을 그리 꼼꼼하게 인식하지 않아도 먹이를 찾고 포식자를 피할 수 있었다는 점에서 탁월한 기능이었다.
하지만 주변 세상에 관한 정보는 활성화된 신경세포 하나만으로는 얻을 수 없고, 여러 신경세포의 활성화 패턴을 통해서만 얻을 수 있다. 당신은 망막을 두드리는 광자의 패턴을 바탕으로 자동차와 집을 구분하고, 속귀(내이)를 두드리는 음파의 패턴으로 횡설수설하는 사람의 말소리와 맹수의 포효를 구분한다. 또한 코에서 활성화되는 후각신경세포의 패턴으로 장미의 냄새와 닭의 냄새를 구분한다.
- 얼굴을 인식하고 자동차를 운전하고 방사선 사진에서 암세포를 인식하는 인공신경망은 새로운 것을 경험하면서 연속적으로 학습하지 않는다. 이 책을 인쇄하는 시점을 기준으로 보면 오픈AI에서 출시한 유명한 챗봇인 챗GPT조차 수백만 명과 대화하면서 연속적으로 학습하지 않으며 세상에 출시된 순간부터 학습을 중단한다. 이 시스템이 새로운 것을 학습하도록 허락하지 않는 이유는 예전에 학습한 것을 잊어버리거나 틀린 것을 학습할 위험이 있기 때문이다. 그래서 현대의 AI 시스템은 매개변수를 고정하고 시간 속에 동결한다. 이들을 업데이트하려면 사람이 수행성과를 꼼꼼히 감시하면서 모든 작업을 처음부터 새로 훈련시켜야 한다.
- 진화는 원래 특정 사물을 감지하는 새로운 감각신경세포를 만들어 동물을무장시키는 방식으로 일을 했다. 하지만 캄브리아기 약육강식의 군비경쟁을 거치는과정에서 무엇이든 알아볼수있는 범용 메커니즘으로 무장시키는 새로운 방식으로 전환했다. 이런 새로운 패턴인식 능력과 함께 척추동물 감각기관의 복잡성은 폭발적으로 증가했고, 신속하게 오늘날의 형태로 꽃을 피웠다. 화학물질을 감지하기 위해 코가 진화하고, 소리의 진동수를 감지하기 위해 속귀가 진화했으며, 빛을 감지하기 위해 눈이 진화했다. 우리에게 익숙한 감기관과 익숙한 척추동물의 뇌가 공진화한 것이 과연 우연일까? 이들은 서로의 성장과 복잡성 중가를 촉진했다. 뇌의 패턴인식 능력이 점진적으로 개선될 때마다 더 세밀한 감각기관을 통해 얻는 이점이 늘어났다. 세밀한 감각기관이 점진적으로 개선될 때마다 더 정교한 패턴인식의 이점도 늘어났다.
그런 과정을 거쳐 뇌에서 만들어낸 결과물이 척추동물의 겉질이다. 어찌어찌해서 척추동물의 겉질은 지도학습 없이도 패턴을 인식하고 서로 겹치는 패턴을 정확하게 식별하며 패턴을 일반화해서 새로운 경험에 적용한다. 또한 파괴적 망각으로 고통받지 않으면서 연속적으로 학습을 하고 입력에 큰 변동성이 있을 때도 패턴을 인식한다.
패턴인식과 감각기관이 정교해지면서 강화학습 그 자체와 되먹임고리가 형성됐다. 패턴인식과 강화학습이 동시에 진화한 것 역시 우연이 아니다. 뇌가 세상의 사물에 반응해서 임의의 행동을 배우는 능력을 키우면 세상의 사물을 더 많이 인식해서 얻는 이점도 많아진다. 그리고 뇌가 인식하는 고유의 대상과 장소가 많아질수록 뇌가 학습하는 고유의 행동도 많아진다. 따라서 겉질, 바닥핵, 감각기관이 모두 강화학습이라는 동일한 메커니즘에서 등장해 함께 진화한 것이다.
- 강화학습이 작동하려면 호기심이 필요하기 때문에 호기심과 강화학습은 함께 진화했다. 패턴을 인식하고 장소를 기억하고 과거의 보상과 처벌을 바탕으로 행동을 유연하게 변화시키는 능력을 발견하면서 최초의 척추동물에게 새로운 기회가 열렸다. 처음으로 학습이 그 자체로 지극히 가치있는 활동이 된 것이다. 척추동물이 많은 패턴을 인식하고 많은 장소를 기억할수록 생존가능성이높아졌다. 그리고더 많은 일을 시도할수록 자신의 행동과 그에 따르는 결과 사이의 올바른 연관성을 학습할가능성도 높아졌다. 따라서 호기심은 5억년전 지금의 어류와 비슷한 조상의 작은 머릿속에서 처음으로 등장했다.
- 초기 척추동물의 뇌에서 공간지도가 진화하면서 수많은'처음'이 기록됐다. 이것은 수십 억 년 생명의 역사에서 생명체가 자신의 위치를 처음으로 인식한 사건이었다. 이 덕분에 얼마나 많은 이익을 얻었을지 쉽게 예상이 될 것이다. 대부분의 무척추동물은 조종을 통해 주변을 돌아다니며 반사작용을 수행한 반면 초기 척추동물은 절지동물이 잘 숨어 있는 장소, 안전한 곳으로 돌아오는 법, 먹이가 가득한 구석진 장소까지도 기억할 수 있었다. 이는 또한 뇌가 처음으로 자신을 세상과 구분한 사건이었다. 공간지도에서 자신의 위치를 추적하려면 동물은 ' 나를 향해 헤엄치는 뭔가'와 '내가 뮌가를 향해 헤엄치는 것'의 차이를 구분할 수 있어야 했다.
가장 중요한 점은 뇌가 바깥세상을 표상하는 내적 모델을 처음으로 구축했다는 것이다. 이 모델은 처음에는 아마도 돌아다니기 위해 쓰였을 것이다.
이 모델 덕분에 뇌는 공간 속 임의의 장소를 알아볼 수 있었고, 어떤 출발 지점에서도 주어진 표적 장소로 가는 올바른 방향을 계산할 수 있었다. 그런데 이 내적 모델을 구축하면서 뇌 진화의 다음 혁신을 위한 토대가 마련되었다. 장소를 기억하는 비법으로 시작된 기술이 그보다 휠씬 대단한 것으로 발달하게 된다.
- 초기 척추동물의 강화학습이 가능했던 것은 이미 초기 좌우대칭동물에서 진화한 감정가와 연합학습의 메커니즘이 있었기 때문이다. 강화학습은 좋고 나쁨의 단순한 감정가 신호를 바탕으로 부트스트래핑되었다. 척추동물의 뇌는 그보다 앞선 고대 좌우대칭동물의 조종 시스템 위에 구축되었다고 할 수 있다. 조종이 없었다면 무엇을 강화하고 약화할지 판단하는 기준이 될 시행착오의 출발점이 존재하지 않았을 것이다.
조종 능력을 갖춘좌우대칭동물 덕분에 나중에 등장한 척추동물이 시행착오를 통해 학습하는 것이 가능했다. 더 나아가 척추동물의 시행착오는 그에 뒤따라올 휠씬 더 당혹스럽고 기념비적인 혁신을 가능하게 했다. 초기 포유류는 색다른 시행착오 학습법을 알아냈다. 바로 실행이 아닌 상상imagination을 통해 학습하는 것이다.
- 시뮬레이션 능력이 진화하려면 두 가지 조건이 필요한 것으로 추측된다.
첫 번째 조건은 멀리 내다볼 수 있는 시력이다. 먹이까지 가는 경로를 시물레이션하는 재주가 효과를 보려면 주변을 멀리 내다볼 수 있어야 한다. 육지에서는 밤에도 물속에 있을 때보다 100배나 멀리 내다볼 수 있다. 반면에 어류는 시물레이션으로 자신의 동작을 미리 계획하기보다는 뭔가가 자기에게 다가얼 때마다 신속하게 반응하는 쪽을 선택했다(그래서 중간뇌와 뒷뇌는 크고 겉질은 상대적으로 작다).
두 번째 조건은 온혈성이다. 앞으로 살펴볼 몇 가지 이유로 인해 행동 시뮬레이션은 겉질-바닥핵 시스템의 강화학습 메커니즘보다 계산하는 데 천문학적으로 많은 비용과 시간이 든다. 신경세포의 전기신호는 온도에 매우 민감하다. 온도가 낮을 때는 높을 때보다 신경세포가 휠씬 느리게 발화한다. 온혈성의 부작용 덕분에 오히려 포유류의 뇌가 어류나 파충류의 뇌보다 작동 속도가 휠씬 빨라질 수 있었다는 의미다. 이 덕분에 휠씬 복잡한 계산을 수행할 수 있다. 파충류가 육지에서 먼 거리를 내다볼 시력을 갖추고도 시뮬레이션 능력을 키우지 못한 이유가 이것이다. 비포유류 중 행동을 시뮬레이션하고 계획하는 능력의 증거를 보여주는 것은 조류뿐이다. 그리고 오늘날 살아 있는 비포유류 중에 온혈성을 독립적으로 진화시킨 동물 역시 조류밖에 없다.
- 새겉질의 특정 영역이 손상된 환자는 그 영역에 해당하는 기능을 즉각 상실한다. 운동겉이 손상되면 마비가 일어나고, 시각겉질이 손상되면 부분적으로 시각장애가 생긴다 하지만 시간이 지나면 사라졌던 기능이 회복될수 있다. 이는 보통 손상된 새겉질이 회복되어 나타나는 결과가 아니다. 새겉질 영역은 영원히 죽은 상태로 있고 주변의 새겉질 영역들이 손상된 새겉질 영역의 기능을 대신하는 것이다. 이런 사실 역시 새겉질의 영역들이 서로 대체할 수 있음을 암시한다.
- 19세기에 독일의 물리학자이자 의사였던 헤르만 폰 헬름홀츠는 지각의 속성을 설명하는 새로운 이론을 제시했다. 그는 사람이 경험한 것을 지각하는 것이 아니라 뇌가 존재한다고 생각하는 것을 지각한다고 주장했다. 헬릅홀츠는 이 과정을 추론이라고 불렀다. 달리 표현하자면 실제로 보이는 것을 지각하는 것이 아니라 보이는 것을 바탕으로 시뮬레이션한 현실을 지각한다는 것이다.
이 이론으로 지각의 세 가지 특성을 모두 설명할 수 있다. 당신의 뇌가 사물에서 비어 있는 부분을 채워 넣는 이유는 시각이 암시하는 진실을 해독하려 하기 때문이다("저기에 진짜로 둥근 물체가 있는 건가?"). 한 번에 한 가지만 볼 수있는 이유는 뇌가 시뮬레이션할 단 하나의 실재를 반드시 골라야 하기때문이다. 현실에서 토끼이면서 동시에 오리인 동물은 없다. 그리고 한 이미지를 가장 잘 설명하는 것이 개구리임을 한번 알고나면 당신의 뇌는 그 이미지를 볼 때마다 그 현실을 유지하려 한다.
많은 심리학자가 대체로 헬름홀츠의 이론에 동의하게 됐지만 헬름홀츠가 주장한 추론을 통한 지각이 실제로 어떻게 작동하는지 설명하는 사람은 한세기가 지나고 난 다음에 야등장했다.
- 포유류의 상상에서 나타니는 많은 속성이 생성모델에서 에상되는 속성과 일치한다. 사람이 자기가 현재 경험하고 있지 않은 상황을 상상하는 것은 쉬운 일이고, 심지어 자연스럽기까지 하다. 당신은 어제저녁에 먹은 음식을 올리거나 오늘 저녁에 먹을 메뉴를 상상할 수 있다. 진가를 상상할 때는 어떤 일이 일어나는 것일까? 그냥 당신의 새겉질이 생성모드에 들어가 새겉질에서 시물레이션한 현실을 불러내는 것이다.
단 사물을 인식하면서 동시에 뮌가를 상상할 수는 없다. 책 속 문장을 읽으면서 자신이 아침 식사를 하는 모습을 상상할 수는 없다. 상상이라는 과정 자체가 본질적으로 실제 감각 데이터를 경험하는 과정과 상충된다. 사실 사람의 동공을 보면 그 사람이 상상에 빠져 있는지 여부를 짐작할 수 있다. 사람이 뮌가를 상상할 때는 뇌가 실제 시각 데이터의 처리를 멈추면서 동공이 확대된다. 시각장애인과 비슷한 상태가 되는 것이다. 생성모델과 마찬가지로 생성과 인식은 동시에 수행할 수없다.
더 나아가 인식하는 동안에 활성화되는 새겉질신경세포(얼굴이나 집에 반응하는 신경세포)를 기록해보면 같은 것을 그냥 상상만 해도 정확히 동일한 신
경세포들이 활성화된다. 당신이 신체 부위 중 한 곳을 움직이는 상상을 하
면 마치 당신이 실제로 그 신체 부위를 움직이는 것처럼 동일한 영역이 활성화된다. 당신이 어떤 모양을 상상하면 당신이 실제로 그 모양을 보고 있을 때와 동일한 시각겉질 영역이 활성화된다. 이런 현상은 매우 일관되게 일어나기 때문에 신경과학자들은 새겉질의 활성만 기록해도 그 사람이 무슨 상상을 하는지 해독할 수 있다(그리고 과학자들은 사람의 뇌를 기록해서 그 사람의 꿈
을 정확히 해독할 수도 있다.20 이는 꿈과 상상의 생성 과정이 같다는 중거다). 새겉질이 손상되어 특정 감각 데이터에 문제가 생긴 사람은(예를 들어 시야의 왼쪽에 있는 물체를 알아볼 수 없는 경우) 동일한 감각 데이터에 대한 특성을 그냥 상상만 하는 데도 문제가 생긴다(시야 왼쪽에 있는 사물을 상상하기도 어려워한다).
이런 결과 중 어느 것도 당연하지 않다. 상상을 인식과는 별개의 시스템에서 수행할 수도 있었다. 하지만 새겉질에서는 그렇지 않다. 이들은 정확히 동일한 영역에서 수행된다. 이는 생성모델에서 예상할 수 있는 과정과 정확히 일치한다. 지각과 상상은 별개의 시스템이 아니라 동전 하나의 양면인 것이다.
- 현대의 AI 시스템에서 빠진 것이 무엇인지, AI 시스템이 인간 수준의 지능을 갖게 하려면 무엇이 필요한지에 대헤 여러 가지 논란이 이어지고 있다. 빠진 핵심 조각이 바로 언어와 논리라 생각하는 사람도 있다. 하지만 메타의 AI 책임자인 얀 르쿤 같은 사람들은 다른 뭔가, 좀 더 원초적이고 월씬 오래전에 진화한 뭔가가 있다고 믿는다. 얀 르쿤의 말을 들어보자.
" 우리 인간은 지능의 기질로서 언어와 기호의 중요성을 지나치게 강조합니다. 영장류, 개, 고양이, 까마귀, 앵무새, 문어 둥 많은 동물은 인간과 비슷한 언어가 없지만 최고의 AI 시스템을 뛰어넘는 지능적 행동을 보여줍니다. 그들에게는 강력한 세계 모델을 학습할 능력이 있습니다. 자신의 행동이 낳을 결과를 예속하고 목적 달성에 필요한 행동을 탐색하고 계획할 수 있게 해주는 모델이죠 세계 모델을 학습하는 능력이야말로 오늘날의 AI 시스템에서 빠진부분입니다.
포유류의 새겉질(어찌면 조류, 심지어 문어의 비슷한 구조)에서 구현되는 시물레이션이 바로 그'세계 모델'이다. 새겉질이 그 정도로 강력한 이유는 내적
시뮬레이션을 감각 중거와 맞춰불 쁜 아니라(헬름홀츠의 추콘윤 풍한 지각), 중요하게는 그 시물레이션을 독립적으로 탐색할 수 있기 때문이다. 바깥세상에 대한 내적 모델이 풍부하다면, 머릿속에서 그 세상을 탐색해 자기가 해보지 않은 행동의 결과를 예측할 수 있다. 그렇다. 새겉질은 눈을 뜨고 자기 앞에 있는 의자를 인식하게도 해주지만, 눈을 감고도 머릿속으로 그 의자를 보게 해준다. 머릿속에서 의자를 돌려도 보고 고처도 보고 색깔도 바꿔 보고 재료도 바뀌 볼 수 있다. 새겉질에서 일어나는 시물레이션은 실제 주변 세상과 분리되었을 때, 곧 세상에 존재하지 않는 것을 상상할 때 진가를 발휘한다.
이것이 새걸질이 초기 포유류에게 안겨준 선물이었다. 인간 지능의 진화
에서 세 번째 혁신은 미래의 가능성을 제시하고 과거의 사건을 떠올릴 수 있는 상상력이었다. 이로부터 지능의 익숙한 속성이 대거 등장했다. 그중에는 AI 시스템을 통해 재현되거나 원래 속성을 능가한 것도 있고, 아직 우리가 이해할 수 없는 것도 있다. 하지만 이 모든 것이 최초 포유류의 작은 뇌에서 진화했다는 것은 분명하다.
- 모델 기반 강화학습은 두 가지 이유로 구현하기 어럽다고 밝혀졌다.
첫째, 세상을 모델로 구축하기가 어렵다. 세상은 복잡하고 세상에 대한 정보는 잡음이 많이 섞여 있으며 불완전하기 때문이다. 이것이 르쿤의 말처럼 새겉질은 만들어내지만 AI 시스템에서는 빠진 세계 모델이다. 세계 모델이 없으면 행동을 시뮬레이션하고 그 결과를 예측할 수 없다.
모델 기반 강화학습을 구현하기 어려운 두 번째 이유는 무엇을 시물레이션할지 선택하기가 어렵기 때문이다. AI의 장애물로 시간적 신뢰 할당 문제를 지적한 논문에서 마빈 민스키는 '검색 문제'라는 것도 확인했다. 대부분의 실제 상황에서 가능한 모든 선택지를 검색하기란 불가능하다.
체스를 생각해보자. 현실세계와 비교하면 체스의 세계 모델을 구축하기는 상대적으로 쉽다. 규칙 자체가 결정론적이고 모든 말과 모든 움직임, 체스판의 모든 칸에 대해 알고 있기 때문이다. 하지만 이런 체스조차 앞으로 둘 수 있는모든 수를 검색하기는 불가능하다. 체스에서 가지치기해서 나오는 모든
경우의수는우주에 있는 모든 원자 수보다도 많다. 따라서 바깥세상에 대한
내적 모델을 구축하는 것도 문제지만, 그것을 어떻게 검색할 것인지 알아내
는것도 문제다.
하지만 초기 포유류의 뇌는 어떻게든 이검색 문제를 해결했다.
- 바둑은 가장 복잡한 보드게임 중 하나지만, 현실세계에서 돌아다니면서 미래를 시물레이션하는 것에 비하면 휠씬 단순하다. 첫째, 바둑에서 일어나는 행동은 불연속적이다. 따라서 바둑판에 돌이 놓였을 때 다음에 둘 수 있는 경우의 수는 200가지 정도밖에 안 된다. 반면 실제 세계에서 일어나는 행동은 연속적이어서 선택할 수 있는 사물과 검색 경로의 수가 무한하다.' 둘째, 바둑이라는 세게에서는 정보가 결정론적이고 완전하다. 반면 현실세계에서는 정보에 잡음이 많이 섞이고 불완전하다. 셋째, 바둑에서 얻는 보상은 이기느냐 지느냐로 단순하다. 하지만 현실세계의 동물에게는 시간에 따라 변화하고 여러 가지 요구가 서로 경쟁한다. 따라서 알파제로가 크게 도약하긴 했지만 AI 시스템이 연속적인 행동 공간, 세상에 대한 불완전한 정보, 복잡한 보상이라는 환경 안에서 계획을 수립하는 경지에 도달하려면 갈 길이 멀다.
무엇보다 계획을 수립할 때 포유류의 뇌가 AI시스템보다 결정적으로 유리한 부분은 연속적 행동 공간, 불완전한 정보, 복잡한 보상 안에서 계획을 수립하는 능력이 아니다. 상황에 따라 계획에 대한 접근방식을 유연하게 바꾸는 능력이다. 알파제로는 보드게임에서 수를 둘 때마다 동일한 검색 전략을 사용한다. 하지만 현실세계에서는 상황에 따라 다른 전략을 써야 한다. 포유류 뇌의 시뮬레이션 능력이 뛰어난 이유가 아직 발견되지 않은 특별한 검색 알고리즘 덕분일 가능성은 낮다. 그보다는 서로 다른 전략을 고를 수 있는 뇌의 유연성 덕분일 가능성이 높다. 우리는 서로 다른 선택지를 시물레이션하기도 하지만, 시뮬레이션 같은 것은 아예 건너뛰고 그냥 본능적으로 행동하기도 한다(어떤 식으로든 뇌는 각각의 행동을 언제 해야 할지 똑똑하게 판단할 수 있다). 우리는 잠시 멈추고 미래의 가능성을 고려하기도 하지만, 잠시 멈추고 과거의 사건이나 과거에 한 선택의 대안들을 시뮬레이션하기도 한다(어떤 식으로든 뇌는 각각의 시물레이션을 언제 해야 한지 관단할 수 있다). 우리는 계획을 세세하게 상상하며 구체적인 하위 과제까지 모두 시뮬레이션하기도 하지만, 계획의 큰 틈만 구상하기도 한다(어떤 식으로든 뇌는 시물레이션의 세분화 수준을 적절하게 선택할 수 있다). 우리 뇌는 어떻게 이런 일을 해내는 것일까?
- 초기 포유류에게는 내부에서 만든 세계 모델을 대리로 탐험하고 상상한 결과를 바탕으로 선택하며 일단 선택한 후에는 상상한 계획을 고수할 수 있는 능력이 있었다. 이들은 언제 미래를 시뮬레이션하고 언제 습관을 이용할지 유연하게 결정할 수 있었고 무엇을 시뮬레이션할지도 똑똑하게 선택해서 검색 문제를 극복할수 있었다. 이들은 목표가 있는 최초의 조상이었다.
- 운동겉질의 감각운동 계획수립 능력 덕분에 초기 포유류는 정교한 움직임을 학습하고 실행할수 있었다. 포유류와 파충류의 운동능력을 비교해보면, 포유류의 미세운동능력이 탁월하다는 사실이 분명하게 드러난다. 생쥐는 씨을 집어 들고 솜씨 좋게 까먹는다. 생쥐, 다람쥐, 고양이는 놀라울 정도로 나무를 잘 타며 떨어지지 않도록 아주 수월하게 정확한 위치에 발을 놓는다. 다람쥐와 고양이는 발판에서 발판으로 놀라울 정도로 정확하고 정교한 점프를 계획하고 실행한다. 반려동물로 도마뱀이나 거북이를 키워본 사람이면 파충류 대부분은 이런 동작을 하기 어럼다는 것을 알 것이다. 사실 장애물위로 뛰어가는 도마뱀들을 조사한 연구를 보면 이들의 동작이 놀라울 정도로 어설프다는 것을 알 수 있다. 도마뱀은 장애물을 예상하지도, 발판을 밟기 위해 앞발 위치를 수정하며 움직이지도 못한다. 미리 운동 계획을 수립할 능력이 없기 때문에 나무 위에 사는 파충류는 거의 없고, 나무 위에 산다고 해도 움직이는 속도가 당연히 느리다. 반면 나무 위에 사는 포유류는 빠르고 능숙하게 나뭇가지에서 달리고 뜀박질을 한다.
- 1억 년 전 우리 포유류의 조상은 생존을 위해 상상극장을 무기화했다. 이들은 대리 시행착오, 반사실적 학습, 일화기억 등을 통해 공룡을 따돌리는 계획을 수립했다. 그리고 현대의 고양이처럼 생긴 우리의 포유류 조상은 나뭇가지를 보면서 발을 어디에 디딜지 계획할 수 있었다. 이런 능력들이 함께한 덕분에 고대의 포유류는 자신의 척추동물 조상보다 더 유연하게 행동하고 신속하게 학습하며 영리하게 운동 기능을 수행했다. 당시 대부분의 척추동물은 현대의 도마뱀, 어류와 비슷하게 빨리 움직이고, 패턴을 기억하고, 시간의 흐름을 추적하고, 모델 없는 강화학습을 통해 지능적으로 학습할 수 있었다. 하지만 이들의 운동은 계획 없이 이루어졌다.
그래서 생각 그 자체는 프로메테우스가 신성한 작업장에서 찰흙을 빚어 만들어낸 창조물에서 탄생한 것이 아니라, 1억년에 걸친 공룡의 포식 활동과 멸종을 피하려던 우리조상들의 필사적인 노력과 쥐라기 지구의 작은 땅굴과 울퉁불퉁한 나무에서 탄생했다.
이것이 우리의 새겉질과 세상에 대한 내적 시뮬레이션이 세상에 나오게 된 진짜 이야기다. 뒤에서 보겠지만 이 어렵게 얻은 능력을 바탕으로 결국 다음 혁신이 등장하게 된다.
다음 혁신은 어떤 면에서 보면 현대의 AI 시스템에 역설계해 입력하기 어려운 것이다. 이 혁신은 우리가 보통 '지능'과 연관지어 생각하지 않지만, 사실 우리 뇌의 가장 눈부신 업적 중하나다.
- 초기 영장류는 나무 꼭대기에서 직접 과일을 따 먹는 독특한 식생활을 한 것으로 보인다. 이들은 과일을 주로 먹는 동물이었다. 과일이 익으면 땅바닥으로 떨어지기 전에 바로 따 먹었다. 이런 방식 덕분에 영장류는 다른 종과 치열하게 경쟁하지 않고도 먹이에 쉽게 접근할 수 있었다. 초기 영장류가 이런 독특한 생태적 지위를 통해 얻은 두 가지 선물이 특이할 정도로 큰 뇌와 복잡한 사회집단으로 이어지는 문을 열어줬는지도 모른다. 첫째, 과일에 쉽게 접근하면서 초기 영장류는 풍부한 열량을 얻었고, 그 덕에 더 큰 뇌에 에너지를 소비할 수 있는 진화적 선택권이 생겼다. 둘째, 초기 영장류에게 시간적 여유가 많이 생겼다. 어쩌면 이것이 더 중요한 부분이다.
동물의 세계에서 자유시간은 지극히 드물다. 대부분의 동물은 하루하루 매순간을 먹기, 쉬기, 짝짓기로 채워야 했다.46 하지만 초기 영장류는 먹이를 구하는 데 다른 동물들만큼 많은 시간을 들일 필요가 없었기 때문에 사회적 위계에서 더 높은 자리를 차지하고 싶을 때 구사할 수 있는 새로운 진화적 선택지가 생겼다. 더 강한 근육을 진화시켜 싸움을 통해 꼭대기 자리를 차지하는 대신 더 큰 뇌를 진화시켜 정치공작을 통해 꼭대기에 이르는 방법을 모색한 것이다.
그래서 영장류는 자신의 남는 시간에 정치공작을 채워 넣었던 것 같다. 오늘날의 영장류는 하루중 최대 20퍼센트를 사교 활동에 투자한다.
- 요즘에는 AI시스템에게 사람의 행동을 담은 동영상을 보여주고 다음에 어떤 행동을 할지 예측하게 만들수 있다. 우리는 AI시스템에게사람이 어떤 행동을 하는 동영상을 수도 없이보여주며 무슨 행동을하고있는 것인지 정답을 알려준다("이건악수야""이건 점프야"). 광고 플랫폼에서는 사람의 행동을 통해 다음에 어떤 물건을 구입할지 예측할 수 있다. 얼굴에 나타난 감정을 파악하는 AI 있다(감정별로 분류한 얼굴 사진을 수없이보여주며 시스템을 훈련시켰다). 하지만 이런 것 모두 사람과 다른 영장류의 뇌에서 보이는 복잡한 마음이론과는 거리가 한참 멀다. AI 시스템과 로봇이 우리와 함께 살면서 우리가 하는 말로 우리의 의도를 추론하고, 우리가 말하기 전에 우리에게 필요하고 우리가 원하는 것이 무엇인지 예측하며, 온갖 규칙과 에티켓이 숨겨져 있는 인간 집단에서 사회적 관계를 탐색할 수 있기를 바란다면, 다시 말해 사람과 비슷한 AI 시스템을 원한다면 그 시스템은 반드시 마음이론을 갖춰야 한다.
초지능 AI 시스템이 함께하는 성공적인 미래를 그리기 위한 필수 요소가 마음이론인지도 모른다. 초지능 AI 시스템이 우리 말을 듣고 실제로 의미하는 내용을 추론할 수 없다면, AI가 우리의 요청을 잘못 해석해서 재앙을 일으키는 암울한 미래가 펼쳐질 것이다.
- 마음이론은 초기 영장류에서 정치공작을 하기 위해 진화했다. 하지만 이 능력이 용도 변경되어 모방학습에도 사용됐다. 다른 개체의 의도를 추론하는 능력 덕분에 초기 영장류는 관련 없는 행동을 걸러내고 관련 있는 행동(그 사람이 하려고 의도한 행동)에만 집중할 수 있었다. 그리고 마음이론 덕분에 어린 개체는 오랜 시간 학습에 집중할 수 있었다. 어쩌면 마음이론 덕분에 초기 영장류는 초보자가 이해하는 것과 이해하지 못하는 것을 추론함으로씨 능동적으로 가르칠 수 있었는지도 모른다. 우리의 포유류 조상도 이미 알고 있는 기술 중 어떤 것은 다른 개체를 관찰해서 골라 쓸 수는 있었지만, 마음이론으로 무장한 초기 영장류야말로 관찰을 통해 진정으로 새로운 기술을 습득할 수 있었다. 그 결과 새로운 수준의 전달성이 생겨났다. 그전에는 똑똑한 개체가 기술을 발건해도 그 개체가 죽으면 기술도 합께 사라졌다. 이제는 이런 전달성 덕분에 기술이 무리 전체로 전파되고 세대를 거처서도 무한히 전달될 수 있었다. 사람은 망치를 쓰지만 쥐는 망치를 쓰지 않는 이유가 바로 이것이다.
- 생태적 뇌 가설에서는 초기 영장류의 급속한 뇌 확장을 이끈 것이 과일 식단이었다고 주장한다. 2017년에 뉴욕대학교의 알렉스 드케이시언은 영장류 140여 종의 식생활과 사회생활을 조사한 연구 결과를 발표했다. 어떤 영장류는 주로 과일을 먹는다. 어떤 영장류는 주로 이파리를 먹는 엽식동물로 살아간다. 어떤 영장류는 아주 작은 사회집단을 이루고 살고 어떤 영장류는 대규모 집단을 이루고 살아간다. 놀랍게도 드케이시언은 영장류 사회집단의 크기보다는 주로 과일을 먹는지 여부가 뇌의 상대적 크기에서 나타나는 다양성을 더욱 잘 설명한다는 점을 발견했다.
- 미래의 필요를 예측하는 능력은 우리 영장류 조상에게 수많은 이점을 제공했을 것이다. 그들은 먹이 채집 경로를 한참 전에 계획한 덕분에 새로 익은 과일들을 가장 먼저 획득할 수 있었다. 시간적으로도 한참 멀고 아직 존재하지도 않는 추상적인 목표에 대해 오늘 결정할 수 있는 우리의 능력은 나무에서 살던 영장류로부터 물려받은 것이다. 아마도 처음에는 이 능력이 과일을 가장 먼저 따기 위해 사용되었겠지만, 오늘날 인류에서는 엄청나게 장기적인 계획을 세울 수 있는 능력으로 발전하는 토대를 마련해주면서 휠씬 더 큰 목적을 이루기 위해 사용된다.
- 초기 영장류에서 등장한 것으로 보이는 능력은 크게 세 가지다.
*마음이론: 상대방의 의도와 지식을 추론하는 능력
*모방학습: 관찰을 통해 새로운 기술을 습득하는 능력
*미래의 필요 예측: 지금 당장은 필요 없어도 미래의 필요를 충족시키기 위해지금 행동을 취할 수 있는 능력
이는 사실 별개의 능력들이 아니라 자신의 마음에 대한 생성모델 구성이라는 한 가지 새로운 혁신에서 등장한 창발적 속성인지도 모른다. 이것을'정신화mentalizing'라 부를 수 있다. 이런 능력들이 초기 영장류에서 처음 진화한 공통 신경구조(gPFC 등)에서 등장하며, 어린아이들이 비슷한 발달시기에 이런 능력들을 습득한다는 사실에서도 확인할 수 있다. 그리고 이런 능력 중 하나가 손상되면 나머지 여러 능력도 손상된다는 사실에서도 확인할 수 있다.
- 자신의 상상 속에서 보는 것을 공유함으로써 공통 신화가 형성되고, 완전히 상상으로 만들어진 허구의 존재와 이야기를 전달할 수 있다. 단지 이 신화가 우리 뇌와 뇌 사이를 뛰어넘을 수 있다는 이유만으로 말이다. 우리는 신화가 판타지 소설이나 아동 서적에나 어울린다고 생각하지만 신화야말로 현대 인류 문명의 토대다. 돈, 신, 협동, 국가 등은 모두 인간 뇌의 집단적 상상에만 존재하는 개념들이다. 이런 개념의 초기 이론 중 하나를 철학자 존 설이 제기하고, 유발 하라리가 저서 사피엔스를 통해 대중화했다. 두 사람은 인간이 독특한 이유가 "수없이 많은 낯선 사람과 지극히 유연한 방식으로 협동하기 때문"이라고 주장했다. 설과 하라리는 우리에게'공통의 신화'가 있다고 본 것이다. 하라리의 말을 빌려보자.
한 번도 만나본 적 없는 두 가톨릭 신자라도 함께 십자군전쟁에 참가하거나
병원 설립을 위한 기금을 모을 수 있는 이유는 두사람 모두 신을 믿기 때문이
다. (...) 한 번도 만나본 적 없는 세르비아인 두 명이 자신의 목숨을 걸고 서로의 목숨을 구하러 나설 수 있는 것도 두 사람 모두 세르비아 민족의 존재를 믿기 때문이다. (...) 한 번도 만나본 적이 없는 변호사 두 명이 힘을 합쳐 완전히 낯선 사람을 변호할 수 있는 이유도 두 사람 모두 법, 정의, 인권 그리고 변호사 비용을 믿기 때문이다.
- 인간이 독보적인 진짜 이유는 세대를 거치며 공통의 시뮬레이션 결과(아이디어,지식,개념, 생각)를 축적한다는 점이다. 우리는 집단지성이 있는 유인원이다. 우리는내적 시뮬레이션을 동기화해서 인간의 문화를 일종의 메타생명체로 바꾼다. 메타 생명체의 의식은 세대를 거치며 수백만 개의 뇌를 통해 흐르는 지속적인 아이디어와 생각안에서 실체화된다. 이 집단지성의 토대가 바로 언어다.
언어의 등장은 인류의 역사에서 변곡점에 해당한다. 아이디어의 진화라는 새롭고 독특한 진화가 시작되는 시간적 경계선인 것이다. 언어의 등장은 자기복제하는 DNA의 등장만큼이나 기념비적인 사건이었다. 언어는 인간의 뇌를 덧없이 찾아왔다 사라지는 기관에서 축적된 발명을 저장하는 영구적 매체로 바꿔놓았다.
이 발명에는 새로운 기술, 새로운 법률, 새로운 사회적 에티켓, 새로운 사고방식, 새로운 조정 시스템, 지도자를 뽑는 새로운 방법, 폭력과 용서에 대한 새로운 역치, 새로운 가치관, 새로운 공동의 허구 둥이 포함된다. 언어를 구사할 수 있게 하는 신경학적 메커니즘은 수학을 하고 컴퓨터를 사용하고 자본주의의 장점에 대해 이야기하기 휠씬 전에 등장했다. 하지만 일단 인간이 언어로 무장하는 순간 이런 발전을 이루는 것은 시간 문제였다. 실제로 지난 수천 년 동안 이뤄진 인류의 믿기 어려운 발전은 더 나은 유전자 덕분이 아니라 뛰어나고 세련된 아이디어의 축적 덕분이었다.
- 결국 새의 뇌에 비행 기관이 없는 것처럼 인간의 뇌에도 언어 기관이 따로 존재하지 않는다는 것이 핵심이다. 언어 능력이 뇌의 어느 부분에 있냐고 묻는 것은 야구 경기력이나 기타 연주력이 뇌의 어느 부분에 있냐고 묻는것만큼이나 어리석다. 이런 복잡한 기술은 특정 영역에 국소화되어 있지 않다.
이런 기술은 여러 영역들 사이의 복잡한 상호작용을 통해 만들어진다. 이 기술을 사용할 수 있게 하는 것은 특정 뇌 부위가 아니라 복잡한 뇌 영역 네트워크에서 그 기술을 학습하도록 강제하는 교육과정이다.
당신의 뇌와 침팬지의 뇌가 사실상 동일한데도 오직 인간만 언어를 배율 수 있는 이유가 바로 이 때문이다. 인간의 뇌에서 고유한 것은 새곁질이 아니다. 편도체와 뇌줄기처럼 오래된 구조 깊숙한 곳에 습겨진 미세한 차이, 곧 우리가 옹알이를 하고 아이와 부모가 서로 번갈아 앞뒤로 바라보고 질문을 던지게 만드는 본능이 고유한 것이다.
유인원이 기초적인 언어를 배울 수 있는 이유도 이 때문이다. 유인원의 새겉질은 이렇게 학습하는 능력이 뛰어나다. 다만 유인원이 언어 능력을 정교하게 다듬는 데 어려움을 겪는 이유는 그냥 그것을 학습하는 데 필요한 본능이 결여되어 있기 때문이다. 침팬지를 공동관심으로 끌어들이기는 쉽지 않다. 차례로 번갈아 보게 만들기도 어럽다. 침팬지는 자신의 생각을 공유하거나 질문하고 싶어 하는 본능도 없다. 뛰어내리려는 본능이 없는 새가 하늘을 나는 법을 결코 배울 수 없듯이 이런 본능이 없으면 언어는 당을 수 없는 영역으로 남을 수밖에 없다.
- 2023년 3월에 오픈AI는 새로 업그레이드한 GPT-4를 발표했다. GPT-4는 PT-3와 대체로 동일한 방식으로 작동한다. 이 모델 역시 오직 앞에 나온 단어들을 바탕으로 다음 단어를 예측한다. 하지만 GPT-3와 달리 휠씬 많은 데이터를 바탕으로 훈련한 휠씬 큰 모형이다.
놀랍게도 내가 이 장에서 GPT-3에게 상식과 물리적 직관이 결여되어 음을 보여주기 위해 설계한 각 질문에 대해 GPT-4는 문제없이 대답했다.
GPT-4는 지하실에서 하늘 쪽을 바라보면 하늘이 아니라 천장이 보인다는 것을 알았다. 누군가 머리에서 30미터 위로 야구공을 던지면 잡을 수 없으리라는 것도 알았다. 심지어 샐리-앤 테스트 같은 마음이론 질문에도 답했다.
GPT-4는 어떻게 이것이 가능할까? 오픈AI가 내적 세계 모델이나 다른 람의 마음을 모델화하는 능력을 추가한 것은 아니다. 대신 GPT-3가 상식이나 추론 질문에서 자주 실수하는 것에 반응해 오픈AI는 특별히 상식과 추론 질문에 대해 GPT-4를 훈련시켰다. 오픈시I는 '인간 피드백을 통한 강화학습reinforcement learning from human feedback,RHF'이라는 기법을 사용했다. 이 기법은 사람이 나서서 GPT-4가 오답을 말하면 벌을 주고 정답을 말하면 보상을 주는 방식이다. 심지어 오픈AI는 GPT-4의수행력을 개선하기 위해 어떤 질문에 특정 방식으로 대답하도록 압박하기도 했다. 예를들어 GPT-4가 상식적 질문에 대한 답을 생각할 때는 각 단계를 글로 적게 훈련시켰다. 이런기
법을'사고 연쇄 프롬프팅'이라고 한다.
- GPT-4에게 단순히 답을 예측하는 데서 그치지 않고 정답을 추론하는 과정에서 다음 단계를 예측하게 훈련시켰더니, 실제로는 생각이 없는데도 생각이라는 창발적 속성을 보이기 시작했다. 세상의 시뮬레이션을 만들어 생각하는 인간의 방식과는 다르지만 말이다.
GPT-4가 단순한 질문에 정답을 맞추기는 했지만, 상식이나 마음이론에 관한 질문에 오답을 내놓는 사례는 아직도 많다. GPT-4에 세계 모델이 결여되어 있다는 사실은 더 복잡한 질문으로 심층 조사를 하면 확인할 수 있다. 하지만 이런 사례를 찾아내기가 점점 어려워지고 있다. 어떤 면에서 보면 이는 두더지 잡기 게임이 됐다. 회의론자들이 상식적 질문에 오답을 말하는 LLM의 사례를 발표할 때마다 오픈AI 같은 회사들은 이런 사례를 다음에 업그레이드할 때 훈련 데이터로 사용해서 그런 질문에 정답을 말하게 만든다.
이런 모델의 거대한 크기와 훈련에 사용된 천문학적인 양의 데이터 때문에 어떤 면에서는 LLM이 생각하는 방식과 사람이 생각하는 방식의 차이를 파악하기가 점점 어려워질 수도 있다. 하지만 계산기는 세상 그 어떤 사람보다도 산수를 잘하지만 사람처럼 수학을 이해하는 것은 아니다. 마찬가지로 LLM이 상식적 질문과 마음이론 질문에 정답을 말한다고 해서 사람과 동일한 방식으로 추론한디는 의미는 아니다.



















'인문' 카테고리의 다른 글
| 미니멀리즘적 쾌락주의 (0) | 2025.12.02 |
|---|---|
| 적당히 잊으며 살아간다 (1) | 2025.11.25 |
| 나이든다는 것의 의미 (0) | 2025.11.03 |
| 넥스트 씽킹 (0) | 2025.11.03 |
| 천재들의 도시 피렌체 (1) | 2025.10.29 |



