딥러닝 레볼루션

IT 2020. 6. 12. 13:01

- 알파고 제로는 인간의 전략을 배제했지만 그럼에도 그 프로그램이 바둑을 두기 위해 이용할 수 있는 바둑 지식은 수작업으로 입력된 상 태였다. 그렇다면 알파고 제로는 바둑에 대한 지식이 없어도 여전히 향상될 수 있을까? 이 의문에 대한 답을 찾기 위해 도출한 것이 알파 제로(AlphaZero)였다. 코카콜라 제로(Coca-Cola Zero)가 코카콜라에서 모든 칼로리를 제거한 것이듯 알파제로는 알파고 제로에서 바둑에 관한 특정 지식 모두를 제거한 것이었다. 결론부터 말하자면 알파제로는 알파고 제로보다 더욱 빠른 속도로 학습할 수 있었고, 알파고 제 로를 뛰어넘는 수준에 이르렀다. 또한 알파제로는 학습 매개변수를 단 하나도 변경하지 않은 상태에서 슈퍼맨 수준으로 체스를 배워 ‘적을수록 더 좋다(less is more)'는 요점을 보다 극적으로 보여줬다. 알파 제로는 인간이 전에 한 번도 시도한 적 없는 외계적 체스 수까지 선보이며 슈퍼맨 수준의 기존 체스 프로그램인 스톡피시(Stockfish)에게 단 한 차례도 승리를 허용하지 않았다. 한 체스 대국에서는 비숍 하나를 희생하는 대담한 수(때로 유리한 위치를 점유하기 위해 이용되는 수)를 둔 후 퀸까지 내줬다. 이런 행보는 치명적인 실수로 보였지만, 이후 적잖은 수가 진행된 후 체스 프로들도, 스톡피시도 예상하지 못했던 외통 수 장군이 나와 모두를 놀라게 했다. 외계인이 도착한 셈이었고, 이제 지구는 더 이상 전과 같지 않을 터였다.
- 컴퓨터 비전은 픽셀이 아닌 특징에 초점을 맞춤으로써 진보하기 시작했다. 예를 들어 조류 사육자나 관찰자들은 몇 가지 미묘한 무늬만 다른 경우가 많은 각각의 종을 구별할 줄 아는 전문가가 되어야 한다. 조류 구분법을 알려주는 실용적이고 대중적인 서적은 대개 각 각의 새에 대해 한 장의 사진을 소개하면서 그들 사이의 미묘한 차이 를 보여주는 스케치를 곁들인다(<그림 2.3) 특정 종에만 고유한 특징 이 있으면 수월한 경우에 해당하지만, 대개 많은 종에서 동일한 특징 들이 발견되기 때문에 새의 식별을 가능하게 하는 것은 날개의 횡대 나 눈의 줄무늬, 깃털의 반점 등과 같은 부위별 표식 몇 가지의 독특 한 조합이다. 그러한 부위별 표식이 밀접히 관련된 종들 사이에 공유 되는 경우에는 다시 울음소리나 노랫소리로 서로를 구별한다. 관련된 종들 사이의 특징에 주의를 집중시킬 때에는 사진보다 그림이나 스케치를 이용하는 것이 효과가 높다. 사진은 관련성이 낮은 수많은 특징까지 가득 포함하기 때문이다. 특징에 기초한 이 접근 방식의 문제점은 수없이 많은 세상의 서로 다른 객체에 대한 특징 감지기를 개발하는 일이 매우 노동 집약적이 라는 것뿐만 아니라 최상의 특징 감지기를 갖춘다 하더라도 객체의 일부가 가려지는 경우 그 이미지에서 모호성이 발생한다는 데 있다. 결국 여러 객체가 뒤섞여 모여 있는 경우 컴퓨터가 각각을 인지하는 일은 벅찬 작업이 될 수밖에 없는 것이다. 1960년대 컴퓨터 비전이 인간 수준의 수행력을 갖추는 데 이후 50 년의 세월에 걸쳐 컴퓨터 성능이 100만 배는 증가해야 될 것으로 짐 작한 사람은 거의 없었다. 컴퓨터 비전 프로그램을 작성하는 일이 수월할 것이라는 잘못된 직관은 우리 인간이 보고 듣고 움직이는 것과 같은 활동을 수월하게 행한다는 사실에 기초했다. 하지만 그런 활동 이 제대로 자리 잡히는 데 수백만 년이라는 진화의 세월이 걸리지 않 았던가. 원통하게도 초기의 인공지능 개척자들은 곧 컴퓨터 비전 문 제를 해결하는 일이 극도로 어렵다는 사실을 인정하지 않을 수 없었 다. 그에 반해 컴퓨터가 로직에서는 인간보다 훨씬 뛰어난 것으로 밝 혀졌기 때문에 그들은 수학적 정리를 증명하도록 컴퓨터를 프로그래 밍하는 일은 훨씬 쉽다는 것을 깨달았다. 수학적 정리의 증명은 최고 수준의 지능을 요하는 것으로 생각되는 과정이다. 논리적으로 생각하는 능력은 진화에서도 늦은 단계의 발달에 속하며, 심지어 인간의 경우에도 정확한 결론에 이르려면 일련의 논리적 명제를 체계적으로 따르도록 훈련을 받아야 하는 무엇이다. 반면에 우리가 생존을 위해 풀어야 할 대부분의 문제는 대개의 경우 이전 경험에 기초한 일반화만으로도 잘 해결할 수 있다.
- 1957년 소련이 스푸트니크 위성을 쏘아올렸을 때 미국의 반응과 흡사하게 2017년 알파고 와 대국을 펼친 중국의 바둑기사 커제의 패배는 베이징에서 2030년까지 전 세계에서 지배적 위치를 구축한다는 목표 아래 야심찬 프로젝트와 스타트업 그리고 학문적 연구 등을 지원하는 수십 억 달러 규 모의 새로운 인공지능 연구 계획이 시작되는 계기가 되었다. 방대 한 의학적, 개인적 데이터를 보유하고 있으며 서방 민주국가들에 비 해 사생활 침해에 대한 우려가 상대적으로 적은 중국이기에 개인정 보를 사유권으로 간주하는 국가들을 뛰어넘어 앞으로 도약하는 일이 충분히 가능하다. 중국은 또한 데이터 수집을 위한 최적의 재배 및 제조 시스템의 구축도 목표로 삼고 있다. 가장 많은 데이터를 보유하는 쪽이 승자가 된다. 중국은 그 점을 간파하고 판을 짜고 있다. 더욱 불길한 것은 중국이 '인공지능 기술을 유도미사일에 접목하 고, 폐쇄회로 카메라에 적용해 사람을 추적하는 데 이용하며, 인터넷 감시를 넘어 범죄 예측에까지 활용하기를 원한다는 점이다. 한편 미국의 정치 지도자들은 과학 기술 분야의 재정 삭감을 계획하고 있다. 1960년대 미국은 우주 개발에 1천 조 달러의 재정을 투입한 바 있다(물가 상승률을 감안해 조정한 금액이다). 덕분에 위성 산업이 발전했고 미국은 초소형전자공학과 재료공학 분야에서 선두로 나서며 과 학기술이 곧 국가의 힘이라는 정치적 선언까지 하지 않았던가. 그때 의 투자로 인한 성과는 오늘날까지 여전히 이어져오고 있다. 초소형 전자공학과 첨단소재 분야는 미국이 아직도 경쟁력을 유지하고 있는 몇몇 산업 분야에 속하기 때문이다. 따라서 인공지능 개발에 대한 중 국의 막대한 투자는 21세기를 지배하는 몇몇 핵심 산업 분야에서 선두를 차지하게 만들기에 충분하다. 바로 이 점이 우리에게 경종을 울리고 있다.
- 생물학자였던 스튜어트 카우프만(Stuart Kauffman)은 이른바 '전사 인자'라고 하는 단백질이 특정 유전자에 결합해 활성화 또는 비활성 화에 관여하는 유전자 네트워크에 흥미를 느끼게 되었다. 그의 가설 에 의해 구축된 모델은 자가 조직적이며 시간의 척도는 훨씬 느리지 만 어떤 측면에서는 뉴럴 네트워크와 흡사한 이진법 단위의 네트워크에 기초한다. 1980년대 후반 크리스토퍼 랭튼(Christopher Langton) 이 '인공 생명'이라는 용어를 처음 사용한 이래' 살아 있는 세포의 복 잡성과 복잡한 행동이 유발되는 원리를 이해하려는 시도가 봇물처럼 터져나왔다. 세포 내 분자 메커니즘의 고도로 진화된 복잡성에 대한 실마리를 찾고자 지금까지 이뤄낸 세포생물학과 분자유전학 분야의 발전에도 불구하고 생명의 신비는 여전히 우리 인간의 이해 범위를 벗어나고 있다.
- 알고리즘은 우리가 사는 세상과 비교해볼 수 있는 복잡한 세상을 만들어낼 새로운 기회를 제공한다. 실제로 20세기에 발견된 알고리즘으로 인해 우리는 복잡성의 특성을 새롭게 조명하게 된 바 있다. 1980년대의 뉴럴 네트워크 혁명 또한 그와 유사한 성격의 시도들이 주도한 것이다. 뇌의 복잡성을 이해하기 위한 시도들 말이다. 비록 우리가 만든 뉴럴 네트워크 모델은 뇌의 뉴런 회로에 비해 상당히 단순 하지만 학습 알고리즘 덕분에 방대한 뉴런으로의 정보 전달과 같은 일반 원칙에 대한 탐구가 가능해졌다. 어떻게 비교적 단순한 학습 규칙으로부터 네트워크 기능의 복잡성이 발생하는 것인가? 보다 쉽게 분석할 수 있는 복잡성을 보유한 보다 단순한 체계가 존재한다는 말인가?
- 주요 컴퓨터 칩 기업과 스타트업들은 너 나 할 것 없이 딥러닝을 위한 칩 개발에 상당한 투자를 하고 있다. 예를 들면 2016년 인텔 (Intel)은 4억 달러에 너바나를 인수했다. 너바나는 샌디에이 고에서 특수 목적 VLSI 칩을 설계하던 작은 스타트업 기업이다. 너바나의 전 CEO 나빈 라오(Naveen Rao)는 현재 인텔의 새로운 인공지능 제품 그룹을 이끌며 중간 단계를 거치지 않고 인텔 CEO에게 직접 보 고하는 위치에 있다. 2017년 인텔은 자율주행 자동차에 적용하는 감 지기와 컴퓨터 비전 분야에 특화된 기업 모빌아이(Mobileye)를 153억 달러에 인수했다. 그래픽 애플리케이션과 게임 구동에 최적화된 특 수 목적 디지털칩, 일명 ‘그래픽처리장치(GPUs)'를 개발한 앤비디아 (Nvidia)의 경우 현재 딥러닝과 클라우드 컴퓨팅을 위한 특수 목적 칩 의 판매량이 훨씬 더 많다. 구글은 자사의 인터넷 서비스에 사용되는 딥러닝 기능을 강화하기 위해 보다 효율적인 특수 목적칩인 텐서처 리장치(Tensor Processing Unit, TPU)를 자체 개발했다.
- 딥러닝 애플리케이션의 개발을 위해서는 특수한 소프트웨어 또한 못지않게 중요하다. 구글은 자사의 딥러닝 네트워크가 대중적으로 활용되도록 하기 위해 텐서플로우(TensorFlow) 프로그램을 제작했다. 비록 그 의도가 보이는 것처럼 이타적인 것은 아닐지라도 말이다. 예 를 들면 안드로이드 프로그램을 무상으로 이용하도록 한 결과 전 세 계에 사용되고 있는 거의 모든 스마트폰의 운영체제에 대한 통제권 이 구글의 손에 들어갔다. 그러나 지금은 구글의 텐서플로우를 대체 할 수 있고 무상으로 사용할 수 있는 대안도 존재한다. 마이크로소프 트의 인지툴킷(Cognitive Tool Kit, CNTK), 아마존을 비롯한 다른 주요 인터넷 기업들이 지원하는 엠브이넷(MVNet), 그 외에도 독자적으로 딥러닝 프로그램의 구동이 가능한 카페(Caffe), 테아노(Theano), 파이토치(PyTorch) 등이 그것이다.
- 자동차처럼 디지털과 뉴로모픽 설계의 융합이 부상하고 있다. 컴퓨팅을 위해 매우 낮은 전력만을 필요로 하는 뉴로모픽 설계의 장점과 커뮤니케이션에 유리한 고대역폭 디지털 칩의 장점을 취하는 새로운 하이브리드 구도 말이다.무어의 법칙은 칩의 처리 성능만을 고려했을 뿐이다. 향후 50년간 병렬 구조가 지속적으로 진화한다면 무어의 법칙은 에너지와 함께 처리량까지 고려하는 새로운 법칙으로 대체되어야 할 것이다. 인텔의 주관으로 오리건, 포틀랜드에서 열린 2018 NICE 콘퍼런스에서 미국과 유럽의 과학자들에 의해 세 가지 새로운 뉴로모픽 칩이 공개되었다. 그중 하나는 인텔이 개발한 로이히 리서치 칩(Loihi research chip)이고 나머지 두 개의 차세대 칩은 유럽의 인간두뇌프로젝트(European Human Brain Project)에서 발표한 것이다. 대량 병렬 구조의 발전과 함께 이 구조에서 작동할 수 있는 새로운 알고리즘 또한 만들어지고 있다. 그러나 이들 구조 내에 있는 칩들은 여전히 정보의 전달을 필요로 한다.
- 생명의 기원은 지구가 현재 우리가 알고 있는 것과는 완전히 다른, 우리가 알고 있는 것처럼 생명을 지탱하지 못했을 수십 억 년 전으로 시간을 거슬러 올라간다. 환경 은 혹독했고 대기 중에는 산소도 얼마 없었다. 고세균류는 박테리아 보다 먼저 지구상에 서식하고 있었다. 그렇다면 고세균류 이전에는 무엇이 있었을까? 오늘날 알려진 모든 세포에는 DNA가 있다. 그렇다. 면 DNA 이전에는 무엇이 있었는가? 1968년 오르겔과 크릭은 DNA 로부터 추출된 RNA가 전구체라고 추측했다. 그러나 그것은 RNA의 자기복제 능력을 전제로 하는 추측이었다. 그 가능성을 뒷받침하는 증거는 RNA 기반의 효소로 RNA 반응의 촉매 작용을 하는 리보자 임의 형태로 발견되었다. 오늘날 대다수의 학자들은 모든 생명체가 초기 'RNA 세상'으로부터 유래되었을 가능성이 충분하다고 믿고 있다. 그렇다면 RNA는 어디서 온 것인가? 불행하게도 그것을 증명할만한 자료는 그리 많지 않다.

Posted by dalai
,