과학

수학은 알고 있다

dalai 2024. 11. 20. 07:18

- 스테이블디퓨전은 말 그대로 확산모델의 일종인 잠재확산모델을 사용해 이미지를 생성하는 AI그림제작 도구임. 잠재확산모델은 VAE(variational aotoencoder)라 불리는 도구를 활용해 기존의 확산모델보다 이미지를 더 효율적으로 변환함.
확산메돌 또한 딥러닝과 작동방식이 크게 다르지 않음. 수만, 수억개의 그림을 픽셀단위로 학습하고 이를 다시 재조합하는 것임. 이 고정에서 스테이블디퓨전은 그림에 인위적 노이즈를 추가하고, 노이즈로부터 다시 그림을 얻는 방식으로 대량의 이미지를 학습함. 그리고 '한 여성과 함께 탁자에 앉아 있는 반 고흐' 같은 조건을 입력해 얻고자 하는 이미지를 노이즈에서 추출함.

- 확산모델은 비단 회화영역에만 국한되지 않는다. 워싱턴대 연구진은 알파폴드2와 비슷한 원리로 작동하는 단백질 구조예측 도구인 로제타폴드를 내놓음. 로제타폴드는 로제타폴드디퓨전이라는 확산모델을 사용. 스테이블디퓨전이 무작위 픽셀로 새로운 이미지를 만든 것처럼, 로제타폴드는 알파폴드의 데이터를 활용해 무작위 아미노산에서 새로운 단백질 복합체를 만들어냄. 실제로 단백질은 여러 단백질이 모인 복합체 형태로 작동하는 경우가 많아 로제타폴드는 하나의 단백질을 만드는 기존 알파폴드보다 더 마은 가능성을 보여주었음. 연구진은 여기서 멈추지 않고, 단순 단백질 뿐만 아니라 DNA, RNA를 포함한 다양한 생물분자를 설계할 수 있는 로제타폴드아톰을 출시. 알파폴드가 21년에 출시된 지 3년도 안되는 시점에 이런 발전을 이룸.
이처럼 어떤 알고리즘은 여러 영역에 활용될 잠재력을 지니고 있다. 딥마인드가 개발한 모델이 바둑 프로그램인 알파고에서 출발해 단백질 예측 프로그램인 알파폴드로 이어진 것처럼 그리고 확산모델이 우리에게 영감을 주는 이미지 생성뿐 아니라 단백질 예측과 설계에 활용되는 것처럼 말입니다.

- 제프 호킨스는 그의 저서 천개의 뇌에서 딥러닝이 인간과 같은 지능을 가진 AI, 소위 인공일반지능을 달성하는 것은 어려울지 모른다고 지적한 바 있음. 인간은 딥러닝과 달리 신체감각을 통해 끊임없이 학습하면서 세계의 모델을 구축. 만약 던진 공이 다른 사물과 어떻게 상호작용하는지 알고 싶다면 그저 공을 관찰하는 것만으로도 충분히 알 수 있다. 이렇게 상호작용 속에서 인과관계를 파악해 세계모델을 구축하는 사람의 방식은 딥러닝의 학습방식과 사뭇 다르다고 호킨스는 주장. 심지어 사람은 세계 모델을 구축하고 이를 토대로 다음 순간에 어떤 사건이 일어날지도 모른다고 예상하며, 필요하다면 기꺼이 그 모델을 수정할 준비가 되어 있다. 

- 알파고의 바둑, GPT의 문장생성, 스테이블디퓨전의 이미지 제작은 동일하게 딥러닝에 기반한 인공신경망 네트워크를 사용하는데도 하나의 프로그램으로 통합되지 못하고 별개의 프로그램으로 구동돼야 한다. 반면 사람은 쉽지 않겠지만 오른손으로 수채화를 그리면서 왼손으로는 체스와 바둑을 두고 게임 상대방을 말로 도발할 수도 있다. 어쩌면 지능은 하나의 작업을 얼마나 잘 해내는가로 측정하는 것이 아닐, 어떤 일이든 유연하게 배울 수 있는가로 평가해야 하는 것인지도 모름.
물론 이런 한계를 해결하기 위한 움직임은 현재진행형이다. 알파고를 개발한 딥마인드는 바둑과 체스, 일본식 장기와 같은 게임을 수행하는 제한적인 범용 알고리듬인 알파제로를 출시하는 한편, 엑스랜드라 불리는 개방형 구조를 통해 기계에게 여러 종류의 문제가 통합된 학습을 유도하는 실험을 진행중. 메타 또한 이미지와 텍스트, 음성을 동시에 인식하는 데이터투벡이라는 알고리즘을 개발. 최근 딥마인드가 개발한 시마라는 AI도 주목할 만하다. 시마는 다양한 게임을 수행하도록 개발된 최신 AI로 범용기계로서의 가능성을 보여주고 있다. 하지만 시마 역시 사람이 할 수 있는 작업의 60%도 수행하지 못하고 있어 범용성과 멀티태스킹 능력을 갖춘 AI는 아직 갈 길이 멀어보임.

- 현재로서는 사람이 개발한 모든 인공지능에는 사실 지능이 없다는 결론을 내릴 수도 있겠다. 물론 지능의 기준은 사람마다 다를 수 있기에 이견은 존재가능. 역전파 알고리즘 개발 등의 업적으로 딥러닝의 대부라 불리는 제프리 힌턴은 23년에 인공신경망이 새로운 형태의 지능이며 더 나은 지능이라 주장하기도 했다. 
오해를 방지하기 위해 말하자면, 딥러닝은 최근 몇년간 놀라운 성취를 보여줌. 하지만 기계가 사람들이 일반적으로 인식하는 지능을 가지려면 단지 이미테이션게임으로 튜링테스트를 통고하는 것 외에도 극복해야 할 장애물이 여전히 산적해 있음. 인공지능을 이용해 인류가 더 나아가고자 한다면 먼저 우리가 가진 도구의 한계를 명확히 알아야할 필요가 있다.

- 딥러닝의 핵심인 역전파학습이 뇌의 학습방식과 동일한지도 의문이 남아 있다. 인간의 뇌가 딥러닝처럼 순방향과 역방향의 순서로 미세조정의 프로세스를 거치거나 지도학습과 유사한 방식으로 세상을 이해할까? 뇌의 학습방식이 딥러닝과 완전히 동일하지 않다면 우리는 무언가 놓치고 있는지도 모름. 따라서 AI를 연구하는 또 다른 진영에서는 현재의 딥러닝이 한계가 있다고 주장하며 실제 뉴런과 비슷하게 작동하는 새로운 인공신겨망을 연구하고 있다. 
이처럼 딥러닝은 AI의 가장 유망한 분야인 동시에 AGI로 나아가려는사람들의 발목을 잡는 분야일 수 있다. 딥러닝은 초기 AI연구자들이 꿈꿔왔던 사람과 같은 지능을 가진 기계인 AGI의 비전을 실현해줄 주인공이 아닐지도 모름. 비록 딥러닝의 초기 아이디어는 뇌의 작동방식세어 영감을 받았지만, 더 이상 딥러닝은 뇌와 신경과학에 신경쓰지 않고 수학과 컴퓨터 공학에 의존하며 독자적인 길을 가고 있다. 만약 딥러닝으로는 근본적인 단계에서 진정한 의미의 지능을 만들어낼 수 없다는 것이 밝혀진다면 AGI를 실현하기 위한 새로운 돌파구를 찾아야 할 것임.
그러나 AGI에 관한 건전한 담론은 쉽게 성사되기 어려워 보임. 온갖 억측은 물론이고 마케팅을 위한 과대포장이 이 분야에서 매우 흔하게 일어나기 때문. 일부 IT기업들은 자사의 거대한 인공신경망을 가진 모델이 뛰어나다고 강조하며, 머지 않아 자신들의 모델이 사람처럼 사고할 것이라고 거리낌 없이 홍보한다. 이런 주장을 검증할 만한 과학적 기반은 아직 존재하지 않는다.