AI 2041

IT 2023. 3. 23. 20:44

-  미국의 과학자이자 미래학자였던 로이 아마라Roy Amara가 주창한 '아마라 법칙'에 따르면 "우리는 기술의 단기 효과를 과대평가하고 장기 효 과는 과소평가하는 경향이 있다." 마찬가지로 대부분 사람이 인공지능 을 협소한 의미에서 생각한다. 이를테면 영화 <터미네이터>에 나오는 살 인 로봇, 재치라곤 전혀 없거나 인간의 존재를 위협하는 불완전한 알고 리즘, 인간이 세계를 인식하고 감정을 주고받으며 소통하고 제도를 관 리하고 삶의 다른 가능성을 탐색하는 방식과 무관한 삭막한 기술의 발 명을 떠올린다.
기원전 3세기 중국 춘추전국시대에 오늘날 휴머노이드에 해당하는 인간의 모습과 흡사한 거대 인형을 만들었던 공예기술자 얀스Yan Shi의 이야기나 그리스 신화에서 불의 신 헤파이스토스가 살아 있는 청동 거 인 탈로스Talos를 만들어 크레타섬의 왕에게 선물했다는 이야기에서 볼 수 있듯이, 인간은 컴퓨터과학이 등장하기 이전부터 혹은 인공지능이라 는 용어가 탄생하기 훨씬 전부터 집요하게 '인공지능'을 탐구해왔다. 오 늘날에도 인공지능은 인류 문명 전반에 걸쳐 혁명적인 변화를 일으키고 있으며, 앞으로도 그럴 것이다.

- 다른 누군가의 삶을 완벽하게 모방하기보다 당신 자신의 운명을 불완전하게 사는 게 낫다. (《바가바드 기타> 3장 35절)
- 인간의 뇌는 1,000억 개가 넘는 신경세포가 100조 개 이상의 시냅스를 통해 병렬적으로 연결된 구조로 되어 있다. 딥러닝은 이러한 인간 뇌의 복잡한 신경망을 모방한 인공신경망을 수학적으로 모델링한 것이라 볼 수 있다. 딥러닝은 입력층과 출력층을 포함한 수천 개의 신경망, 즉 소프 트웨어층으로 구성된다. 기존 인공신경망이 가졌던 한계를 뛰어넘은 딥 러닝은 풍부한 학습 데이터와 결합하면서 음성인식과 객체인식 등의 분 야에서 놀라운 발전을 가져왔다.
사람들은 흔히 인공지능이 "고양이는 귀와 수염이 뾰족하다"와 같은 일련의 패턴화된 규칙들을 통해 '학습한다고 생각한다. 하지만 딥러닝 은 인간이 만든 그러한 규칙들의 개입이 없을 때 더 잘 작동한다. 딥러닝은 특정 규칙이 아닌 다양한 현상들의 데이터가 입력되면 스스로 데이 터들의 패턴과 상관관계를 파악하고 계산하는데, 이 작업은 이미 출력 층에 설정된 '올바른 답과 연관되어 이루어진다. 딥러닝 신경망의 입력 층과 출력층 사이에 존재하는 무수한 소프트웨어층은 입력된 특정 데이 터들로부터 올바른 답을 얻을 가능성을 극대화하기 위해 스스로 훈련하 고 학습한다.
예컨대 연구자가 고양이를 찍은 사진과 고양이가 아닌 다른 동물을 찍은 사진을 구별하는 법을 딥러닝 신경망에 가르치려 한다고 가정해보 자. 우선 연구자는 출력층에 미리 '고양이' 또는 '고양이 아님'을 결괏값 으로 설정한다. 그리고 수백만 장의 샘플 사진을 입력층에 보낸다. 딥러 닝의 신경망은 수백만 개의 이미지에 나타난 특징들 가운데 어느 것이 고양이와 다른 동물을 식별하는 데 가장 유용한지 스스로 파악하도록 훈련된다. 이 훈련은 고양이 이미지를 입력하면 '고양이'가 출력되고 고 양이가 아닌 이미지를 입력하면 '고양이 아님'이 출력될 가능성을 극대 화하기 위해 딥러닝 신경망에 있는 수백만(때론 수십억 개의 매개변수를 조정하는 수학적 과정이다. 
- 딥러닝 신경망의 훈련은 '목적함수'의 값을 극대화하기 위한 수학 적 연산 과정이기도 하다. 고양이 인식 사례의 경우, 목적함수는 '고양 이' 또는 '고양이 아님을 올바르게 인식할 확률이다. 일단 '훈련된' 딥러 닝 신경망은 새로운 이미지를 입력해도 여전히 올바른 답을 얻을 수 있 는 거대한 수학 방정식이나 마찬가지다. 이 방정식에 따라 이미지에 고 양이가 있는지 없는지 판단하는 '추론'을 수행한다. 딥러닝의 등장은 이 전에는 불가능했던 많은 영역에서 인공지능을 적용할 수 있도록 해주었다. 
- 딥러닝이 아무리 강력하다 할지라도 만병통치약은 아니다. 인간은 인공지능처럼 동시에 수많은 데이터 포인트를 분석할 수는 없지만, 대신 의사결정을 위해 경험, 추상적 개념, 상식을 이용하는 고유한 능력을 지 니고 있다. 반면에 딥러닝이 잘 작동하려면 방대한 데이터, 한정된 범위, 최적화를 위한 구체적인 목적함수가 필요하다. 이 가운데 하나라도 부 족하면 제대로 작동하지 않을 수 있다. 데이터가 너무 적다면? 알고리즘은 데이터 간의 의미 있는 상관관계를 발견하기에 충분한 예시를 갖지 못할 것이다. 복수의 분야를 다뤄야 한다면? 알고리즘은 서로 다른 분야 간 상관관계를 설명할 수 없으며, 모든 순열을 포함할 만한 충분한 데이 터를 얻지 못할 것이다. 목적함수가 너무 광범위하다면? 알고리즘은 최 적화를 달성하는 데 필요한 명확한 지침을 얻지 못할 것이다.
- 시각은 인간의 여섯 가지 감각 가운데 가장 중요하다. 컴퓨터 비 전computer vision은 컴퓨터의 '보는' 능력에 관한 문제를 중점적으로 다루 는 인공지능의 하위 분야다. 여기서 '본다'라는 것은 '본 것을 이해하는 것'까지 포함한다. 컴퓨터 비전은 다음과 같은 기술을 포함하고 있으며, 이런 기술들은 점점 더 복잡해지고 있다.
* 이미지 포착 및 처리: 실제 세계의 3D 장면을 카메라와 다른 센서들을 이용해 동영상으로 구현한다. 각 동영상은 연속적인 이미지들로 구성되며, 각 이 미지는 2D로 배열되는 픽셀의 집합체로 만들어진다.
* 대상 감지 및 이미지 세분화: 이미지를 뚜렷한 부분들로 나누고 대상이 어디에 있는지 찾는다.
* 대상 인식: 대상을 인식하고 세부 정보를 이해한다. 가령 대상이 강아지임을 인식하고 그 강아지가 독일산 셰퍼드라는 것까지 이해한다.
* 대상 추적: 연속적인 이미지나 동영상에서 움직이는 대상을 추적한다.
* 몸짓과 움직임 인식: 엑스박스Xbox 댄싱 게임에서 캐릭터의 춤추는 동작과 같은 움직임을 인식한다.
* 장면 이해: 어떤 장면을 전체적으로 이해한다. 예를 들어, '뼈다귀를 바라보는 배고픈 강아지'처럼 장면 속의 여러 대상이 갖는 미묘한 연관성까지도 함께 파악한다.
- 우리는 이미 매일 컴퓨터 비전 기술을 사용하고 있다. 컴퓨터 비전은 교통부터 보안에 이르는 다양한 분야에서 실시간으로 사용될 수 있다. 이 미 사용되고 있는 예는 다음과 같다.
* 졸고 있는 운전자를 감지하도록 자동차에 설치된 운전자 보조 기능
* 아마존고Amazon Go와 같은 무인 매장(쇼핑 카트에 물건을 담을 때 카메라가 인식한다.)
* 공항 보안(사람들의 수를 세고, 테러리스트를 인식한다.)
* 몸짓 인식(엑스박스 댄싱 게임에서 각 캐릭터의 춤추는 동작을 인식하고 점수를 매긴다.)
* 얼굴 인식(스마트폰 잠금 해제를 위해 얼굴을 인식한다.)
* 스마트카메라(아이폰의 인물 사진 모드는 전경에 있는 사람들을 인식해 추출한 후 배경을 '아름답고 흐릿하게 처리해 DSLR과 같은 효과를 낸다.)
* 군사적 적용(적군과 민간인을 구별한다.)
* 드론과 자동차의 자동항법 시스템
- 컴퓨터 비전은 이미지와 동영상에도 적용할 수 있는데, 몇 가지 예를 살펴보자.
* 사진과 동영상의 스마트 편집(포토샵과 같은 도구들은 얼굴 윤곽을 따라 테두 리를 그릴 수 있고, 충혈된 눈을 없앨 수도 있다. 셀카 사진을 아름답게 업그레이 드하는 데 컴퓨터 비전이 광범위하게 사용된다.)
* 의료 영상 분석(폐 CT에서 악성 종양이 있는지 판단하기 위해 사용한다.) 콘텐츠 감시(소셜미디어에서 포르노와 폭력적인 콘텐츠를 감지한다.)
* 특정 동영상의 콘텐츠를 분석해 관련 광고가 보이도록 하는 시스템
* 스마트 이미지 검색(키워드나 다른 이미지를 검색창에 입력해 이미지를 찾는다.)
* 딥페이크 동영상 제작(동영상에서 하나의 얼굴을 다른 얼굴로 대체한다.)
- 장기적으로 가장 큰 문제는 GAN이 위조신경망을 '업그레이드'하는 메커니즘을 내장하고 있다는 점이다. 예를 들어, 당신이 GAN의 위조신 경망을 학습시켰고 누군가 당신의 딥페이크를 탐지하기 위한 새로운 탐 지 알고리즘을 내놓았다고 생각해보자. 당신은 그 탐지 알고리즘을 속 이려는 목표를 갖고 GAN의 위조신경망을 재훈련시킬 수 있다. 이는 결 국 어느 쪽이 더 우수한 컴퓨팅 성능을 지닌 장비를 갖추고 있느냐 하는 군비 경쟁이 될 수밖에 없다. 컴퓨팅 성능이 뛰어난 장비일수록 GAN을 더욱 잘 훈련시킬 수 있기 때문이다.
- 그렇다면 딥페이크를 100% 찾아내는 것은 불가능할까? 지금 당장은 어렵겠지만 장기적인 접근법이 한 가지 있다. 원본이 변경되지 않았 음을 보장해주는 블록체인 기술을 사용해 카메라나 스마트폰으로 찍히 는 모든 사진과 동영상의 진위를 촬영 시점에 확인하는 것이다. 그런 다 음 웹사이트에 올리는 모든 사진과 영상은 블록체인 기술로 인증되었 음을 보여주면 된다. 이렇게 하면 위조된 이미지나 동영상이 퍼져나가 는 것을 막을 수 있다. 하지만 그러려면 (현재 모든 오디오 수신기가 돌비 디지털을 사용하는 것처럼) 모든 장치가 블록체인 기술을 사용해야 하고, 블록체인이 이것을 대규모로 처리할 만큼 빨라져야 한다. 이는 아마도 2041년까지는 구현되기 어려울 듯하다.
- 기술이 발전하면서 어떤 컴퓨팅 플랫폼에서든 취약점과 보안상의 위험이 나타난다. 개인용 컴퓨터PC의 바이러스, 신용카드의 신원 도용, 이메일의 스팸 등이 그러한 예이다. 인공지능이 주류가 되면 인공지능 역시 취약점에 대한 공격을 받게 될 것이다. 딥페이크는 그러한 여러 취약점 가운데 하나일 뿐이다.
인공지능이 적대적인 공격을 받을 수 있는 또 하나의 취약점은 데이 터를 분류하는 기준값인 결정경계decision boundaries이다. 누군가 결정경 계를 추정해 입력 데이터를 위장하면 인공지능이 실수하도록 만들 수 있다. 가령 한 연구자는 인공지능이 그를 영화배우 밀라 요보비치 Milla Jovovich로 잘못 인식하게 하는 선글라스를 설계했다. 또 다른 연구자는 테슬라 모델S의 자율주행 기술인 오토파일럿Autopilot을 속이는 스티커" 를 도로에 붙여 차선을 바꾸고 다가오는 차들을 향해 돌진하도록 만들 었다. <가면 뒤의 신> 도입부에 아마카는 전철역에서 안면인식 시스템을 속이기 위해 마스크를 사용한다. 이런 종류의 위장술이 전쟁에서 이용 될 경우 극도로 위험하다. 적군에서 탱크를 구급차로 인식하도록 위장 했다고 상상해보라.
- 포이즈닝poisoning이라고 부르는 또 다른 공격은 의도적으로 악의적인 훈련 데이터 training data를 주입함으로써 인공지능의 학습 과정에 직접 관 여해 모델 자체를 공격한다. 이로 인해 인공지능 시스템 전체가 망가질 수 있으며 혹은 범법자에 의해 제어될 수도 있다. 군사용 드론이 테러리 스트에게 해킹당해 자국을 공격한다고 상상해보라. 이러한 공격은 기존 의 해킹보다 더 감지하기 어려운데, 인공지능 모델이 정해진 컴퓨터 코 드가 아니라 수천 개의 신경망에서 실행되는 극도로 복잡한 방정식이라 서 '디버그debug', 즉 오류를 수정하기가 쉽지 않기 때문이다.
이러한 난제들에도 불구하고 우리는 훈련과 실행 환경의 보안을 강화 하고, 포이즈닝 신호를 자동으로 찾는 도구를 개발하고, 조작된 데이터 나 회피 공격에 대항해 싸우는 기술을 개발하는 것과 같은 조치를 취할 수 있다. 기술 혁신으로 스팸과 바이러스를 극복한 것처럼 인공지능 보 안 기술도 충분히 발전하면 오직 간헐적인 공격만 받게 될 것이다(지금 도 가끔 스팸이나 바이러스의 공격을 받는 것처럼 말이다). 기술에 의한 취 약점은 항상 기술적 해법으로 해결되거나 개선되었다.

- 사랑하는 친구여, 우리 둘은 태양과 달이며 바다와 육지다. 우리의 목표는 나는 네가 되고 너는 내가 되는 게 아니라 서로를 인식하고 상대방을 있는 그대로 지켜보고 존중하는 것이다. 그렇게 해서 서로가 대립하면서도 보완하는 관계를 만드는 것이다. _헤르만 헤세, 《지와 사랑》 중
- 몇 년 전만 해도 사실상 모든 딥러닝 기반 NLP 신경망은 '지도학습'을 이용해 언어를 배웠다. '지도'라는 단어는 인공지능이 학습할 때 각 훈련 입력값에 대해 올바른 출력값이 주어져야 한다는 뜻이다(이 '지도'를 인 간이 인공지능에 규칙을 '프로그래밍'한다는 뜻으로 생각해선 안 된다. 1장 에서 봤듯이 그런 방식은 통하지 않는다). 인공지능은 한 쌍의 분류된 데이 터인 입력값과 올바른 출력값을 받는다. 그런 후 특정 입력값에 해당하 는 올바른 출력값을 제시하는 법을 배운다. 인공지능이 고양이 사진을 인식한 예를 기억하는가? 지도학습 방식의 딥러닝은 인공지능이 '고양 이'라는 단어를 제시하는 법을 배우는 훈련 과정이다.
인공지능이 자연어를 배우도록 지도학습을 적용하려면 우선 특정 목적에 맞게 분류된 데이터 세트가 있어야 한다. 가령 동일한 콘텐츠에 대 한 다국어 번역 데이터가 존재한다면, 이는 인공지능이 스스로 언어 번 역을 배우도록 하는 지도학습을 위한 데이터 세트가 될 수 있다. 이러한 데이터 세트가 있으면 인공지능은 영어로 된 수백만 개의 문장 하나하 나를 프랑스어로 전문적으로 번역된 문장 하나하나와 짝짓는 방식으로 스스로 훈련한다. 지도학습 방식의 NLP 응용프로그램은 사람의 말소리 를 글로 변환하는 음성인식, 손글씨나 이미지를 글로 번역하는 광학문 자인식OCR 혹은 글을 말소리로 변환하는 음성합성까지 확장될 수 있다. 이러한 지도학습이 가능한 종류의 자연어 인식 작업의 경우 이미 인공 지능이 대부분 인간보다 더 뛰어나다.
- 좀 더 복잡한 수준의 NLP 응용프로그램은 '인식recognition'에서 '이 해understanding'의 수준으로 넘어간다. 이 기술적 비약을 위해서는 말이 나 글이 가리키는 행동의 예시가 주어져야 한다. 가령 당신이 알렉사에 게 "바흐를 틀어줘"라고 말하면, 알렉사는 당신이 요한 제바스티안 바흐 가 작곡한 클래식 작품을 재생하길 원하는 것이라고 이해해야 한다. 혹 은 전자상거래 챗봇에게 "난 환불을 원해"라고 말하면 챗봇은 당신에게 해당 상품을 반품하는 방법을 안내한 뒤에 구매대금을 되돌려줄 수 있 어야 한다. 이러한 이해의 수준에서 지도학습 방식의 NLP 응용프로그램 을 개발하는 것은 매우 많은 시간이 걸리는 일이다. 인간은 한 가지 의도 나 명제를 정말 수많은 방식으로 표현하기 때문이다. 가령 당신은 "난 환 불을 원해"라고 말하는 대신 "나는 돈을 돌려받길 원해"라든가 "토스터 에 결함이 있어"라고 말할 수도 있다.
- 명료하고 구체적인 대화에서 상상할 수 있는 모든 다양한 표현이 NLP 훈련 데이터에 포함되어야 한다. 또 데이터는 인공지능이 스스로 학습 하는 데 필요한 단서를 제공하기 위해 인간의 목적에 맞게 '분류labeling' 되어야 한다. NLP 신경망의 지도학습을 위한 데이터 레이블링은 최근 20년간 거대 산업을 형성했다. 일례로 자동화된 항공사 고객 서비스 시 스템에서 언어 이해 훈련용으로 분류된 데이터는 다음과 같다.
[항공_예약_의향] 나는 [방법: 비행기를 타다]를 원합니다. [출발지: 보스턴]으로 부터 [출발 시간: 오전 838]에 출발하여 [목적지: 덴버]에 [도착 시간: 아침 1110] 에 도착하길 바랍니다.
이것은 아주 기초적인 예시다. 이 정도 상세한 수준에서 수십만 건의 인간 언어를 기록하고 분류하는 데 드는 비용을 상상해보라. 비행기 예 약이라는 협소한 분야에서조차 모든 가능한 표현을 다루려면 아직 가야 할 길이 한참 남은 상태다.
- 지난 수년 동안 '이해' 수준의 NLP 응용프로그램 개발은 협소한 특정 분야에 수많은 시간과 비용을 기꺼이 투자할 의향이 있을 때만 가능했 다. 이러한 한계로 인해 인공지능이 인간 수준으로 언어를 이해하고 처 리하는 단계로 나아간다는 원대한 비전을 달성하기가 어려웠다. 우리는 여전히 NLP 신경망의 지도학습을 위해 모든 입력값에 대한 올바른 출 력값을 제공하는 방법을 알지 못한다. 설령 그 방법을 안다 해도 세상에 존재하는 모든 언어 데이터 세트를 목적에 맞게 분류하는 것은 엄청나 게 많은 시간과 비용이 드는 일이 될 것이다
- 그런데 최근에 '자기지도학습'이라는 단순하면서도 우아한 새로운 접근법이 출현했다. 자기지도학습 방식에서는 방대한 데이터 분류 작업이 필요하지 않기 때문에 앞서 언급된 문제를 극복할 수 있다. 이 접근법은 '시퀀스-투-시퀀스'라고 불린다. 시퀀스-투-시퀀스는 순환신경망을 사용해 문장을 학습하는 기법으로 인공지능은 시퀀스로 이루어진 대화 의 말뭉치***를 학습함으로써 선행 발화가 후행 발화로 변환되는 확률을 계산해 대화를 생성해낸다. 가령 '87년 전에'라는 발화가 입력되면 RNN 이 다음에 올 내용을 예측해 '우리의 선조들이 이 땅에 나라를 세웠다'라는 발화를 출력할 수 있다. 사실 우리는 이 기술의 간단한 버전을 이미 매일 사용하고 있다. 지메일의 '스마트 완성' 기능이나 구글 검색의 '자 동 완성 기능이 바로 그 예다.
2017년에는 구글 연구진이 '트랜스포머transformer'라는 새로운 자기지 도학습 방식의 딥러닝 모델을 소개했다. 이 모델에서 인공지능은 문장 속 단어들의 관계를 추적해 맥락과 의미를 학습한다. 이 모델은 인공지 능이 대량의 텍스트를 바탕으로 훈련될 경우 과거에 있었던 '중요하고 의미상 관련 있는' 무엇이든 선별적으로 기억하는 '어텐션 메커니즘'**이 가능하다는 것을 보여준다. 이 메커니즘 덕분에 인공지능은 입력된 문장의 맥락을 훨씬 더 정교하게 파악해 출력값을 내보낸다.
- CNN이나 RNN에 비해 한층 강화된 딥러닝 모델인 트랜스포머는 처 음부터 스스로 언어를 가르칠 수 있다. 용언 활용이나 문법과 같이 인간 이 정한 규칙 대신 스스로 만든 규칙과 개념에 의존한다. 이러한 규칙과 개념은 방대한 데이터에서 자동으로 수집한 것으로 거대한 인공신경망 에 내장된다. 트랜스포머에 제공하는 데이터 역시 인간에 의한 분류 작 업을 하지 않아도 된다. 충분한 자연어 데이터와 처리 능력을 갖춘 트랜 스포머는 자기지도학습 방식의 딥러닝을 통해서 입력값과 출력값 사이 의 데이터에서 훨씬 많은 것을 탐지할 수 있다.
구글의 트랜스포머 뒤를 이은 것은 GPT-3 모델이다. 지금까지 가 장 뛰어난 자연어처리 기반 인공지능이라 할 수 있는 이 확장 버전은 2020년에 일론 머스크 등이 설립한 연구소 오픈에이아이에서 출시했다. 
- 토스터와 연필 중에 무엇이 더 무거울까?'라고 물으면, GPT-3는 '토스터'라고 올바르게 답한다. 첫 두 문장은 GPT- 3가 '더 무겁다'라는 표현의 구체적인 의미를 파악하는 데 도움을 주었 고, 마지막 문장은 답을 묻고 있다는 신호다. 마지막 문장만 입력해도 답 을 할 순 있지만, 아마도 오답을 제시할 가능성이 클 것이다.
GPT-3는 특정 산업, 분야, 영역 등에 특화된 언어인 DSLDomain Specif- ic Language을 사용하는 NLP 등 협소한 분야에 특화되었던 이전 모델과 달리 모든 분야의 다양한 과업들을 수행할 수 있다. 시를 짓고, 철학적 사색을 하고, 기사를 작성하고, 기술 매뉴얼을 제작하고 또는 특정 작가 의 스타일을 흉내 내서 글을 쓸 수도 있다.
- 우리 인간은 우리가 무엇을 알고 무엇을 모르는지 잘 안다. 하지만 GPT-3는 그렇지 않다. 이 결함 때문에 일종의 '가짜 뉴스'를 만들어낼 수도 있다.
GPT-3는 인과관계 추론, 추상적 사고, 설명식 문장, 상식, 의도적) 창 의성 부분에서도 취약하다. 또 인간에게서 나온 데이터를 너무 많이 학습하기 때문에 안타깝게도 인간의 편향, 편견과 악의까지도 흡수하게 되 는 치명적 약점이 있다. 사용자를 잘못 만날 경우에 GPT-3는 특정 그룹 의 사람들을 타깃으로 그들의 여론에 영향을 주기 위해 맞춤형 메시지 를 작성해 보내는 데 악용될 수도 있다. 이런 정치 단체가 있다면 2016년 미국 대선을 조작했다고 알려진 영국의 정치컨설팅업체인 케임브리지 애널리티카Cambridge Analytica보다 훨씬 더 위험할 것이다. 이러한 단점들 은 다가올 수십 년 동안 면밀하게 조사되고 해결되길 기대하고 있다.
- GPT-3의 잠재력 가운데 가장 흥미진진한 측면은 그것이 NLP 응용프 로그램을 빠르게 개발할 수 있는 새로운 플랫폼 역할을 할 수 있다는 것 이다. 실제로 GPT-3가 출시된 후 몇 달 만에 사람들은 많은 응용프로 그램을 개발했다. 가령 역사 인물과 대화할 수 있는 챗봇, 작성하기 시작 한 기타 악보를 마무리해주는 작곡 도구, 반쪽 이미지를 가지고 전체 이 미지를 완성할 수 있는 응용프로그램이 있다. 또 자연어 묘사(예: 발레 복을 입은 아기 무가 강아지를 산책시킨다)를 기초로 인물을 그릴 수 있는 달리 DALL.E라고 불리는 응용프로그램도 있다. 이러한 응용프로그램들은 현재로선 단순히 호기심을 유발하는 정도지만, 앞서 말한 결함이 해결 되면 GPT-3와 같은 플랫폼이 수만 명의 개발자가 더 많은 사용자를 끌 어들이는 멋진 응용프로그램을 만드는 선순환을 만들어낼 수 있다. 마 치 윈도와 안드로이드가 그런 것처럼 말이다.
- 대화형 인공지능 외에도 NLP 플랫폼은 어떤 질문에는 답할 수 있는 차세대 검색엔진이 될 수 있다. 질문을 던지면 NLP 검색엔진은 그 질문 과 관련된 모든 읽을거리를 읽고 소화해 해당 전문 분야 혹은 산업 특성 에 부합하는 맞춤형 답을 제공할 것이다. 가령 금융 인공지능 응용프로 그램은 '코로나19가 가을에 다시 확산된다면 투자 포트폴리오를 어떻게 조정해야 하나?'와 같은 질문에 답할 수 있다. 또 이 플랫폼은 스포츠 경 기나 주식시장 동향에 관한 기초적인 보고서를 작성할 수 있고, 아주 긴 보고서를 요약해줄 수도 있을 것이다. 그렇기에 기자, 투자분석가, 작가 등 언어를 가지고 작업하는 누구에게라도 훌륭한 동반자이자 도구가 될 수 있다.

- 산앵두나무꽃이 바람에 흩날리니 어찌 그대가 그립지 않으리오? 다만 그대 머무는 곳 멀어라. 
시를 읽고 공자께서 말씀하셨다.
"그리움이 부족하구나. 진정으로 그립다면 멀리 떨어진 것이 어찌 문제가 되겠는가?" 공자, <논어> 제9편 30장
- 딥마인드는 단백질 접힘 구조를 알아내기 위해(2단계) 2020년에 알파폴드AlphaFold2를 개발했다. 현재까지 인공지능이 과학을 위해 이룬 가장 위대한 업적이다. 단백질은 생명체의 구성 요소지만, 생 명 유지를 수행하기 위해 아미노산 배열이 어떻게 3차원 구조로 접히는 지는 수수께끼로 남아 있었다. 이는 심오한 과학적·의학적 함의를 가진 문제로 딥러닝에 매우 적합해 보였다. 딥마인드의 알파폴드는 기존에 발견된 단백질 접힘 구조의 거대한 데이터베이스를 바탕으로 훈련된 인 공지능이다. 알파폴드는 단백질 접힘 구조를 극저온 전자현미경과 같은 전통적인 방법들과 유사한 정확도로 파악해낼 수 있음을 증명했다. 전 통적인 방법들은 비용과 시간 때문에 모든 단백질의 0.1%도 해결하지 못했다. 알파폴드는 빠른 속도로 모든 단백질의 3차원 구조를 파악하는 방법을 제공했다. 알파폴드는 생물학계에서 '50년 묵은 대과제'를 해결 한 것으로 크게 환영받았다.
- 일단 단백질의 3차원 구조를 파악하고 나면 그다음 효과적인 치료법 을 발견하는 빠른 방법은 신약재창출drug repurposing, 즉 다른 질병에 효 과가 있는 것으로 증명된 모든 기존의 약을 대상으로 어떤 것이 해당 단 백질의 3차원 구조에 들어맞는지 확인하는 것이다. 신약재창출은 심각 한 팬데믹 확산을 초기에 막기 위한 응급처치가 될 수 있다. 기존의 약품 들은 이미 부작용 시험을 거쳤기 때문에 신약과 달리 광범위한 임상시험 없이도 사용될 수 있다.
- 인공지능 로봇은 앞 장들에서 설명한 인터넷과 금융, 인식 분야와 비교 해 완벽하게 구현하기가 훨씬 더 어렵다. 로봇의 문제는 딥러닝을 직접 적용해서 해결할 수 없기 때문이다. 게다가 로봇공학은 설계, 움직임, 조 작을 포함하므로 기계공학, 신체감각을 인식하는 인공지능, 소근육운동 조작 기술의 절묘한 상호작용이 필요하다. 이는 모두 해결할 수 있는 문 제들이긴 하지만, 미세 조정에 더 많은 시간이 걸리는 데다 학제적인 기 술의 통합이 필요하다.
로봇공학에서 인간의 시각, 움직임, 조작 능력은 정밀하게 복제돼야 한다. 로봇 기계는 자동화돼야 할 뿐만 아니라 자율성도 가져야 하는데, 이는 의사결정을 로봇에게 넘긴다는 뜻이다. 이렇게 되면 로봇은 계획 하고 피드백을 수집하고 환경 변화에 적응하거나 그에 따라 즉흥적으로 행동을 바꿀 수 있을 것이다. 로봇에 시각, 촉각, 이동 능력을 부여함으 로써 인공지능이 처리하는 과업의 수를 크게 늘릴 수 있다.
일반적인 인간 수준의 시각, 촉각, 조작, 움직임 및 조정은 향후 20년 이내에 인공지능 로봇으로 완벽하게 구현하기에는 대단히 까다로운 영 역이다. 각각의 능력은 제한된 환경에서 독립적으로 개발될 것이며, 시 간이 지남에 따라 차츰 제약 조건이 완화될 것이다. 현재 로봇의 컴퓨터 비전 능력은 노인들을 위한 안전장치(위험 상황을 경보로 알려주는 요양 보조 로봇), 조립공정에서 육안을 통한 검사, 에너지와 대중교통 산업에 서의 비정상행위 탐지 등에 적용될 수 있다. 한편 자율주행 로봇AMRs이 나 자율주행 무인지게차는 실내 공간을 자유롭게 이동할 수 있어서 스 스로 장애물을 '보고' 경로를 계획하며 화물을 옮길 수 있다. 현재 로봇 팔은 용접, 조립공정, 전자상거래 물류센터에서 이뤄지는 물품 피킹과 같은 분야에 적용되어 딱딱한 물체를 움켜잡고, 조작하고, 이동시킬 수 있다.

- 가상현실은 눈을 뜬 채 꿈을 꾸는 것과 같다. 브레넌 슈피겔 Brennan Spiegel
- 당신을 떠올리자..
이 늪의 반딧불이가
내 몸의 갈망에서 나온
영혼처럼 보이네. (이즈미 시키부 Izumi Shikibu)
- XR 글라스 외에도 XR 콘택트렌즈가 시장 대중화에 성공하는 최초의 확장현실 기술이 되지 않을까 싶다. 몇몇 스타트업은 이미 XR 콘택트렌 즈 개발에 착수했다. 그들이 내놓은 프로토타입 콘택트렌즈는 내장된 디스플레이와 센서를 통해 텍스트와 이미지를 보여준다. 이러한 콘택트 렌즈에는 여전히 외부 CPU가 필요한데 스마트폰이 그 역할을 할 수 있 다. 나는 2041년까지는 XR 콘택트렌즈의 시장 대중화가 이뤄지고 더 나 아가 사생활 보호와 각종 규제 및 가격 문제가 극복될 것으로 예상한다. 시각 정보가 글라스와 콘택트렌즈를 통해 입력된다면, 청각 정보는 이어셋을 통해 입력될 수 있다. 청각 정보를 처리하는 확장현실 기술 역시 해마다 발전하고 있다. 2030년이 되면 이어셋은 이머시브 사운드immersive sound 제작 기술을 비롯한 다른 음향 기술을 통해 거의 보이지 않을 만큼 소형화되고 덕분에 온종일 사용해도 전혀 불편하지 않을 것이다.
- 결론은 이렇다. 2041년까지 우리가 하는 일과 놀이의 많은 부분에 가상기술이 사용될 것이다. 이 불가피성을 받아들이고 적응해야 한다. 아 마도 확장현실 분야에서 거대한 기술적 비약이 일어날 것이며, 그것은 아마도 엔터테인먼트 산업에서부터 시작될 것이다. 현재 인공지능에 대 해 그러하듯이 모든 산업은 확장현실을 어떻게 사용할지 고민하고 결국 에는 수용하게 될 것이다. 인공지능이 데이터를 지능으로 전환하는 것 이라면, 확장현실은 인간의 눈, 귀, 팔다리 그리고 궁극적으로 뇌에서 더 많은 양질의 데이터를 모으게 될 것이다. 인공지능과 확장현실은 자신을 이해하고 더 발전하려는 인간의 꿈을 완성하고 그 과정에서 인간 경험의 가능성을 확장할 것이다.

- 그래서 두 가지 톤이 진행된다. 그건 마치 두 대의 기타를 동시에 치는 것과 같다. 자연스럽게 흐르도록 놔두면서도 제어해야 한다. 지미 헨드릭스, 레온 헨드릭스, 지미 헨드릭스: 형제의 이야기> 중

- 우리를 파괴하기 위해 굳이 인공지능이 필요하지 않다. 인간이 가진 오만함만으로도 충분하다. (영화 <엑스 마키나>)
- 모든 건 서로 얽혀 있으니 거미줄은 신성하다. (마르쿠스 아우렐리우스)
- 양자컴퓨터는 고전적인 컴퓨터보다 특정 종류의 전산 처리를 훨씬 더 효율적으로 수행하기 위해 양자역학을 이용하는 새로운 컴퓨터 아키텍처다. 고전적인 컴퓨터는 '비트bit'를 기반으로 한다. 비트는 스위치와 같 아서 (꺼지면) 0혹은 켜지면) 1이 된다. 모든 응용프로그램과 웹사이트 혹은 사진은 수백만 개의 비트로 구성된다. 이진법인 비트 덕분에 고전 적인 컴퓨터를 더 쉽게 만들고 제어하게 되었지만, 0과 1의 조합만으로 계산해야 하기에 정말 어려운 컴퓨터과학 문제를 해결할 잠재력은 제한 되었다.
양자컴퓨팅은 비트 대신 양자비트, 즉 전자나 광자와 같은 아원자 입 자인 큐비트를 사용한다. 큐비트는 원자 입자와 아원자 입자와 마찬가 지로 양자역학의 원리를 따름으로써 어마어마한 컴퓨팅 능력을 부여한 다. 그 첫 번째 특성은 중첩superposition으로 이는 각 큐비트가 언제든 복 수의 상태로 존재할 수 있는 능력이다. 0과 1의 값을 모두 보유한 중첩 상태에 있는 복수의 큐비트들은 방대한 수의 출력값을 동시에 처리할 수 있으며 다양한 상황에 대한 분석이 가능하다. 양자컴퓨팅을 기반으로 구축된 인공지능은 고도의 효율성을 바탕으로 작동하기 때문에 복잡성은 기하급수적으로 줄어든다.
두 번째 특성은 얽힘entanglement으로, 두 개의 큐비트가 서로 연결되어 멀리 떨어져 있을 때조차 하나의 큐비트에서 수행되는 행동이 다른 하 나에 영향을 주는 것을 말한다. 얽힘 덕분에 양자 기계에 하나의 큐비트 가 더해질 때마다 컴퓨팅 능력은 기하급수적으로 증가한다. 1억 달러의 기존 슈퍼컴퓨터가 컴퓨팅 능력을 2배로 늘리려면 1억 달러를 더 써야 한다. 하지만 양자컴퓨팅의 능력을 2배로 늘리려면 하나의 큐비트만 더 하면 된다.
이렇게 놀라운 특성에는 대가가 따른다. 양자컴퓨팅은 컴퓨터와 그 주변 환경의 작은 이상에도 매우 민감하게 반응한다. 작은 진동, 전기적 간섭, 온도 변화 혹은 자기장에도 중첩이 붕괴하거나 심지어 사라질 수 있다. 실용적이면서 확장 가능한 양자컴퓨팅을 위해서는 이전에 없던 진공실, 초전도체, 초냉각 냉장고를 개발해 환경에 의해 발생하는 양자의 '결어긋남decoherence'을 최소화해야 한다.
- 이러한 도전적 문제들로 인해 과학자들이 양자컴퓨팅에서 큐비트의 수를 늘리는 데 오랜 시간이 걸렸다. 1998년에 2개이던 것이 2020년 에 65개로 늘었는데 이는 실용적인 작업을 수행하기에는 아직 너무 적 은 수다. 그렇긴 해도 수십 개의 큐비트만으로 일부 컴퓨팅 작업은 기존 의 슈퍼컴퓨터보다 100만 배 더 빠르게 처리할 수 있다. 구글은 2019년 에 기존의 슈퍼컴퓨터라면 수년이 걸렸을 문제를 54큐비트의 양자컴퓨 터가 수십 분 만에 풀 수 있음을 보여주며 처음으로 '양자 우월성quantum supremacy'을 증명했다.
IBM의 로드맵에 따르면, 향후 3년간 해마다 큐비트의 수가 2배 이 상 늘어나 2023년에 1,000 큐비트 프로세서가 등장할 것으로 기대된다. 4,000개의 논리적 큐비트logical qubit는 비트코인 암호를 깨는 것을 포함 해 일부 분야에 적용되기에 충분하다. 이를 근거로 일부 낙관론자들은 양자컴퓨터가 5년에서 10년 후에 도래할 것으로 예측하기도 한다.
하지만 이러한 낙관론자들은 몇몇 도전을 간과했을지도 모른다. IBM 연구자들은 큐비트가 늘어날수록 결어긋남에 의한 오류를 통제하기가 더 어렵다는 것을 인정한다. 이 문제를 해결하려면 신기술과 정밀공학 을 이용해 복잡하면서도 섬세한 장비를 구축해야만 한다. 또 결어긋남 오류를 해결하려면 안정성, 오류 수정 및 내결함성 fault tolerance을 제공하 기 위해 각각의 논리적 큐비트를 다수의 물리적 큐비트physical qubit로 나 타내야 한다. 4,000개의 논리적 큐비트를 가진 양자컴퓨터가 작동하려 면 한 대당 100만 개가 넘는 물리적 큐비트가 필요할 것으로 추정된다. 게다가 유용한 양자컴퓨터가 성공적으로 시연된다고 해도 대량 생산은 또 다른 문제다. 마지막으로 양자컴퓨터는 고전적인 슈퍼컴퓨터와 완전 히 다르게 프로그래밍되므로 새로운 알고리즘이 발명되어야 하고 새로 운 소프트웨어 도구도 만들어져야 한다.
- 다음과 같은 궁금증이 생길 수 있다. 왜 사람들은 그들의 지갑 주소와 공개키를 세상에 공개하는가? 이것은 초기 설계가 가진 결함이었다. 비 트코인 전문가들은 공개가 불필요하고 위험하다는 사실을 뒤늦게 깨달 았다. 2010년에 사실상 모든 새로운 거래가 주소를 숨김으로써 훨씬 더 안전한 새로운 포맷으로 전환되었다(물론 전혀 공격을 당하지 않는다고 는 할 수 없다). 이 새로운 기준이 바로 P2PKH이다. 하지만 과거의 취약 한 포맷(P2PK)에 아직도 200만 개의 비트코인이 저장되어 있다. 그리 고 2021년 1월, 코인당 가격이 6만 달러에 달해 전체 비트코인의 가치는 1,200억 달러가 되었다. 이것이 바로 <양자 대학살>에서 도둑들이 노린 것이다. 만일 구식 P2PK 계정을 갖고 있다면 당장 이 책을 내려놓고 가서 지갑을 안전하게 바꾸길 바란다!
- 마크 루소는 왜 은행을 털지 않았을까? 우선 은행에는 공개키가 담긴 공개 장부가 없고 따라서 개인키를 계산할 수 없기 때문이다. 둘째, 은 행에는 거액의 이체와 같은 수상한 거래를 감시하는 시스템이 있기 때 문이다. 셋째, 계정 간 돈의 이동은 추적이 가능하며 불법일 경우 기소당 하기 때문이다. 마지막으로, 은행 거래는 암호 해독에 더 많은 애를 써야 하는 다른 암호화 알고리즘에 의해 보호되기 때문이다.
암호화를 '업그레이드하려면 어떻게 해야 할까? 양자 저항 알고리즘 이 존재한다. 실제로 피터 쇼어는 난공불락의 암호화를 양자컴퓨터에 구축할 수 있음을 보여주었다. 양자역학에 기초한 대칭적인 암호화 알 고리즘은 침입자들이 강력한 양자컴퓨터를 갖고 있다 해도 뚫을 수 없 다. 이 암호에 침투할 수 있는 유일한 방법은 양자역학의 원리가 잘못된 것으로 판명될 경우뿐이다.
하지만 양자 저항 알고리즘을 적용하는 것은 매우 비싸다는 이유로 현재로선 대부분 기업이나 비트코인 거래소에서 고려하지 않고 있다.

- 증기 드릴이 나를 쓰러트리기 전에 내 손에 망치를 쥐고 죽겠소. (미국 민요 ‘존 헨리John Henry' 중)
- 낙관론자들은 신기술에 의한 생산성 향상이 거의 항상 경제적 이익을 창출한다고 주장한다. 더 큰 성장과 번영은 항상 더 많은 일자리를 의미 한다는 것이다. 하지만 인공지능과 자동화는 다른 기술들과 다르다. 인 공지능은 범용 기술로서 화이트칼라와 블루칼라를 통틀어서 거의 모든 산업과 직무 분야에서 변화를 가져올 것이다. 대부분 기술은 일자리를 창출하기도 하고 앗아가기도 한다. 조립 라인의 등장으로 자동차 생산 공장에서 더 낮은 비용으로 수많은 노동자를 대체했던 것을 떠올려보 라. 인공지능이 표명하는 기술적 목표는 인간의 일을 수월하게 해주거 나 대신하는 것이다. 산업혁명이 유럽과 미국을 넘어 전 세계로 퍼져나 가는데 100년 이상이 걸렸던 반면 인공지능은 이미 전 세계에서 채택 되고 있다.
- 다음 세 가지 능력은 인공지능이 뒤처지는 분야로, 2041년까지 인공지능이 통달하기 어려울 것이다.
* 창의력: 인공지능은 무언가를 전략적으로 만들어내거나 개념화할 수 없으며 계획을 세우지도 못한다. 인공지능은 협소한 목표를 위한 최적화는 잘하지만 스스로 목표를 정하거나 창의적으로 생각할 수 없다. 인공지능은 서로 다른 영역들을 넘나들며 생각하거나 상식을 적용할 수도 없다.
* 공감: 인공지능은 공감이나 연민과 같은 감정을 느낄 수도 그런 감정을 바 탕으로 상호작용할 수도 없다. 인공지능은 다른 사람이 이해받고 있다거 나 보살핌을 받는다고 느끼게 할 수 없다. 이와 관련해 인공지능이 아무리 개선된다고 해도 배려와 공감이 요구되는 상황에서 혹은 '휴먼터치 서비 스human-touch service' 분야에서 인간과 로봇이 상호작용하며 편안하게 느낄 수 있는 수준에 도달하기란 매우 어렵다.
* 수작업: 인공지능과 로봇은 인간의 손재주나 정교한 손과 눈의 협업이 요구 되는 복잡한 신체적 노동을 할 수 없다. 인공지능은 알지 못하는 비구조화된 공간, 특히 이전에 관찰한 적이 없는 공간에 대처할 수 없다.
- 인공지능에 의한 일자리 이동의 물결 속 에 결국 비숙련 신규직원들이 주로 하는 모든 반복적인 일이 사실상 사 라질 것이다. 하지만 이런 초보적인 일을 해보지 못한다면 그들은 어떻 게 학습하고 성장하고 발전해 상급직의 업무를 맡을 수 있을까? 자동화 가 점점 더 확대되고 있지만 우리는 여전히 사람들이 모든 직업에 종사 하고, 업무를 직접 해보면서 배우고, 능력에 따라 승진할 수 있는 방법 이 있는지 확인해야 한다. 이를 구현하기 위해 가상현실 기술이 활용되 면서 '가짜 일', '실무 훈련', '진짜 일'의 구분이 분명 모호해질 것이다.

- 두려워 마세요. 이 섬은 온갖 소리와 달콤한 공기에 싸여 있으니 오직 기쁨만 줄 뿐 해롭지 않습니다. 꿈속에서는 구름이 걷혀서 금방이라도 온갖 보물이 내게 쏟아질 듯합니다. 그래서 잠에서 깨어나면 다시 꿈나라로 돌아가고 싶어서 웁니다. (윌리엄 셰익스피어, <템페스트> 중)
- 아직도 가장 소중한 데이터를 제삼자에게 맡기는 것이 터무니없는 생 각이라고 여긴다면, 우리 대부분이 은행 금고와 같이 확실한 제삼자에 게 가장 소중한 물리적 소지품을 맡겨 보관하는 관행에 대해 생각해보 라. 게다가 주식은 증권회사에 맡기고, 비트코인은 인터넷에 맡긴다. 데 이터에 대해서만 그렇게 할 수 없는 이유는 무엇인가? 모든 데이터를 우 리와 같은 이해관계를 가진 신뢰할 만한 주체에게 맡길 수 있다면 우리 는 가장 강력한 인공지능의 도움을 받아 지속 가능한 행복을 찾을 수 있 으며, 더 이상 수많은 애플리케이션의 데이터 사용에 동의할지 말지를 생각할 필요도, 데이터 도난이나 오용에 대해 걱정할 필요도 없을 것이 다. 이 신뢰할 만한 주체가 자애로운 군주이든 오픈소스 코뮌이든 아니 면 분산형 블록체인 시스템이든, 신기술의 발전이 계속해서 우리의 데 이터를 더 안전하게 지켜줄 것이라 기대하면서 동시에 이 강력한 인공 지능이 주는 전례 없는 혜택을 누릴 수 있을 것이다.

- 꿈을 잃은 자는 길을 잃은 것이다. (호주 원주민 속담)












'IT' 카테고리의 다른 글

인공지능 파운데이션  (4) 2023.05.13
프로덕트 매니저는 무슨 일을 하고 있을까  (1) 2023.04.08
웹 3.0 사용설명서  (2) 2023.03.17
최소한의 IT언어  (2) 2023.02.24
비전공자도 이해할 수 있는 AI지식  (3) 2022.12.29
Posted by dalai
,