- 인터넷은 통신으로 연결된 네트워크인 웹상에서 어떤 데이터나 정 보를 전송하고 수령하는 기술인데, 대부분 5개 층위(layer)로 구성된 다. 최하위 하드웨어 레이어부터 하드웨어와 네트워크를 연결하는 링 크레이어, 인터넷 프로토콜(protocol)로 부르는 네트워크 레이어, 데이 터를 분할하고 다시 조합하는 통신 레이어, 이용자가 정보를 공유하고 메시지와 파일을 교환하는 최상위의 애플리케이션 레이어가 있다. 블록 체인 이전 인터넷이 서버-클라이언트 컴퓨터 구조에서 정보를 전달하 는 데 그쳤다면, 블록체인은 인터넷의 통신 레이어 위에 위치하여 정 보를 전달하는 기능 외에 다수 컴퓨터에서 정보를 저장하고 코드를 작동하게 하는 다양한 온라인 서비스 기능을 수행하게 해준다. 인터넷의 기술적 구조가 중앙화 기관의 서버와 그에 연결된 다수의 클라이언트 컴퓨터로 이루어진 것이라면 블록체인은 서버 없이 각 컴퓨터들이 노 드로 참여하여 서로 P2P (peer to peer)'로 연결된 것이 다른 점이다." 인터넷이 등장한 초기에 개인들이 정보의 자유를 무제한으로 누릴 것이라는 희망이 매우 컸다. 사이버상에서 개인은 국가의 통제없이, 국가 경계의 제한 없이 자유롭게 정보를 생성, 전파하는 자유를 가질 수 있게 될 것이라는 기대까지 형성되었다.
- 이더리움 창시자 비탈릭 부테린이 표현했듯이, 비트코인이 전화기 라면 이더리움은 스마트폰이라 할 수 있다. 스마트폰은 통화는 물론 각종 앱을 설치하여 이용할 수 있는 플랫폼이다. 비트코인이 기존 화 폐제도에 반발해서 나왔다면 이더리움은 비트코인의 바탕 위에서 사 회 · 경제를 구성하는 다양한 제도의 운영방식 개선 방안을 개발하면 서 나왔다.
- 스마트 컨트랙트와 자산이전의 혁신
비트코인은 송금과 수취 관련 거래만 기록하지만 이더리움은 튜링 완전(turing-complete) 언어인 솔리디티(Solidity)'를 이용하여 스마트 컨트랙트 기능까지 구현했다. 이는 컴퓨터 프로그램에서 어떤 조 건을 충족하면 자동으로 가상자산의 이전 등 어떤 거래를 발생 · 완결 시키는(코드가 if then의 문장형식으로 이루어짐) 작동체계를 의미한다. 스마트 컨트랙트는 대중이 거부감 없이 받아들이고 기억하기 쉽다 는 측면에서는 용어를 성공적으로 선택한 것으로 보인다. 하지만 엄 밀한 의미에서 여러 국가의 법체계상 계약의 정의에 포함되는지는 논 란이 있다.
『이더리움 백서』에서는 '블록체인상 토큰 시스템(on-blockchain token system)'이라는 용어를 사용해서 미국 달러, 금 등과 연동된 하 위화폐, 주식과 스마트자산, 인센티브로 지급하는 다양한 토큰을 거래하는 시스템이 쉽게 구현된다고 설명한다. 그 시스템의 핵심은 결 국 한 가지 작업을 수행하는 것인데, 그 작업은 A와 B가 토큰거래를 할 때 A 계좌에서 X개 토큰을 차감하고 그 차감한 X개 토큰을 B 계 좌로 지급한다는 논리다. 그렇게 처리하는 조건은 A가 거래 전에 X개 이상의 토큰을 보유하고 있고 이 거래를 승인하는 것이다.
스마트라는 말을 붙인 것은 의사능력이 있는 법적 주체인 개인이 나 법인이 일일이 계약의 조건과 내용을 합의하지 않고도 미리 정해 둔 소프트웨어 알고리즘으로 자산의 이전이나 블록체인 원장상 어떤 상태의 변화를 실행한다는 의미이다. 물론 참여자들은 실명으로 확 인되거나 실명의 당사자와 1:1로 연결될 필요는 없다. 법 체계하에서는 계약의 체결과 이행이 논리적·실무적으로 구분되는 데 비하여 스마트 컨트랙트에서는 계약의 체결과 이행이 동시에 일어나고 계약내 용에 하자가 있어도 이미 이행이 완료된 스마트 컨트랙트를 해제·해 지하거나 수정할 여지가 없다. 이더리움이 창안한 스마트 컨트랙트는 다양한 목적을 이루는 데 활용되고 또 더 널리 활용될 것이다. 하지만 전통적 의미의 계약을 스마트 컨트랙트로 구성하는 기술적 방법은 앞 으로 더 많은 연구가 필요하다.
- 전자지갑은 암호자산을 보관할 뿐 아니라 실물신분증 대신 개인의 암호화된 신원확인정보를 블록체인에 저장하고 그 정보를 필요에 따 라 검증하는 분산신원확인(DID) 시스템에서 신원확인정보를 통제하 는 프라이빗키도 보관할 수 있다. 전자지갑은 암호화폐 생태계에서 신원확인정보와 자산에 대한 접근권과 통제권을 행사하려면 반드시 필요한 기능이다.
전자지갑이 항상 인터넷에 연결되어 있어야 하는 것은 아니다. 인 터넷에 항상 연결된 핫월렛(hot wallet)에 개인키를 보관하는 경우, 전 자지갑 소유자는 언제라도 개인키를 사용하여 가상자산을 전송할 수 있다. USB메모리 같은 하드웨어 형태인 콜드월렛(cold wallet)에 개 인키를 보관하는 경우에는 지갑소유자가 필요할 때만 통신에 연결하 여 가상자산에 접속한 뒤 전송할 수 있다. 전자는 편리한 데 비하여 해 킹 등의 위험이 있고, 후자는 안전한 데 비하여 사용하기가 번거롭다.

- 페루의 경제학자 에르난도 데소토는 자본의 미스터리에서 자산 이 자본으로 전환되는 과정, 자본과 종이 문명의 관계에 대해 남다른 통찰을 보여준다. 그는 어떤 자산은 그 자체로 자본이 될 수 없으며, 자신이 가지는 경제적 잠재력을 부가적 생산활동에 활용할 수 있는 형태로 전환되어 고정된 상태를 자본으로 본다. 내 집 한 채는 그것이 지닌 경제적 잠재력을 자본으로 전환하기 전까지는 하나의 자산에 머 문다. 자본주의를 꽃피운 국가들은 집의 소유권과 거래제도를 법과 규정에 따라 확립하여 누구든 쉽게 그 집의 권리관계를 확인하고 그 집을 사고팔아 추가 생산활동에 활용하게 함으로써 자본화가 이루진 다는 것이다. 자본은 관념적으로 찾아내고 관리할 수 있어서 자본을 직접 만질 수 있게 하는 유일한 방법은 재산체제로 자산의 경제적 측 면을 종이에 기록해 특정한 소유주에게 귀착시킨다고 본다. 이에 비 추어보면 종이와 그 위에 기록된 재산체제는 자본주의를 발전시킨 핵 심의 하나라고 할 수 있다.
컴퓨터와 인터넷이 등장한 이후 수많은 권리와 지위를 표상하는 종 이와 종이 장부는 컴퓨터에 기재되어 디지털화(digitization)해 왔다. 하지만 그 예인 선불전자지급수단, 전자증권, 전자신분증은 기존의 종이로 작성된 중앙장부와 그 내용에 근거하여 발행된 실물형태의 화 폐, 주권, 신분증의 존재를 인정하되 그 실물종이의 내용만 디지털화 했을 뿐 실물을 발행하는 중앙화된 기관의 지위는 그대로 유지된다. 그러나 블록체인은 종이화폐, 실물신분증, 실물주권, 실물계약서를 사라지게 한다. 블록체인에 기록. 저장되는 데이터 자체가 그것들을 대체하게 되고, 이런 데이터가 복수의 장부에 분산 저장됨으로써 중 앙화된 기관 장부의 필요성과 효용도 없어지거나 축소될 수 있다. 블 록체인기술이야말로 이런 디지털 전환을 완성하고, 권리와 자산의 개 념에서 종이와 종이문명의 요소를 완전히 배제할 가능성을 보여준다.
- 국제기구들도 토큰경제가 글로벌 차원에서 확산될 가능성을 자주 언급하고 있다. 예를 들어 세계은행이 2022년 3월에 발표한 「세계 의 암호자산 활동, 진화와 거시적 금융 추동력(Crypto-assets Activity around the World, Evolution and Macro-Financial Drivers)」 보고서 에서는 각 국가들에서 암호자산 거래량의 변화는 주로 미국 장기 인 플레이션 예상, 미국 국채수익률, 금과 암호자산 가격에 따라 결정될 뿐 최근 각 국가 내부의 거시경제적 발전으로 영향을 받지는 않는다 고 분석하고, 암호자산은 국경 간 거래를 지원하는 잠재적 수단으로 점점 더 선호될 거라고 내다보았다. 앞으로 자산의 토큰화가 확대되면 실물자산에 기반한 토큰의 거래도 글로벌 플랫폼을 이용하여 여러나라에서 활성화될 것이다.
자산기반 토큰 중 증권의 성격을 갖는 토큰은 각 나라의 규제에 따 라 발행이나 유통에 대한 제한이 다른 비증권형 토큰에 비하여 더 부 과되겠지만 점진적으로 각 나라가 증권형 토큰 생태계의 발전 추이를 보면서 자본시장의 개방정책이나 규제 변화를 모색할 여지도 있다. 어쨌든 현재의 다양한 실물기반 경제적 거래가 토큰 기반으로 전환될 경우, 경제적 현상은 글로벌 블록체인 메인넷과 그 위의 다양한 탈중 앙화 앱에서 이루지면서 경제의 글로벌 동조화가 가속되고, 그에 따 라 각 국가들의 법체계에 대한 통일화 논의가 더 확대될 것이다.
- 이렇듯 앞으로 크립토사피엔스는 금융 분야는 물론 교육, 의료, 물 류 등 거의 모든 산업 분야에서 산업적 특성을 고려하여 블록체인 : 반 토큰경제의 이점과 인공지능의 장점을 적절히 결합해 나갈 것으로 예상된다.
챗GPT를 개발한 샘 알트만이 투자한 월드코인도 인공지능으로 인 한 문제를 블록체인기술로 해결하려고 한다. 월드코인은 인간과 인공 지능을 구분하고 인공지능으로 인한 일자리 손실을 상쇄할 수 있는 '보편적 기본소득(universal basic income)'을 제공하는 것을 목표로 한다. 인공지능이 널리 활용되면 온라인에서 거래하거나 발언하는 주 체가 진짜 사람인지 인공지능인지 구분할 필요성이 커질 수 있다. 이 때 사람은 지갑인 '월드 앱을 내려받아 휴대전화번호로 인증하면 '월 드ID'를 생성할 수 있고, 월드ID로 신원이 증명된 사람끼리 지갑을 통해 암호화폐를 교환할 수 있으며, 필요할 때마다 생성홍채인식으로 진짜 사람임을 인증(Proof of Personhood)할 수 있다. 보편적 기본소득은 사람으로 인증된 지갑에만 '월드코인' 토큰으로 지급한다는 것인데, 그로써 인공지능이 확산된 세상이 인간들 사이에 공평함을 유 지하는 데 일조한다는 비전을 내세운다.
현재까지 월드ID를 등록한 사람이 170만 명이며, 2024년에 월드코인을 발행할 예정이라고 한다. 인공지능의 급속한 확산을 기정사 실로 전제하고 인간의 고유한 정체성 확인과 최소한의 소득확보는 블 록체인 토큰과 지갑을 활용한다는 취지인데, 월드토큰의 발행과 배 분, 유통구조가 어떻게 구체화되는지 예의주시할 일이다.
- 만약 월드코인의 비전대로 진행된다면, 인공지능에 대응하는 의미 를 넘어서 많은 사람이 신원확인을 월드ID로 하고, 월드코인이 글로 벌 지급수단으로 널리 이용되어 탈중앙화, 개인정보보호 등이 제대로 구현되는 게 매우 중요한 이슈가 될 것이다. 리브라가 등장했지만 갑 작스럽게 전 세계인이 이용하는 글로벌 지급수단이 되고 금융플랫폼 이 되는 데 대한 미국 정부의 우려와 거버넌스의 탈중앙성이 처음부 터 확보되지 못한 점 등이 원인이 되어 좌초된 점을 교훈으로 삼아야 한다. 크립토사피엔스가 산업과 기술뿐 아니라 인공지능의 확산으로 인한 인간의 문제 해결을 고민하고 주도하는 한 인공지능을 장착한 호모 데우스가 인류를 지배하는 일은 하나의 기우로 끝날 수 있다.
- 기존 증권의 토큰화 현상이 더 가시화되고 확대될 경우 현재의 자본시장은 폭발적으로 성장할 수 있다는 예상이 나온다. 글로벌 컨설팅 회사 PwC(PricewaterhouseCoopers) 독일은 이렇게 발전할 자본 시장의 단계를 '자본시장 3.0'으로 정의했다. 자본시장의 발전 단계 를 자본시장 1.0, 2.0과 3.0으로 구분하는데, 각 단계는 시기와 구조 측면에서 Web1.0부터 3.0까지의 단계에 각각 대응된다는 흥미로운 분석이다.
자본시장 1.0은 글로벌 금융위기가 발생한 2007년까지로, 대형 투 자금융기관과 대규모 자본시장이 일방적인 시장지배력을 갖고 자금조달자의 수요에 맞춤형으로 설계했지만 그들이 이해하기는 힘든 상 품으로 금융기관이 큰 이익을 본 단계다. 자본시장 2.0에서는 금융상 품이 정형화 · 디지털화되어 거래와 결제까지 자동으로 이루어지는 상 품들이 늘어난 단계다. 소비자들의 참여는 늘었으나 소비자들이 금융 상품설계에 협업을 하지는 않는 단계다. 자본시장 3.0은 특정한 중앙 화 주체 없이도 탈중앙화된 금융 위주로 성장한다는 것이다. 앞으로 기존의 증권이 토큰화되는 데 추가하여 증권형 토큰을 디파이 플랫폼 에서 대여하고 차입하는 것을 활성화하거나 증권형 토큰의 기초자산 이 있는 경우 그 자산을 수익성 높게 운용하는 방안 등이 결부되면 증 권형 토큰으로 인한 자본시장의 혁신효과가 훨씬 크게 나타날 것이다.

- PwC는 또한 다음 세 가지 예측을 제시했다.
첫째, 자본시장 3.0의 핵심 전망은 자산의 토큰화로 현재의 많은 비 유동성 자산을 유동화할 수 있고, 자본시장에 참여하지 않는 여러 국 가와 계층의 사람들이 추가로 자본시장에 참여할 수 있다는 것이다. 2030년까지 지금은 유동화되지 않은 부동산, 데이터, 지적재산권 등 의 자산이 토큰화되어 유동화될 것으로 추산되는 자산규모가 1조 6,000억 달러(한화 약 2경 원)라는 놀라운 금액이다. 자본시장이 존재 하는 이유는 사람들을 유동성과 연결하는 것이고 토큰화로 자본시장 이 더 발전할 거라고 보기 때문이다.
둘째, 탈중앙화거래소(DEX)의 큰 성장이 예상되는데, 현재 전체 가상자산거래소의 거래대금 중 탈중앙화거래소에서 거래되는 금액은 전체의 10%인 100억 달러 정도에 불과하기 때문이라고 본다.
셋째, 많은 증권형 토큰이 NFT로 발행되고 NFT 커뮤니티의 발전 이 예상되는데, NFT가 2021년 말 이후 쇠퇴 중이나 곧 이전 NFT 시 가총액의 최고액인 총가액 20억 달러를 갱신할 것이라고 예측한다. 블록체인의 기술력만으로 자본시장 3.0이 발전할 수 없으므로 더 많은 사람을 교육하여 이해를 넓힘으로써 많이 사용하도록 해야 하 고, 현재의 중앙화금융(CeFi)시스템을 이용해 디파이에 접근할 통로 를 제공하는 것도 중요하다고 강조한다.

- 토큰을 거래에서 지급결제수단으로 쓰면 결제의 신속함, 낮은 수수 료, 국제간 결제의 편리함이라는 효용을 누릴 수 있다. 비트코인은 송 금 거래 블록이 형성되는데 10분이나 걸려서 수많은 거래를 실시간 으로 기록하기 힘들므로 일상적 재화와 용역대금의 직접적 지급결제 수단으로 널리 이용되지 못하고 있다.
그러나 몇 년 사이에 토큰을 다양한 형태의 지급결제수단으로 쓰 는 수요가 늘어서 머지않아 토큰결제가 일상화될 가능성이 커지고 있 다. 우선 카드사들이 기존 카드결제에 다양한 형태로 토큰을 결합해 나갈 것이다. 결제업의 대표주자인 비자와 마스터카드사가 입맞추어 '앞으로 3~5년이면 토큰이 지배적 지급결제수단이 될 터여서 자신 들이 그 흐름에서 뒤처지고 싶지 않다고 밝혔다. 흥미롭게도 카드사 들이 이런 변화를 꾀하는 가장 큰 원동력은 카드사 고객들이 점점 더 토큰으로 대금지급결제를 희망한다는 사실이다. 즉 고객들은 이왕이면 믿을 만한 대형 카드사들이 토큰으로 대금지급결제를 해주기를 원 한다는 분석이 나왔다. 지급결제수단인 토큰 자체는 탈중앙화된 플랫 폼에서 발행되더라도, 토큰을 이용한 결제대행업은 기존 관념의 신뢰 를 받는 중앙화된 회사가 담당해 주기를 일반 소비자가 원한다는 데 서 대중은 상황에 따라 탈중앙화와 중앙화 구조를 교차로 원할 수도 있다는 사실을 알 수 있다.
현재 비자와 마스터카드가 토큰으로 결제하는 구조는 제3의 핀테 크회사와 협업하는 방식이다. 이용자가 카드를 이용하여 크립토 토큰 단위로 결제하면, 협업하는 팍소스가 뒷단에서 크립토를 매입해 현금화한 다음 가맹점에 현금으로 대금을 정산해 주는 구조이다. 그러나 장기적으로 카드회사는 직접 카드 이용자로부터 크립토를 받아서 가 맹점에 정산해 주는 구조를 꿈꾸고 있다. 현재 쓰이는 직불카드(debit card)가 은행잔고 범위 내에서 사용되는 것처럼 전자지갑 계좌에 보 관 중인 토큰 범위 내에서 결제하는 방식이다. 그것이 현실화되면 수 십 년간 법정화폐에 연계된 대금결제시스템에 엄청난 변혁이 발생하 게 된다.
그러나 불확실성도 있다. 크립토 토큰이 해킹당하거나 크립토 토큰 의 플랫폼 운영상 하자 같은 보안사고에 대한 방지책이 필요하다. 규 제당국의 관점에서는 지급결제회사가 대량의 토큰으로 결제대행을 하려면 만약의 사태에 대비하여 지급된 토큰에 상응하는 준비금이나 담보금이 필요한지 검토도 해야 한다. 가맹점에서는 궁극적으로 카드 사 개입을 배제하고 토큰을 바로 대금으로 받기를 희망할 수도 있는 데, 카드사에 지급하는 수수료를 절약할 수는 있지만 어떤 리스크를 안게 될지에 대한 분석도 필요해진다.
페이팔도 2021년 블록체인 플랫폼인 소스와 협업해 토큰 지급 을 허용했다. 이용자가 팍소스 플랫폼 위에 전자지갑을 개설해 토큰 을 보유한 상태에서 가맹점에서 물건을 사면서 페이팔 앱에서 비트 코인 등 암호자산을 지급수단으로 선택해 지급하면 된다. 그러면 팍소스 트러스트(Paxos Trust)가 그 암호자산을 받아 법정화폐로 환전해 가맹점에 정산·지급하는 결제시스템이다. 페이팔은 뉴욕주에서 가상자산 매매, 송금, 결제업을 하는 것과 관련해 비트 라이선스(Bit License)를 취득했으며, 이와 같은 결제대행을 금지하거나 제한하는 다른 규제는 없다.
비자는 스테이블코인을 이용해 결제하는 방법을 준비하고 있다. 우 선 이용자가 스테이블코인으로 대금을 지급하면 비자가 법정통화로 환전해 가맹점에 정산 지급하는 구조인데, 장기적으로는 이용자, 비 자, 가맹점 사이에 스테이블코인으로 지급·결제하는 구조도 고려하 고 있다. 아직 대부분 미국 은행은 토큰 가격의 변동성을 이유로 자신 들이 발급한 카드로 고객들이 토큰을 사는 것을 허용하지 않는다.
- 한국에서도 비트코인 같은 토큰을 결제수단으로 가게에 직접 지급 하고 가게에서 그를 수령하는 데는 별다른 금지나 제한을 하지 않았 다. 그러나 물건 구매자와 가게 사이에 직접 지급수단으로 사용하는 것을 넘어 제3자가 토큰을 이용해 지급결제대행업을 하거나 선불전 자지급수단 발행, 관리업 등록을 한 회사가 토큰을 선불전자지급수단 의 충전수단으로 활용하는 데는 제동을 걸고 있다.
다날이 스위스에 설립한 자회사 페이프로토콜은 스위스에서 페이코 인을 발행해 지급수단으로 쓰려는 구조를 만들었다. 페이프로토콜은 페이코인을 한국의 몇몇 거래소에 상장하고, 페이코인으로 결제가 가 능한 레스토랑, 편의점 등 수십 개의 가맹점을 모은 후 이용자들이 가맹점에서 물건이나 음식을 산 다음, 페이코인으로 다날 앱에서 지급하 면 다날이 지급된 페이코인을 받는 대신 가맹점에 현금으로 대금을 정 산해 주는 구조였다. 다날은 지급받은 페이코인을 일정 주기별로 다날 핀테크에 매도해 대금을 수령했다. 다날은 전자금융거래법상 선불전 자지급수단 발행·관리업과 지급결제대행업 등록을 이미 한 상태였다. 이런 구조가 나오자 금융위에서는 다날이 토큰으로 선불전자지급 수단을 충전하는 데 부정적인 태도를 보였고, 다날 자회사가 발행한 토큰으로 대금을 지급하는 것을 다날이 지급결제를 대행하는 데도 일 반 이용자에게 위험을 줄 수 있다는 이유로 허용하지 않겠다고 했다. 계열사가 발행한 토큰을 다른 계열사가 지급결제수단으로 사용하도 록 지급결제대행업을 하면 실질적으로 아무런 제한없이 화폐를 발행해 엄청난 주조차익(발행화폐의 액면가액에서 발행비용을 공제한 금액 상당 의 이익을 발행자가 취함)을 차지하는 문제점이 있고, 암호자산거래소에 서 발행사가 임의로 언제나 많은 수량을 매각하게 됨으로써 토큰 보 유자에게 예측할 수 없는 큰 손해를 줄 수 있다는 점이 주된 이유였다. 엄격한 의미에서 토큰을 선불전자지급수단의 충전수단으로 허용할 수 없다는 것과 토큰으로 지급결제대행을 해서는 안 된다는 것도 법 률에 명백하게 규정되어 있다고 보기 어려운데도 국가는 토큰을 지급 결제업에 이용하는 것이 예측하지 못한 위험을 가져올 수 있다는 이 유를 내세워 토큰을 지급결제수단으로 사용하지 못하도록 정책적으 로 제한하고 있다.

- Web3.0의 개념은 아직 명확하게 정립되어 있다고 하기 어려우며, 이 용어를 쓰는 사람이나 맥락에 따라 매우 다양한 의미를 나타낸다. 실리콘밸리의 벤처캐피털 앤드리슨 호로위츠의 총괄파트너 크리스딕슨이 '사용자와 생산자가 토큰을 기반으로 공동소유하는 인터넷'이 라고 한 표현에 비교적 함축된 의미가 들어 있다. 이더리움 공동 개발 자 개빈 우드는 Web3.0을 '애플리케이션 제작자들이 쉽게 개발하도 록 돕는 프로토콜의 묶음'으로 프로토콜은 컴퓨터 사이에 데이터를 교환하는 방식을 정의하는 표준화된 규칙과 절차를 의미한다고 한다. 여기서는 개념을 가능한 한 넓게 정의하고자 한다. 우선 웹기술 측 면에서는 컴퓨터가 웹페이지에 담긴 내용을 맥락에 따라 이해하고 개 인 맞춤형 정보를 제공하는 시맨틱 웹기술 또는 지능형 웹기술을 도 입하여 Web3.0 이 시작되었다. Web2.0 에서는 플랫폼 운영자가 컴 퓨팅, 저장공간, 호스팅 등 모든 웹 관련 서비스를 제공한 데 반해 Web3.0 에서는 프로토콜이 그런 서비스를 대체한다.
- 인터넷 플랫폼과 앱의 운영권한과 생성된 데이터의 소유권을 누가 갖는지를 기준으로 보면 플랫폼 운영자가 독점하는 구조에서 벗어나 사용자들에게 권한 권리 · 이익을 나눠주려는 방향성과 실행방안이 Web3.0 의 요소를 구성한다고 할 수 있다. 우선 Web3.0은 플랫폼의 지배구조, 수익배분, 데이터 통제권에서 Web2.0과 달리 탈중앙화와 오픈 플랫폼을 지향한다. 이용자는 읽고 써서 기여함으로써 보상을 받고 플랫폼을 일부 소유해 플랫폼 수익도 분배받는다. 플랫폼을 이 용하거나 그에 기여하는 개인의 데이터는 개인이 소유하며, 개인정보 는 해당 개인이 통제할 수 있다(read, write, open&own). 이 요소들이 Web3.0 이 추구하는 본질적 가치이다. Web3.0은 인터넷과 모바일 시대에 큰 역할을 한 플랫폼 경제구조의 한계점을 개선하려는 큰 목 표 아래 Web2.0 구조하의 이용자와 공급자의 엄격한 구분과 수익의 집중현상을 해결하고 그동안 단순히 이용자 지위에만 머물러 온 개인 들에게 운영자·수익자의 지위를 겸하게 하도록 변화를 꾀하자는 사 회 · 경제 · 문화적 현상이라고 할 수 있다.

- 웹3.0과 블록체인의 결합
Web3.0 이 추구하는 가치와 방향성을 구현하려는 다양한 방법 과 기술을 모색하는 과정에서 많은 사람이 블록체인기술과 블록체 인 기반 서비스가 필요하다는 사실을 절감하면서 Web3.0 과 블록체 인은 필연적으로 그리고 전방위적으로 결합되었다. Web3.0 을 블록 체인과 거의 같은 개념으로 쓰는 사람들도 있으나 위에서 보았듯이 Web3.0 은 인터넷의 변화에 따른 사회 · 경제 · 문화 · 정치적 변화를 모 두 포괄하는 데 쓰이지만 블록체인과 암호자산, 토큰경제는 그 변화를 가능케 하는 필수불가결한 기술이자 체계라는 점에서 차이가 있다.'

- 기존 ID체계의 문제점과 DID의 필요성을 인식하여 신분증 체계를 블록체인 기반 DID 방식으로 바꾸려는 시도가 늘고 있다. 모 든 분야의 디지털화가 폭넓게 진행되고 있는 현실에서 신분증의 발급 및 신원확인도 그에 맞추어 디지털 방식으로 변경되는 것은 자연스러 운 현상인 것 같다. 민간에서 DID체계 개발과 확산을 위한 연합프로 젝트들이 진행되고 있다. 블록체인 기술회사인 아이콘루프가 주도하 는 마이아이디(MyID)와 SK텔레콤과 다른 통신사들이 공동으로 진행하는 이니셜, 보안기업 라온시큐어가 주도하는 DID얼라이언스 등이 있다. DID는 발급기관(예를 들어 경찰청장)이 어느 개인이 본인인지 확 인한 후 전자적 형태의 암호화된 ID (예를 들어, 운전면허상 신원정보)를 그 개인의 스마트폰으로 발급하고, 개인은 이를 스마트폰에 저장한 후 ID 발급 내역은 신원검증 블록체인에 저장해 두었다가 누가 신원 확인 · 검증을 요청하면 블록체인을 통해 ID를 검증해 주는 시스템이 다. 위 이미지가 DID 작동구조의 핵심을 잘 보여준다.
기존의 중앙화된 신분증 발급·관리체계와 달리 발급기관이 독점적 으로 관리하던 신분증 대장이나 서버 대신 다수 당사자가 노드로 참 여하는 블록체인에 신분확인 관련 정보를 저장하고 이용자가 필요할 때마다 정보의 진위를 검증해 주는 시스템이다. DID체계가 작동되기 위해서는 신원확인정보 발급기관 외에 검증인과 블록체인의 노드가 필요하다. 발급기관은 해당 개인이 본인이라는 대면확인 등 엄격한 절차를 거쳐 신원확인정보, 즉 이름, 주민등록번호, 여권번호, 운전면 허증 번호 같은 신분증 발급번호와 주소 등을 확인한 후 그 정보를 암 호화해서 검증가능신원확인정보(VC, Verifiable Claims)로 만들어 개 인 휴대전화로 발급 · 전달하고, 블록체인에는 그 VC 발급사실과 내역 을 기록한다.
개인은 발급받은 VC를 자기 휴대전화에 저장한 뒤 신원확인 또는 자격확인을 위해 필요하다고 판단할 때만 저장된 VC 전부 또는 일부를 개인키로 전자서명을 해서 검증가능제공정보(VP, Verifiable Presen- tation)로 만들어 신원확인 검증인에게 제출하고, 검증인은 블록체인에 진위검증과 신원확인 요청을 해서 확인받는다. 이를 단순화하면 DID 체계에서의 주요 당사자와 정보/데이터의 흐름은 다음 도표와 같다." DID 신분증 발행인이 이용자의 스마트폰으로 암호화된 VC를 발행 해 주고, 이용자는 공적 또는 사적으로 신원이나 자격확인을 해야 할 필요성이 있을 때마다 VC 중 필요한 범위 내의 VP를 검증인에 제출 하여 검증받는다. 검증인은 블록체인에 저장된 이용자의 신원확인정 보 및 VC 발급내역정보와 VP를 대조하여 동일인의 것인지 검증한다. 술집에서 고객을 받을 때 확인하려는 정보는 성인 여부다. 그런데도 실물신분증을 갖고 술집에 들어갈 때 신분증에 기재된 모든 정보를 보여주어야 하지만, DID에서는 전체 신원확인정보인 VC 중 나이 정보만 VP로 제공하면 되는 이점이 있다.
여기서도 전자지갑은 필수적이다. 이용자가 스마트폰의 전자지갑 에 개인키를 보관하고 있다가 VP를 개인키로 전자서명하여 검증기관 에 제공하면, 검증인은 그의 공개키를 이용하여 그 이용자의 VP임을 확인할 수 있다.
이때 신원확인정보의 저장과 확인은 개인의 스마트폰에 내려받은 앱으로 하게 되며, 이러한 앱서비스는 분산신원확인이 지향하는 탈중앙화 정신의 취지에 따라 정부뿐 아니라 민간회사도 제공할 수 있다. 위와 같이 신원확인정보를 저장하고 진위검증과 신원확인을 하는 구체적인 기술적 구조는 설계하기에 따라 다를 수 있다.
현재 행정안전부도 정부가 발행하는 주민등록증, 운전면허증, 여권, 장애인증명 등 각종 신분증을 DID 형태로 발급하고 필요할 때 ID를 검증해 주는 분산신원증명 블록체인 플랫폼을 계획하고 있다. 필자는
- 2021년 정부는 여기서 말하는 DID 에 해당하지는 않지만, 시범적 으로 모바일 운전면허증 서비스를 시작했다. 스마트폰의 패스(PASS) 앱에서 본인인증이 된 사람이 실물 운전면허증의 사진을 찍어 제출하 면 면허증과 같이 생긴 모바일 운전면허증이 발급되며, 필요할 때 QR 코드 또는 바코드 형태로 제시할 수 있다. 그러나 이러한 모바일 운전 면허증은 엄격한 의미에서 신원증명 ID의 발급에 관한 정보를 블록체인 분산원장에 저장하고 요청이 있을 때마다 ID를 검증해 주는 체 계는 아니다.
PASS 앱에서 보여지는 운전면허증 이미지를 보여줌으로써 운전면 허증 제시와 같은 효력을 부여하는 것으로, 규제 샌드박스를 이용해 한시적으로 허용하는 서비스이다. PASS 앱에서 보여지는 운전면허증 이 실물운전면허증과 같은 효력을 가지는 것은 아니다.
정부가 발급하는 신분증 중에서는 역시 운전면허증을 가장 먼저 블 록체인 기반으로 발행하기 시작하였다. 2022년부터 블록체인 기술에 기반한 모바일 운전면허증을 발급하였다. 이름, 주민등록번호, 주소, 사진 등 운전면허증 정보를 개인의 휴대폰에 저장한 후, 개인이 필요한 경우에 필요한 범위의 정보만 제공할 수 있는 방식으로, 실물 운전면허증과 동일한 법적 효력을 부여하고 있다. 모바일에 발급, 저장된 정보와 블록체인에 저장된 정보를 검증하는 절차와 기술적 구조에 대 해서 자세하게 알려져 있지는 않다.
2023년 6월 행정안전부는 실물 주민등록증을 대체하는 모바일 주 민등록증을 발급할 수 있는 법률안을 만들었다. 아직 구체적인 발급 구조와 기술적 내용은 알려지지 않았지만, 탈중앙화 정신을 반영하여 주민등록증 정보를 암호화해서 개인의 휴대폰에 저장하고, 개인이 허 용할 때에만 다른 사람이 정보를 열람하거나 이용할 수 있도록 하는 구조로 보도되었다.

- 불완전한 또는 위장된 탈중앙화
탈중앙화는 블록체인기술의 핵심이지만 실제로 블록체인 합의 알 고리즘을 운영할 때 탈중앙화가 제대로 구현되지 못하는 경우가 있 다. 탈중앙화를 구현할 의사 없이 탈중앙화의 외관만 가지는 가장된 탈중앙화나 탈중앙화를 의도했으나 기술적·운영적 이유로 제대로 구 현하지 못하는 불완전한 탈중앙화가 나오는 이유는 블록체인을 운영 하는 인간의 양면성 때문이라고 본다.
- 탈중앙화를 내세우는 블록체인 프로젝트가 얼마나 명실상부하게 탈중앙화를 구현하는가? 사실 탈중앙화금융 플랫폼도 완벽하게 모든 과정을 탈중앙화하지 못하고 있다. 예를 들어 이더리움 기반의 합성 자산을 발행하고 거래하는 탈중앙화 합성자산신세틱스 플랫폼에서 는 시스템의 기능 일부분, 즉 다른 서버에 있는 파일, 데이터 등의 데 이터를 찾아 가져오는 프록시 (proxy)기능은 중앙화된 주체가 담당한 다고 공개했다. DAO도 초기 코어팀이 프로토콜을 개발하고 거버넌 스 구조를 정할 때 초기 코어팀에게 투표권이나 의안 제안권을 더 비 중 있게 부여하거나 실질적인 혜택을 제공하는 구조가 될 수도 있다.
- 각종 블록체인 플랫폼에 외부 정보를 취합하여 제공해 주는 오라클도 현재 주로 중앙화된 주체가 수행하는 모델인데, 더 높은 신뢰를 얻기 위하여 점진적으로 탈중앙화 방식으로 전환하려고 한다.
- 실제 ICO나 토큰판매계약(token sale agreement), 장래토큰판매계 약(simple agreement of future token)의 실태를 보면, 발행자 이익에 너무 치중하며 토큰 구매자나 투자자 입장은 거의 보호하지 않는 구 조가 많다. 지금까지 본 여러 분야의 다양한 계약 유형 중 당사자 간 의 이해관계조정에서 가장 편향적인 계약이었고, 한쪽 당사자인 매도 인에게 일방적으로 유리한 계약이었다. 예를 들면 토큰 개발이 실패 로 끝나도, 토큰 개발기간이 아무리 늦추어져도, 토큰에 기술적 하자 가 있어도 매수인은 매도인에게 일절 책임을 물을 수 없게 되어 있다. 이같이 계약 당사자 사이에서 협상력이 현격하게 기울어진 이유는 어떻게 하든 토큰을 매수하겠다는 열기가 뜨겁고 묻지 마 투자가 확산되다 보니 매매계약에서 일반적 · 통상적으로 매수인이 자신의 정당한 이익을 보호받고자 규정을 넣어달라고 요청하지 않았거나 요청할 수 없는 상황이 되었기 때문이다. 또 자유경제시장에서 자산매매에 대한 오랜 거래에서 관행으로 확립되어 온 정형적으로 채택하는 계약 서의 구조와 조항도 거의 무시당했다.
토큰이 여러 노드의 동등한 의결권과 지위를 근간으로 하는 탈중앙 화 구조에서 생성되었지만 막상 토큰 판매계약의 구조는 지극히 불공 평하거나 불공정하다는 현실이 아이러니하게 느껴졌다. 탈중앙화를 남들에게 명분과 구호로 내세우기는 쉽지만 이를 제대로 이해하고 실 용화하는 데는 많은 연구와 시행착오를 거쳐야 한다. 어쨌든 2018년 을 지나면서 ICO의 열기는 가라앉았고, 따라서 판매자 이익만 주로 고려한 계약서 양식도 쓰이는 일이 급격히 줄어들었다.

- 테라는 앵커프로토콜에서 테라 예금자에게 20% 가까운 이자를 지 급한 후 테라 수요가 급격히 증가하고 그에 따라 루나 수요도 증가하 면서 가격이 올랐다. 여기서 문제는 20% 가까운 이자율이 지속가능 했느냐 또는 지속가능하지 않음을 충분히 알면서도 의도적으로 플랫 폼 이용자들을 속이려 했다고 볼 수 있느냐다. 테라 프로토콜이 언제 든 1달러 상당의 루나와 테라를 교환해 줌으로써 테라 가격을 1달러 에 수렴하는 알고리즘을 만들었지만, 테라폼랩스는 알고리즘만으로 는 테라 가격이 유지되지 못하고 테라 가격과 루나 가격이 동시에 떨 어질 상황에 대비해 테라를 매입할 자금을 확보했다. 루나 파운데이션 가드(Lunar Foundation Guard)라는 비영리재단을 설립하고 10억달러의 재원을 확보해 비트코인을 매입한 것이다.
그러나 결과적으로 테라 가격 붕괴 시 급락을 막으려 비트코인을 팔아 테라를 매입하는 과정에서 오히려 비트코인 가격까지 급락하 는 충격을 가져왔을 뿐 테라 가격 방어에는 성공하지 못했다. 그럼에 도 위와 같이 상당한 양의 비트코인을 확보했다가 실제로 테라 가격을 방어하고자 비트코인을 매각해 테라를 매입한 사실은 테라 가격을 1달러에 유지하려 한 데 진정성이 있었음을 뒷받침한다. 다만, 그런 조치만으로는 실제로 테라 가격을 유지하기에 불충분했다. 이런 점들 을 종합적으로 보면, 테라의 탈중앙화 구조는 설계자가 1달러 연동이 불가능한 점을 알고도 악의로 투자자들에게 연동이 가능하다고 거짓 말한 것이 아니라 불완전한 설계와 작동에 가깝다고 판단된다.
유발 하라리는 호모 데우스」에서, 인간의 도덕적 통제 없이 블록 체인기술이 발전하면 많은 사회적 기능이 블록체인 코드로 대체되고, 결과적으로 소수가 코드를 통제하거나 지배할 위험성이 있다고 지적 했다. 블록체인이 확산된 결과가 탈중앙화 정신을 제대로 살리지 못하는 정도가 아니라 탈중앙화를 추구한 블록체인이 많은 것을 코드화 · 프로토콜화하는 과정에서 오히려 누군가가 코드와 프로토콜의 개 발과 운영을 장악하고 통제할 우려까지 있다는 의미로, 탈중앙화 논 쟁에서 새겨볼 만한 대목이다.
불완전한 탈중앙화 블록체인 플랫폼에서 실제로 통제권이나 영향 력이 있는 사람들이 프로토콜의 구조와 작동의 오류에 책임을 부담 해 프로토콜 붕괴, 비정상적 작동, 백서 기재와는 다른 오작동 등으로 손해를 입은 자들에게 배상책임을 져야 한다는 법적 주장이 대두되고 있다. 이런 논의는 나라별로 전개과정이 다르고 법제화 여부와 정도 도 다를 수 있지만, 탈중앙화 블록체인을 정확히 인식하고 신뢰를 제고하려면 불완전하거나 무늬만 탈중앙화된 플랫폼에서 발생하는 사고와 문제점에 누군가는 책임지는 방향으로 정립되어야 한다.



'IT' 카테고리의 다른 글

챗 GPT전쟁  (1) 2023.12.26
챗 GPT 거대한 전환  (1) 2023.12.24
오늘날 우리는 컴퓨터라 부른다  (2) 2023.12.07
박태웅의 AI강의  (1) 2023.12.05
로봇의 지배  (0) 2023.08.14
Posted by dalai
,

챗 GPT전쟁

IT 2023. 12. 26. 20:06

- 버너스리는 미래의 웹은 시맨틱 웹Semantic Web이 될 것이라고 2001년 전망한 바 있다. 시맨틱은 '의미론적인'이라는 뜻이다. 무수히 많은 정보의 홍수 속에서 불필요한 정보를 걷어내고 사 용자에게 꼭 맞는 정보를 제시해야 한다는 것이었다.
모두가 손쉽게 이용하는 범용성을 갖추면서도 나에게 꼭 맞 는 정보를 골라 볼 수 있다는 점에서 개인화된 특징을 모두 갖 고 있는 웹은 기술적으로는 구현하기 어려워 보였다. 하지만 챗GPT가 등장하면서 많은 이가 웹의 변화를 목격하고 있다. 마이크로소프트가 챗GPT를 업데이트해 자사의 검색엔진인 빙Bing에 탑재했으며, 구글 역시 새로운 인공지능 검색엔진의 도입을 서두르고 있다. 생성형 인공지능의 등장으로 모든 이의 예상을 깨고 웹3.0의 서막이 서서히 올라가고 있는 것이다.

- "스스로 학습할 수 있는 인공신경망은 훗날 인간의 두뇌처럼 사고하고, 다른 행성에 보내져 우주탐사 활동에도 쓰일 것이다.” (프랭크 로젠블랫)
- 20세기에 접어들자 수학자들은 모든 논리를 수학으로 증명 할 수 있으리라 믿었다. 영국의 철학자이자 수학자인 버트런드 러셀 Bertrand Russell 과 앨프리드 화이트헤드Alfred Whitehead는 《수학 원리 Principia Mathematica》를 통해 언어 중심의 논리학에 종지부를 찍었다. 이들은 모든 명제는 수학적 형식으로 증명할 수 있다 고 믿었다. 이 책은 훗날 등장할 수많은 학자에게 큰 영향을 주 었으며, 이를 반박하고 재반박하는 과정을 통해 컴퓨터과학은 크게 발전한다.
- 수학이 논리학을 대신할 것이라는 생각에 도전한 이는 독일 의 수학자 쿠르트 괴델 Kurt Gödel이었다. 그는 1931년 《수학 원리》와 관련 체계들의 형식적으로 불가능한 명제들에 관하여> 라는 논문을 발표하면서 학계의 시선을 사로잡았다. 러셀과 화이트헤드는 수학적으로 풀 수 없는 논리란 존재하지 않는다고 선언했지만, 괴델은 아무리 완벽한 논리 체계를 만들더라도 참 인지 거짓인지 판단할 수 없는 명제는 반드시 존재한다는 사실 을 수학적으로 입증했다.
- 폰노이만은 최초의 프로그램 내장 방식 컴퓨터인 에드박 EDVAC 개발에 참여해 오늘날 컴퓨터와 같은 입력, 제어, 산술 및 논리, 기억, 출력 장치라는 방식을 고안한다. 새로운 프로그램 을 구동하기 위해 하드웨어를 통째로 바꾸는 번거로움이 사라 진 것이다. 핵심은 중앙처리장치 CPU 옆에 기억장치를 붙인 것 인데, 필요한 자료를 기억장치에 저장한 뒤 사람이 지시하는 명령에 따라 해당 작업을 차례로 불러내는 방식이었다.
폰노이만 구조는 현대적 컴퓨터 구조라는 점에서 큰 의의가 있지만 중요한 과제를 남겼다. 폰노이만이 이러한 방식을 고안할 때 참고한 것은 인간의 사고 능력이었다. 사람은 평상시 모 든 기억을 항상 떠올리고 살진 않지만 특정 기억이 필요한 경 우 머리를 짜내 기억을 되살린다. 메모리에 보관된 데이터를 필요시 CPU에 불러내 사용한다는 아이디어는 사람을 모사한 장치였다.
하지만 폰노이만 구조는 기계적으로 하나씩 순차적으로 불 러내야 한다는 점에서 막대한 데이터를 처리해야 하는 인공지능 연산에서는 적합하지 않았다. 연산할 숫자의 자릿수가 증가할 때마다 계산에 필요한 시간은 기하급수로 증가한다. 10의 13 자릿수를 계산할 때 10초가 걸린다면 10의 20자릿수는 그 1000만 배인 1억 초(약 3년)가 소요된다.
생각이 틀을 규정하기도 하지만, 틀이 생각을 규정하기도 한 다. 컴퓨터과학계에서 상징과 기호 효율을 중시하는 기호주의 학자들이 인간의 두뇌를 닮은 연결주의 인공지능이 실패할 수 밖에 없다고 믿었던 이유도 폰노이만 구조 때문이었다.
- 두뇌의 작동원리를 모방하다
오늘날의 인공지능과 유사한 인공신경망을 지닌 최초의 알고리즘은 연결주의의 중심인물인 프랭크 로젠블랫이 만든 퍼 셉트론Perceptron이다.  인공지능이 신경망 neural network으로 도약 을 준비하는 순간이었다. 로젠블랫은 뉴욕 주에 있는 코넬항공 연구소에서 인지시스템 부문 책임자로 활동하면서 1957년 퍼 셉트론이라는 인공신경망 시스템을 발표했다.
- 로젠블랫이 모방하고자 했던 것은 두뇌의 작동원리였다. 그는 생물학적 시스템이 실제로 어떻게 정보를 감지하는지, 정보 는 어떤 형태로 저장이 되는지, 저장된 정보는 우리 인식에 어 떤 영향을 주는지를 깊이 연구했다. 당시 신경망의 작동 방식 은 여전히 미지의 세계였다.
학계에서는 오직 두 가지 가설만이 존재했다. 첫 번째는 신 경망으로 들어오는 신호를 저장하는 별도의 기억장치가 존재 한다는 학설, 두 번째는 신경망에 있는 연결 자체가 신호를 저 장한다는 학설이었다. 퍼셉트론은 후자를 입증하기 위한 일종 의 도전적 실험이었다.
- 이해를 돕기 위해 우리가 컵을 인식하는 방법을 떠올려보자. 이 세상에는 수많은 컵이 존재한다. 하지만 인간은 컵의 모양 이 다르더라도 0.1초 내에 이것이 컵인지 아닌지를 식별할 수 있다. 망막에 상이 맺히면 그 정보는 우리 뇌에 있는 뉴런으로 이동한다. 신경세포인 뉴런이 모인 것이 대뇌피질이다.
뉴런은 정보의 강도에 따라 활성화되거나 비활성화된다. 뉴 런이 활성화되려면 일정한 자극, 즉 임계치 이상의 자극을 받 아야 한다. 활성화된 뉴런은 통로인 시냅스를 통해 결과값을 다른 뉴런으로 전달하고, 궁극적으로는 최상위에 있는 추상화 뉴런에 전달한다. 이 뉴런이 종합적으로 판별해 순식간에 컵인지 아닌지를 판단하는 것이다.
퍼셉트론은 인간의 뇌가 이러한 논리로 작동할 것이라는 가 설을 토대로 설계되었다. 단일 뉴런을 갖춘 인공신경망으로 시 각에 해당하는 인풋 노드(인풋 층)가 있고 여기에 들어온 정보 를 한 개의 뉴런에 해당하는 인풋 유닛에 전달한다. 인풋 유닛 은 패턴을 분류하고 그 결과값을 아웃풋 유닛에 전달한다. 중요한 것은 각 인풋 노드의 연결 강도다. 이는 뉴런의 받아들이 는 신호 자극의 세기를 모방한 것이다. 연산적으로는 가중치를 곱한 값을 합산해 결정하는데, 임계치보다 큰 경우 1의 결과, 그렇지 않을 경우 0의 결과를 도출하는 계단함수다. 따라서 결 과는 O와 X 두 개로 나타난다.
기호주의를 따랐다면 가중치를 직접 입력했을 것인데, 연결 주의를 표방한 퍼셉트론은 학습이라는 방법으로 이를 해결하 려 한 시도였다. 로젠블랫이 위대한 것은 가중치를 스스로 수 정하는 알고리즘을 만들었다는 데 있다. 
- "속이고 잡아내라” GAN의 출현
2015년을 전후해 출현한 새로운 인공지능 모델들은 종전 모 델의 성능을 앞도하기 시작했다. 그동안 인공지능 모델은 신 경생물학의 영향을 받아 장기 기억을 저장하는 방법을 연구하 고 있었다. 신경심리학자인 도널드 헤브Donald Hebb는 자신의 책 《행동의 조직화 The Organization of Behavior》에서 우리 뇌가 무엇인가 를 기억하는 행위에 대해 전체가 아닌 극히 일부 뉴런에서 이 정보를 변환해 보관하고 있는 상태라고 주장했다. 신경세포인 뉴런들이 자극을 받아 동시에 활성화되면 그 사이 통로인 시 냅스의 연결이 강화되고 특정 시냅스에서 장기 강화LTP, long-term potentiation 현상이 나타난다는 메시지였다.
수십 년간 장기 기억은 인공지능 학계에서 큰 숙제였다. 자 연어 처리, 음악 작성, 컴퓨터 비전과 같은 시간차가 필요한 분 야에서는 반드시 인공지능이 장기적으로 기억할 수 있는 능력을 갖추고 있어야 했다.
- 예를 들어 한국어를 영어로 번역할 때, 첫 번째 입력한 단 어는 곧바로 이어지는 영어 단어 순서에 영향을 준다. 만약 인 공지능 기억이 매우 짧다면 번역은 불가능하다. 이 문제를 해 결하기 위해 순방향 신경망인 피드포워드 네트워크FFNN, Feed- Forward Neural Network를 업그레이드해 층 내에서 서로 되먹임할 수 있도록 한 순환신경망이 개발되었다.
오늘날 원본과 유사하지만 독창적인 그림이나 문장을 생성 하는 이른바 생성형 인공지능 역시 피드포워드 네트워크를 학 습시키는 과정에서 발견되었다. 몬트리올대학교의 이언 굿펠 로lan Goodfellow 팀은 인공지능이 적대적 상황에 놓이면 보다 강력한 샘플을 생성한다는 사실을 알아냈다. 이를 위해서는 이미지 · 동영상 · 텍스트 사운드를 분류하는 머신러닝의 한 유형인 합성곱 신경망이 필요하다. 한 인공지능은 꾸준히 그림을 그려대고, 또 다른 인공지능은 그 결과값을 입력값으로 받아들여 이 그림이 진짜인지 가짜인지를 판별하는 식이다. 마치 특수 경찰관이 위조지폐범이 계속해서 그려댄 위조지폐를 식별하면 서 서로 실력을 겨루고 발전하는 과정과 흡사하다. 이른바 생 성형 대립신경망GAN, Generative Adversarial Network의 등장이다.
특히 GAN은 별도로 학습을 시킬 필요가 없는 비지도 학습 을 토대로 한다. GAN을 활용하면 우주 천체 이미지에서 잡음을 제거할 수 있고 인간의 감정적인 언어 표현까지 생성할 수 있다. 이언 굿펠로는 졸업 후 오픈AI, 구글 리서치, 애플 등을 누비며 GAN을 전파했다.
GAN을 활용한 서비스들이 속속 등장했다. 미국의 대표 반 도체 기업인 엔비디아 NVIDIA에서 개발한 스타일GAN은 사실 적으로 사람 얼굴을 그리고 고해상도 이미지를 생성하며 패션 디자인에도 활용할 수 있다. 또 UC버클리에서 내놓은 사이클 GANCycleGAN은 다양한 이미지를 전환하는 데 성공했다. 말 사 진을 올리면 얼룩말로 전환되는 방식이다. 또 다른 UC버클리 팀이 만든 픽스투픽스pIx2Pix는 스케치 그림을 올리면 디지털 아트로 전환해준다. 오픈AI가 내놓은 달리 DALL-E 역시 GAN을 기반으로 이미지를 생성한다. 영어로 간단한 문장만 입력하면 원하는 그림을 얻어낼 수 있다.
- 챗GPT의 핵심은 트랜스포머다. 이를 통해 시퀀스 투 시퀀 스sequence to Sequence를 수행할 수 있다. 여기서 시퀀스란 무엇 인가를 나열한다는 뜻으로, 문장, 이미지 등 모든 것이 될 수 있 다. 다만 자연어 처리에서는 문장이 곧 시퀀스라 할 수 있다. 즉 한 문장을 넣으면 다른 문장이 되어 나타나는 것이다. 번역이나 추론, 전망도 이를 통해 가능하다. 주가예측을 한다면 '미국 연방준비제도가 금리를 올렸다'라는 시퀀스가 미국 나스닥이 하락했다'라는 시퀀스로 변경되는 것을 뜻한다.
트랜스포머에는 정교함을 극대화하고자 셀프어텐션self attention이라는 기능이 포함돼 있다. 모델에는 인코더Encoder와 디 코더Decoder가 존재하는데, 인코더가 입력 시퀀스를 압축해 디 코더로 보내면 디코더는 목표로 한 시퀀스를 생성한다. 인코더 에 들어온 시퀀스를 압축하는 과정을 인코딩이라고 부르고 나 가는 것을 디코딩이라고 한다. 오염된 물이 정수기 필터를 지 나가는 것과 흡사하다. 번역 인공지능을 예로 들면 '나는 너를 사랑한다'라는 한 문장의 시퀀스가 인코더에 들어오면, 디코더는 I love you’라는 번역 문장의 시퀀스를 생성한다.
구글의 트랜스포머 모델에서는 인코더에 들어온 시퀀스가 셀프어텐션 레이어를 지나도록 하고 있다. 오픈AI의 트랜스포 머 모델에서는 디코더에 마스크드 셀프어텐션 레이어가 있다. 셀프어텐션은 말 그대로 '스스로 집중한다'는 뜻이다.
인간의 뇌를 생각해보자. 한 사람이 편의점 문을 열고 들어 와 "아...... 그, 저 말인데요. 저기 있는 우유 얼마인가요?" 하고 우물쭈물 묻는다면, 점원은 "아...... 그, 저 말인데요"보다는 "저기 우유 얼마인가요?"라는 문장 속 주요 단어를 재빠르게 파악할 수 있다. 우리 뇌는 이처럼 수많은 단어 속에서 핵심만 추리 는 능력이 있는 것이다.
마찬가지로 셀프어텐션 레이어는 가장 중요하고 관련 있는 정보를 집어낸다. 한 시퀀스가 입력되더라도 '하지만', '그러나', '결론적으로'와 같은 주요 토큰에 집중한다. 또 디코더로 나가 는 시퀀스에 있는 마스크드 셀프어텐션 레이어는 정교한 시퀀스를 형성하도록 돕는다.
- 지금까지 인공신경망 모델은 문장이 길어질수록 문맥을 해석하는 것을 힘들어했다. 모든 단어를 일일이 훑어서 분석해야 했기 때문이다. 하지만 트랜스포머 모델은 셀프어텐션 레이어 를 통해 집중할 수 있다. 아무리 문장에 단어가 많더라도 필요 한 정보만 빠르게 이해하고 불필요한 단어를 내뱉지도 않는다. 챗GPT에 오타가 수두룩한 문장을 대충 입력해도, 사용자의 뜻 을 헤아려 군더더기 없이 답변하는 것은 바로 트랜스포머의 힘 이다.

- "인공 일반 지능이 개발되면, 자본주의가 무너질 수 있다. 인공지능이 스스로 수익을 창출하면 어떻게 배분할 것인가. 또 이런 인공지능은 누가 통제할 수 있을 것인가." (오픈AI 공동창업자 샘 올트먼)
- 샘 올트먼은 왜 챗GPT를 공개했는가
샘 올트먼은 오픈AI 설립 이유를 사회 운동으로 설명했다. 그는 2023년 <포브스>와의 인터뷰에서 챗GPT를 무료로 외부 에 공개한 이유를 '오버톤 윈도overton Window' 효과를 위해서라고 언급하기도 했다.3
오버톤 윈도는 극단적 선택지 가운데 대중이 받아들일 수 있 는 정책과 사고의 범위를 말하는데, 외부 충격에 따라 수용 여 부가 달라진다. 1998년 외환위기를 계기로 국제통화기금IMF이 대규모 정리해고를 권고하자, 근로자들은 저항 없이 수용했다. 일반인들이 인공지능에 대한 경외심과 공포감을 가지라는 메 시지를 던지고자 기술을 공개했다는 것이다.
올트먼은 특히 인공지능이 고도로 발달할 경우 자본주의가 무너질 수 있다고 경고했다. 인공지능이 인간을 대신해 스스로 수익을 창출하는 세상이 온다면, 시장 경제의 근간인 사유재산 에 대한 권리를 더 이상 주장하기 힘들 것이라는 뜻이다. 그는 "자본주의를 사랑한다"면서도 "하지만 자본주의는 나쁜 시스템 중에서 가장 좋은 시스템이기 때문에, 현존하는 더 나은 방안 을 찾았으면 한다"라고 말을 이었다.
- 오픈AI는 기존의 기업과는 다른 방식으로 만들어졌다. 올트 먼은 구체적으로 "인공 일반 지능은 (스스로 일해) 수익을 발생 시킬 텐데 이를 어떻게 배분해야 할지가 관건일 것"이라며 "이 런 인공지능을 누가 통제할 수 있으며, 이를 소유한 회사는 어 떤 지배구조(거버넌스)로 구성이 되어야 하는지 등 새로운 생각 이 필요하다"라고 말했다. 막대한 성능을 지닌 인공지능이 고장날 경우 특별한 조치가 필요할 수 있고, 이 때문에 특정 회사 가 이런 인공지능을 소유해서는 안된다는 말도 잊지 않았다.
- 2018년 머스크는 오픈AI가 구글에 비해 뒤처져 있다고 주장 하면서 직접 CEO로 나서겠다고 밝혔다. 하지만 다른 공동창 업자들이 반대에 나섰고, 이후 머스크는 오픈AI를 떠나게 되었 다. 약속한 투자 계획 역시 중단했다. 추가 자금이 필요했던 오 AI는 오픈AI 유한투자 openAI LP라는 영리 자회사를 설립했다. 머스크가 빠진 자리는 마이크로소프트가 대신했다. 마이 크로소프트는 2019년 오픈AI에 초기 투자를 단행했고, 이후 2022년까지 총 100억 달러에 달하는 자금을 투자하며 그 대가 로 파트너십을 요구했다. 챗GPT의 업데이트 버전은 마이크로 소프트의 챗봇인 '빙'에 탑재되었고, 마이크로소프트는 구글이 장악한 검색 시장을 점점 확대 중이다.
- 챗GPT는 코드 생성 기능을 장착한 업데이트 버전인 GPT- 3.5를 토대로 하는데, 2022년 1월 발표한 언어처리 모델인 인 스트럭트GPT의 장점을 결합한 융·복합 버전이다. 특히 수요 자의 트래픽이 몰리는 것에 따라 다른 버전을 적용하는 동적 모델인 것으로 알려졌다. 실리콘밸리에서는 GPT-3 스몰 또 는 GPT-3 XL이 동적으로 구동하는 것으로 추정하고 있다. 사 용자 수요가 몰리면 파라미터가 적은 버전이 등장하고, 수요가 없으면 큰 파라미터가 있는 버전이 구동되는 방식이다.
파라미터 수가 서버 안정성과 직접적인 관련은 적지만, 파라 미터 수가 늘면 실행에 상당한 컴퓨팅 리소스가 투입돼야 하는 문제점이 발생한다. 때문에 사람이 뜸한 한적한 시간에 사용하 면 매우 빠른 속도로 정확한 답변을 내놓는 데 반해, 사람이 몰 리는 시간대에 활용하면 성능이 저조한 것 같은 기분이 드는 이유 역시 챗GPT가 동적 버전이기 때문인 것으로 보인다.
- 오픈AI는 현지 시각 2023년 3월 14일, 챗GPT의 골격인 초거대 인공지능 GPT를 GPT-4로 업데이트했다고 밝혔다. 이날 샘 올트먼 오픈AI CEO는 트위터를 통해 "GPT-4는 가장 뛰어 나고 정리가 잘 된 모델"이라고 강조했다.
GPT-4는 현재 GPT의 근간이 되는 GPT-3.5의 업데이 트 버전으로 미국 모의 변호사시험에서 상위 10퍼센트, 미국 대학 입학 자격시험인 SAT 읽기와 수학에서 각각 상위 7퍼센 트와 11퍼센트의 성적을 기록했다.
추론 능력도 대폭 향상되었으며, 인공지능이 거짓말을 하는 이른바 '환각hallucination 현상' 역시 감소시켰다. 오픈AI는 “GPT-4가 허용되지 않은 콘텐츠 요청에 응답할 가능성이 82퍼 센트 줄었다"면서 "사실을 바탕으로 대답하는 비율도 GPT-3.5 보다 40퍼센트 정도 높아졌다”라고 설명했다.
가장 주목받는 것은 이미지를 올리면 텍스트로 인식하는 기 능이다. 이미지 속의 그림이나 글자를 인식해 대화를 주고받을 수 있다. 예를 들어 복잡한 의약품을 스마트폰 카메라로 촬영 해 업로드하고 해당 제품의 성분과 장단점을 물어볼 수 있다. 더 놀라운 점은 식재료 분석이다. 식재료 사진을 아무렇게나 촬영해 올리면, 챗GPT가 해당 식재료로 만들 수 있는 요리와 그 요리 조리법을 작성한다.
텍스트 분석 기능도 대폭 업데이트돼 GPT-4는 2만 5000단어 이상을 한 번에 분석한다. 오픈AI는 "URL을 입력하면 보다 긴 형식의 콘텐츠를 생성할 뿐 아니라, 보다 정교하게 분석할 수 있다"라고 설명했다. 하지만 GPT-4가 얼마나 많은 파라미 터를 가졌는지에 대해서는 함구했다.
파라미터란 인간의 뇌에 있는 시냅스와 같은 요소로 파라 미터가 많다는 것은 그만큼 연산 능력이 높아 복잡한 문제를 더 정교하게 처리할 수 있다는 것을 의미한다. GPT-3.5는 1750억 개의 파라미터를 갖고 있다. 오픈AI는 챗GPT 무료 버 전은 GPT-3.5, 유료 버전인 '플러스'는 GPT-4에 연동했다고 밝혔다.
이러한 발전은 샘 올트먼 오픈AI CEO가 강조한 인간을 대 신하고 스스로 학습하는 인공 일반 지능에 다소나마 근접하는 양상이다. 인공 일반 지능을 장착한 챗GPT는 파라미터 수가 100조개에 달해, 인간 시냅스 100조 개에 버금가는 능력을 지 닐 것이라는 기대를 받고 있다. 오픈AI의 공동창업자 샘 올트 먼은 2022년 9월 한 팟캐스트에 출연해 가까운 미래에는 멀티 모달 Multi Modal 이 장착된 인공지능이 출현할 것으로 전망했다.
- 챗GPT는 인간의 언어인 자연어를 이해하고 분석해 코드를 생성한다. 챗GPT의 근간인 초거대 인공지능 GPT-3.5에 코드 를 생성해 주는 'code-davinci-002'라는 기능이 추가됐기 때문 이다. GPT-3.5는 159 기가바이트 분량의 코드를 학습한 코덱 스Codex를 연동하고 있어 다양한 코드 생성이 가능하다. 일정 부분 코딩에 대한 이해와 논리, 그리고 자신이 무엇을 원하는 지 정확히 아는 사용자라면 원하는 코드를 생성할 수 있다. 책 GPT가 소프트웨어 업계의 게임체인저로 불리는 이유다. 이런 챗GPT가 파고들 영역은 전방위적이다.
- 지금껏 프로그래머들은 프론트엔드, 백엔드, 모바일 개발, 머 신러닝, 게임 개발 등 한 분야에 특화되어 있었다. 전체를 총괄 하는 풀스택 개발자가 없는 것은 아니지만 극히 드물다. 하지 만 챗GPT는 이를 모두 소화할 수 있다. 챗GPT로 다룰 수 있 는 프로그램 언어는 약 12종(HTML, CSS, 자바스크립트 JavaScript, 파이썬 Python, 루비 Ruby, Node.js, 텐서플로우 TensorFlow, 파이토치PyTorch, 판다스Pandas, 매트플롯립 Matplotlib, 유니티 Unity, 언리얼 엔진Unreal Engine)으로, 웬만한 프로그래머보다 더 많은 일을 할 수 있다.
- 테슬라의 인공지능 담당자에서 오픈AI로 자리를 옮긴 안드레이 카르파티 Andrej Karpathy 는 2023년 1월 트위터를 통해 "오늘 날 가장 인기 있는 새로운 프로그램은 영어"라고 강조했다. 그 만큼 프롬프트 엔지니어의 중요성이 날로 커지고 있다는 메시 지다.
일부 프롬프트 엔지니어는 자신이 개발한 프롬프트를 프롬 프트베이스promptBase 같은 사이트에서 판매하기도 한다. 프롬 프트베이스에 따르면, 2021년 이후 현재까지 2만 5000명이 프 롬프트를 판매했다. 예를 들어 이미지 생성 인공지능인 미드저 니Midjourney를 통해 정확히 원하는 그림을 생성해내는 프롬프트 는 단어 50개로 구성이 돼 있는데 약 1.99달러에 판매된다. 그 만큼 수요가 크다는 방증이다. 또한 프롬프트 히어로PromptHero, 프롬피티스트promptist와 같은 프롬프트 안내 및 교환 사이트도 등장하고 있다.
- 물론 이 새로운 직업에 대한 부정적인 의견도 존재한다. 워 싱턴대학교의 셰인 스타이너트트렐켈드Shane Steinert-Threlkeld 교수 는 프롬프트 엔지니어링에 대해 "프롬프트 엔지니어링은 과학 이 아니다”라고 주장하면서 "곰을 여러 방법으로 찔러 보고 어 떻게 그들이 포효하는지 분석하는 것과 무엇이 다른가?" 지적 하기도 했다. 그러나 대다수 전문가는 오늘날 모든 것이 자연 어로 가능해지면서, 프롬프트를 제대로 활용할 수 있는 사람에 대한 수요가 갈수록 늘어날 것으로 보고 있다.

- 인공지능을 활용한 투자가 늘어나면서 인공지능을 활용해 이를 감시하는 '레그테크RegTech'마저 등장하고 있다. 레그 테크는 규제Regulation와 기술 Technology의 합성어로 금융 서비스 의 문제를 해결하기 위한 혁신적 기술을 뜻한다. 일본 금융청은 2017년 이 같은 중기 활동 방침을 발표했다. 수많은 사람 이 인공지능을 활용해 매매하면서 주가가 요동치고, 레이어링 Layering 방식으로 일반인들이 피해를 보기 때문이다.
레이어링은 알고리즘이 매도 주문을 순식간에 쏟아내 주가 를 하락시킨 뒤 저점에서 다시 주식을 매집하는 행위를 가리 킨다. 사람이 클릭하기도 전에 알고리즘이 움직여 기존의 규제방식으로는 이러한 패턴을 찾아내는 것이 불가능하다. 때문에 앞으로는 금융감독기관이 인공지능을 활용해 문제점을 포착하는 날이 머지않아 도래할 것으로 보인다.
- 오늘날 인공지능은 금융 산업 전반을 혁신하고 있는 강한 무기다. 개인 금융 서비스, 신용 평가 및 대출, 시장 동향 분석 및 예측, 로보틱 프로세스 자동화RPA, 금융 규제 및 이상거래 탐 지 등에 사용이 가능하다. 딜로이트컨설팅의 김석태 이사는 "인공지능 활용이 확대되면서 금융업의 경쟁 구도가 재편될 것 으로 보인다"면서 "앞으로 직원과 인공지능의 협업 역량이 새로운 경쟁력이 될 것 같다"고 설명했다. 

- 전 세계에서 가장 많은 전기차를 팔고 있는 테슬라는 GPT를 기반으로 자율주행 기능인 오토파일럿의 성능 업그레이드 를 시도하고 있다. 24 테슬라 차량에는 수많은 반도체가 탑재되 는데 그 핵심은 트립TRIP 칩이다. 트립 칩은 자율주행에 필요한 복잡한 계산을 빠르고 효율적으로 처리한다. 트립 칩을 사용하 면 서버에 있는 GPU와 연동이 필요 없다. GPU와 소통하는 시 간을 줄여 인공지능 처리 속도를 높일 수 있기 때문이다. 테슬 라 오토파일럿은 트립 칩을 토대로 통신하면서 오류를 실시간 으로 감지하고 차량 이상을 파악한다. 인공지능이 다양한 운전 변수를 학습했기 때문에 가능하다. 
문제는 효율이다. 이러한 학습 과정에는 소프트웨어 조정 방향을 사람이 알려주는 이른바 '휴리스틱neuristic 프로세스'가 사 용된다. 하지만 인간의 개입은 효과적이지 않아 GPT는 그 대 안으로 꼽힌다. GPT는 자연어를 생성하지만, 이미지나 동영상 픽셀 위치에 대한 공간 정보를 제공한다. 이를 자율주행에 접 목하면 휴리스틱을 크게 개선할 수 있다. 테크 유튜브 채널인 '닥터노우잇올Dr.Know It All'을 운영하는 존 깁스John Gibbs 조지아대 학교 교수는 머스크와 대화 직후 "테슬라가 트립 칩에 GPT를 사용하려고 한 것은 매우 인상적"이라면서 "이것이 만약 성공 적으로 구현이 된다면 자율주행 문제가 더 빨리 해결될 수 있 다"라고 설명했다.

- 생성형 인공지능이 자유자재로 문장을 생성하면서 산업의 전체 판도가 흔들리고 있다. 오픈AI 출신으로 또 다른 생성형 인공지능 스타트업인 앤스로픽(구글이 2023년 2월 4억 달러를 투 자했다.)을 공동창업한 크리스토퍼 올라 Christopher Olah는 트위터 에서 이 같은 힘을 "소프트웨어 3.0'이라고 불렀다. 챗GPT의 근간이 되는 초거대 인공지능 GPT에 메타 학습Meta Learning을 접목하는 방법을 연구했고, 이를 기반으로 프롬프트 프로그래 밍을 했다는 설명이다.
'메타 학습'이란 인공지능이 경험을 통해 스스로 학습 프로 세스를 개선하는 학습법이다. GPT-3.5는 소량의 데이터로 기 계가 학습하는 퓨샷러닝으로 다양한 상황에서 대응이 가능했 다. 또 프롬프트 프로그래밍을 통해 사용자의 의도를 정확히 파악할 수 있도록 했다. 

- CRM의 양대 산맥은 마이크로소프트와 세일즈포스Salesforce 다. 특히 세일즈포스는 기업용 소프트웨어 업계의 애플로 불린 다. 수많은 외부 소프트웨어를 구독 플랫폼처럼 운영하기 때 문이다. 세일즈포스는 이미 2017년에 아인슈타인 Einstein이라는 CRM을 선보이면서 인공지능을 전면에 내세웠다.
하지만 챗GPT 개발사인 오픈AI에 투자하고 파트너십을 맺 은 마이크로소프트가 움직였다. 마이크로소프트는 2023년 3월 '다이내믹스 365 코파일럿'이라는 시범 서비스를 선보였는데, 인공지능이 고객 문의에 대해 응대하고, 이메일 답변을 작성하 며, 마케터가 목표로 삼을 고객을 분류해내는 기능을 담았다. 앞서 사티아 나델라Satya Nadella 마이크로소프트 CEO는 자사의 모든 제품 라인업을 오픈AI의 인공지능 도구를 활용해 재정비 할 것이라고 밝힌 바 있는데 이를 곧바로 시연한 것이다.
업계 1위인 세일즈포스 역시 오픈AI 챗GPT를 접목한 아 인슈타인GPTEinstein GPT라는 서비스를 선보이며 맞대응에 나 섰다.22 아인슈타인은 프롬프트에 명령어를 입력하면 문장 요 약, 개인 맞춤형 이메일 발송, 마케팅용 코드 등을 생성한다. 또 기업이 광고 캠페인에 사용할 수 있도록 이미지도 만들어낼 수 있다.
차별점은 공개된 정보나 세일즈포스에 있는 각종 데이터를 불러낼 수 있으며, 각 기업이 자체 데이터를 이용해 인공지능 을 훈련시킬 수 있다는 점이다. 기업이 자체 인공지능을 구축 할 수 있는 것이다. 아울러 생성형 인공지능이 거짓 정보를 생 성하는 환각 현상을 방지하고자 인공지능이 생성한 답변을 이 용자가 사용하기 전에 확인하는 절차를 도입했다.

- 언어를 이미지로 생성하는 '스테이블 디퓨전'
스테이블 디퓨전은 인간의 문장을 토대로 이미지를 만들어 내는 딥러닝 인공지능 모델로, 자연어인 텍스트를 입력하면 이 미지를 생성한다. 자연어처리 분야에 GPT를 중심으로 한 트랜스포머 모델 기반 인공지능이 있다면, 이미지 분야에선 스 테이블 디퓨전 모델이 중심이다. 그동안 수많은 이미지 생성 인공지능이 등장했지만, '와우 모먼트'를 달성하는 데에는 실패 했다. 하지만 스테이블 디퓨전은 2022년 급부상해 많은 이의 감탄을 불러왔다.
인공지능의 프로세스는 크게 데이터 트레이닝 딥러닝→ 잠재공간latent space 배치→ 생성(디퓨전diffusion)→ 결과인 아웃풋 으로 이뤄진다. 이미지 생성 딥러닝은 이미지와 그 이미지에 대한 설명인 캡션caption 짝을 대조해보는 방식으로 학습이 이뤄 진다. 컴퓨터는 이미지에 대한 세세한 화소점인 픽셀을 숫자로 인식하고 그 패턴 값을 분석하고 이를 설명 문장과 대조하며 학습한다.
이렇게 학습된 생성형 인공지능은 문장이 입력되면 가상공간에 그림을 배치하는데 이를 잠재공간 배치라고 한다. 예를 들어 엑스축이 빨간색, 와이축이 원형이라고 한다면, 맨 상단 우측에 빨간 공이, 맨 하단 좌측에 노란 바나나가 배치될 것이 다. 문제는 여기서 발생한다. 복잡한 문장을 입력하면 변수가 급증하기 때문에 인공지능이 잠재공간에 이미지를 집어넣는 데 착오를 일으킬 수 있다. 가끔 얼굴이 두 개 달린 인물 이미 지가 그려지는 이유다.
하지만 스테이블 디퓨전은 인간이 인식할 수 있는 공간을 넘 어 매우 방대한 공간을 처리할 수 있는 능력을 갖고 있다. 그 비결은 역방향 학습이다. 디퓨전이란 영어로 '퍼짐'이라는 뜻으로 "안정적 확산 모델"이라고도 부른다. 투명한 물에 빨간 잉크 한 방울을 떨어뜨리는 모습을 상상하면 이해가 쉽다. 잉크 방 울은 서서히 퍼져 특정 시간에 도달하면 물 전체를 빨갛게 물 들인다. 평형 상태에 도달한 것이다.
실제 세계에선 한번 평형이 이뤄지면 원점으로 돌아올 수 없다. 하지만 스테이블 디퓨전은 안정적으로 확산된 상태를 다 시 원점으로 돌리는 능력이 있다. 이는 매우 잘 그린 초상화를 백지가 될 때까지 손으로 문질러 없앤 뒤, 지운 그림을 생각하 면서 다시 그리는 것과 같은 이치다. 인공지능은 이 과정을 무 한으로 반복한다. 학습할 때에는 그림을 지워 없애는 방식을 쓰지만, 실제 작업을 수행할 때에는 역방향으로 움직인다.
스테이블 디퓨전은 독일 뮌헨대학교 연구진이 스타트업 스 태빌리티AIstability Al의 지원을 받아 2022년 8월에 개발한 인공 지능이다. 이 모델은 인공지능 학습에만 60만 달러에 달하는 거액이 들어갔지만 스태빌리티AI와 뮌헨대학교는 이를 누구나 사용할 수 있도록 오픈소스로 공개했다.
생성형 인공지능 서비스로는 이미 미드저니, 오픈AI 달리, 드림 바이 웜보Dream by WOMBO 등이 이미 존재하고 있었지만, 스 테이블 디퓨전이 오픈소스로 공개되면서 수많은 기업이 이 모델을 주로 이용하고 있다.

- 넷스케이프를 창업한 마크 앤드리슨이 이끄는 실리콘밸리 벤처캐피털인 앤드리슨호로위츠Andreessen Horowitz는 생성형 인공 지능의 산업 영역을 크게 세 가지로 분류했다. 인공지능 칩과 그 칩을 활용해 컴퓨팅 파워를 제공하는 인프라 산업, 이 컴퓨 팅 파워를 활용해 생성형 인공지능을 직접 개발하는 파운데이 션 모델, 다시 이 파운데이션 모델을 활용해 B2B(기업 간 기업) 나 B2C(기업 간 소비자)용으로 앱과 웹을 제공하는 서비스다. 여기에서 어떤 수익 구조를 갖느냐에 따라 다시 세분화된다.
맷 본스틴Matt Bornstein 파트너는 “현재까지는 인프라 공급 회 사가 시장의 승자일 가능성이 크다"면서 "앱을 제공하는 회사 는 매출이 급속도로 늘고 있지만 아직 수익이 충분하지 않고, 인공지능 모델을 제공하는 업체는 수익 구조를 만들지 못한 상 태"라고 진단했다. 산업이 꿈틀대는 초기 단계이기 때문에 미 래를 섣불리 예단하기 힘들다는 설명이다.
- 오픈소스 생태계는 독특한 비즈니스 모델을 만들어냈다. 바로 모델 허브 비즈니스다. 스테이블 디퓨전이 오픈소스로 제공 되더라도 일반 기업이 이를 활용해 서비스를 개발하는 것은 쉬 운 일이 아니다. 하지만 허깅페이스와 같은 모델 허브를 활용 하면 비교적 쉽게 구축할 수 있다.
허깅페이스는 다양한 모델과 학습 스크립트를 모아 놓은 라 이브러리 서비스를 제공하고 있다. 레고를 생각하면 이해가 쉽 다. 오픈소스 모델이 개별 레고 블록이라고 한다면, 허깅페이스 는 이를 색상과 모양별로 모아둔 상자라고 할 수 있다.
- 빙 챗봇은 챗GPT에서 한 단계 업데이트됐다. 챗GPT가 2021년 이후 사실에 대해선 알려주지 않지만, 빙 챗봇은 검색 사이트를 훑어 출처까지 인용해 요약·정리해준다. 예를 들어 2023년 가장 인기 있는 스마트폰이 무엇인지 묻는다면, 삼성전 자와 아이폰의 최신 정보를 나열한다. 여기에 GPT의 기본 기능마저 담고 있다.
더 나아가 마이크로소프트는 빙 챗봇에 오픈AI의 이미지 생 성 인공지능인 달리를 탑재했다. '빙 이미지 크리에이터'라고 명명된 이 기능은 이미지를 생성해달라고 요청하면, 오픈AI의 달리가 곧바로 그림을 그려주는 방식이다. 또 인공지능이 생성한 인포그래픽과 차트 등을 사용할 수 있도록 비주얼 스토리와 지식 카드와 같은 새로운 기능마저 추가했다.
이처럼 마이크로소프트가 GPT를 탑재한 이유는 구글을 단 숨에 추격하기 위해서다. 다만 복병도 있다. 빙 챗봇은 전 세계 100만 명을 상대로 우선 공개됐다. 모든 사용자에게 공개할 경 우서버 비용을 감당할 수 없어서다. 시장이 확대되는 모습을 보면서 서서히 대상을 늘리겠다는 전략이지만, 추격에 상당한 시일이 소요될 것이라는 점을 시인한 것이다.
빙 챗봇 사용 대기리스트에 이름을 올리기 위해서는 마이크 로소프트의 지시를 따라야 한다. 윈도우를 업데이트해 검색엔 진 기본값을 구글에서 빙으로 바꿔야 하며, 웹브라우저인 엣지를 업데이트해야 한다. 시장에서는 마이크로소프트의 이러한 전략이 당장 통했다는 평가가 나왔다. 빙 챗봇을 도입한 이후 빙의 일간 활성 사용자DAU는 1억 명을 돌파했다. 2009년 빙이 출시한 이래 처음이었다. 특히 빙 챗봇 이용자의 3분의 1은 빙 을 처음 사용하는 신규 사용자였다.
마이크로소프트가 막대한 자본을 투자해 빙 챗봇을 개발한 이유는 디지털 광고 때문이다. 검색 광고 시장에서 점유율이 1퍼센트 상승할 때마다 디지털 광고 수익은 약 20억 달러가 증가하는 것으로 알려졌다. 마이크로소프트는 이에 그치지 않고 웹브라우저 시장 저변을 넓혀나가고 있다.
검색엔진이 웹사이트라면 웹브라우저는 이를 구동하는 프로 그램이다. 웹브라우저 시장을 장악하면, 이용자의 인터넷 이용 데이터를 손쉽게 얻을 수 있을 뿐 아니라 자사의 검색엔진으로 유도하기가 수월하다. 이 시장은 한때 마이크로소프트의 인터 넷 익스플로러가 대부분을 차지했지만, 현재는 구글의 크롬이 60퍼센트를 차지하고 있다. 엣지의 점유율은 고작 10퍼센트 남 짓이다.

- 메타의 초거대 인공지능 '라마'는 파라미터 수가 최대 650억개다. 이는 GPT-3.5 1750억 개, 구글 람다 1370억 개에 비해 적은 숫자지만, 발 빠른 대응이 아닐 수 없다. 현재 라마 개발은 메타의 부사장 겸 수석 AI 과학자인 얀 르쿤 Yann LeCun이 이끌고 있다.
메타 역시 구글처럼 모델을 섣불리 공개하지는 않고 있다. 2022년 11월 챗GPT에 맞불을 놓고자 인공지능 챗봇 갤럭 티카 Galactica를 공개한 뒤 곤욕을 치른 학습 효과가 있기 때문 이다. 10 당시 갤럭티카는 가짜 정보 생성은 물론 혐오적 표현 을 사용해 논란을 불러일으켰다. 현재는 연구자들을 대상으로만 라마의 사용 신청을 받고 있다. 연구용으로 고안된 만큼 일 반 사용자에겐 공개하지 않는 것이다. 메타의 라마가 오픈AI의 GPT나 구글의 람다에 비해 우수한 분야는 상식 추론으로 꼽 힌다. 인공지능은 학습을 하지 않은 데이터를 물어볼 경우 논 리에 맞지 않는 가짜 정보를 생성하기 쉬운데, 라마는 상식 추 론 능력이 이들보다 뛰어나다는 평가다.
투자자들이 주목하는 것은 메타가 생성형 인공지능 산업에 서 오픈소스 비즈니스 모델을 채택했다는 점이다. 후발 주자로 서 생태계를 더욱 빠르게 장악하고자 무료 공개 전략을 수립한 것이다. 저커버그는 "언어 모델의 발전에도 이를 학습시키고 실행하는 데 필요한 자원의 한계로 완전한 연구는 여전히 제한 적"이라며 "이런 제한된 접근은 인공지능 모델의 편향성, 유해 성, 잘못된 정보 생성 등의 문제를 완화하려는 연구자들의 노 력을 방해한다"고 설명했다. 더 많은 이가 메타의 인공지능을 활용할 수 있도록 하겠다는 메시지다.
메타가 라마의 개발을 완료하면 소셜미디어 역시 크게 탈바 꿈할 것으로 보인다. 저커버그는 앞서 "생성형 인공지능에 초 점을 맞춘 최상위 제품 그룹을 만들고 있다"고 강조한 바 있다. 생성형 인공지능을 연구하는 팀을 단일 팀으로 구성하고 모든 제품을 인공지능 기반으로 업데이트하겠다는 구상이다. 페이스북, 인스타그램, 왓츠앱 WhatsApp 등에 라마 기반 챗봇이 탑재 될 가능성을 시사하는 대목이다.

- 티스타에 따르면, CRM 시장에서 세일즈포스 점유율은 23.8퍼센트로 SAP 5.4퍼센트, 마이크로소프트 5.3퍼센트, 오라클 5.1 퍼센트, 어도비 3.8퍼센트보다 압도적으로 높다. 이런 가운데 마이크로소프트가 CRM 서비스에 챗GPT를 접목하면서 비상 이 걸렸고, 세일즈포스는 정공법을 택했다. 오픈AI의 GPT를 연동해 그 이상의 서비스를 구현하는 전략이다. 새로운 인공지 능 서비스 명칭은 '아인슈타인GPT다.
아인슈타인GPT는 프롬프트에 문장을 입력하면 요약, 개인 이메일, 마케팅 코드 등을 생성한다. 또 기업이 캠페인에 사용 할 수 있도록 이미지도 만들어낼 수 있다. 특히 공공 정보나 세일즈포스 등에서 각종 데이터를 불러낼 수 있으며, 각 기업이 자체 데이터를 이용해 자사만의 아인슈타인GPT를 훈련할 수 있도록 했다. 앞서 인수한 메신저형 협업 툴 슬랙slack을 위한 챗GPT 앱도 출시한다. 챗봇은 슬랙에서 대화를 요약하고 답장 을 쓰고 사용자가 주제를 조사하도록 지원한다.
마이크로소프트와의 차별화도 잊지 않았다. 빙 챗봇이 거짓 정보를 생성하는 이른바 '환각 현상'을 만드는 것을 보고, 아인 슈타인GPT는 인공지능이 생성한 답변을 이용자가 사용하기 전에 확인하는 절차를 추가하기로 했다. 클라라 쉬Clara Shin 세일즈포스 총괄매니저는 “이번 발표는 기업의 수요에 부응한 것"이라며 "기업들이 고객과 소통 방식을 재정립하는 데 생성형 AI가 도움을 줄 것"이라고 설명했다.

- 카툰피플 Cartoon People의 창업자인 사이드 라샤드syed Rashad는 "사진이 처음 발명되었을 때 신문, 광고, 디자인 회사 등에서 일 했던 수많은 초상화 화가가 직장을 잃었다"면서 "사진이 예술 인지 여부에 대한 논쟁은 나중에 다루어야 할 문제이고, 당면 한 과제는 인간이 기술을 억제할 수 없다는 데 있다"라고 말했 다. 사진기가 등장하면서 사진사가 필요했듯, 인공지능을 활용 해 보다 더 창의적으로 그림을 자유자재로 그릴 수 있는 사람 만이 생존할 수 있다는 메시지다.


'IT' 카테고리의 다른 글

크립토사피엔스와 변화하는 세상의 질서  (2) 2024.01.31
챗 GPT 거대한 전환  (1) 2023.12.24
오늘날 우리는 컴퓨터라 부른다  (2) 2023.12.07
박태웅의 AI강의  (1) 2023.12.05
로봇의 지배  (0) 2023.08.14
Posted by dalai
,

챗 GPT 거대한 전환

IT 2023. 12. 24. 09:24

- 일론 머스크가 떠난 뒤 오픈AI는 비영리 조직과는 다소 거리가 있는 행보를 보이고 있다. 2019년 MS는 오픈AI에 10억 달러를 투자하였고, 2020년에는 마이크로소프트 이그나이트 Mircrosoft Ignite" 2020에서 오픈AI의 라이선스 독점 파트너십 체결을 발표했다. 이 는 오픈AI가 MS의 슈퍼컴퓨팅을 활용해 기술개발을 촉진할 수 있 는 계기가 되었다. 이후, 오픈AI는 1750억개 이상의 매개 변수를 가진 GPT-3를 출시하며 개선 및 확장을 이어가고 있다. 한편 MS 는 오픈AI가 개발한 챗GPT를 다양한 자사 제품에 결합하고자 한 다. 이는 챗GPT'를 이용해 수익을 다각화하고 시장 지배력을 높이 려는 시도다.
- 2022년 12월 1일 오픈AI는 GPT를 공식 출시하였으며 현재 PC버전을 무료로 제공하고 있다. 인간과 유사한 텍스트를 생성하 도록 설계된 GPT 모델과 챗GPT의 등장은 AI 분야에서 중요한 이 정표가 되고 있다. MS는 오픈AI에 앞으로 약 100억 달러를 투자해 지분의 49퍼센트를 확보할 계획을 가지고 있다. 일론 머스크의 손 을 떠난 챗GPT 그리고 오픈AI가 앞으로 어떤 비즈니스 모델을 구 축해 나갈 것인지 기대해 본다.
- 특히 2013년 신경망 모델을 통해 방대한 텍스트 말뭉치에서 단어와 단어 사이의 패턴을 학습하는 단어 임베딩 모델 워드투벡터 Word2vec가 발표된 뒤 딥러닝 분야에서 자연어 처 리에 대한 연구가 더 활발히 이루어지고 있다. 구글의 버트BERT나 오픈AI의 GPT가 대표적인 딥러닝 기반의 언어 모델이다.
언어 모델이란 단어의 다음에 올 단어를 예측하여 문장을 완성 하는 자연어 처리 모델로, 쉽게 표현하면 마치 네이버나 구글, 혹은 스마트폰에서 제공하는 자동 완성 기능과 유사하다. “하루 종일 게 임만 했더니 역시나 시험점수가 [빈칸]"이라는 문장이 있다고 가정 하자. 인간은 빈칸에 올 단어가 '떨어졌다'라는 걸 쉽게 맞힐 수 있 다. 우리는 우리가 쌓아온 경험과 지식에 기반해서 빈칸에 올 단어 중 확률이 가장 높은 것이 '떨어졌다'라고 판단하는 것이다.
- 언어 모델이 빈칸에 올 단어를 예측하는 방식도 인간과 비슷하 다. 앞에 있는 단어들을 기반으로 빈칸에 올 수 있는 단어들의 후보 들 중 빈칸에 올 확률이 가장 높은 단어를 선택하는 것이다. 컴퓨터 는 다음 단어를 맞히기 위해 경향성을 학습하는데 그 방식이 버트 와 GPT가 다른 지점이다. 버트는 '마스크 언어 모델'이라는 방식을 활용해 문장 '중간'에 위치한 빈칸을 맞추는 방식인 반면, GPT는 '다음' 단어를 맞추는 모델을 활용한다. 버트는 양방향 모델로 빈칸 의 앞과 뒤의 문맥을 모두 고려할 수 있기 때문에 문장의 전체적인 의미를 추출하는데 강점을 갖는 반면, GPT는 앞에서부터 순차적 으로 학습하며 다음에 나올 단어의 확률을 계산하기 때문에 문장 생성에 강점을 갖는다. GPT-3.5가 적용된 GPT는 GPT 기반으 로 텍스트 분류, 텍스트 생성, 요약 등 다양한 자연어 처리 작업을 수행하는데, 그 중에서도 특히 텍스트 생성에 강점을 보이는 것도 이런 언어 모델의 특징 때문이다.
- 예를 들어 개와 고양이를 분류하는 경우를 생각해보자. 기존의 머신러닝 모델을 사용할 경우, 사람이 사진 속 동물의 귀 모양, 얼 굴 모양, 몸의 구조 등의 특징을 선정 및 추출하고, 이를 라벨링하 여 입력한다. 이후 모델은 주어진 라벨을 기준으로 제시된 사진이 각각 개와 고양이 중 어느 쪽에 속하는지 판단하도록 학습한다. 하 지만 딥러닝 알고리즘의 경우 특징을 선정하는 것까지 인공신경망 을 통해 학습하기 때문에 사람이 특징을 추출하는 과정을 생략할 수 있다. 그저 잘 분류된 개와 고양이 사진을 제공해주기만 하면 딥 러닝 알고리즘이 혼자서 사진에 포함된 특성을 계산하고 그 속에 서 패턴을 찾는다. 그리고 개 사진이 들어오면 미리 찾아둔 패턴과 비슷한 특징을 갖고 있는 것이 개라는 사실을 판단하여 답을 내리 게 된다.
- 딥러닝의 성능 차이를 결정하는 것은 파라미터의 수다. 파라미 터는 딥러닝을 통해 학습한 모델이 저장되는 곳으로, 인간의 신경 세포에서 정보를 전달하는 시냅스와 유사한 역할을 한다. 딥러닝 모델을 만드는 기업들은 더 많은 파라미터로 구성된 모델을 확보 하기 위해 고군분투하고 있다. 학습 데이터가 많을수록 그리고 파 라미터가 많을수록 실제값과 AI의 출력값 사이의 오차가 줄어들고 정답에 근접하기 때문이다.
- GPT 모델은 딥러닝을 통한 사전 학습으로 인간처럼 추론하는 능력을 가진 생성형 AI 챗봇의 엔진이 되었지만 거짓 정보를 생성 하거나 유해한 콘텐츠를 생산하는 등의 한계를 지니고 있다. AI 모 델은 일반적으로 사전 학습 후 특정 태스크에 대한 성능을 개선하기 위해 '미세 조정fine tuning'이 이루어진다. GPT-3를 기반으로 만들 어진 인스트럭트 GPT 역시 이런 한계를 극복하고 더 안전한 모델을 만들기 위해 인간 피드백 기반 강화 학습RLHF: Reinforcement Learning with Human Feedback이라는 미세 조정 방법이 적용되었다. 오픈AI는 이 과정을 통해 과격한 표현이나 윤리적 문제들이 발생할 위험을 해소해 나간다. 비슷하게 챗GPT 역시 GPT-3.5에 인간 피드백 기 반 강화 학습 기술을 적용해 만들어졌다.
- 인간 피드백 기반 강화 학습은 3단계에 걸쳐 진행된다. 첫 번째 단계에서는 특정 프롬프트에 대해서 사람이 직접 이상적인 설명을 작성한다. 예를 들어 "여섯 살 아이에게 달 착륙을 설명하라”는 프 롬프트에 대해 인간 라벨러가 정답 예시에 가까운 설명을 직접 작 성하는 것이다. 이렇게 만들어진 데이터는 지도 학습의 방법을 통 해 GPT-3와 GPT-3.5를 미세 조정하는 데 사용된다. 두 번째 단계 에서는 여러 개의 아웃풋에 대해 인간 라벨러가 어떤 아웃풋이 좋고 나쁜지 순위를 매긴다. GPT-3와 GPT-3.5의 리워드 모델은 인간이 매긴 순위 데이터를 학습한다. 마지막 단계에서는 확보 답변들 중에서 리워드 수치가 가장 높은 답변을 선택하는 방향으로 GPT 학습 정책을 업데이트한다.
인간 피드백 기반 강화 학습을 적용한 모델들은 기존보다 사용 자 의도에 더 적합한 답변을 생성했다. 안정성에 있어서도 유해한 답변을 더 적게 생성했고, 좀 더 사실에 기반한 응답을 생성하는 것 을 확인할 수 있었다. 인스트럭트GPT와 GPT-3가 생성한 응답을 비교해 보면, GPT-3는 질문에 이어질 만한 텍스트를 단순 생성하 여 반복적인 표현을 사용했지만 인스트럭트GPT는 더 사용자 질문 에 적합한 응답을 생성했다.
-  구글 검색은 인터넷에서 정보를 검색하고 색인하는 도구인 반면, 챗GPT는 학 습된 정보를 바탕으로 사람과 유사한 텍스트를 생성하는 강력한 도구이다. 정확도 측면에서는 일반적으로 방대하고 다양한 데이터 소스에 의존하며 관련된 정보들을 색인하고 순위를 매겨서 사용자 에게 제공하는 구글 검색이 더 나을 수 있다. 반면 챗GPT는 인간 과 유사한 텍스트를 생성함은 물론, 학습된 데이터를 바탕으로 자 체적으로 도출한 결론을 제공할 수 있다. 하지만 학습 데이터에 따 라 오류나 편견이 포함될 수 있고 언어를 생성하는 과정에서 거짓 된 정보를 마치 그럴싸한 사실처럼 제공할 수 있다는 단점이 존재 한다. 따라서 현재 상황에서 구글 검색은 일반적인 정보를 제공하고 정보형 질문에 답하는 데 더 적합하지만 챗GPT는 이야기나 시를 쓰거나 코드와 이메일을 작성하는 것과 같은 창의적인 과제에 더 적합하다고 볼 수 있다.
그리고 MS는 검색과 대화형 응답이라는 두 가지 도구를 통합하 였다. 챗GPT를 검색 서비스인 빙에 적용하여 대화형 검색 서비스 로 재탄생시킨 것이다. 사용자는 대화형 검색이라는 자연스럽고 직 관적인 경험을 통해 편리하게 자신이 원하는 정보를 찾을 수 있다. 뿐만 아니라 챗GPT는 학습된 대규모 데이터를 바탕으로 양질의 응답까지 생성한다.
- 궁지에 몰린 구글, 바드 공개
한편 구글은 2023년 2월 8일 프랑스 파리에서 챗봇 바드Bard를 결합한 새로운 검색 시스템을 공개했다. MS가 새로운 AI 기반 검 색 엔진을 발표한 지 하루만에 나온 구글의 반격이다. 상당히 성급 해 보이기도 하는 이 대응에서는 구글의 다급함을 느낄 수 있는데, 구글의 검색 사업이 큰 타격을 받을 수도 있다는 위기감을 느끼고 있는 것으로 보인다. 사실 구글의 검색 엔진이 위협받는다는 것은 검색 사업뿐 아니라 이로 인해 광고 등의 기타 파생 비즈니스가 전 적으로 타격을 받을 수 있다는 것을 의미한다. 구글의 창업자 래리 페이지가 구글의 최종 종착지는 AI라고 이야기했으며 늘 'AI 퍼스트'를 외쳐 왔지만, 구글은 구글이라는 이름이 갖고 있는 무게감과 책임감 때문에 AI 알고리즘과 서비스 공개에는 다소 조심스러운 태도를 보여 왔다. 하지만 이번만큼은 숨 막히는 대응전을 펼치며 필사적으로 대응하고 있다.
바드는 구글의 언어 모델 람다LaMDA를 기반으로 하는 실험적인 대화형 AI 서비스로, 대규모 언어 모델과 웹의 정보를 기반으로 구 축되었다. 2023년 2월, 새로운 검색 시스템을 공개하는 자리에서 구글은 바드가 결합된 새로운 검색 엔진이 "완전히 새로운 방식으 로” 정보를 다룰 수 있게 해줄 것이라고 자신했다. 또한 “검색은 결코 해결된 문제가 아니며", "구글이 검색 시장에 몸을 담근지 25년이 다 되어가지만 검색은 여전히 구글의 가장 크고 혁신적인 도 전"이라고 강조했다. 완벽한 검색이 어려운 이유는 "사람들이 자연 스럽고 직관적으로 정보를 접하기를 기대하는 방식"과 "기술이 어 떻게 그러한 사람들의 경험을 강화할 수 있을지가 계속 변화하기 때문이다. 이러한 복잡하고도 어려운 검색이라는 영역에서 구글은 사람들이 자연스럽게 세상을 이해하는 방식을 반영함으로써, 마치 "우리의 마음처럼 작동하는 새로운 검색 경험"을 만들고 있다고 이 야기했다.
- 구글의 모기업인 알파벳의 매출 50퍼센트 이상은 검색 광고에서 발생한다. 하지만 바드와 같은 챗봇이 검색 엔진에 붙게 될 경우, 기존의 비즈니스 모델이 흔들릴 수밖에 없다. 구글은 새로운 검색 서비스로 기존의 검색 서비스의 매출이 줄어드는 자기 시장 잠 식cannibalization을 우려하지 않을 수 없다. 카니발 효과라고도 불리 는 자기 잠식 효과는 기업이 새롭게 출시한 제품이 매출 증대를 일 으키는 것이 아니라 오히려 기존 주력 상품의 매출을 마이너스로 만드는 현상을 뜻한다. 
- 이처럼 '검색'이라는 행위에는 무수히 많은 인간의 니즈가 담겨 있으며 그 니즈를 충족하기 위한 최적의 방법은 모두 다르다. 어떤 검색에서 우리는 챗봇을 통한 직문직답을 원하지만 어떤 검색에서 는 좀 더 구체적인 정보와 출처를 원하기도 한다. 그리고 때로는 텍 스트보다 이미지가 더 효과적인 경우도 존재한다. 구글은 이미 당 신이 무엇을 원하는지 알고 있다. 그동안 쌓은 데이터와 분석 결과 를 통해 온라인에서 무언가를 검색하는 사용자의 마음을 파악하고 있으며 이를 어떻게 사용자 친화적으로 제공할 것인지에 대한 노 하우도 장착한 상태이다. MS는 데이터 측면에서 자신들의 이런 약점을 충분히 파악하고 있기 때문에 최대한 많은 사용자 데이터를 모으고자 아직 완벽하지 않은 제품을 발 빠르게 시장에 선보인 것이다.
검색 시장에서의 전쟁은 미국만의 일이 아니다. 중국 최대 검색 엔진인 바이두는 AI 챗봇 '어ERNIE Bot'의 내부 테스트를 2023 년 3월까지 마무리하고 곧 공식 출시하겠다고 발표했다. 어니봇은 한자로 '문심일언'으로 표기하며, ERNIE는 지식 통합을 통 한 향상된 표현Enhanced Representation Through Knowledge Integration을 의미한다. 바이두의 챗봇은 챗GPT와 비슷한 방식으로 웹 기반 서비스로 먼저 제공된 뒤, 추후 바이두 검색 엔진에 통합될 것으로 보인다.
생성형 AI 기반 챗봇이 결합된 검색 엔진은 기존의 검색 엔진을 당장 대체하기는 힘들 것이다. 두 가지 패러다임은 당분간 공존하 는 형태로 현실의 서비스에 적용될 것이다. 하지만 이 과정에서 새 로운 실험적인 인터페이스가 탄생할 수도 있다. 더 나은 검색 경험 을 제공하는 것을 넘어 이를 어떻게 새로운 비즈니스 모델로 만들 고수익을 창출할 것인가를 지켜보는 것도 중요한 관전 포인트다.

- 시드 투자는 스타트업이 사업 아이디어를 제품 프로토타입이나 베타 서비스로 구축하는 단계에서 이루어진다. 시드 단계의 초기 투 자자들은 비록 스타트업의 비즈니스 모델이 제대로 검증된 상태가 아니더라도, 팀의 역량과 기술, 성장 가능성을 보고 초기 투자를 감 행한다.
시리즈 A는 시드 투자를 받은 스타트업이 출시한 프로토타입이 나 베타 서비스가 금액은 작지만 일관된 매출이나 실적 지표를 달 성했을 때 주로 이루어진다. 엄청난 성과는 아니더라도 성장 가능 성이 입증된 수익 모델을 기반으로 투자를 유치한다. 성장 가능성 이 확실하다면 서비스 지표만으로도 투자가 진행되지만, 대체로 수 익 모델에 대한 검증을 요구하는 것이 일반적이다.
- 시리즈 B는 본격적인 성장을 앞둔 스타트업 회사를 빌드업 하는 단계에서 받는 투자다. 즉, 정식으로 출시한 서비스가 상당한 수의 안정적 사용자 기반을 확보한 뒤, 사업을 확장하는 단계에서 이루 어진다. 투자 금액은 보통 국내 IT 스타트업을 기준으로 50~150억 사이이며, 투자 유치 이후의 기업 가치는 약 250~750억 원 사이에 서 형성된다.
생존을 위한 전쟁을 끝내고 비즈니스 모델이 검증된 기업들은 시 리즈 C 투자를 고려하게 된다. 보통 해외 시장으로 진출하거나 새로 운 연관 사업을 추진하는 단계에서 이루어지며, 기업 공개나 인수합 병이 가능한 기업들이 그 대상이다. 이 단계에서는 수백억 원 이상 의 투자가 이루어지며 투자 이후의 기업 가치도 약 750~1500억원 사이다. 대부분의 스타트업이 시리즈 C에서 외부 투자 유치를 마무 리하지만 더 큰 성장을 향해 시리즈 D, E, F까지 이어지는 경우도 있다.

- 하이퍼클로바는 이미 네이버의 다양한 서비스에 활용되고 있다. 검색어 입력 시 오탈자를 자동으로 수정하고, 네이버 쇼핑에 서 상품의 소개 문구 작성을 가이드 하거나, 클로바노트를 통해 회 의록을 요약하는 등의 기능은 하이퍼클로바의 숨은 공 덕분이다. 또한 하이퍼클로바를 손쉽게 쓸 수 있는 응용 서비스도 출시되었 다. 노코드 툴인 '클로바 스튜디오'가 그 예이다. 클로바 스튜디오 는 스타트업이나 개인이 코딩 없이도 AI 서비스나 앱을 개발할 수 있는 서비스이다. 실제로 국내 카피라이팅 서비스인 뤼튼은 클로바 스튜디오를 기반으로 제작되었다.
- 카카오브레인은 초거대 AI 모델 코GPTKoGPT를 오픈 API로 공개 했다. 코GPT는 한국어를 사전적, 문맥적으로 이해하고 사용자의 의도를 파악하여 문장을 생성하는 한국어 특화 언어 모델이다. 이 모델의 파라미터는 60억 개로 크기는 다른 모델들보다 비교적 작 은 편이다. 하지만 코GPT는 주어진 문장의 감정 분석, 질문에 대한 답변, 내용 요약 및 결론 예측, 다음 문장 작성 등 한국어와 관련된 언어 태스크에 강점을 보인다. 카카오브레인은 코GPT 모델의 크 기를 향후 100배 이상의 규모로 키울 예정이다.
또한 카카오브레인은 한국어 언어 모델 코GPT뿐 아니라 이미지 생성 모델 칼로의 API도 대중에게 무료로 공개했다. 이는 스태빌리 티AI와 비슷한 전략으로, 대중성을 경쟁력으로 삼고 있다. 이렇듯 카카오는 자체 개발한 혁신적 AI 모델을 API 형태로 지속적으로 공 개하고, 다양한 기업과의 협업 기회를 적극적으로 모색해 나가고 있다. 덕분에 개발자들은 코GPT를 활용해 앱을 개발하거나 서비 스의 성능을 높이는 데 활용할 수 있다. 가령 앱에서 키워드를 입력하면 문구를 자동 완성하거나 추천 문구를 보여주고 맞춤형 상품 추천 기능을 구현하는데도 이 모델을 사용할 수 있다. 또한 코드가 공개되어 있기 때문에 사용자가 풀고자 하는 문제에 맞게 모델을 파인 튜닝하는 것이 가능하다. 카카오브레인은 고객 서비스 플랫폼 및 광고 회사 등과 파트너십을 맺고 서비스 적용 범위를 넓혀 가고 있다.
카카오가 다른 언어 모델들과 차별되는 점 중에 하나는 코GPT 에 블록체인 기술을 적용할 로드맵을 가지고 있다는 점이다. 그렇 게 되면 코GPT의 학습을 지원하거나 고퀄리티의 참조 지식이 될 수 있는 데이터를 제공하는 사람은 모델의 지분을 가질 수 있다. 사용자가 이 모델을 사용했을 때 모델의 지분만큼 보상을 받는 구조 를 만들기 위함이다.
재미있는 전략이다. 이런 전략은 어쩌면 카카오가 무료 공개 메 신저로 시작해서 많은 사용자들을 모았고, 대중들의 커뮤니케이션 플랫폼이 되면서 혁신 비즈니스 모델들을 다양하게 만들어 본 경 험에서 비롯되는 것일지도 모른다. 만약 이 새로운 비즈니스 모델 이 만들어진다면, 특정 산업 분야에서 높은 퀄리티의 데이터를 가 지고 있는 개인이나 기업이 코GPT의 학습에 데이터를 제공하게 될 수도 있다. 개인이나 기업이 데이터를 제공할 유인을 블록체인 모델로 제공하고 있기 때문이다. 덕분에 코GPT는 비록 규모가 작 은 모델이지만 다양한 개인과 기업의 참여를 바탕으로 높은 성능 을 발휘하는 모델로 성장해 나갈 수 있을 것이다.
- 엑사원EXAONE은 이미지와 텍스트를 함께 학습한 멀티모달 초거대 AI 모델이다. 엑사원은 3천억 개의 파라미터를 가진 모델로 6천 억 개의 말뭉치와 2억 5천만 장의 이미지 - 텍스트 페어 데이터를 학습했기 때문에 언어와 시각정보를 통합적으로 다룰 수 있다. 텍스트를 입력하면 이미지를 생성할 수 있고, 이미지를 입력하면 텍스트로 설명하는 것이 가능하다.
엑사원은 '모두를 위한 전문가 AIExpert Al for Everyone'에서 이름을 따왔는데, 작명에서부터 느낄 수 있듯이 헬스케어, 금융, 교육, 제조 등 전 산업 분야에서 1퍼센트의 전문가와 같은 AI를 개발하는 것이 LG의 목적이다. 엑사원은 세상의 지식을 실시간으로 활용하고 현 실의 난제를 함께 해결하며, 최적의 의사 결정을 돕는 전문가 AI를 꿈꾼다. 즉, 전문가이면서도 폭넓은 AI로서 인간과 협력해 인류의 난제를 해결하고자 하는 휴머니즘적인 철학이 담겨있다.
- SKT가 제공하고 있는 에이닷은 사용자 맞춤형으로 다양한 정보 를 제공하여 사용자의 일상 관리를 돕는 서비스다. 아침에 사용자 를 깨우는 일부터 출근, 식사, 업무 일정 등 일상 루틴을 케어하고, 사용자의 관심사나 취향을 파악해 맞춤형 정보를 제안한다. 번거로 운 일들을 대신 처리해주고 사용자가 좋아할 만한 콘텐츠를 추천 해 주기도 한다. 이런 기능들은 SKT의 음성 비서 누구NUGU와 비슷 한 속성을 갖고 있다.
에이닷의 장점은 사람과 이야기하는 것처럼 자연스러운 소통이 가능하다는 점이다. 이를 위해 장기 기억 기술과 이미지 리트리벌 기술을 활용하고 있고 멀티모달 서비스를 적용 중이다. 장기 기억 은 오래된 대화 중 중요한 정보를 별도로 저장해 두었다가 대화 중 에 활용하는 기술이고 이미지 리트리벌 기술은 대화의 흐름상 가장 적합한 이미지를 찾고 소통에 활용하는 기술이다. 멀티모달은 텍스트뿐 아니라 음성, 이미지 등 다양한 데이터를 종합적으로 추 론하는 방식으로 보다 입체적인 소통을 가능케 한다. 또한 편향되 거나 부정확한 답변, 인식 오류 등에 대해서는 지속적으로 사용자 피드백을 통해 교정하면서 서비스를 고도화해 나가고 있다.
2023년 SKT는 자신들이 보유한 슈퍼컴퓨터 '타이탄'을 기존 대비 두 배의 규모로 확장했다. 컴퓨터에 설치된 엔비디아의 GPU 를 1,040개로 증설하였으며 초당 1경 7,100조 번의 연산 처리가 가능한 인프라를 구축했다. 이는 에이닷의 성능을 높여 가겠다는 적극적인 투자이다. 앞으로 에이닷에는 영어 학습, 사진 관리, 엑스 퍼트 서비스 등의 기능도 추가될 예정이며, 외부 사업자들에게도 API를 오픈해 생성형 AI 생태계를 지속적으로 넓혀 가고자 한다.

- 미국과 중국이 큰 축을 차지하고 있는 AI 전쟁에서 한국 기업은 어떻게 생존할 수 있을까?
검색 시장을 제패했던 네이버의 전략을 되짚어 보자. 구글 검색 이 정복하지 못한 3개국이 있다. 바로 중국, 러시아, 그리고 한국이 다. 나스미디어에 따르면 2022년 인터넷 이용자 조사에서 네이버 는 국내 검색 점유율 1위를 차지했다. 그 다음으로 유튜브, 구글이 뒤를 따른다. 구글 검색이 한국에 진출했을 때, 구글은 네이버보다 기술력, 한글 데이터, 자본, 관련 인재와 경험, 모든 면에서 앞서 있었다. 하지만 네이버는 이러한 격차를 극복하고 국내 검색 시장의 1위로 도약했다.
- 네이버는 국내 소비자의 감성과 니즈에 집중하고 이를 만족시키는 뾰족한 서비스를 제공했다. 네이버 실시간 검색은 지금 유행 하는 토픽을 알고 싶은 한국인들의 니즈를 저격한 서비스였다. 또 한 네이버 지식인은 기존 단순 검색에서 사용자가 스스로 필요 정 보를 모으고 종합해야만 하는 방식을 순식간에 바꿨다. 궁금한 내 용에 대해 질문을 던지면 전문가가 답변을 달아주는 새로운 검색 은 키워드 검색으로 만족할 수 없었던 소비자들의 마음을 사로잡았다. 검색 플랫폼과 연동된 네이버 카페, 블로그, 스마트스토어도 네이버 검색을 찾게 되는 이유다. 이런 사용자 니즈를 저격한 다양 한 모델들로 네이버 검색량은 급격히 증가하기 시작했다. 네이버는 이렇게 검색의 순환 구조를 만들면서 검색 시장의 지배력을 강화 해 나갔다.
AI도 마찬가지다. 네이버 검색이 특정 소비자 타깃의 니즈를 뾰 족하게 파고들었듯이, 불특정 다수의 소비자를 만족시키는 것이 아 니라 구체적인 소비자의 니즈를 노린다면 충분히 승산이 있다. 모 든 분야에 활용 가능한 AI가 아니라 미디어 AI, 엔터테인먼트 AI, 금융 AI, 교육 AI, 의학 AI와 같은 특정 분야에 특화된 AI 서비스 개 발에 집중하는 전략을 생각해 볼 필요가 있다.

- 깃허브의 코파일럿Copilot은 코드 자동 생성 서비스로 2022년 6 월 출시된 이후 많은 개발자들의 사랑을 받고 있다. 개발자의 반쪽 과도 같은 AI 프로그래머인 코파일럿은 코드 작성 에디터에서 실 시간으로 코드와 함수를 제안함은 물론, 코드 한줄 자동 완성부터 전체 코드 블록 작성까지 다양한 기능을 제공 중이다. 2022년 깃허 브의 조사에 따르면 88퍼센트의 개발자가 코파일럿이 개발자의 생 산성을 향상시켰으며, 96퍼센트가 코파일럿으로 반복적인 업무를 더 빠르게 처리할 수 있다고 응답했다.
- 깃허브의 코파일럿은 오픈AI의 코덱스Codex에 기반하고 있다. 코덱스는 자연어를 코드로 번역하는 모델로 비공개 베타 버전이 제공 중이다(2023년 2월 기준). 코덱스는 특정 작업 수행에 필요한 컴 퓨터 프로그램의 명령어인 커맨드를 자연어로 해석하고 사용자 대 신 커맨드를 실행할 수 있다. 코덱스는 GPT-3의 후손 격인 모델이 다. GPT-3 가 자연어 프롬프트에 대한 응답으로 자연어를 생성한 다면, 코덱스는 GPT-3의 자연어 이해 능력을 상당 부분 갖추고 있 지만 코드를 생성한다는 점이 다르다. 코덱스의 학습 데이터는 자연 어와 함께 공개적으로 사용 가능한 수십억 줄의 소스코드를 포함하 고 있다. 코덱스는 파이썬에 가장 탁월한 성능을 보이지만 이외에도 자바스크립트Javascript, PHP, 루비 Ruby, 타입스크립트Typescript, 쉘 Shell을 포함한 12개 이상의 프로그래밍 언어를 지원한다. 오픈AI 코덱스의 목표는 사람의 의도를 더 잘 이해하는 컴퓨터를 만들어 서 모든 사람이 프로그래밍으로 더 많은 일을 할 수 있도록 돕는 것이다.
코파일럿이 어떻게 작동하는지를 좀 더 자세히 살펴보자. 우선 개발자가 작성하고자 하는 코드의 로직을 설명하면 코파일럿이 개 발자의 의도를 구현하는 코드를 생성하고 제안한다. 그림에서는 '텍스트의 감성을 분석하는 코드를 웹 서비스를 사용해서 작성해 달라'는 개발자의 요청에 코파일럿이 곧바로 타입스크립트라는 프로그래밍 언어로 코드를 작성하는 것을 확인할 수 있다. 이런 식으 로 반복적인 코드 패턴을 만드는 일은 코파일럿에게 맡기고 개발 자는 구조를 개선하는 등 소프트웨어 개발에 있어서 더 중요한 일 에 더 많은 시간과 노력을 할애할 수 있다. 또한 개발자가 온라인에 서 코드 예제나 함수를 일일이 검색할 필요가 없으므로 많은 시간 과 노력이 절약된다. 코파일럿은 비주얼 스튜디오Visual Studio, 네오 빔Neovim, 젯브레인IDE'etBrains IDE와 같은 인기 있는 코드 편집기에 서도 지원되기 때문에 개발자가 다른 도구로 전환할 필요 없이 본 인이 선호하는 코딩 환경 내에서 사용할 수 있다는 장점도 갖고 있 다.
- 물론 코파일럿이 완벽한 코드를 작성하는 것은 아니며 코파일럿 이 생성한 코드가 100퍼센트 개발자에 의해 수용되는 것도 아니 다. 깃허브에 따르면 개발자는 코파일럿이 생성한 코드의 26퍼센 트 정도를 수락했으며, 개발자의 코드 파일 중 평균 27퍼센트 정도 가 코파일럿을 통해 생성되었다. 파이썬의 경우 코파일럿을 통한 코드 생성 비율이 40퍼센트까지 올라가기도 한다. 하지만 코파일 럿은 생성한 코드를 별도로 테스트하지 않으며 더 이상 사용되지 않는 라이브러리를 제안할 수도 있기 때문에 개발자가 직접 테스 트를 거치는 단계가 필수적이다. 그럼에도 이런 한계를 명확히 이 해하고 코파일럿을 활용한다면 더 효율적으로 코딩 작업을 수행할 수 있을 것이다.

- 유닷컴은 궁극적으로 구글의 대항마 자리를 노린다. 유닷컴의 CEO 리차드 소처는 구글이 폐쇄적이고 독점적인 검색 엔진이며, 광고 수익 극대화라는 목표 달성을 위해 사용자를 상대로 AI를 무 기화 했다고 비판한다. 또한 AI가 사용자를 조작하여 광고를 클릭 할 때까지 사이트에서 최대한 많은 시간을 보내도록 유도하는 것 은 이상적이지 않다고 지적한다. 이와 반대로 유닷컴은 개방형 검 색 플랫폼으로, 사용자에게 광고 폭격을 가하는 대신 사용자의 요 구를 충족시키는 것을 가장 중요하게 생각한다고 밝혔다. 또한 유 닷컴은 사용자들에게 검색 엔진 선택권이 있음을 강조한다. 같은 운영체제와 브라우저를 사용하더라도 다른 검색 엔진을 사용할 수 있는 기회와 권리가 있다는 것이다. 유닷컴은 아직 수익화 방법을 고민 중이지만 구글이나 빙 같은 광고 중심의 방식은 아닐 것이라 고 밝혔다. 오히려 덕덕고DuckDuckGo'와 유사한 비공개 광고를 검토 할 계획이라고 전했다. 또한 에세이와 블로그를 작성해 주는 기능에 대한 구독 모델이나, 주식 차트를 표시할 때 주식 앱을 연동하는 등 서드 파티 앱과의 연동을 통한 수익 모델을 고려 중이다.
유닷컴은 2022년 12월 생성형 AI를 도입했으며, 대화형 검색인 유챗은 유닷컴의 가장 특별한 기능이다. 사용자가 유챗을 통해 정 보를 검색하면 유챗은 온라인의 수많은 정보를 텍스트로 요약함과 동시에 출처에 대한 레퍼런스를 함께 표시한다. 사용자는 레퍼런스 의 하이퍼링크를 통해 출처에서 정보의 세부 내용을 확인할 수 있 다. 이는 생성형 AI가 갖고 있는 가장 큰 한계인 정확도와 할루시네 이션 문제를 일정 부분 극복한 것이다. 유챗은 멀티턴 대화도 지원하여, 사용자는 유챗이 제시한 정보를 바탕으로 연속적인 대화를 이어갈 수 있다. 가령 유챗이 추천한 컴퓨터 정보를 표로 정리해 달 라고 하면 표로 정리해서 보여주고, 유챗이 추천한 많은 제품 중에 서 하나만 추천해 달라고 하면 하나의 제품을 이유와 함께 추천해 준다. 이외에도 유닷컴은 에세이, 소셜 미디어 포스트, 블로그 등의 글쓰기, 코드 생성, 이미지 생성 등 생성형 AI를 활용한 기타 기능 들도 제공하고 있다.
유닷컴은 멀티모달 검색을 통해 서비스를 더욱 발전시킬 계획이 다. 계획이 실현될 경우, 사용자 질문의 성격에 따라 텍스트뿐 아니 라 이미지나 영상, 그래프, 표와 같은 다양한 접근법을 활용하여 질문에 더 적합한 응답을 생성할 수 있다. 
- 우리가 눈으로 보는 것을 컴퓨터가 알아듣는 언어로 표현하기 위해서는 기계와 대화할 수 있는 기술이 필요하다. 이런 기술을 구 매하기 위한 시장이 바로 프롬프트베이스이다. 프롬프트를 사고 판 다는 아이디어가 다소 생소할 수도 있다. 하지만 이 논리는 회사의 온라인 콘텐츠가 구글 검색 결과에서 더 높은 순위를 차지하도록 돈과 인력을 투입하는 검색 엔진 최적화와 큰 흐름에서 유사하다. 그럼에도 여전히 프롬프트를 돈을 주고 구매한다는 발상이 황당 한 이야기처럼 들릴 수 있지만 홈페이지에서 판매되는 상품들의 퀄 리티와 가격을 생각해 보면 생각보다 합리적이다. 현재 6.99달러에 판매 중인 레트로 푸드 스티커 이미지 파일은 기업용 판촉물을 만 드는데 사용할 수 있고, 1.99달러짜리 일러스트레이션 책 표지도 독립 출판을 준비하는 사람에게 유용하게 활용될 수 있다. 이처럼 상품들의 질이 유지될 수 있는 것은 프롬프트베이스가 프롬프트의 신 빙성을 위해 내부 검토 프로세스를 거치고 있기 때문이다. 마켓플레 이스에 등록된 모든 프롬프트는 사람이 직접 검토하며, 일관된 결과 를 안정적으로 생산하지 못하는 프롬프트는 이 단계에서 탈락한다. 게다가 다양한 스틸 사진을 생성할 수 있는 프롬프트는 저작권 걱 정 없이 마음 놓고 이미지를 사용할 수 있다는 점에서 아주 매력적이 다. 틱톡 비디오 스크립트, 비즈니스 모델 생성기, 책 작성, 유튜브 생 성기 등은 챗GPT의 인기 프롬프트로, 콘텐츠를 만드는 사람이라면 솔깃할 만하다. 물론 앞으로 풀어야 할 과제들도 남아 있다. 현재 프 롬프트베이스는 20퍼센트의 수수료를 받고 프롬프트 판매자는 수 익의 80퍼센트를 가져가는 구조로 되어 있다. 하지만 AI 작품이나 프롬프트의 저작권에 대한 문제는 합의가 되지 않은 영역이다.

- 혁신 기술은 새롭게 소비자 효용을 창출하면서 비즈니스 방식을 변화시키고 때로는 새로운 시장을 만들어 산업의 지형을 바꾼다. 하지만 무엇보다 중요한 사실은 혁신 기술이 등장하는 초기에는 이러한 변화의 상당 부분을 예측하기 어렵다는 것이다. 기술 혁신 이 일어나면 이전에는 전혀 상상하지 못했던 사회·경제적 양상, 시 장 그리고 심지어 문화의 변화까지 나타난다. 이렇게 혁신 기술로 인해 모든 것이 다시 시작되는 것 같은 순간이 찾아오는데 이를 '리셋 모먼트'라 부른다.
- 전략 기술 트렌드 예측으로 유명한 가트너는 생성형 AI가 적용 될 산업 분야를 어떻게 전망할까? 2023년 가트너는 생성형 AI가 활발하게 적용되고 있는 산업으로 다음의 다섯 가지를 꼽았다. 신약 설계, 재료 과학, 반도체 설계, 데이터 합성, 부품 설계가 그것이다. 신약은 보통 개발부터 시장에 선보이기까지 약 18억 달러의 비 용이 필요하다. 이 가운데 1/3은 신약 설계에 소요되는 비용이며, 이 단계에만 무려 3년에서 6년 정도의 시간이 필요하다. 생성형 AI 는 신약을 설계하는 이 기간을 수개월 단위까지 단축하며 비용을 획기적으로 줄일 수 있을 것이라 예측된다.
- 재료 과학과 관련성이 높은 자동차, 항공 우주, 방위, 에너지 등 의 산업 분야에서는 '인버스 디자인'을 통해 완전히 새로운 소재를 찾는 작업에 AI가 활용될 수 있다. 인버스 디자인이란 제품이 필요 로 하는 물성을 정의하고, 이로부터 역으로 해당 물성을 가질 가능 성이 높은 소재를 찾거나 만들어 내는 방법이다. 이 역시 데이터 분 석이 중요한 과정이므로 생성형 AI가 중요한 역할을 수행할 수 있 다.
반도체 또한 설계 단계에서 테스트를 거쳐 양산에 이르기까지 오랜 시간의 투자가 요구되는 분야이다. 생성형 AI는 이 과정에서 반도체의 설계를 최적화할 수 있는 디자인을 빠르게 만들어 냄으로써 몇 주씩 소요되었던 전문가의 제품 개발 라이프사이클을 단 몇 시간까지도 줄일 수 있을 것으로 기대된다.
지금까지는 개인 정보 보호 이슈 때문에 데이터 분석을 진행하 기 어려운 분야가 있었다. 하지만 생성형 AI를 활용하면 실제 데이 터의 통계적 특성을 파악하여 만들어 낸 가상 데이터 혹은 합성 데 이터를 토대로 데이터 분석을 진행해 이런 문제를 해결할 수 있다. 예컨대, 의료 데이터에서 개인 정보를 제외하고 실제와 유사한 가 상 데이터를 생성하여 연구 분석을 진행할 수 있는 것이다.
- 마지막으로 생성형 AI를 이용하여 성능, 재료, 제조 방법 등 특정 목표와 제약 조건을 충족하는 최적화된 부품을 설계할 수도 있다. 예를 들어, 자동차 제조 업체에서는 생성형 AI로 최적화된 부품을 설계함으로써 최종 제품인 자동차의 연비 향상을 이룰 수도 있다. 또한, 가트너는 2022년 기준 아직까지는 마케팅 메시지의 2퍼 센트만이 생성형 AI를 통해 만들어지고 있지만 2025년에는 대형 기업의 아웃바운드 마케팅 메시지 중 30퍼센트가 생성형 AI의 도 움을 받을 것이라고 예측한다. 그뿐만 아니라 영화 산업에서는 2030년 주요 블록버스터 영화의 90퍼센트가 생성형 AI로 만들어 질 것이라 예견하기도 했다. 

- 쉽고 빠른 카피라이팅 전문가: 카피스미스
카피스미스Copysmith가 사용자들에게 어필하는 포인트 중 하나 는 '빈 페이지 앞에서 멍하니 시간을 보내고 있지 말라'는 메세지이 다. 카피스미스에 당장 떠오르는 키워드를 넣는 것만으로도 카피라 이터, 블로거, 마케터는 빠르게 창의적인 아이디어를 얻고 점점 더 풍성하게 콘텐츠를 만들어 갈 수 있다고 강조한다. 카피스미스는 창의력이 풍부하든 그렇지 않든 누구나 쉽고 빠르게 광고 콘텐츠 작성을 시작할 수 있게 도와준다고 홍보한다.
카피스미스는 GPT-3를 기반으로 카피라이터와 AI 전문가가 함께 설계한 카피라이팅 서비스이다. 이 서비스는 사용 케이스에 따라 분류한 50개 이상의 템플릿을 제공한다. 또한 원하는 템플릿이 없는 경우 맞춤형 콘텐츠를 생성하는 것도 가능하다. 사용자가 해 야 하는 일은 단지 몇 개의 키워드를 입력하는 것뿐이다. 브레인스 토밍, 리서치, 초안 작성, 편집, 교정 등의 과정에 필요한, 지루하고 시간이 많이 걸리는 노력을 획기적으로 줄여준 것이다. 이렇게 AI 의 도움을 받아 매력적인 카피를 순식간에 생성한 사용자는 추가 적으로 콘텐츠의 완성도를 높일 수 있다. 이를 위해 카피스미스는 광고, 소셜 미디어부터 블로그 게시물까지 단어 수 및 가독성까지 체크해 준다. 또한 표절 검사기가 내장되어 있어서 작성한 카피를 검증하는 데도 활용할 수 있다.
카피스미스의 또 다른 특징은 팀원들과 함께 공동 작업을 할 수 있다는 점이다. 서비스의 UI에서 콘텐츠 작업에 팀원을 할당하고 작업 상태를 설정하기만 하면 쉽게 작업을 공동으로 진행할 수 있 다. 카피스미스는 크롬 브라우저의 확장 프로그램도 제공하고 있 고, API로도 활용이 가능하다.
카피스미스는 2020년 설립된 미국 스타트업으로, 쉽게 배포할 수 있는 AI 서비스를 통해 고객의 성장을 촉진하겠다는 목표로 설 립되었다. 2021년에 자신들의 서비스를 구글 애즈Google Ads에 통합 하는 기능을 출시했고, 현재는 생성형 AI 기반 카피라이팅 플랫폼 을 구축하기 위해 새로운 기능과 콘텐츠 템플릿을 지속적으로 만 들어 나가고 있다.

- 생성형 AI의 사용자는 자신이 원하는 방향으로 콘텐츠가 만들어 지게끔 프롬프트를 통해 AI를 잘 이끌어야 한다. 프롬프트가 구체 적이고 창의적일수록 더 고퀄리티의 결과물이 나온다. 아마존에는 이미 달리, 미드저니, 스테이블 디퓨전 관련 이미지 프롬프트 책이 다수 출간되었고, 앞 장에서 살펴본 프롬프트베이스처럼 프롬프트 를 돈 주고 거래할 수 있는 마켓플레이스도 등장했다. 따라서 '프롬 프트 엔지니어링'은 지금보다 똑똑한 차세대 AI가 등장할 때까지는 특히 창작 영역에서 가장 중요한 기술이자 직무로 자리 잡을 가능 성이 높다.
- 또한 프롬프트는 한두 번의 입력으로 끝나지 않는다. 모델이 이미지나 텍스트와 같은 콘텐츠를 생성하면 다시 사람이 이를 평가 하고 편집하는 파인 튜닝 작업이 이루어져야 하는데, 특히 이미지 생성 모델은 상당히 긴 과정의 프롬프트 엔지니어링을 거쳐야 한 다. 미술전에서 1등을 차지한 제이슨 앨런과 미드저니의 합작품은 무려 80시간 이상, 900개 이상의 습작으로부터 탄생한 결과이다. 제이슨은 원하는 그림을 얻을 때까지 프롬프트를 계속해서 미세 조정한 뒤, 어느 정도 원하는 결과물이 나왔을 때 어도비 포토샵과 AI툴을 활용해 이미지의 품질과 해상도를 높였다. 그렇게 완성된 세 개의 작품이 캔버스에 인쇄되어 세상에 드러난 것이다.
이처럼 창작의 영역은 AI가 가장 빠르게 발전하고 있는 부분이 지만 동시에 여전히 인간의 개입이 필수적인 분야이다. 이런 흐름 에 맞게 창작과 콘텐츠 분야의 생성형 AI는 사용자와 AI 사이의 협 업을 증진하고, 사용자가 AI를 활용해서 더 좋은 결과물을 만들 수 있도록 지원하는 방향으로 흘러가고 있다.
- 생성형 AI는 아직 전문가가 만든 콘텐츠 만큼 고퀄리티의 영상 을 생성하지는 못하고 있다. 하지만 기술력이 성숙하는 단계에 이 르면 멀티미디어 영역에서도 고도화된 모델을 기반으로 다양한 서 비스가 나올 것으로 기대된다. 다만 구글과 메타는 텍스트를 영상 으로 바꾸는 AI의 소스코드는 공개하지 않았다. 유명인이나 지인을 합성하는 악용 사례를 우려한 결정이다.
대표적인 미디어 매체인 뉴스의 경우에도 생성형 AI 서비스의 혜택을 누릴 것으로 보인다. 데이터 수집과 같은 저널리즘의 단순 업무는 생성형 AI를 활용해 자동화하고, 기자와 편집자는 스토리라 인 등에 집중하는 것이다. 이제 미디어 업계에서 AI는 일종의 필수 도구가 되었다. 이 새로운 도구를 얼마나 잘 활용하는지가 경쟁력 이 되는 시대가 온 것이다.
- 지금까지 디자인은 인간의 창의성이 표현되는 대표적인 영역이 었다. 디자인을 포함해 예술 분야에서는 도구에 대한 논란이 끊임 없이 등장해 왔다. 사진 기술이 처음 등장했을 때 과거의 예술가들 은 사진을 예술로 인정하지 않았다. 하지만 현대의 사진은 엄연한 예술의 영역으로 인정받고 있다. 디지털 도구로 사진을 편집하는 포토샵이 처음 등장했을 때도 이런 도구는 예술가의 영역을 침범 하고 과도한 경쟁을 유발한다는 논란이 있었다.
이런 역사를 통해 우리가 잊지 말아야 하는 점은, 언제나 새로운 도구가 도입되었을 때는 이를 거부하는 사람들이 있었고, 반대로 이를 적극적으로 채택하여 본인의 경쟁력을 강화해 온 사람들 또 한 있었다는 것이다. 생성형 AI 서비스는 디자이너가 반복적인 작 업을 간편하게 처리해 효율적으로 작품과 디자인에 대한 아이디어 를 빠르게 떠올리도록 도울 수 있다. 예를 들어, 챗GPT에 "[무언 가]에 적합한 색 구성표를 찾아줘"와 같은 요청을 할 수 있다. 이러 한 사용자의 요청에 대해 챗GPT는 몇 가지 권장 사항을 제공하는 데 이를 참고하여 디자인 가이드로 활용할 수 있다. 디자인 AI는 과 거의 사진 기술처럼 논란의 대상일 수도 있지만, 생성형 AI가 디자 이너에게 유용한 도구라는 사실은 분명하다. 디자인 분야가 생성형 AI를 활용해 더 풍부한 영역으로 나아갈 수 있을지는 디자이너들 의 선택에 달렸다.

- 키퍼와 타뷸레이트 서비스는 모두 GPT-3 모델을 기반으로 하 고 있다. 이들은 언어 모델의 텍스트 처리 능력을 기반으로 데이터 를 분류하고 편리한 세금, 회계 관리를 지원한다. 재밌는 것은 둘다 명확한 고객층을 타깃으로 서비스를 시작했다는 점이다. 키퍼는 긱 워커와 크리에이터, 타뷸레이트는 푸드트럭이나 중소규모의 식당 을 운영하는 사람 등을 주요 고객으로 삼고 서비스를 개발했다. 세 무사나 회계사를 고용하기에는 비용이 부담되고 또 기존의 소프트 웨어가 잘 지원하지 못하는 고객을 시작으로 점차 비즈니스 영역 을 확장해 나가고 있는 것이다.
- 현재 금융 분야에서 생성형 AI는 금융 서비스의 단순 자동화와 비용 절감에 주로 활용되고 있다. 하지만 점차 초개인화된 금융 자 문 서비스로 발전해 나갈 것이다. 예컨대 계좌 잔액 확인, 결제, 투 자 추적과 같은 고객 응대 서비스에 주로 활용되기 시작하여, 이후에 는 은행 직원의 도움 없이 생성형 AI와의 대화를 통해 금융 거래를 빠르고 효율적으로 완료할 수 있게 될 것이다. 기업 입장에서는 콜센터 및 오프라인 지점 운영 비용을 절감할 수 있다.
하지만 이는 정말 기초적인 수준에 불과하다. 앞으로 생성형 AI 가 금융에 미칠 영향은 고객 서비스 이상이 될 것이다. 챗GPT가 대중에게 충격을 주었던 것은 단순히 기존 데이터를 잘 요약해 주 었기 때문이 아니다. 이는 기존 데이터를 기반으로 새로운 내용을 '생성하는 일이 가능했기 때문이었다. 따라서 생성형 AI는 방대한 양의 금융 데이터를 학습해 기존 분석가들이 볼 수 없었던 트렌드와 패턴을 포착하고 미래를 예측하는데 활용될 수 있다. 예를 들어 뉴스 기사, 수익 보고서, 애널리스트 보고서와 같은 대량의 금융 관 련 데이터를 처리하고 분석해서 주식 또는 전체 시장 예측에 대한 새로운 의견을 생성할 수도 있다.
또한 생성형 AI는 개인에게 맞춤화된 금융 조언과 상품 추천 등 을 제공하게 될 것이다. 이를 통해 더 많은 소비자가 더욱 개인화된 금융 경험을 누릴 수 있다. 자산가들이 주로 이용하는 자산관리 서 비스는 AI를 통해 대중화될 것이며, 재정 자문 및 계획, 투자 추천, 포 트폴리오 관리 등의 서비스를 일반인도 사용할 수 있게 될 것이다.
- 2016년 설립된 노션랩스Notion Labs는 미국 샌프란시스코에 본사 를 두고 있는 유니콘 스타트업으로, 현재 시리즈 C까지 총 3억 4000만 달러가량의 투자를 받았다. 이 기업은 메모, 문서, 프로젝 트 관리, 웹 사이트 등 모든 업무 관련 애플리케이션을 통합한 올인 원 업무 서비스 노션을 제공하고 있다. 노션이 갖는 장점은 업무를 위해 여러 가지 앱을 사용했던 기존 서비스와 달리 하나의 서비스 에 모든 기능을 통합했을 뿐만 아니라 직관적인 인터페이스까지 갖추고 있다는 점이다. 이런 특징이 유효하게 작용해, 출시 후 사용자들의 폭발적인 호응을 얻으며 현재 50개국 이상의 고객들이 사용하고 있다.
노션랩스는 2023년 2월 노션AI 서비스를 출시했다. 오픈AI의 GPT-3 모델을 기반으로 문서 작성을 지원하는 서비스이다. 현재 영어를 비롯해서 한국어, 일본어, 프랑스어, 독일어 총 다섯 개 언 어로 서비스를 지원하고 있다. 하지만 GPT-3가 영어 텍스트를 주 로 학습한 모델인 만큼 영어 버전의 성능이 가장 높다.
노션 AI는 총 14개 기능을 제공한다. 주요한 기능으로 사용자가 참신한 아이디어를 떠올릴 수 있게 도와주는 브레인스토밍, 더 빠 른 업무를 위한 단순 작업 자동화, 맞춤법 오류, 문법 오류 수정 및 번역 등을 제공 중이다. 게다가 작성된 글의 콘셉트도 클릭 한 번으로 바꿀 수 있다. 캐주얼한 글인지, 전문가 스타일의 글인지만 선택 하면 노션AI가 전체 글을 다듬어 준다. 전문 글쓰기를 하는 사람들 이 글쓰기를 빠르게 시작하고 편하게 마무리할 수 있도록 돕는 기 능이다.
노션AI는 메모 요약, 할 일 목록 정리, 콘텐츠 커스텀이 가능한 AI 블록을 제공한다. 이 기능들을 활용하면 이제 회의록을 작성할 사람을 따로 지정할 필요가 없어진다. 회의를 녹음해서 업로드하기 만 하면 회의 내용 요약에서 해야 할 일 정리까지 순식간에 처리되 기 때문이다.

- 그 목적에 따라 검색 양상은 크게 네 가지 정도로 분류해볼 수 있다. 첫 번째 검색 양상은 룩업형 검색 Exploitative, lookup search이다. 가장 기본적인 검색 방식으로 사용자가 찾고자 하는 목표가 명확 한 경우이다. 사용자는 자신이 뭘 원하는지를 분명히 알고 있고 비 교적 객관적인 정답이 존재한다. 날씨나 제품의 가격을 묻거나 유 명인의 생일을 확인하는 것이 이에 해당한다.
두 번째 검색 양상은 탐사형 검색 Exploratory search 으로 탐사형 검색을 하는 사용자는 자신이 무엇을 원하는지에 대한 목표도 불분 명하고 해당 영역에 익숙하지 않다. 사용자는 부정확한 검색 쿼리 를 이리저리 수정하고, 초기 결과를 바탕으로 쿼리를 반복적으로 재구성하는 등 매우 역동적인 행동을 보인다. 예를 들어 뉴스를 통 해챗GPT를 처음 접한 사용자가 챗GPT를 통해서 무언가 해보고 싶다는 생각이 들어서 인터넷을 찾는 경우가 탐사형 검색에 속한다. 세 번째로 룩업형 검색과 탐사형 검색의 양상이 결합된 유형인 하이브리드 검색 Hybrid search이 존재한다. 사용자가 자신이 뭘 원하는지는 알고 있지만 더 많은 정보와 추가 탐색이 필요한 케이스다. 이때 사용자는 한 번의 쿼리로 검색을 끝내는 것이 아니라 다수의 문서와 항목들에 걸쳐 반복적으로 검색하고 정보들을 종합해야 한다. 제한된 예산 내에서 컴퓨터 구매를 위한 결정을 내리는 경우가 여기에 해당한다.
마지막 검색 양상은 대규모 언어 모델 그리고 생성형 AI의 탄생 과 함께 등장한 생성형 검색 Generative search이다. 챗GPT에게 소설 이나 이메일을 써 달라고 하거나, 코드 작성을 요청하는 경우가 여 기에 해당한다. 이는 기존 검색 엔진에서는 찾아볼 수 없었던 검색 양상이다.

- GPT-3.5를 기반으로 한 챗GPT는 입출력이 텍스트에 제한되어 있었다. 그리고 2023년 3월 14일 오픈AI는 GPT-4를 공개하면서 자신들의 모델이 대규모 멀티모달 모델large multimodal model로 진화 하였음을 발표했다. GPT-4는 이전보다 매개변수가 더 커지고 성 능도 향상되었으며, 특히 창의력과 추론 능력이 발전하였다. 이제 막 출시된 GPT-4는 듀오링고Duolingo, 칸 아카데미, 모건스탠리 Morgan Stanley와 스트라이프Stripe 등 교육에서 금융에 이르기까지 다양한 분야에서 서비스 고도화를 위해 도입하고 있다.
- GPT-4의 가장 인상 깊은 변화는 텍스트와 이미지를 모두 입력 으로 받아 이해하고 처리할 수 있는 멀티모달 모델이 되었다는 점이다. 예를 들어, 냉장고 내용물 사진을 제시하고 어떤 요리를 만들 수 있는지 물어보면 GPT-4는 사진 속 재료로 만들 수 있는 음식 을 제안한다. 또한 이미지의 유머 코드를 이해하는 것까지도 가능 하다.
멀티모달 모델이 적용된 GPT-4는 실제 서비스에 적용될 수 있도록 테스트 과정을 거치고 있다







'IT' 카테고리의 다른 글

크립토사피엔스와 변화하는 세상의 질서  (2) 2024.01.31
챗 GPT전쟁  (1) 2023.12.26
오늘날 우리는 컴퓨터라 부른다  (2) 2023.12.07
박태웅의 AI강의  (1) 2023.12.05
로봇의 지배  (0) 2023.08.14
Posted by dalai
,

- 각각 독자적으로 미적분학을 만들어 낸 뉴턴과 라이프니츠의 업적 과 관련해 역사책을 뒤져 보면 편지로 영국 해협을 왕래하며 서로 표 절이라고 신랄하게 비난하던 당시 사람들의 어리석음에 대해 읽을 수 있다. 둘을 비교할 때 우리 이야기에 관련된 한 가지 중요한 사실은 라 이프니츠가 만들어 낸 기호가 더 우수했다는 점이다. [7] 적분을 위해 사 용하는 핵심 기법(교과서에서는 '치환적분법'이라고 부르는)은 라이프 니츠의 기호를 사용할 때 거의 자동으로 이루어지는 반면, 뉴턴의 방식 에서는 더 복잡하다. 혹자는 미적분으로 인해 빠르게 발전하던 다른 유럽 지역의 수학에 비해 영국이 뒤쳐졌던 이유를 맹목적으로 자국의 영웅인 뉴턴을 떠받들던 그 시대 영국의 분위기 때문이었다고 말한다.
- 범용의 문자 체계
라이프니츠가 어린 시절 꿈꾸었던 '놀라운 생각', 즉 사람의 생각을 나 타내는 기호와 그 기호를 처리해 생각을 계산하는 기계는 어떻게 되었 을까? 자기 혼자서는 이 원대한 꿈을 이룰 수 없다는 사실을 잘 알고 있었지만 그는 절대로 꿈을 포기하지 않았고 그 꿈에 대해 계속해서 글을 써냈다. 기초 연산과 대수학에서 사용하는 특별한 문자들, 화학 이나 천문학에서 사용하는 기호들, 그리고 그가 미분과 적분 방정식에 서 사용했던 기호들은 적절한 기호가 문제의 해결에서 얼마나 중요한 지 새로운 패러다임을 보여 줬다.
라이프니츠는 이처럼 특별한 문자 기호들이 가능케 하는 새로운 언 어 체계를 '문자 체계 characteristic'라고 불렀다. 기호 자체에 의미가 없는 알파벳과 달리 앞에서 소개한 기호들은 실제적인 문자 체계로 각각의 문자 기호가 분명히 존재하는 개념을 자연스럽게 나타낸다. 라이프니츠는 범용의 문자 체계가 필요하다고 믿었다. 이러한 범용 체계는 실 제로 존재하고 모든 인간의 생각을 다 표현할 수 있다는 믿음이었다. 프랑스의 수학자 기욤 드 로피탈에게 쓴 편지에서 라이프니츠는 이 렇게 썼다. "대수학을 푸는 비밀은 부호를 어떻게 사용해 내는지 그기 술 여부에 달려있습니다. 적절하게 부호를 사용하면, 이 부호가 '아리 아드네의 실타래10'가 되어 학자들이 자신의 체계를 만들도록 인도할 것입니다."
20세기 초반 논리학자이자 라이프니츠를 연구한 학자 루이 쿠투라 는 이렇게 설명했다.
대수학에서 기호는 수학의 시스템 자체를 상징한다고 볼 수 있고 모델로도 쓰인다. 이는 또한 라이프니츠가 꾸준히 인용했던 것처럼, 적 절한 기호의 선택이야말로 논리를 추론해 가는 데 유용할 뿐 아니라 꼭 필요하다는 걸 보여 준다. 
아마도 라이프니츠와 많은 서신을 교환했던 프랑스의 학자 장 갈로이 스에게 보낸 이 편지의 글만큼 그의 문자 체계 제안을 잘 설명하는 것 이 없을 듯하다.
나는 이 새로운 과학 체계의 실제 가치를 점점 더 확신하고 있습니 다. 하지만 이 과학 체계의 의미를 이해하는 사람은 거의 없다고 봐도 좋습니다.... 이 체계는 어떤 특정한 언어로 구성되어 있습니다. · 이것이 우리 생각의 관계들을 완벽하게 표현합니다. 이 체계의 문자들은 지금까지의 상상과는 완전히 다를 것입니다. 사람들이 대 수학이나 기초 연산에서 하는 것처럼 이 문자들은 의미를 만들고 판 단하는 데 사용되기 때문입니다. 이 체계는 대단히 강력한데, 그중 이 문자 체계를 사용하면 말이 안 되는 것(거짓된 사실)들은 표현할 수 없다는 점이 특히 중요합니다. 무지한 사람은 그 체계를 사용할 수 없습니다. 아니면 그 체계를 사용하면서 똑똑해질 것입니다.

- 불은 논리의 추론이 수학의 한 분야로 발전할 수 있음을 증명하는 위대한 업적을 남겼다. 아리스토텔레스가 논리학을 개척한 이후로 (그리스 시대의 스토아학파와 20세기 유럽 학자들에 의해) 몇 가지 발전이 있긴 했지만 불은 아리스토텔레스가 2000년 전에 남겨 놓았던 주제를 재발견하게끔 했다. 수리 논리학mathematical logic은 불 이후 현 재에 이르기까지 지속적으로 발전하고 있다.

- 칸토어는 뛰어나고 혁신적인 사상가였다. 그의 추상적 원칙과 일관된 수학적 직관은 무한이라는 새로운 수학 세계를 만들어 냈다. 그의 정리들은 여전히 변화 없이 사용되고, 현대에 와서 그보다 더 엄밀한 체계를 사용할 수 있는 집합론 학자들에 의해 계속 발전하고 있다.
그러나 칸토어는 정신적으로 심각한 문제가 있었는데, 조울증으로 인해 감정의 극단을 오가며 고통 받고 있었다. 또한 자신의 연구를 무 의미하게 여기는 스승 크로네커로 인해 깊은 상처를 받았다. 그는 크 로네커의 반대가 단순히 말 수준을 넘어 여러 차례 그의 연구를 지연 시키거나 막았다고 믿었다. 그러나 크로네커와 그와의 관계는 여전히 우호적이었고 그의 연구들은 급진적인 내용을 담았음에도 모두 출판 되었다. 부유한 학자였던 크로네커는 학계의 논쟁을 멀리하고 스스로 만들어 낸 방법들로 수학을 파고들어 중요한 결과를 만들어 내는 데 만족하고 있었을지도 모른다. 그리고 이들이 만들어 낸 결과를 현재의 연구와 교육에 사용하고 있는 우리는 두 사람 모두를 존경해야 한다.

- 폰 노이만과 훗날 컴퓨터에 대해 함께 연구했던 사람은 폰 노이만이 수학의 일관성 증명을 위해 얼마만큼 노력을 기울였는지 엿볼 수 있는 재미있는 일화를 소개했다.
하루 일과를 마치고 나면 (폰 노이만은) 침대에 누워 새로운 통찰을 얻을 때까지 깨어 있곤 했습니다. (수학의 일관성을 증명하기 위해 계속해서 생각했지만 성공하지 못했던 겁니다! 어느 날 밤 그는 꿈속 에서 걸림돌을 해결하는 방법을 발견해서 더 길게 증명을 이어갈 수 있었습니다. 그리고 다음날 아침 다시 증명에 매달렸지만 실패했습 니다. 그리고 그날 밤 다시 침대에 누워 꿈을 꾸었습니다. 이번에는 정말로 그 걸림돌의 해결책을 찾은 겁니다. 그러나 아침에 깨었을 때 는 ... 여전히 문제점이 남아 있었습니다.
폰 노이만은 “세 번째 밤 역시 꿈을 꾸었다면 결과는 달랐을 것입니다!"라고 재치 있게 술회했다. 

- 1930년대 프린스턴에서 수학을 둘러싸고 벌어진 일들
1930년대 (그리고 1950년대까지) 프린스턴의 수학과는 낮은 층수의 매력적인 붉은 벽돌 건물인 파인 홀Fine Hall에 입주해 있었다. 그 시절 파인 홀에서는 프린스턴 대학교의 수학과 교수들뿐 아니라 고등연구 소의 수학자들이 일하고 있었다. 나치 정권을 피해 미국으로 탈출한 과학자들이 대거 유입되었으며, 프린스턴에 모여 있는 수학자들의 재 능은 1930년대에 이르러 괴팅겐과 견줄 만했고 곧 괴팅겐을 능가했 다. 파인 홀의 복도에서는 바일, 아인슈타인, 폰 노이만과 같은 사람들 을 마주칠 수 있었다. 이때의 폰 노이만은 수학의 근본에 관한 힐베르 트의 프로젝트에서 아주 멀어져 있었다.
논리학자 알론조 처치 역시 프린스턴 대학교의 교수 중 한 명이었 다. 또한 수학자로서 뛰어난 업적을 남긴 스티븐 클레이니와 버클리 로서가 처치의 박사과정 학생으로 거기에 있었다.

- 1947년 2월 20일 튜링은 런던 수학 학회에서 디지털 전자 컴퓨터를 주제로 한 강연 중 에이스에 대해 이야기했다. 그는 1936년 쓴 <계산 가능한 수> 논문에 대한 이야기로 시작했다.
나는 중앙에서 제어하고, 무한한 테이프에 담겨 메모리에 제한이 없 는 기계에 대해 상상했습니다. 한 가지 결론은 사람이 대략적으로 셈을 하는 과정'과 '기계의 과정'은 동일하다는 것입니다. 에이스와 같은 기계는 내가 상상했던 기계의 실제적인 버전이라고 생각할 수 있 습니다. 에이스와 같은 디지털 컴퓨터는 범용 기계의 실제적인 버전 이라고 부를 수 있을 만큼 둘 사이에는 유사점이 아주 많습니다.
튜링은 이어서 이런 질문을 던졌다. "컴퓨터는 이론적으로 얼마만큼 사람을 흉내 낼 수 있을까요?" 이어서 그는 컴퓨터가 스스로 배울 수 있고 때론 실수도 할 수 있도록 프로그래밍할 수 있을지 질문했다. “이 렇게 이야기할 수 있는 여러 가지 정리가 있습니다. ... 기계에 실수가 없다면 지능이 있다고 이야기할 수도 없습니다.... 그러나 이러한 증 명은 기계가 실수를 한다는 가정하에 얼마만큼의 지능을 보일 수 있을 지는 이야기하지 않습니다."
이 말은 괴델의 불완전성 정리를 에둘러댄 언급이었는데, 다음 장에 서 더 이야기하겠다. 튜링은 컴퓨터가 사람보다 더 완벽하리라 기대해 서는 안 된다고 하며 '컴퓨터에게 공정한 게임'을 요청했다. 그러면서 그 시작으로 체스 게임이 적절한 연습이 되리라 제안하며 강연을 마무 리했다. 아직 그러한 기계가 단 하나도 완성되지 않았을 때였다! 전해 지는 말에 따르면 청중들은 놀라 아무 말도 못했다고 한다.
블레츨리 파크의 책임자들은 적절한 재정과 지원을 얻지 못하게 되자 윈스턴 처칠에게 편지를 보냈고 처칠은 즉시 그들이 필요로 하는 지원 을 얻도록 조치했다. 그러나 에이스 제작은 우선순위에서 밀렸고 NPL 담당자들은 관리에 미숙했다.

- 사람의 자아 인식은 우리가 각자의 고유한 개성을 경험하는 주요한 방식이다. 그러나 우리는 오직 우리 마음으로만 인식할 수 있다. 우리 는 우리 자신의 자아만 인식하지 다른 사람들의 의식은 알지 못한다. 내 아내는 자신의 의식이 대부분 시각적 이미지로 채워져 있다고 강조 한다. 아내의 의식과 내 의식이 정말로 같은 종류일까? 의식은 도대체 무엇이고 의식의 목적은 무엇이란 말인가? 내가 이 글을 쓰며 적절한 표현을 찾고 있는데 운이 좋을 때는) 마음 깊은 곳에 있는 의식에서 그 단어가 떠오른다. 내 머리에서 어떻게 그렇게 신기한 일이 벌어지 는지는 나도 모른다. 단순한 진리는 이 시점에 자각이란 현상은 여전히 미스터리로 남아 있다는 사실이다.






'IT' 카테고리의 다른 글

챗 GPT전쟁  (1) 2023.12.26
챗 GPT 거대한 전환  (1) 2023.12.24
박태웅의 AI강의  (1) 2023.12.05
로봇의 지배  (0) 2023.08.14
AI빅뱅  (0) 2023.08.14
Posted by dalai
,

박태웅의 AI강의

IT 2023. 12. 5. 07:12

- 챗GPT의 답은 물을 때마다 조금씩 달라집니다. 그 이유는 챗 GPT의 답의 자유도를 설정할 수 있기 때문입니다. 이것을 챗 GPT의 온도temperature라고 부릅니다. 흔히 0도에서 1도 사이 로 설정합니다. 0에 가까울수록 정답만 말합니다. 트랜스포머 는 주어진 단어들을 보고 그 뒤에 올 가장 근사한 단어를 찾아 내는 모델이라고 했지요? 가장 높은 점수를 받은 단어만 결과 로 내놓는 것을 0도의 온도라고 부릅니다. 이렇게 되면 같은 질 문을 몇 번을 묻더라도 동일한 답을 내놓을 겁니다. 1에 가까울수록, 그러니까 온도가 높아질수록 자유도가 높아집니다. 가장 점수가 높은 단어뿐 아니라 그것과 비슷한 점수를 받은 다른 단어들을 내놓는다는 뜻입니다. 문장은 여러 개의 단어로 이뤄 지므로 첫 번째 단어로 다른 것을 내놓으면 그다음에 올 단어 들도 모두 달라질 가능성이 높습니다. 챗GPT의 온도는 0도로 설정되어 있지 않으므로, 물을 때마다 조금씩 다른 답이 나오 게 되는 것입니다.
- 인공지능은 '잠재된 패턴'이 있는 곳에서는 어디서나 위력을 발휘할 수 있습니다.
컴퓨터 프로그래밍은 인간이 만든 언어를 가지고 하는 일입니 다. 그러니까 굉장히 규칙적이고 닫힌 세계에 있지요. 이런 곳 에서는 GPT가 굉장히 잘 쓰일 수 있습니다. 이미 여러 소프 트웨어 회사들이 챗GPT를 쓰고 있는데, 경험자들은 똘똘한 3 년 차 개발자 서너 명이 옆에 붙어 있는 것과 비슷한 것 같다고 말합니다. 법률사무직도 인간이 만든 엄격한 형식에 따라 움직이는 곳이니 당연히 인공지능이 잘할 수 있습니다. 언론 보도도 마찬가지입니다. 비슷한 형식을 갖춘 기사들이 있지요. 가령 일 기예보라든가 스포츠 경기의 결과 보도가 그렇고, 주식시장의 움직임도 그렇습니다. 숫자에 따라 대개 비슷한 패턴을 보이지 요. 지표에 따라 투자하는 주식 거래도 마찬가지고요. 그래픽 디자인 쪽도 생성형 인공지능의 발전이 하루가 다릅니다. 디 자이너가챗GPT를 잘 쓰는 사람일 경우에는 짧은 시간에 굉장 히 많은 일을 할 수 있기도 합니다. 사람들이 챗GPT에 열광하 는 데는 분명한 이유가 있습니다.
- 말하자면 지금의 인공지능은 '어려운 일은 쉽게 하고 쉬운 일은 어렵게'합니다. 잠재된 패턴이 없는 곳, 그러니까 확률이 필요하지 않은 분야에서는 어처구니없이 약합니다. 챗GPT는 인터넷에 올라와 있는 거의 모든 문서를 학습했다고 해도 과언 이 아닐 텐데요, 이 말은 웹에 없는 정보에는 취약하다는 것을 의미합니다. 가령 다섯 자리 이상의 더하기, 빼기의 모든 셈 결 과가 웹에 다 있는 것은 아니겠지요. 123,456,789+56,789 와 같은 셈의 결과들이 모조리 인터넷에 올라와 있을 리는 없으 니, 챗GPT는 이런 셈을 잘하지 못합니다.
- 모차르트의 첼로 협주곡에 대해 물으면 쾨헬 넘버(모차르트의 곡에다 연대기 순으로 번호를 붙인 것)까지 붙여서 다섯 곡을 내놓기도 합니다. 모차르트의 첼로 협주곡은 실제로 남아 있는 게 없지 만챗GPT는 쾨헬 넘버까지 붙여서 답을 합니다. 그래야 그럴듯 하기 때문입니다. 뭔가 허언증환자와 비슷한 느낌입니다.
미국의 인공지능 스타트업인 갓 잇 AIGot it Al에서 조사한 결과 챗GPT가 한 답변의 15~20퍼센트 정도에서 할루시네이션 오류가 보이는 것으로 나왔습니다. 그래서 노엄 촘스키 같은 세계 최고의 언어학자는 "GPT는 천문학적인 양의 데이터 에 접근해 규칙성, 문자열 등에 기반해 문장을 만드는 첨단 기 술 표절 시스템이다"라고 말하기도 했습니다. 이런 입장은 챗 GPT가 인간의 언어모델과 인간 사고방식의 일부를 들여다보 았을지도 모르겠다고 하는 해석과는 정반대 편에 서 있습니다. 얀 르쿤Yann LeCun 이라는 세계적인 AI 학자는 "거대언어모델은 인간 수준의 인공지능으로 향하는 고속도로에서 옆길로 새버 린 것"이라고 말했습니다. 인공지능이 인간의 지능을 넘어서 는 지점을 특이점singularity 이라고 하는데, 거대언어모델로는 절 대로 가지 못한다는 것입니다.
- 사람들은 GPT-3와 같은 거대언어모델이 무엇을 할 수 있는지에 대해 아주 비현실적 기대를 갖고 있다. GPT-3는 세계가 어떻게 돌아가는지 전혀 알지 못한다. ............... 다시 말하는데, 사람들과 교류하기 위해서는 명료하게 훈련된 다른 접근법이 더 낫다. 언어모델을 확장해서 지능적 기계를 만들려는 것은 고공비행기로 달에 가려 하는 것과 같다. 고공비행기로 고도비 행 기록을 깰 수는 있으나 달에 가는 것은 완전히 다른 접근법을 필요로 한다.
- 세계적인 SF 소설가 테드 창Ted Chiang은 <뉴요커>에 실은 글에서 "GPT는 웹의 흐릿한 JPEG다"라고 말했습니다. 그의 글은 아주 흥미롭습니다. 원문을 읽어볼 것을 권합니다. 글의 일부를 소개합니다.
챗GPT는 웹에 있는 모든 텍스트를 흐릿하게 처리한 JPEG 이라 고 생각하면 됩니다. JPEG가 고해상도 이미지에 관한 많은 정 보를 가지고 있듯이 챗GPT는 웹상의 많은 정보를 보유합니다. 그러나 비트의 정확한 순서 (sequence)를 찾으려 한다면 결코 찾을 수 없습니다. 당신이 얻을 수 있는 모든 것은 근사치일 뿐입니다. 이 근사치는 문법에 맞는 텍스트의 형태로 제공됩니다. 챗 GPT는 이를 생성하는 데 탁월하기 때문에, 전반적으로 읽을 만 합니다. 당신은 여전히 흐릿한 JPEG를 보고 있지만, 흐릿한 부 분이 사진 전체의 선명도를 떨어뜨리지는 않습니다.
손실 압축에 대한 이러한 비유는 웹에서 찾은 정보를 다른 단어 를 사용해 재포장해내는 챗GPT의 특성을 이해하는 방법에만 적용되는 게 아닙니다. 이 비유는 챗GPT와 같은 거대언어모델 에서 발생하기 쉬운 '환각(Hallucination)'이나, 혹은 사실에 근거한 질문에 터무니없는 답변을 내놓는 것을 이해하는 방법이기도 합니다. 이러한 환각은 제록스 복사기에서 잘못 생성된 레이 블과 마찬가지로 압축 풍화로 발생한 것입니다. 그러나 환각은 원본과 비교해서 확인해야 알 수 있을 만큼 그럴듯하게 보입니 다. 웹상의 실제 정보나 세상에 대한 우리의 고유한 지식과 비교 해야만 진위를 확인할 수 있습니다. 사실이 이렇다면 환각은 결 코 놀라운 것이 아닙니다. 원본의 99퍼센트가 폐기된 후 텍스트 를 재구성하도록 설계된 압축 알고리듬이라면, 생성된 텍스트의 상당 부분이 완전히 조작될 것으로 예상해야 합니다.

- 늘 잘 먹히는 대표적인 프롬프트들은 다음과 같습니다.
"차근차근 생각해보자"처럼 단계적 추론을 유도하는 말을 덧붙이거나,
"네가 ᄋᄋᄋ (예: 생물학자, 변호사, 마케터・・・・・・ 라고 가정하자처럼 역할을 부여하거나,
"ᄆᄆᄆ를 표로 만들어줘"처럼 포맷을 지정하거나,
"△△△를 요약하고 가장 중요한 것 여섯 가지를 나열해줘"처럼 구체적으로 일을 지정할 때 좋은 결과가 나옵니다.

- 말하기와 생각하기는 다르다
MIT의 인지과학자 안나 이바노바와 카일 마호월드 등은 말하 기와 생각하기가 다르다는 점에서 거대언어모델의 한계를 지 적합니다. 13 '언어'와 '사고'는 분리돼 있어서, 언어를 통한 의 사소통과 사고 행위는 서로 다른 일이라는 것입니다. 이들이 제시하는 증거는 이렇습니다.
수십 개의 언어를 사용하는 사람들의 뇌를 스캔한 결과, 언어 (나비어나 도트라키어 같은 발명된 언어 포함)의 종류와 무관하게 작 동하는 특정 뉴런 네트워크가 발견되었습니다. 이 뉴런 네트워크는 수학, 음악, 코딩과 같은 사고 활동에는 관여하지 않았습 니다. 또한 뇌 손상으로 인해 언어를 이해하거나 산출하는 능 력이 상실된 실어증 환자 중 상당수는 여전히 산술 및 기타 비 언어적 정신 작업에는 능숙합니다. 이 두 가지 증거를 종합하 면 언어만으로는 사고의 매개체가 아니며, 언어가 오히려 메신 저에 가깝다는 것을 알 수 있습니다. 실제로 우리는 생각을 말 로 표현할 수 없는 경험을 종종 합니다.
이들은 언어의 형식적 역량과 기능적 역량을 구분합니다. 주어진 언어의 규칙과 패턴에 대한 지식을 포함하는 것이 '형식 적 언어 능력'이라면, 실제 세계에서 언어를 이해하고 사용하 는 데 필요한 여러 가지 인지 능력을 '기능적 언어 능력'이라고 부릅니다. 이들은 인간의 형식적 역량은 특수한 언어 처리 메 커니즘에 의존하는 반면, 기능적 역량은 형식적 추론, 세계 지 식, 상황 모델링, 사회적 인지 등 인간의 사고를 구성하는 여러 언어 외적 역량을 활용한다는 사실을 인지 신경과학의 증거를 바탕으로 보여줍니다. 요컨대 거대언어모델은 언어에 대한 좋 은 모델이지만, 인간 사고에 대해서는 불완전한 모델이라는 것 입니다.
- 이런 차이 때문에 '형식적 언어 능력'이 필요한 과제에서는 거 대언어모델이 인상적인 성과를 보이지만, '기능적 능력'이 필 요한 많은 테스트에서는 실패한다는 것입니다. 이들은 
(1) 현재의 거대언어모델은 형식적 언어 능력의 모델로서 진지하게 받아들여야 하며, 
(2) 실제 언어 사용을 마스터하는 모델은 핵심 언어 모듈뿐만 아니라 사고 모델링에 필요한 여러 비언어적 인지 능력을 통합하거나 추가 개발할 필요가 있다고 주장 합니다
- 우리가 챗GPT에 열광하게 된 또 다른 이유는 이것이 사상 최초로 사람이 평소에 쓰는 말(자연어 Natural Language)로 기계와 대 화할 수 있게 만들어주었기 때문입니다. 즉, 처음으로 나타난 자연어 인터페이스라는 것입니다. 이전까지 우리는 컴퓨터와 대화하려면 C++, 자바, 파이썬과 같은 컴퓨터 랭귀지(기계어 Machine Language)를 따로 배워야 했습니다. 그런데 드디어 사람 에게 하듯이 자연어로 컴퓨터에게 일을 시킬 수가 있게 된 것 입니다.
- 앞서 챗GPT는 잠재된 패턴이 있는 일을 잘한다고 했지요? 거대언어모델의 경우 어마어마한 양의 정제한 데이터를 가지고 100일 안팎의 학습을 해야 합니다. 그 러니 학습이 시작된 이후의 최신 정보들에 대해서는 지식이 없 습니다. 배우지 못한 것이지요. 그래서 최신 뉴스에 대한 답변 을 잘하지 못합니다. 숫자 계산에도 약하고요. 그런데 챗GPT 가 계산기를 쓰고, 검색엔진을 쓸 수 있게 된다면 어떨까요? 즉, 도구를 쓰게 된다면 어떻게 될까요?
실제로 그런 일이 일어났습니다. 오픈AI가 내놓은 플러그인 Plug-ins이 바로 챗GPT가 도구를 쓸 수 있도록 해준 것이죠. 우 리가 챗GPT에게 일을 시키면, 챗GPT가 플러그인된 프로그 램들을 불러다 일을 시킨 후 그 결과를 다시 사람에게 전달합 니다.
거대언어모델 인공지능이 사람으로부터 할 일을 받으면, 그 일 을 몇 개의 서로 다른 작은 일로 나눌 수 있을 겁니다. 그러고 는 각각에 맞는 도구, 즉 소프트웨어나 서비스를 찾아서 그 일 을 수행합니다. 결과가 나오면 그 결과를 모아서 다시 일을 시킨 사람에게 보고하게 됩니다. 그러니까 사람으로부터 일을 받는 에이전트, 그 일을 여러 개의 하위 일로 나누는 에이전트, 각각의 일에 가장 적합한 소프트웨어나 서비스를 찾는 에이전 트, 이런 도구를 써서 일을 수행하는 에이전트, 결과들을 다 모으는 에이전트, 정리해서 사람에게 보고하는 에이전트 등 등 이렇게 스스로 역할을 여러 개로 나누어 수행하면 되는 것 이지요.
- 챗GPT와 GPT-4도 API를 공개했습니다. 세상의 모든 소프트웨어 회사들이 이것을 통해 GPT와 GPT-4를 쓸 수 있게 된 것이지요. 물론 돈은 내야 합니다.
챗GPT가 바깥의 도구를 가져다 쓰는 게 플러그인이라면, API 는 바깥의 프로그램과 서비스들이 GPT 혹은 GPT-4를 가져 다 쓸 수 있는 것이지요. 이것으로 어떤 일을 할 수 있을까요? 마이크로소프트가 자신들의 오피스 프로그램에 GPT-4의 API를 연결했습니다. 이렇게 함으로써 사용자들은 워드를 쓰다가 자신의 문서를 떠나지 않고도 챗GPT에게 자신이 쓸 주제에 맞 게 목차를 만들어달라는 요청을 할 수 있게 됩니다. 목차가 나 오면 의도에 맞게 고친 다음, 목차대로 내용을 채워달라고 요 구할 수도 있습니다. 엑셀을 쓰는 중이라면 엑셀을 떠나지 않 고도, 엑셀에서 챗GPT에게 입력한 표를 읽고 5개년의 영업이 익률 그래프를 그려달라고 요청할 수 있습니다. 그러니까 브라 우저를 열고 키워드를 입력하고, 그래서 나온 값을 복사해서 워드나 엑셀에 옮겨 담고 하는 작업들이 한번에 사라진 것입니 다! 엄청 편해진 것이지요.

- 게리 마커스의 다섯 가지 걱정
제프리 힌턴, 스튜어트 러셀 등 많은 인공지능 과학자들이 드 디어 공개적으로 경고하기 시작했습니다. 신경과학자인 게리 마커스Gary Marcus는 이런 상황과 관련해 다음과 같은 다섯 가지 우려를 밝혔습니다.
1. 극단주의자들이 어마어마한 허위 정보를 생성해 민주주의와 공론을 쓸어버릴 것이다.
2. 환각은 잘못된 의료 정보를 생성할 것이다.
3. 콘텐츠 팜(content farm)들이 광고 클릭을 위해 사실과 상관
없는 자극적인 내용을 생성할 것이다.
4. 챗봇은 일부 사용자들에게 감정적인 고통을 유발할 수 있다.
5. 남용으로 인해 웹 포럼과 피어리뷰 (peer review) 사이트를 붕 괴시킬 것이다.

- 스택오버플로(stackoverflow.com)라는 사이트가 있습니다. "모든 개발자는 스택오버플로 탭을 열어두고 있습니다"라는 캐치프 레이즈를 자랑하는 곳입니다. 전 세계의 개발자들이 개발을 하 다 궁금한 게 생기거나 막힌 곳이 있으면 물어보고 답하는 게 시판입니다. 개발자를 위한 네이버 지식인과 같은 곳이지요. 챗GPT가 발표된 뒤 이 스택오버플로의 방문자 수가 급감하기 시작했습니다.
2022년 12월 한 달 새 12퍼센트나 떨어져 버린 것입니다. 이런 추세는 계속 이어져 2023년 3월에도 13.9퍼센트가 떨어졌습니다.  개발자들은 이제 스택오버플로에서 질문하고 답을 찾는 대신 챗GPT에게 코드를 짜달라고 바로 요구하기 시작했습니다.
커뮤니티 구성원들이 주어진 코딩 질문에 대해 다양한 답변을 게시하고, 장점과 단점에 대해 토론하고, 투표를 통해 최고의 솔루션을 선정하는 것이 스택오버플로의 전통이었습니다. 훌 륭한 공동체였지요. 거의 모든 개발자들이 한두 번쯤은 스택오 버플로에 올라온 코드를 그대로 복사해 사용한 적이 있었을 겁 니다. 그런 공동체가 무너지고 있습니다.
문제는 챗GPT가 프로그래밍을 학습한 대상이 바로 이 스택오 버플로였다는 겁니다. 온라인 코드 저장소인 깃허브GitHub와 스 택오버플로는 인공지능이 개발 공부를 하기 가장 좋은 두 개의 사이트였습니다. 그렇게 공부한 챗GPT가 스택오버플로의 트 래픽을 빼앗아가고 있는 것입니다. 우리는 인공지능이 또 하나 의 오리지널을 무너뜨리는 장면을 보고 있습니다.

- 미디어는 메시지입니다. 새로운 미디어는 돌이킬 수 없이 분명 하고 근본적인 변화를 지시합니다. 인류는 소셜미디어의 출현 에 제대로 대응하지 못했습니다. 페이스북이 알고리듬을 바꾸 자전 세계의 정치가 출렁였습니다. 곳곳에서 포퓰리즘이 기승 을 떨칩니다. 미국에선 소녀들의 자살률이 두 배로 뛰어올랐습 니다. 지금도 미국 10대들의 자살률은 계속해서 오르고 있습니다.  한국에선 독점적인 포털사의 광고 수익을 배분하는 알고 리듬 하나가 언론사 보도를 통째로 망치고 있습니다. 이 사실 을 모두가 알고 있지만 누구도 해결책을 내놓지 못하고 있습니 다. 인스타그램은 여전히 에코 챔버(반향실, 자신이 원하는 정보만 보게 됨으로써 인지편향이 확대 강화되는 현상)와 필터 버블(필터는 추천 알고리듬을 뜻합니다. 사용자가 시스템이 보여주는 정보만 보게 되는 게 마 치 추천 알고리듬의 거품에 갇힌 모양과 같다고 해서 붙은 이름)의 본향이고, 한국 신문들은 변함없이 해외 황색지를 베껴 올립니다.
인공지능은 소셜미디어에 비할 바 없이 위력적입니다. 발전 속 도도 인류 역사상 이런 기술이 있었을까 싶을 정도로 빠릅니 다. 오죽하면 생물종이 폭발적으로 나타났던 캄브리아기에 빗 대어 요즘을 인공지능의 캄브리아기라고 부르기도 합니다. 이 치명적인 미디어 앞에서 인류는 또 한 번의 실패를 경험해야 하는 것일까요?

'IT' 카테고리의 다른 글

챗 GPT 거대한 전환  (1) 2023.12.24
오늘날 우리는 컴퓨터라 부른다  (2) 2023.12.07
로봇의 지배  (0) 2023.08.14
AI빅뱅  (0) 2023.08.14
슈퍼개인의 탄생  (0) 2023.07.14
Posted by dalai
,

로봇의 지배

IT 2023. 8. 14. 14:35

- 딥러닝 프로젝트가 GPU로 이동하자 선도적인 기술 회사의 인공 지능 연구원들은 심층 신경망 구현을 활성화할 수 있는 소프트웨어 도구를 개발하기 시작했다. 구글, 페이스북, 바이두는 딥러닝에 맞 춰 무료로 다운로드해 사용하고 업데이트할 수 있는 오픈 소스 소 프트웨어를 출시했다. 가장 유명하고 널리 사용되는 플랫폼은 구글 이 2015년에 공개한 텐서플로TensorFlow다. 텐서플로는 딥러닝을 위한 포괄적인 소프트웨어 플랫폼으로, 실용적인 응용프로그램을 연구 하는 연구자와 엔지니어에게 심층 신경망을 구현하는 최적화된 코 드와 특정 응용프로그램을 보다 효율적으로 개발할 수 있는 다양한 도구를 제공한다. 텐서플로나 페이스북이 내놓은 경쟁 개발 플랫 폼인 파이토치 PyTorch 같은 패키지는 연구자들이 복잡한 세부 사항을 처리하기 위해 소프트웨어 코딩을 작성하고 테스트하는 수고를 덜 어주는 대신 시스템 개발동안 관점과 균형감을 유지하도록 돕는다. 딥러닝 혁명이 진행될수록 엔비디아와 여러 경쟁사는 딥러닝에 최적화된 더욱 강력한 마이크로프로세서 칩 개발을 위해 움직였다. 인텔, IBM, 애플, 테슬라는 이제 모두 심층 신경망에 필요한 연산 을 가속하도록 설계된 회로가 포함된 컴퓨터 칩을 설계한다. 딥러 닝 칩은 고성능 컴퓨터 서버부터 스마트폰, 자율 주행 자동차, 로봇 에 이르기까지 다양한 응용프로그램에 사용된다. 그 결과 처음부터 인공지능을 구현하도록 설계된 장치들의 네트워크가 계속 확장되 고 있다. 2016년 구글은 텐서처리장치 Tensor Processing Unit, TPU라는 자체제작한 맞춤형 칩을 발표했다. TPU는 구글의 텐서플로 소프트웨 어 플랫폼에서 개발된 딥러닝 응용프로그램을 최적화하기 위해 특 별히 설계됐다. 처음에 구글은 이 새로운 칩을 자체 데이터 센터에 사용했지만 2018년부터는 클라우드 컴퓨팅 서비스를 운영하는 서 버에 통합해 서비스 이용 고객들이 최첨단 딥러닝 기능에 쉽게 접 근하도록 했다. 이러한 발전은 인공지능의 능력을 광범위하게 배포 하는 가장 중요한 단일 통로가 돼 지배력 확장에 기여하고 있다.
- 고도의 기술적 배경이 필요하지 않은 다양한 사람들이 기술에 쉽 게 접근할 수 있는 새로운 도구들이 등장하면서 클라우드 기반 인 공지능이 범용 기술로 진화하는 속도가 빨라지고 있다. 텐서플로나 파이토치 같은 플랫폼 덕분에 딥러닝 시스템 구축이 쉬워졌지만, 아직은 주로 컴퓨터공학 박사 학위가 있거나 고도로 훈련된 전문가 들이 사용한다. 2018년 1월에 공개된 구글의 오토ML AutoML 같은 새 로운 도구는 기술적인 세부 사항을 대부분 자동화하고 진입 장벽 을 크게 낮춰 더 많은 사람에게 실질적인 문제 해결을 위해 딥러닝 을 활용할 기회를 제공한다. 오토ML은 본질적으로 인공지능을 더 많이 만들기 위해 인공지능을 배포하는 것이고 리페이페이 교수가 “인공지능의 민주화”라고 부르는 경향의 한 부분이다.
- 기술적 한계와 경제성 때문에 용도가 다양하고 생산적인 가정용 로봇이 나오기까지 시간이 오래 걸린다면, 여러 산업이나 상업 환 경에서는 정반대다. 공장이나 창고처럼 밀폐된 공간에서는 외부 세 계를 지배하는 예측 불가능하고 혼란스러운 요소를 제거하거나, 적 어도 최소화할 수 있다. 그래서 로봇은 한계를 피하고 기능은 활용 할 수 있는 시설에서 사람, 기계, 물건의 상호작용과 흐름을 재조직 하는 데 주로 사용된다. 로봇이 심부름을 제대로 하려면 냉장고 안 정확한 좌표에 그 물건이 틀림없이 있어야 하는 엄격한 조건을 요 구하는 가치 제안은 별다른 매력이 없어 보인다. 하지만 조금만 효 율이 높아져도 엄청난 재정적 이익을 얻을 수 있는 대규모 상업 환 경에서는 계산이 달라진다
- 로봇의 손 기술이 좋아지고 인간 수준의 능력에 근접한다고 해도 가정에서 소비자 제품으로 사용할 만큼 저렴해지기까지는 시간 이 오래 걸릴 것이다. 하지만 공장이나 물류 창고처럼 상황을 예측 할 수 있고 수익성과 효율성의 논리가 노동자와 기계 사이의 균형 을 바꿀 수밖에 없게 만드는 환경에서 파괴적 혁신은 훨씬 앞당겨 질 것이다. 앞에서 살펴본 것처럼 로봇이 물리적 조작에 능숙해지 고 유연성과 적응력까지 갖추면 새로운 제품을 공급하기 위해 신속 하게 생산을 전환하는 능력이 중요한 전자 조립 영역에서도 점차 사용될 것이다. 이 모든 것은 인공지능이 경제의 모든 측면에 촉수 를 뻗는 전기와 같은 동력으로 진화하는 이야기에서 중요한 장으로 기록될 것이다.
- 컴퓨터 사용과 인터넷의 놀라운 발전 그 자체로는 지난 수십 년 동안 보아온 광범위한 진보를 따라갈 수 없다는 사실은 피터 틸의 유명한 한마디로 압축할 수 있다. “우리는 하늘을 나는 자동차를 기대했지만, 결국 얻은 건 140자(트위터)뿐이다." 정보 기술은 계속 발 전하고 있지만, 우리가 상대적으로 정체된 시대를 살고 있다는 주 장은 경제학자 타일러 코웬Tyler Cowen이 2011년에 출간한 책 <거대 한 침체》 "와 로버트 고든Robert Gordon이 미국의 미래를 매우 비관적 으로 그린 2016년 책 《미국의 성장은 끝났는가> 65에 상세히 설명돼 있다. 두 책의 핵심 주장은 손쉽게 얻을 수 있는 기술혁신은 이미 1970년대에 대부분 거둬들였다는 것이다. 그 결과 우리는 지금 혁 신이라는 나무의 높은 가지에 닿으려고 애쓰는 기술적 소강상태에 있다. 코웬은 결국 기술 정체기를 벗어날 것으로 낙관한다. 하지만 고든은 그렇지 못해서, 나무 위쪽 가지에는 수확할 열매가 남지 않 았고 가장 위대한 발명은 이미 지나갔다고 말한다.
- 사실, 질문에 대한 더 완전한 대답은 실제로 정확히 무슨 일이 일 어나는지 모르고, 적어도 쉽게 설명할 수 없다고 인정하는 것이다. 어떤 프로그래머도 다양한 수준의 추상화나 네트워크 안에서 지식 이 표현되는 방식을 정의하려 하지 않는다. 이 모든 것은 유기적으 로 나타나고 표현은 시스템 전체에서 활성화하는 수백만 개의 상호 연결된 인공 뉴런을 통해 분산된다. 우리는 어떤 의미에서 네트워 크가 이미지를 이해한다는 것을 알지만 뉴런 안에서 무엇이 합쳐지 는지 정확히 설명하기는 매우 어렵거나, 심지어 불가능하다. 네트
워크의 다른 층으로 더 깊이 들어가거나 쉽게 시각화할 수 없는 유 형의 데이터에 작동하는 시스템을 분석할 때 더욱더 그렇다. 이러 한 상대적인 불투명함, 즉 심층 신경망이 사실상 '블랙박스'라는 우려는 8장에서 다시 다룰 중요한 문제 중 하나다
- 우리는 일반적으로 강화 학습을 바둑을 두거나 시뮬레이션으로 자동차를 운전하는 방법을 학습하는 것처럼 외부의 매크로 프로세 스macro process를 최적화하는 보상 기반 알고리즘 관점에서 설명한다. 그러나 하사비스는 강화 학습이 뇌 내부에서 중요한 역할을 하고 지능이 나타나는 데 필수일 수 있다고 지적한다. 강화 학습은 뇌를 호기심과 학습, 그리고 추론으로 이끄는 주요한 메커니즘일 수 있다. 예를 들어 뇌의 고유한 목적이 끊임없이 쏟아지는 엄청난 양의 원데이터를 단순히 탐색하고 순서를 정하는 것이라고 가정해보자. 하사비스의 말에 따르면, "우리는 새로운 것을 보면 뇌에서 도파민 이 분비된다는 것을 안다." 만약 뇌에서 "정보와 구조를 찾는 것 그 자체가 보상이라면 이는 매우 유용한 동기다."  다시 말해 우리 주 변 세계를 이해하도록 끊임없이 동력을 제공하는 엔진이 도파민 생성과 연결된 강화 학습 알고리즘일 수 있다.
- 인공지능 시스템이 펠로폰네소스 전쟁사같은 역사적 문헌을 읽을 수 있으면 여기서 배운 교훈을 현대의 지정학적 상황에 적용 할 수 있을까? 그럴 수 있다면 일반 인공지능으로 가는 길에서 가 장 중요한 이정표 중 하나인 전이 학습transfer learning에 도달하는 것이 다. 한 영역에서 정보를 학습한 다음 다른 영역에 이 정보를 성공 적으로 활용하는 능력은 인간 지능의 특징 가운데 하나이고 창의성 과 혁신에 필수다. 일반 기계 지능이 정말 유용하려면 단순히 교과 서 연습 문제에 대답하는 이상을 해야 한다. 학습한 내용과 발전시킨 통찰력을 완전히 새로운 과제에 적용할 수 있어야 한다. 인공지능 시스템이 이 일을 해내려면 현재 심층 신경망의 피상적인 수준 의 이해를 뛰어넘어 진정한 이해에 도달해야 한다. 사실 지식을 다 양한 영역과 새로운 상황에 적용하는 능력은 기계 지능의 진정한 이해 능력을 테스트하는 단 하나의 최고의 방법이 될 것이다.
- 핵심 질문은 인공지능의 영향으로 초래한 고용 시장 혼란이 이 와 비슷한 결과로 이어질지 여부다. 인공지능은 농업을 바꾼 농업 기술처럼 노동 절약형 혁신의 사례일까? 아니면 근본적으로 성격 이 다른 혁신일까? 사실 인공지능은 다르다는 것이 내가 해온 주장 이다. 그 이유는 이 책의 핵심 주제에 근거를 두고 있다. 인공지능 은 전기와 다를 바 없이 체계적인 범용 기술이며, 따라서 궁극적으 로 경제와 사회의 모든 측면으로 확장되고 스며들 것이다. 역사적 으로 노동시장의 기술적 혁신은 부문별로 영향을 끼치는 경향이 있었다. 농업 기계화는 수백만 개의 일자리를 사라지게 했지만, 제조업 부문의 성장으로 노동자를 흡수할 수 있었다. 마찬가지로 제조업이 자동화되고 공장이 저임금 국가로 이전하자 빠르게 성장하는 서비스업 부문이 실직한 노동자에게 기회를 제공했다. 반면에 인공 지능은 경제 모든 부문에 거의 동시에 영향을 끼칠 것이다. 가장 중 요하게는 여기에 미국 노동력의 대다수가 종사하고 있는 서비스업 부문과 화이트칼라 일자리가 포함될 것이다. 인공지능은 거의 모든 기존 산업에 촉수를 뻗어 변화시킬 것이고 미래에 새롭게 등장하는 산업은 처음부터 인공지능과 로봇공학의 최신 혁신을 포함할 것이 다. 다시 말해 수천만 개의 새로운 일자리를 제공하는 완전히 새로 운 부문이 기존 산업의 자동화로 일자리를 잃은 노동자를 어떻게든 흡수할 가능성은 매우 희박해 보인다. 오히려 미래 산업은 디지털기술, 데이터과학, 인공지능의 기반 위에 구축될 것이다. 따라서 엄청난 수의 일자리를 창출하지는 않을 것이다.
- 물론 경제는 고숙련· 고임금 일자리도 창출했지만 4년제 대학 학 위가 없는 미국 노동자의 4분의 3은 거의 접근할 수 없다. 대학 졸 업자 사이에도 실업률은 심각한 문제를 떠오르고 있다. 대학 졸업 자들이 카페나 패스트푸드점에서 일하면서 학자금 대출을 상환해 야 하는 부담에 시달리는 이야기는 너무 흔하다. 2020년 2월 뉴욕연방준비은행이 발표한 데이터에 따르면 최근 대학 졸업자의 41퍼센트가 대학 학위가 필요 없는 일에 종사하는 것으로 나타났다. 전 체 대학 졸업자의 3분의 1이 불완전 취업 상태에 있다. 경제 전반에 걸친 주요 실업률이 3.6퍼센트로 떨어졌지만 22세에서 27세 사이 의 최근 대학 졸업자 실업률은 6퍼센트를 넘는다." 다시 말해 통념상 교육을 강조하고 대학 등록을 확대해야 할 것 같지만 경제는 이미 배출된 대학 졸업자를 흡수할 만큼 숙련직 일자리를 충분히 만 들지 못하고 있다.
- 코로나바이러스 팬데믹의 여파로 미국과 중국 사이의 긴장이 크게 고조됐고, 중국 생산에 대한 과잉 의존이 잠재적으로 위협이 될수 있다는 인식이 널리 퍼졌다. 미국이 의료용품이나 의약품을 비롯한 중요한 전략 물자에 접근할 때, 코로나 위기 이전에도 두 나 라의 경제적 시너지와 상호 의존성이 (2006년 역사학자 니얼 퍼거슨Niall Ferguson은 이 현상에 '치메리카 Chimerica'라는 용어를 붙였다) 점차 느슨해지는 것은 분명했다. 긴장이 고조되고 양국 관계가 계속 분리되면 인공 지능 개발과 배치에 집중된 갈등과 경쟁이 중심 역할을 할 것은 피 할 수 없어 보인다. 인공지능이 체계적이면서 전략적인 기술이라는 점이 분명해지면서 양국 간의 전면적인 인공지능 군비경쟁의 우려는 진정한 위협으로 다가오고 있다.
- 얼굴 인식 시스템이 개인의 사생활을 위협할 가능성은 매우 현실 적이지만 이 기술을 적절하고 윤리적으로 배치해 얻는 분명한 혜택 도 중요하게 생각해야 한다. 우선 이 기술을 사용해 중범죄자들을 많이 검거할 수 있었다. 개인 정보 보호 문제는 어떤 이득을 얻더라 도 분명히 더 중대한 사안이지만 클리어뷰 앱의 경우, 위험한 범인 을 체포하는 데 일조했고, 특히 성범죄자나 아동 포르노 공급책을 파악하는 데 효과적이었다. 마찬가지로 공공장소에 배치된 얼굴인 식 시스템은 범죄율을 낮추는 면에서 실질적인 도움이 될 수 있다. 런던의 광역 경찰청이 이렇게 말하는 것도 틀리지는 않다. "우리는 모두 안전한 도시에서 살고 일하기를 바랍니다. 대중은 우리가 가 능한 기술을 널리 사용해 범죄자를 저지하기를 바랍니다."
사실 중국에서 실행 중인 광범위한 감시는 서양의 관점에서 보면 명백하게 억압적이지만 중국인 대부분이 꼭 부정적으로만 바라보 는 것은 아니다. 샹양의 주민들은 무단 횡단 시스템에 매우 협조적 이다. 이 시스템이 작동하면서 한때 위험했던 교차로가 지금은 매 우 질서 정연해졌기 때문이다. 중국에 사는 지인들과 개인적으로 대화를 나누면서 한 가지 공통점을 발견했다. 예전보다 범죄에 대 해 우려하기보다 안전하다고 느끼고, 특히 어린 자녀를 둔 부모들 이 안심하는 경우가 늘었다는 점이다. 이러한 잠재적 중요성도 과소평가해서는 안 된다. 대부분의 사람들은 이웃환경에서 느끼는 안정감을 높이 평가하고 이것은 육체와 정신 건강과도 상관관계가 있다. 중국이 미국을 분명히 앞서는 부분 중 하나가 바로 이 영역이다. "
- 딥페이크는 '적대적 생성 신경망 generative adversarial network, GAN'으로 알 려진 혁신적인 딥러닝으로 구동된다. GAN은 끊임없이 더 좋은 품 질의 시뮬레이션 음성이나 영상을 생성하도록 2개의 신경망을 일 종의 게임처럼 경쟁시킨다. 예를 들어 가짜 사진을 생성하도록 설 계된 GAN에는 두 가지 심층 신경망이 포함된다. 먼저 '생성자 generator'라고 불리는 신경망은 조작된 이미지를 만든다. 그리고 '판 별자discriminator'로 불리는 신경망은 실제 사진으로 구성된 데이터 세트를 학습한다. 생성자가 합성한 이미지는 실제 사진과 섞여 판별 자로 입력된다. 두 신경망은 생성자가 만든 사진을 판별자가 평가 해 진위를 가리는 경쟁을 진행하면서 계속 상호작용한다. 생성자의 목표는 가짜 사진을 만들어 판별자를 속이는 것이다. 두 신경망이 경쟁을 반복하면서 이미지 품질이 계속 향상되고 결국 시스템은 판 별자가 분석하는 이미지의 진위를 구분할 수 없는 일종의 평형 상 태에 도달한다. 이 기법을 통해 놀랍게 조작된 이미지를 얻을 수 있 다. 인터넷에서 'GAN 가짜 얼굴'을 검색하면 세상에 존재하지 않 는 인물을 완벽하게 그려낸 고해상도 이미지의 예를 수없이 찾을 수 있다. 판별자 신경망의 관점에서 보면, 사진들은 완전히 실제처 럼 보이지만 모두 디지털 천상계에서 만들어낸 이미지 합성이자 환상일 뿐이다.

- GAN은 몬트리올대학교의 대학원생이던 이언 굿펠로lan Goodfellow 가 개발했다. 2014년 어느 저녁, 굿펠로는 친구 몇 명과 동네 술집 에서 고품질 이미지를 생성할 수 있는 딥러닝 시스템을 만드는 문 제를 놓고 대화를 나눴다. 맥주를 셀 수 없을 만큼 마신 굿펠로는 GAN의 기본 개념을 제안했지만, 지나친 의심에 부딪혔다. 굿펠로 는 집으로 돌아와 곧장 코딩을 시작했다. 몇 시간 뒤 그는 최초로 작동하는 GAN을 만들어냈다. 이 성취는 굿펠로를 딥러닝 커뮤니 티의 전설적 인물로 바꿀 만했다. 페이스북의 최고 인공지능 과학 자얀 르쿤은 GAN을 "지난 20년간 딥러닝 분야에서 나온 가장 멋진 아이디어"라고 말했다. 굿펠로는 몬트리올대학교에서 박사 학위를 마친 다음 구글 브레인 프로젝트와 오픈AI를 거쳐 지금은 애플의 머신러닝 책임자로 일하고 있다. 그는 딥러닝 분야의 표준적인 대학 교재를 집필한 주요 저자이기도 하다.

- 딥페이크는 인간을 속이기 위한 것이지만 문제는 머신러닝 알고 리즘을 속이거나 제어하기 위해 데이터를 악의적으로 조작하는 것 과 관련이 있다. 이런 '적대적 공격adversarial attack'에서는 특별히 설계 된 입력이 공격자가 원하는 출력을 생성하도록 머신러닝 시스템에 오류를 일으킨다. 머신 비전의 경우 신경망이 이미지 해석을 왜곡 하도록 시야에 무언가를 배치한다. 유명한 사례를 소개하면, 연구 자들이 판다 사진을 딥러닝 시스템이 58퍼센트의 신뢰 수준으로 식 별하도록 한 다음, 이 이미지에 신중하게 조작한 시각적 노이즈를 추가해 판다를 긴팔원숭이로 99퍼센트 이상 확신하도록 시스템을 속이는 것이다. 하지만 소름 끼치는 사례도 있었다. 정지신호에 4개의 작은 직사각형 모양의 흑백 스티커를 추가해 자율 주행차에 사용되는 이미지 인식 시스템이 정지신호를 시속 70킬로미터 속도 제한 표시로 인식하도록 속인 경우다. 다시 말해 적대적 공격은 생 사가 걸린 중요한 결과를 쉽게 초래할 수 있다. 두 가지 경우 모두 인간 관찰자는 이미지에 추가된 정보를 알아차리지 못하거나 분명 히 그 정보 때문에 혼동하지 않을 것이다. 나는 이런 사례가 오늘날 심층 신경망이 얼마나 피상적이고 불안정하게 연결돼 있는지를 생 생히 보여준다고 생각한다.
인공지능 연구자들은 적대적 공격을 심각하게 받아들이고 치명 적인 취약점으로 간주한다. 이언 굿펠로는 머신러닝 시스템 내 보안 문제를 연구하고 가능한 보호 장치를 개발하는 데 연구 경력의 많은 부분을 쏟았다. 적대적 공격에 맞서 강력한 인공지능 시스템 을 개발하기란 결코 쉬운 작업이 아니다. 한 가지 접근 방법은 '적 대적 학습adversarial learning’으로, 시스템이 배치되면 신경망이 공격을 파악하기를 기대하며 의도적으로 적대적인 예시를 훈련 데이터 안 에 포함한다. 하지만 딥페이크와 마찬가지로 공격자가 항상 유리한 위치를 차지하는 확장 경쟁이 계속될 가능성이 있다. 굿펠로가 지 적했듯이 "다양한 경우의 적대적 공격 알고리즘에 대항할 수 있는 정말 강력한 방어 알고리즘을 설계한 사람은 아직 없다." 
- 적대적 공격은 머신러닝 시스템에 해당하지만, 사이버 범죄자나 해커, 외국 정보기관에 의해 악용될 수 있는 컴퓨터 취약점의 중요한 항목이 될 수 있다. 인공지능이 더 많이 사용되고 사물 인터넷을 통해 기기와 기계, 인프라가 더욱 연결될수록 보안 문제는 앞으로 훨씬 더 중요해지고 사이버 공격은 거의 확실히 더 자주 일어날 것 이다. 인공지능의 폭넓은 사용은 결과적으로 더 자율적이고 인간의 개입은 적은 시스템으로 나타날 것이며, 이런 시스템은 점점 더 사 이버 공격의 매력적인 표적이 될 것이다. 앞으로 자율 주행 트럭이 식품이나 의약품, 긴급 물자를 배송한다고 상상해보자. 이런 차량 을 멈춰 세우거나 배송을 오래 지연시키는 공격은 생명을 위협하는 결과를 초래할 수도 있다.
이 모든 것의 결론은 증가한 인공지능의 가용성과 의존도가 시스템의 보안 위험과 결부된다는 것이다. 여기에는 사회질서와 경제, 민주주의 제도와 함께 주요 인프라와 시스템에 대한 위협도 포함된 다. 보안 위험은 인공지능의 부상과 연관된 가장 중요한 단기적 위 험이다. 이런 이유로 견고한 인공지능 시스템 개발에 중점을 둔 연 구에 투자하고, 심각한 취약점이 발견되기 전에 적절한 규제와 보 호 장치를 마련하기 위해 정부와 민간 부문 간 효과적인 연합을 구 성하는 것이 중요하다.
- 인공지능과 머신러닝이 폭넓게 사용될수록 알고리즘이 생성하는 결과와 추천이 공정하다고 인식하고 알고리즘의 추론 과정을 적절 하게 설명할 수 있는 것이 중요하다. 이를테면 산업기계의 에너지 효율을 극대화하기 위해 딥러닝 시스템을 사용하고 있다면 아마 알 고리즘이 결과를 도출하는 세부 사항에는 특별한 관심을 기울이지 않을 것이다. 그저 최적의 결과만 바랄 뿐이다. 하지만 머신러닝이 형사적 판단이나 고용 결정, 주택 담보 대출 신청 절차 같은 분야에 적용될 때, 다시 말해 인간의 권리와 미래의 행복에 직접 영향을 끼 치는 중대한 결정에 적용될 때, 알고리즘의 결과가 인구통계 집단 에 편향되지 않고 이런 결과를 도출한 분석이 투명하고 공정하다는 것을 보여주는 것이 필요하다.
- 장 낙관적인 시나리오는 TV 프로그램 <스타트렉>에 나오는 세상이다. 희소성이 사라진 세상에서는 발전한 기술 덕분에 물질적 으로 풍요롭고 가난이 사라졌으며, 환경 문제도 해결되고, 대부분 질병도 치료할 수 있다. 단지 생존을 위해 보람 없는 일을 하며 힘 들게 고생할 필요도 없다. 사람들은 높은 수준의 교육을 받고 보람 있는 도전을 추구한다. 전통적인 직업이 없어졌다고 사람들이 게을 러지거나 삶의 의미나 인간의 존엄이 결핍되지 않는다. <스타트렉> 의 세계에서 사람들은 경제적 결과가 아니라 고유한 인간성에 가치를 둔다. 비록 <스타트렉>에 그려진 많은 기술이 실현 불가능하거 나 최소한 먼 미래에나 가능할 법해 보이지만 나는 이 프로그램이 합리적인 미래상을 보여준다고 생각한다. 발전한 기술이 광범위한 번영을 가져오고, 인류의 지상 과제를 해결하며, 우리를 다른 별에 도 데려다주지 않는가?
- 반면에 훨씬 더 디스토피아적인 미래는 영화 <매트릭스>에 가까 울 것이다. 내가 두려운 것은 인공지능이 우리를 노예로 만드는 것 이 아니라 현실 세계가 너무 불평등하고 더 나아질 기회가 부족한 나머지 많은 인구가 대안 현실로 도피하는 선택을 하는 것이다. 앞 으로 인공지능과 가상현실 기술의 발전 속도가 빨라질수록 두 기술 이 결합해 너무나도 매력적이고 현실적인 가상 세계를 만들 것이 고, 많은 사람에게 이 세계는 우리가 실제로 사는 세상보다 훨씬 우월해 보일 것이다. 사실, 2017년에 한 경제학자 그룹이 발표한 분석에 따르면 노동시장에서 소외된 젊은이들 가운데 점점 더 많은 수가 비디오게임에 엄청난 시간을 소비하고 있다. 가상 환경을 일 종의 마약으로 볼 수 있을 정도로 중독성을 높이는 기술이 곧 나타 날 것이다.
인공지능과 로봇 기술이 노동시장을 뒤흔들고 고용 기회가 사라 지거나 고용의 질이 감소한다면 정부는 결국 사회질서 유지를 위해 시민들에게 기본 소득과 같은 형태의 지원을 제공하게 될 것이다. 하지만 사람들이 교육을 우선시하고 목적의식을 유지하도록 보장하는 일을 정부가 소홀히 한다면 만연한 무관심과 이탈이라는 결과 를 불러올 것이다. 앞으로 사회는 소수 엘리트는 현실 세계에 탄탄 한 기반을 두지만, 대다수는 점점 더 기술적 환상 속으로 도피하거 나 범죄나 다른 형태의 중독에 빠지는 분열된 방향으로 갈 수도 있 다. 그렇다면 우리는 교육 수준이 낮은 인구, 포용적이고 효과적이 지 못한 민주주의, 느린 속도로 진행되는 혁신이라는 결과에 도달 할 수밖에 없을 것이다. 똑똑한 개인들도 더욱 매력적인 가상 세계 에 현혹돼 더는 현실 세계에서 살아남는 데 강력한 동기를 찾지 못 할 것이다. 이런 비관적인 시나리오에서 경제적·사회적 역풍은 우리가 직면한 전 지구적 도전을 극복하는 것을 더욱더 어렵게 만들 것이다.





'IT' 카테고리의 다른 글

오늘날 우리는 컴퓨터라 부른다  (2) 2023.12.07
박태웅의 AI강의  (1) 2023.12.05
AI빅뱅  (0) 2023.08.14
슈퍼개인의 탄생  (0) 2023.07.14
AI 지도책  (0) 2023.07.06
Posted by dalai
,

AI빅뱅

IT 2023. 8. 14. 14:34

- 인공지능은 미적 가치를 평가하지 못한다. 자신이 탄생시킨 작품이 나 화풍에 대해 생각을 품지도 못하고 자기 작품을 감상하지도 못한 다. 럿거스 팀은 AICAN이 그런 평가를 할 수 있다고 주장했지만, 그 전제가 되는 시각 튜링 검사가 잘못 설계되어 있기에 사실상 평가한 건 인간인 럿거스 팀원이다. 작품들은 인공지능에 의해서가 아니라 작품을 감상하는 인간에 의해서 선택됐다. 인공지능에게 작품을 무작 위가 아닌 스스로 내린 평가 순서대로 내놓으라고 할 수 있을까? 자 기 작품 중 제일 좋은 것 10개를 순서대로 꼽아보라고 할 수 있을까? 적어도 AICAN의 작업에서는 그것이 불가능하다. AICAN은 알고리즘 상 예술에는 속하되 기존 스타일에서 최대한 벗어난 작품을 무작위로 생산하는 일을 넘어서는 작업은 하지 못하기 때문이다. 인간 예술가 는 다르다. 자신이 그린 작품 중 전시회에 걸고 싶은 작품 10개를 고 르라고 하면 잘 골라낸다. 이건 좋다, 이건 별로다, 이건 왜 그렸다 등 이유를 대면서 스스로 평가한다.
인공지능은 자기 작품은 물론 다른 작품도 평가하지 못한다. 인공 지능에게 미술사에 등장했던 수많은 작품 중에 어떤 것을 좋아하며, 왜 좋은지 10개만 꼽아 설명하라고 하면 어떨까? 미술사 속 작품뿐 아니라 동시대에 창작되고 있는 작품에 대해서도 이런 평가 작업은 불가능하다. 원리상 인공지능은 평가 기준을 자기 바깥에 둘 수밖에 없기 때문이다. 그 기준은 인간이 준 것이다. 나는 이 점을 논증한 바 있다(그림11 참조). 
역설적으로 들릴지 몰라도, 작품은 예술일 수 있지만 인공지능은 예술가가 될 수 없다. 이 점을 이해하기 위해 우리는 "하나의 작품은 작가가 그 안에서 자기 의도에 도달할 때 만족된다"라는 렘브란트 의 말을 참조할 수 있다. 이 말은 그 어떤 작가라도 충분히 동의할 수 있는 말이리라. 미술사가 곰브리치는 이 구절과 관련해서 "하나의 그림이 완성됐다고 판단할 권리는 화가에게 있다"라고 적절하게 해석 한다. 
작품에 서명하기 전에 작가는 충분히 숙고한다. 서명의 순간은 작 품이 완성되는 순간, 즉 작품이 완성됐다고 작가가 승인하는 순간이다. 이 순간에 주목하면 그 어떤 예술작품이건 작가의 평가를 통해 완성된다는 것을 알 수 있다. 이런 점에서 작품을 완성하는 건 작가의 권리다.
- 사실 GPT 같은 트랜스포머 모델이 준 충격은 커질수록 결과가 좋 다는 것이었다. 그래서 GPT가 버전을 올리거나 학습 언어 데이터 개 수와 매개변수의 개수를 늘릴 때 경탄을 낳았다. 그렇다면 계속 그 방 향으로 갈 때 성능이 얼마나 향상될까? 철학적으로 보면, 언어모델이 지닌 근본적 한계 때문에 성능 향상은 상당히 제한적이다. 세계와의 접점이 극적으로 증가하지는 못한다는 뜻이다.
- 더 많은 언어를 학습시키고 매개변수를 늘려도 언어모델은 결국 언어 세계에 머물 수밖에 없다는 점이 핵심이다. 챗GPT가 현재 생성하고 있는 언어는 이미 충분히 언어스럽다. 내용의 진실성 면에서 봤을 때, 유능한 '구라 생성기'이자 '아무 말 대잔치'라는 점이 문제일 뿐이 지. 언어 데이터는 이미 오류로 가득하며, 이는 인간과 언어의 본성과 관련된다. 인간이 원래 구라를 좋아한다는 점, 따라서 언어에 구라가 수두룩하다는 점을 외면해서는 곤란하다.
- 언어모델을 벗어나야 한다. 앞에서 이를 시맨틱웹과 존재론(온톨로 지) 문제라고 말했다. 언어가 존재론으로 확장되지 않는 한, 현재의 놀 라움은 조만간 진부함으로 바뀌고 말 것이다. 그렇다면 존재론으로 이행하려면 무엇이 필요할까? 짐작할 수 있겠지만, 세계를 분류하는 획기적인 틀이 필요하다. 설사 사물인터넷(Internet of Things 이 세계를 감지해 데이터를 확보할 수 있다 하더라도 그걸 분류해 넣어줄 범주 가 필요하다. 그런데 철학에서 존재론의 역사가 보여주듯이, 이건 굉장히 어려운 과제다. 인간이 과연 그런 일을 해낼 수 있을지조차 의문이다.
- 오라클 문제
초거대 언어모델이 내포한 한계는 정보의 단위인 '비트'와 물질의 단위인 '아톰'의 관계를 통해 진술할 수도 있다. 요컨대 비트는 언어고 아톰은 세계다.
디지털 세계는 비트 공간에 있다. 비트 공간의 가장 중요한 특징은 그곳이 자족적 공간이라는 점이다. 비트의 세계는 컴퓨터 파일로 이 루어져 있다. 파일이 생성되고, 저장되고, 전송되고, 조합된다. 비트 공간은 적절한 디지털 인프라만 갖춰지면 아톰 세계와 독립해서 구성 될 수 있다. 아주 정교한 컴퓨터 게임 공간을 떠올려 보라. 비트 공간 은 게임 공간과도 같다.
비트 공간이 아톰 세계와 접점이 있는지, 비트 공간 속의 아톰 세계 표상이 참인지 같은 문제는 '오라클 문제oracle problem'로 알려져 있 다. 이 문제가 가장 중요하게 논의된 곳은 블록체인 기술 영역이지만 모든 디지털 세계에 다 해당한다.
- 미국 표준 기술원이 발표한 '블록체인 기술 개관Blockchain Technology Overview'의 다음 구절은 오라클 문제를 잘 요약하고 있다.
"블록체인 네트워크는 자신의 디지털 시스템 내에 있는 데이터 에는 극히 잘 작동한다. 하지만 블록체인 네트워크가 현실 세계 와 접촉할 필요가 있을 때는 몇 가지 이슈(보통 오라클 문제라고 불 리는)가 발생한다. 블록체인 네트워크는 인간 입력 데이터뿐 아 니라 현실 세계에서 온 감각 입력 데이터 둘 다를 기록할 자리가 있을 수 있다. 하지만 입력 데이터가 실제 세계의 사건을 반영하는지 결정할 방법이 없는 것 같다. 
- 가장 중요한 점은 언어가 의미 네트워크라는 독자적 시스템이 아니 라는 지적이다. 언어는 항상 사회 속에서, 즉 사람들 사이에서 작동하 는데, 평서문이건 의문문이건 감탄문이건 명령문이건 관계없이 항상 '명령'의 형태로 작동한다. 명령은 모든 문장에 따라다니는 '잉여'다. 즉 모든 문장은 '문장+명령'이다. 앞에서 영화 <이미테이션 게임>의 한 장면을 소개했다. 동료가 튜링에게 "우리 점심 먹으러 가"라고 몇차례 말을 건넸을 때 튜링은 '명령'의 측면, 즉 "같이 점심 먹으러 가자"라는 요구의 의미를 놓쳤다. 잉여로서 수반되는 명령이 이 사례에서 잘 드러난다.
- LLM은 비트겐슈타인의 언어관에 부합하는 것 같다. LLM은 단어와 단어, 문장과 문장의 관계를 통계적으로 학습해 어떤 단어나 문장 다 음에 올 단어나 문장을 생성한다. 왜 그래야 하는지를 명시적으로 밝 힐 수 없다는 점에서 LLM은 비트겐슈타인이 말하는 언어 게임을 한 다. 다만 인공지능은 세계가 없기에 책상물림을 할 뿐이며, 따라서 삶 의 형식을 갖고 있지 않다. LLM이 삶의 형식 없이도 언어를 구사하는 것일까? 삶의 형식은 언어에서 애초에 필수적인 것이었을까? 비트겐슈타인 전문가가 성찰하고 답할 문제다.
- 들뢰즈와 과타리의 언어관은 우리에게 직관적으로 와닿는다. LLM 은 언어에서 핵심 요인을 결핍하고 있다. 바로 행위와 실천이다. 나아 가 들뢰즈와 과타리는 비언어적인 사고의 중요성을 강조한다. 대표적 으로 예술과 과학을 꼽는다. 과학이 수식과 법칙의 영역이기 때문에 LLM과 결합하는 것이 비교적 쉽다고 할 수 있을지 몰라도, 예술은 감 각을 통해 신경계에 직접 가닿기 때문에 LLM과 원리상 결합하지 못 한다. LLM에 몸을 주고 감각 기관을 붙이는 문제는 시간이 지난다고 해결될 것 같지 않다. 특히 촉각, 후각, 미각처럼 디지털화가 어려운 근접 감각은 더더욱 넘기 힘든 걸림돌이다.
- 개성, 스타일, 취향은 기계 번역 과정에서 상당히 뭉개져서 고유한 향 같은 게 사라지고 인공 향으로 진한 느낌만 주는 건 아닐까? 우리 가 언어라고 할 때 너무 평균치(그런 게 가능하다면)만 생각하는 것 같 다. 하지만 언어는 같은 단어와 문장이라 할지라도 누가 사용하느냐 에 따라 굉장히 달라진다. 이를 너무 단일한 것으로, 나와 너와 저사 람의 언어가 다 같은 것으로 여기면서 언어의 풍요로움을 느끼지 못하는 것은 아닐까?
- 인공지능은 인간이 준 과제에 대해서만 합리적 해답을 제출한다. 물론 동물에게도 해결해야 할 과제로서 문제가 닥친다. 차이는 동물 은 혼자서도 문제를 문제라고 감지한다는 점이다. 인공지능에게는 문 제를 문제라고 알려주어야 하지만, 동물은 스스로 문제를 문제라고 깨닫는다. 문제가 생긴 후에 지능이 작동하는 과정은 인공지능에게나 인간에게나 같다고 봐도 좋다. 현실적인 최상의 해결책을 찾으려 한 다는 점에서 '합리적'이라고 불러도 좋다. 인공지능은 최고의 확률을 찾아내고 최적화 솔루션을 제시할 수 있지만, 인간이 시킨 일에 대해 서만 그럴 수 있다.
- 인공지능의 핵심인 알고리즘은 자신의 고유한 의지로 목표를 세우 고 그 목표를 성취하는 게 아니다. 목표를 정하는 건 인간이다. '문제' 라는 관점에서 보면, 공학에서는 문제가 인간이 정해준 과제 형태다. 반면에 진화에서 문제는 생물이 환경에서 해결해야만 하는 것이다. 진화란 문제의 발생과 문제의 포착 그리고 문제의 해결 과정이라고해도 과언이 아니다. 그러니까, 공학과 진화에서는 각각 문제의 성격도 다르고 목표의 위상도 다르다.
기술적 분류를 떠나 '철학적으로' 조금 더 강하게 주장해 보면, 어 떤 유형의 기계학습이건 간에 '모든' 기계학습은 자율학습이 아니며 지도학습을 벗어나지 못한다. 학습 목표, 즉 해결해야 할 과제가 내부 가 아니라 외부에서, 말하자면 인간에 의해 주어져야 한다는 뜻이다.
- 지도학습이 현실의 데이터로부터 연결규칙pattern, function을 찾아 내는 과정이라면, 강화학습은 행동 규칙rule이 정해진 플레이에서 최 선의 수를 찾아내는 것을 목표로 한다. 가령 중국 바둑 규칙에 따라 바둑을 둔다고 할 때, 매번 수를 둘 때마다 승률이 가장 높은 수를 찾 아내는 것이다. 아니면 <스타크래프트>에서 최선의 키보드마우스 조작 방법을 찾는 작업이라 해도 좋다. 목표는 최고의 보상maximized reward이다. 바로 알파고가 최종적으로는 강화학습을 통해 만들어졌 다. 그것이 알파고 제로다.
알파고는 한국 사회에 인공지능 열풍을 일으키기도 했지만 심각한 오해도 함께 불러일으켰다. 강화학습에는 본래 데이터가 필요 없 다. 그런데 이세돌과 대국한 알파고, 이듬해 중국 기사들과 대국한 알 파고는 인간이 생산한 기보를 통해 학습했다. 데이터를 사용한 것이 다. 그렇게 기보 데이터를 학습해서 만들어진 최강자가 알파고 마스 터' 버전이다. 인간 프로 기사에게 완승했다. 한편 중국 바둑 규칙 내 에서 마음대로 플레이해서 승률이 높은 수를 찾는 훈련을 시켜 만들 어 낸 것이 '알파고 제로' 버전이다. 무려 자가 대국 2,900만 판을 두 게 했다. 그리고 역사적 대국이 벌어진다. '알파고 마스터' 대 '알파고 제로'의 대결. 알파고 제로는 89 대 11로 알파고 마스터를 이겼고, 바로 바둑에서 은퇴했다.
- 알파고 개발사 '구글 딥마인드'는 이세돌과 대국을 벌인 2016년에 는 데이터가 필요한 '지도학습형 기계학습'과 본래 데이터 없이 최 고 보상을 찾도록 하는 '강화학습형 기계학습을 섞어서 사용했지만, 2017년에는 '데이터 없이도 인공지능이 만들어질 수 있다는 것을 보 여주었다. 알파고는 원리상 처음부터 인간 기보 없이 만들어질 수 있 었고, 오히려 인간 기보에 포함된 나쁜 데이터가 걸림돌이 되어 알파 고 제로에게 패했다. 인간이 생산한 데이터가 더 이상 필요 없는 인 공지능이 등장했다는 오보는 강화학습과 지도학습을 혼동한 데서 비 롯됐다. '알파고'라는 이름이 계속 사용되면서 생긴 문제이기도 하다. '알파고'와 '알파고 제로'는 전혀 다른 프로그램인데 말이다.
알파고는 '신경망을 갖춘 '딥러닝'을 통해 만들어진 인공지능인 건 맞다. 하지만 이런 용어들은 최근 모든 기계학습 프로그램의 작동 원리이기도 하다. 더 중요한 건 기계학습 중에서 지도학습'과 '강화학 습'의 구별이다. 지도학습은 데이터 분석에 기반한 규칙 파악이 중요 하고, 강화학습은 데이터 없이 규칙에 따른 플레이에서의 최대 보상 이 중요하다. 알파고는 데이터 없이 개발될 수 있는 '강화학습 기반 인공지능이다. 처음에 데이터를 통해 학습했던 건 연구 초기 단계라 어쩔 수 없었을지라도, 개발사인 딥마인드나 언론이나 혼동의 여지를 제공한 건 분명 문제다. 오해를 바로잡았어야 한다.
- 챗GPT가 준 충격은 튜링 검사를 통과한 것처럼 보인다는 점이다. 자기가 잘 모르는 사안에 대해서는 인간이 답해주는 것처럼 느껴진 다. 물론 인간의 답변에도 오류가 있는 경우가 많다. 따라서 오류가 섞여 있다고 해서 GPT의 답을 기계가 한 답이라고 알아챌 가능성 도 크지 않다. 공학자들은 챗GPT가 튜링 검사를 통과했다고 자신 있 게 주장한다. 언어학자나 철학자의 견해는 조금 다르다. 튜링이 요구 했던 '심문'을 했느냐는 것이다. 튜링은 무심코 대화를 나눈 상대방이 인간인지 기계인지 잘 구별되지 않을 때를 상정한 것이 아니라 훨씬 엄밀한 심문 상황을 가정했다. 요컨대 심문자가 의심하면서 자기 전 문 지식을 놓고 캐묻는 상황이다. 사람들은 '심문'의 중요성을 간과해 왔다. 현시점에서 튜링 검사를 통해 진정으로 확인하려 했던 게 무엇인지 살피는 일이 우선해야 할 것이다. 이 책의 부록으로 튜링의 논문을 넣은 이유가 여기에 있다.
한편 딥엘, 구글 번역, 파파고 같은 인공지능 번역기는 설이 말한 중국어 방 에이전트와 꽤 닮아 보인다. 인공지능 번역기를 번역가나 통역사로 이해한다면 말이다. 그렇다면 인공지능 번역기는 언어의 의 미를 이해하는 걸까? 통념상 그렇다고 말하기는 어려우리라. 하지만 언어의 의미를 이해한다는 것과 번역이나 통역을 한다는 것이 같은 뜻인지는 물어볼 수 있다.
우리는 종종 생각 없는 사람이 많다는 당혹스러운 사실에 직면하곤 한다. 정말이지 자기 생각은 하나도 없으면서 녹음기처럼 특정한 말 을 되풀이하기만 하는 사람이 정말 많다. 심지어 최근에는 실제로는 인간인데도 불구하고 대화 상대자가 컴퓨터 프로그램이라고 판단한 사람이 실험 참가자의 42%라는 충격적인 연구도 보고되었다." 나아 가 사람에 따라 생각의 깊이도 천차만별이다. 그렇기에 '의미 이해'라 는 말의 다층성을 고려하지 않고 그 모두를 '생각하고 있다'는 증거로 삼기는 어렵다.
- 현상만 놓고 봤을 때 고민이란 생각의 교란이다. 생각이 교란된다 는 건 생각에 질서가 잡혀 있음을 전제한다. 요컨대 고민은 생각을 이 루고 있는 규칙과 질서의 교란이자 변경 과정이다. 고민 중에 있다는 건 생각이 아직 새 질서를 찾지 못했다는 뜻이고, 고민이 끝났다는 것 은 생각이 새 규칙에 의해 재편됐다는 걸 말한다. 우리가 운동을 해서 근육을 단련한다는 건 실은 근육섬유에 상처를 내고 아무는 과정에 서 더 굵어지게 하는 과정이다. 고민이 많다는 건 그만큼 생각이 성장 한다는 뜻이다. 물론 당사자로서는 '왜 나는 계속 고민하며 사나?'라 고 자괴감이 들지 몰라도, 거꾸로 보면 고민이 없다는 건 생각이 멈춰 있어서 새로운 생각을 하지 못한다는 뜻이기도 하다.
물론 고민을 사서 자청하는 사람은 없다. 고민은 문제가 포착됐음 을 뜻하며, 생각이 더 이상 전과 같을 수 없다는 징표다. 이런 점에서 고민은 일종의 탁월한 능력이다. 민감하지 않으면 고민도 없다. 인공 지능은 고민하지 않는다. 시키는 일을 아주 잘해낼 뿐이다. 이제 중요 한 차이가 드러났다. 생각의 고장은 사람에게만 있다. 요컨대 사람이 니까 고민한다.
고민이 시작이라면 다음 단계는 궁리다. 궁리란 해결책을 찾으려는 갖가지 노력과 시도다. 인공지능은 궁리하지 못한다. 주어진 명령을 따라갈 뿐이다. 자기 자신에게 명령할 수 있는 능력이야말로 자유라는 이름에 값한다. 자유란 추상적인 능력이 아니라 고민하고 궁리하 는 구체적 과정이다. 그러니 자유를 누린다는 건 무슨 뜻이랴? 고민 이 많다면 자유의 기회가 찾아왔다고 기뻐해야 하리라.
- 그렇다면 인공지능은 과연 그런 맥락을 파악하는가? '파악한다'고
할 수 없을 것 같다. 다음과 같은 연구 결과도 참고할 수 있다. 어떤 문장에서 영국인과 네덜란드인이 생각하는 속내가 무엇인지 비교한 논문'이 있다.
논문에 따르면, 일상생활에서 영국인이 "당신 말 들었어! hear what you say "라고 말하는 속내는 "내 의견은 완전히 달라" 이지만 네덜란 드인은 그 말을 "그가 내 관점을 인정했어"라고 알아듣는다. 또한 영 국인이 "내 잘못이 확실해I'm sure it's my fault"라고 말할 때 속내는 "네 잘못이야!"이지만, 네덜란드인은 그 말을 "그 사람 잘못이구나"라고 알아듣는다. 논문을 심사할 때 영국인이 "기술된 방법은 다소 독창적 이다The method described is rather original"라고 쓴다면 이는 "헛소리"라 는 뜻이지만 네덜란드인은 "훌륭한 방법"이라고 알아들으며, 영국인 이 "이번에 당신을 실망시켜 미안하다! am sorry to disappoint you on this occasion"라고 쓰면 "더는 신경 쓰지 않겠다"라는 뜻이지만 네덜란드 인은 "그 사람이 미안해하는군"으로 알아듣는다.
- 인공지능은 학습 자료를 통해서 어떤 것을 습득한다. 그런데 결국 인 간도 그 자료를 통해서 뭔가를 이해한다. 기계학습 과정도 실천해 보 고 안 되면 다시 수정하는 일이다. 일종의 시행착오인데, 이런 면도 인간과 비슷해 보인다. 하지만 이 과정에서 일어나는 일의 키워드를 '이해'로 잡아서는 안 될 것 같다. 인간의 이해도 인공지능보다 못한 수준이 태반이다. 대화하다 보면 그런 경우가 많다. 그렇다면 인간의 이해는 무엇일까?
인간에게는 두 개의 층layer 아니면 층위level가 같이 작동한다는 점 에서 출발해 보자. 한편에 바라보는 관찰자적인 '나'가 있고 다른 한 편에는 관찰되는 다양하고 잡다한, 때로는 분열되어 있고 때로는 수 렴된, 때로는 또렷하고 때로는 흐리멍덩한 어떤 '작용'이 있다. 이 두 층을 언어 활동에 적용해 보면, 의미론적인 수준이 하나 있고('작용'의 층) 의미가 오가는 배경이나 환경 또는 맥락에 해당하는 층(관찰하는 '나'의 층)이 있다. 인간에게는 그 두 층을 동시에 포착하는 능력이 있 다. 인공지능은 작동이 일어나는 한 층밖에 없다.
챗GPT의 문제는 같은 걸 물어봐도 다른 답을 계속 내놓고 다른 답 을 한다는 걸 알아채지도 못한다는 점이다. 알아채는 주체에 해당하 는 뭔가가 없다. 순전히 무작위random다. 챗GPT는 너무 쉽게 고친다. 고정된 몸이 없다. 생성 인공지능에서 생성물의 '변덕성'에 주목해야 한다. 미드저니, 달리, 스테이블디퓨전 같은 이미지 생성 인공지능도 그렇고 챗GPT 같은 언어 생성 인공지능도 그렇고 가끔은 번역 인공 지능도 그러한데, 조금만 다른 프롬프트를 주면, 아니 심지어 같은 프 롬프트를 주더라도 생성물이 크게 바뀐다. 인간으로 치면 매번 생각이 바뀐다고 해야 할 것이다. 인공지능은 휘발성이 강해 매번 새롭다. 학습된 모델 자체는 엄청난 잠재 기억 덩어리지만, 생성물이 변덕스럽게 달라지는 인공지능
- 인간의 생각은 쉽게 바뀌지 않는다. 인간은 고집스러운 동물이다.
인간은 습관을 가지고 있어서 계속 고집을 피운다. 반복하면 굳어지 고, 그게 습관이라고 많은 철학자가 말한다. 인간은 잘 안 고친다. 외부에서 주어진 정보가 달라져도, 가령 위조 뉴스가 위조된 것임을 확 실히 알려주는 증거를 접하더라도 인간은 좀처럼 생각을 바꾸지 않 는다. 고집은 인간의 중요한 '특징'이다. 
- 언어모델은 언어 데 이터 안에 있는 것만 처리합니다. 다음 단계는 멀티모달 형태로 가고 있습니다. 언어모델에서 멀티모달 초거대 언어모델로 간다는 게 무슨 변화를 의미할까요? 언어로 설명된 그림, 소리, 그 밖의 무엇들, 즉 인 간 세계에 존재하는 다양한 것을 언어로 설명된 범위 내에 묶어둔다 는 뜻입니다. 그래서 멀티모달 초거대 언어모델은 언어모델의 한계 안에서 작동할 수밖에 없습니다. 물론 수식이나 코딩은 기계가 잘 다 루는 영역이니까 별문제 없겠죠.
그럼 한계가 뭘까요? 근본적인 장벽이 뭘까요? 온톨로지, 철학에서 '존재론'이라고 부르는 영역입니다. 온톨로지 문제를 해결해야 한 단 계 비약이 가능합니다. '암묵지'란 설명하지 않더라도 알고 있는 지식 입니다. 암묵지는 정보의 구멍이 너무 많습니다. 인간은 동물이기 때문에 진화의 역사에서 구멍을 알아채고 대처하는 법을 충분히 알게 됐습니다. 반면 기계는 암묵지를 처리하는 데 어려움과 제약이 많습니다. 언어를 비롯해 인간이 집어넣어 준 것에 국한된다는 한계가 있 습니다. 인간이 주지 않더라도 스스로 입력할 수 있어야 합니다. 그래서 오류를 줄이려고 노력합니다. 사람들이 자꾸 고쳐주는 거예 요. 고쳐주면 언어모델이 현실 세계를 반영하며 수정될 거라고 기대 할 수 있습니다. 그런데 거기에도 한계가 있다고 생각합니다. 바로 비 언어 때문이죠. 그림을 보거나 음악을 들었을 때 그 경험을 언어로 번 역할 수 있을까요? 언어를 통해 다른 사람에게 전달할 수 있을까요? 기계는 주로 디지털 정보로 전환할 수 있는 시각과 청각 같은 '원격 감각'을 처리합니다. 언어를 비껴가거나 언어 바깥에 있는 현실의 많 은 부분은 기계가 도저히 알 수 없습니다. 또한 인간이나 생명체는 촉 각, 미각, 후각 같은 '근접 감각' 환경에서 살아갑니다. 이런 지점에서 기계에 비약적인 발전이 가능할지 의문입니다. 언어로 포착하고 설명 할 수 없는 영역이 존재하는 한 인공지능의 번역과 해석은 한계를 가 질 수밖에 없을 것입니다.
- 철학자 니체는 인간을 규정할 때 가장 중요한 특징으로 '자기 자신 을 넘어서는 존재'라는 점을 지적한다. 이게 '초인übermensch'의 의미 와도 관련된다. 인간이되 자기를 넘어서는 존재로서의 인간, 넘어가 기overcome oneself가 인간의 본질이다. 인간은 고인 물, 중심부, 평균 지대에 멈춰 있지 않고 바깥쪽으로 가서 뭔가 새로운 것을, 유산에 창 조적인 내용물을 계속 보태간다. 인간이 서로 새로운 걸 찾아서 인간 의 공동 저장소pool에다가 계속 넣어주는 존재라는 점이 중요하다. 그런 활동이 인간의 본질이라고 니체는 규정했다. 이게 왜 중요할까? 인간의 사고 활동, 생각 활동에서 가장 중요한 면은 남들이 하지 않았 던, 하고 있지 않은 활동을 한다는 점 아닐까? 이게 결국 생각과 이해 같은 말의 진정한 의미가 아닐까? 과학과 예술과 철학과 여타 온갖 종류의 발명과 창조 작업이 일어나는 지점은 유산의 바깥쪽이고 이와 관련된 활동이 생각과 이해의 본질이다. 유산의 안쪽, 즉 유산에 머무는 것은 생각과 이해의 본질이라고 할 수 없다. 결국 인간이 무엇인지 묻게 된다. 평균적인 것은 반복이다. 평균을 넘어서는 것을 사람들에 게 소개하는 활동이 인간의 생각과 이해의 진정한 의미라고 주장해 볼 수 있지 않을까?
인간이 만든 최고의 발명품 중 하나인 인공지능을 통해 인간이 무 엇인지 다시 발견하게 되었다. 기묘한 상황이다. 언어는 단순히 정보 를 주고받는 수단이 아니다. 기계 번역이나 GPT 같은 언어 생성 인 공지능은 언어에 확정적인 의미가 있다고 보고 정보 교환 수준에서 언어를 다룬다. 하지만 이를 넘어 뭔가 더 창조적인 활동을 수반하는 것이 언어의 더 본질적인 측면 아닐까? 따라서 본래 언어는 기계가 처리하는 수준 바깥쪽에 있다고 생각할 수 있다.
- 칙센트미하이는 "창의성이란 무엇인가 What is creativity?"라는 물음을 “창의성은 어디에 있는가 Where is creativity?"라는 물음으로 바꾸었다.' 물음의 변경은, 칙센트미하이 본인이 비유했듯, 가히 코페르니쿠스 혁명이라 부를 만하다. 왜냐하면 그 전까지 창의성은 개인의 심리 및 재능과 관련해서만 고찰됐을 뿐 사회적, 문화적 요인은 고려되지 않 았기 때문이다. 새로운 물음 아래에서 개인은 창의성의 중심에 있지 않고 오히려 다른 여러 요인과 얽혀 있는 한 요소에 불과한 것으로 새 롭게 자리매김한다. 개인을 중심으로 세상이 돌아가는 게 아니라 개인이 세상의 일부가 된다는 점에서 분명 코페르니쿠스 혁명에 해당한다.
칙센트미하이는 '창의성에 대한 시스템 관점A Systems View of Creativity'을 제안한 1988년의 저 유명한 논문 서두에서 다음과 같이 말한다.
"우리는 개인들과 그들의 작업을 그 행동이 수행되는 사회적, 역 사적 환경과 격리해서 창의성을 연구할 수 없다. 이는 우리가 창 의적이라고 부르는 것이 결코 개인의 행동만의 결과가 아니기 때 문이다. 그것은 다음 세 가지 주요 형성력의 산물이다. 첫째, 개인 들이 생산한 변이 중에서 보존할 가치가 있는 것을 선별하는 사 회 제도의 집합, 즉 현장(field), 둘째, 선별된 새로운 아이디어나 형태를 보존하고 다음 세대에 전달할 안정된 문화 영역(domain), 끝으로, 영역 안에서 약간의 변화, 즉 현장이 창의적이라고 여길 변화를 가져오는 개인(individual)이 그것이다. 그래서 "창의성 은 어디에 있는가?"라는 질문은 사람과 사람의 작업만 참조하여 답변할 수 없다. 창의성은 이 세 가지 시스템 간의 상호작용에서 비롯되는 현상이다. 혁신이 가능한, 문화적으로 정의된 행동 영 역이 없으면 사람은 시작조차 할 수 없다. 그리고 혁신의 적응성 을 평가하고 확정하는 동료 집단이 없으면 창의적인 것과 단순히 통계적으로 있을 법하지 않은 것 혹은 기이한 것을 구별하는 것이 불가능하다."
이에 대한 칙센트미하이의 설명은 시간이 가면서 더 정교하게 발전 되지만, 그렇긴 해도 처음의 아이디어에서 달라지는 건 거의 없다. 칙 센트미하이는 세 가지 시스템, 즉 현장, 영역, 개인을 함께 고려해야 창의성을 이해할 수 있다고 주장한다. 나아가 이 셋은 시간의 흐름에 따르는 나선형 상승 관계를 맺고 있다.
- 유전과 진화 둘 모두에 결정적인 건 환경이다. 시간의 흐름 속에서 환경이 대체로 일정하면 유전이 득세하고, 급변하면 진화가 가속한 다. 따라서 생물학에서 고려해야 하는 가장 중요한 요인은 바로 환경 이다(이것이 생태학 관점이다). 환경은 특정 종 혹은 지배적 개체군을 둘 러싼 먹이와 포식자 같은 유기 환경과 빛, 온도, 물, 광물 같은 무기 환 경 그리고 화산폭발, 지각변동 같은 지질학 요인과 운석의 충돌 같은 우주적 요인 등을 모두 포함한다. 물론 환경의 변화는 우발적이다. 변 화는 갑자기 일어난다. 이 때문에 험준한 산꼭대기에서 조개 화석이 발견되고 북극 빙하에서 얼어붙은 매머드가 발견된다.
- 유전의 관점에서 우연에 의존하는 돌연변이는 급변하는 환경에 대 처하기에 너무 느리다. 즉 진화 전에 멸종이 닥친다. 비교적 짧은 시 간에 급변에 대처하기 위해서는 생물에 어떤 힘이 내장되어 있지 않 으면 안 된다. 니체는 이 힘을 '권력의지der Wille zur Macht'라 불렀고, 베르그손Henri Bergson은 이를 '생의 약동elan vital'이라 불렀다.
진화와 유전이 어느 정도 보편적 지식이 된 후에, 생물학자이자 인류학자이며 사이버네틱스의 창시자 중 하나인 그레고리 베이트슨Gregory Bateson (1904~1980)은 이를 다른 방식으로 설명했다. 베이트슨의 이론을 풀어보면 다음과 같다. 생물은 진화 과정에서 형성된 유전자 풀pool에서 버릴 게 하나도 없다. 왜냐하면 생명은 유 전자에 기억된 유전체 기능의 도움을 받았던 적이 있기 때문이다. 따 라서 특정 유전 정보를 지금 당장 써먹지 않더라도, 마치 윈도 시스템 에서 여러 프로그램이 공동으로 활용할 수 있는 함수인 DLLdynamic- link library(동적 링크 라이브러리)처럼, 필요할 때 써먹기 위해 유전자 풀 에 담아놓은 채 특정 유전체의 작동 스위치만 꺼놓고 있을 뿐이다. 지 금 당장 사용하지 않더라도 DLL은 언젠가는 제 역할을 할 것으로 기대된다.
- 급변한 환경에 맞닥뜨려 생물이 동원하는 건 결국 생명이 발명하고 저장해 놓았던 유전자 풀 전체일 수밖에 없다. 특정 조건에서 생물은 생명으로서 유전자 풀 전체에 기억된 정보를 조합한다. 개별 유전자 내 유전체들의 활성화 스위치를 다시 끄고 켜는 방식으로 말이다. 만 일 생명이 이 일에 실패했다면 현존하는 생물은 없으리라. 이것이 생 명의 힘이다."
칙센트미하이가 베이트슨의 방식으로 '영역'을 설명했다면 훨씬 더 설득력이 있지 않았을까 생각한다. 베이트의 '유전자 풀'에 대응하 는, 몸 밖의 정보들로 이루어진 '문화 풀'이 바로 칙센트미하이가 강 조하려 한 '영역'이다. 나아가 '유전자 풀'이 없다면 '문화 풀'도 작동하지 않는다는 점은 명백하다. 유전자가 뒷받침하지 않는 표현형은 있을 수 없고, 문화란 몸 밖의 기억, 즉 '사회 기억'이기 때문이다. 문 화 풀 혹은 사회 기억을 유전자와 분리하려는 시도는 생물학, 고생물 학, 인류학 같은 분야의 고찰을 통해 볼 때 부적절하다. 문화의 발현 은 전적으로 유전자에 의존하며, 유전자의 잠재력은 문화에 내재하는 씨앗과도 같다. 
- 유전자가 뒷받침하지 않는 표현형은 있을 수 없고, 문화란 몸 밖의 기억, 즉 '사회 기억'이기 때문이다. 문 화 풀 혹은 사회 기억을 유전자와 분리하려는 시도는 생물학, 고생물 학, 인류학 같은 분야의 고찰을 통해 볼 때 부적절하다. 문화의 발현 은 전적으로 유전자에 의존하며, 유전자의 잠재력은 문화에 내재하 는 씨앗과도 같다. 
- 250년 동안 통용되어 온 '예술'과 '창작' 개념이 절대적일 수는 없 다. 역사에서 태어난 것은 역사로 마감될 운명이다. 그러나 근대의 발 명품인 예술이 가치가 있다고 평가하는 사람에겐 그 가치를 보존하 려는 쪽이 현명한 선택이다. 예술의 본질은 개념으로 발현되기 전부 터도 인간에게 내재하고 있던 미덕이었으리라. 다만 충분히 개화하지 못한 채 오래 잠자고 있었을 뿐. 아직 그 잠재력을 다 발휘하지 못한 예술은 계속 인간의 몫으로 남게 되는 것 같다. 인공지능의 등장은 이점을 새삼 확인시켜 준다. 그러나 그 잠재력은 결국 개인이 아닌 집단에서 협업을 통해 발휘된다는 점은 중요한 교훈이다.
특정한 시기, 비교적 좁은 지역에서 창의성이 꽃피었던 예들은 사 회적 창의성이 왜 중요한지 잘 보여준다. 기원전 5세기 아테네, 14세 기 피렌체, 17세기 암스테르담, 18세기 에든버러, 19세기 말 파리, 20 세기 초빈, 20세기 말 뉴욕, 21세기 초 서울 등 창의적 인물과 결과는 홀로 불쑥 등장하지 않았다. 왜 창의적 결과는 떼로 등장하는 걸까? 이 물음에 대한 답은 창의성은 본성상 사회적 현상이며 사회의 높은 자유도가 창의성을 배양한다는 데서 찾을 수 있을 것이다.
- 글을 쓰려면 무엇이 필요할까? 바로 생각이다. 생각의 출발은 풀어 야 하는 문제다. 문제를 풀려면 데이터가 필요하고, 데이터를 잘 이해 하고 요약하고 정리할 수 있어야 하며, 데이터를 압축해야 하고, 데이 터에서 플러스알파를 추출해야 한다. 데이터란 남들이 기왕에 찾아낸 해결의 단서다. 문제가 크게 새롭지 않다면 남들이 제공한 데이터를 적절히 조합해 해결책을 만들 수 있다. 그런데 문제가 새롭다면 데이 터를 토대로 자신이 직접 생각해야 한다. 새로운 문제여야 보람이 있 다. 지식이건, 콘텐츠건, 돈벌이건 간에 말이다.
글쓰기는 문제의 발견, 데이터 처리와 종합, 플러스알파의 추가, 멋진 표현이 합쳐지는 과정이다. 이 점에서 나는 글쓰기가 생각의 싸움을 위한 근력과 관련된다고 주장한 것이다. 챗GPT가 '좋은'(?) 답을 내놓게 하려면 질문을 잘해야 한다거나 답을 잘 유도해야 한다는 이 야기가 있다. 맞는 말이지만 조건이 있다. 질문자가 던지는 문제가 새 롭거나, 질문자가 전문 지식을 갖추고 있거나 답을 평가할 능력을 지 니고 있어야 그것이 성립한다. 즉 생각의 근력이 길러져 있어야 한다 는 말이다.
생각의 근력을 키우기 위해 지금까지 인류가 발견해 낸 가장 좋은 방법은 바로 글쓰기다. 글쓰기는 문제를 발견하고, 문제를 풀기 위해 데이터를 모으고 압축하고, 새로운 생각을 보태고, 자신과 남이 알아 들을 수 있게 표현하는 전 과정을 말한다. 

- 30년도 더 전에 경영학자 피터 드러커Peter Ferdinand Drucker는 열역학 제2법칙을 모르는 '인문학'과 셰익스피어를 읽지 않은 '과학'의 소통 단절 문제를 지적한 찰스 퍼시 스노Charles Percy Snow의 '두 문화' 이론을 비판하면서, '경영management'이 이미 이 단절을 극복하고 있 다고 주장한다.
"경영이란 전통이 리버럴아트Liberal Art라고 일컬어 온 바로 그것 이다. 경영은 지식의 근본, 즉 자신에 대한 지식, 지혜, 리더십을 다루기 때문에 '리버럴'이고 실천과 응용을 다루기 때문에 '아트' 다. 경영자는 인문학과 사회과학의 지식과 통찰, 즉 심리학과 철 학, 경제와 역사, 물리과학과 윤리를 끌어온다. 이에 그치지 않고 경영자는 이런 지식을 모아 환자를 치료하고, 학생을 가르치고, 교량을 건설하고, 사용자 친화적인 소프트웨어 프로그램을 설계 하고 판매하는 등의 성과와 결과를 창출해야만 한다. 이런 이유 들 때문에, 점차 경영을 통해 '인문학'은 인정과 영향력과 타당성 을 다시 획득하는 분과와 실천이 될 것이다."
- 서양인들은 그리스와 로마의 고전을 읽으며 삶을 배웠고, 자기 생 각을 글로 표현했다. 요컨대 읽기와 쓰기가 곧 인문학이었다. 다른 관 용어 중 하나는 '비판' 혹은 '비판적 사고'다. 일찍이 세네카도 강조 했고 르네상스 인문주의자도 강조했다. 비판에 대한 강조는 근대에 도 이어졌다. 칸트가 "계몽이란 무엇인가?"에 대한 답변』(1784)에서 잘 지적했듯이, 위기를 직시하며 위험을 무릅쓸 수 있는 성숙함과 용 기와 자유로운 정신, "과감히 알려고 하라!"라는 표어에 핵심이 있다. 이 흐름은 앞서 소개했던 '아르테스 리베랄레스', 즉 리버럴아츠로 수 렴될 수 있다.
아르테스 리베랄레스는 근래에 '자유학예學' 혹은 '자유 교양 학문'이라고 번역된다. 굳이 '인문학'이라는 이름을 고집하지 않아도 된다. 서양에서 그것은 공적인 삶에 능동적으로 참여하기 위해 자유 로운 인간이 필수적으로 알아야 할 이론적, 실천적, 실용적 앎의 총합 이었다. 이런 소양이 오늘날에도 필요한지는 물어볼 필요도 없다. 이를 갱신한 것이 '리버럴아츠'인데, 리버럴아츠칼리지를 단순 수용 하는 것이 아니라면 '새로움new'은 어디에 있을까? 가장 중요한 것은 인문학의 핵심에 있는 '언어'의 의미를 확장하고 재정의하려 한다 는 데 있다.
근대에 이르기 전까지 '언어'는 인간과 사회와 자연을 이해하는 가 장 중요한 도구였다. 세상은 느리게 변했고, 고전은 거듭 읽혔다. 갖 춰야 할 최초의 능력은 문해력이었다. 문해력이 있어야 기본 데이터 를 습득할 수 있었다. 하지만 근대는 이를 송두리째 뒤집었다. 언어로 표현하거나 포착할 수 없는 세계가 발견된 것이다. 갈릴레오가 말했 듯, 그것은 '수학의 언어로 쓰여 있다. 이제는 지식을 얻기 위해 언어 뿐 아니라 수학도 알아야만 한다. 그런데 오늘날에 와서는 언어와 수 학이 전부가 아니다. 오늘날 '문해력'의 용법은 매우 확장됐다. 데이 터를 얻고 내용을 이해하기 위해 곳곳에 이 용어가 쓰인다. '디지털 문해력', '통계 문해력', '과학 문해력', '미디어 문해력', '예술 문해력' 등 '문', 즉 '언어'가 지칭하는 바가 아주 다양해진 것이다. 
- 언어의 확장은 오늘날 아주 중요한 함의를 갖는다. 예를 하나 보겠 다. 기원전 3000년에 페니키아인이 지중해 전역에 걸친 최초의 무역 왕국을 건설할 수 있었던 출발점은 무엇일까? 비밀은 뿔고둥에 있었 다. 페니키아인은 뿔고둥의 독샘에 든 자줏빛 액체에서 진한 자주색 염료를 생산하는 법을 발견했다. 이 자원은 대단히 귀했고 비쌌고 쉽 게 고갈됐고 수요가 많았다. 얕은 물에서 6~7년을 사는 뿔고둥이 절 멸하면 더 깊은 물로 가야 했고, 페니키아인은 뿔고둥이 풍부했던 서 식지가 고갈될 때마다 해안을 따라 지중해 전역으로 이동했다. 이 과 정에서 튼튼한 배를 만들기 위한 원료인 레바논시다 숲을 착취했고, 항해와 원양 기술을 발달시켰으며, 바다를 장악하고 새로운 자원을 개척하며 새로운 거래처를 확보했다. 교역로를 보호하기 위해 전함을 포함한 상단을 운영했고, 저장 용기로서 유리 제품을 개발했으며, 늘 어난 노동 수요를 충당코자 노예를 거래했다. 이처럼 하나의 역사적 사건이 전개되는 과정을 이해하기 위해서는 지리, 생물학, 정치 등에 대한 이해가 필요하다. 뿔고둥과 레바논시다의 생태를 이해해야 페니 키아의 흥망성쇠가 비로소 해명될 수 있다.
오늘날 세상 돌아가는 것을 알기 위해서는 물론이려니와 자립적인 확장된 인문학은 진정한 의미의 융합 교육이다. 분리된 것을 합치 는 것이 아니라 처음부터 분리 자체를 인정하지 않는다. 그간 이루어 졌던 시도를 참조하면, 이를 '컴퓨팅 사고computational thinking와 창의 성의 결합', '디자인 사고design thinking의 함양', '플롯을 구성하고 내 용을 편집할 줄 아는 소양' 등 배타적이지만 않다면 뭐라 불러도 좋 다. 이 능력은 실용적이기도 하다. 기술력이 필요한 제품뿐 아니라 음 악, 영화, 드라마, 웹툰, 소설 등 문화 콘텐츠를 만드는 원동력이 될 수 도 있다. 레오나르도 다빈치처럼 인문, 예술, 과학, 기술 모두에 능한 '르네상스형 인간'을 길러내겠다는 지향을 가져야 한다.
확장된 인문학의 가장 큰 지향은 다음 세대 시민이 융복합 과업을 해낼 수 있도록 교육하는 일이다. 
- 영어로 된 지식 중심의 접근법을 벗어나야 합니다. 가령 "언어는 ~한 것이다"라고 말할 때 촘스키와 같은 사람의 이론, 영어로 된 지식 이 논의의 중심에 있습니다. 그런 식의 표준으로 아이디어가 한정되 는 것 같아요. 그런데 그것만으로는 분명히 한계가 있습니다. 기존의 룰은 영어로 구성돼 있습니다. 엔지니어도 영어로 사고합니 다. 거기에서 아이디어를 확장해 나간다. 정말 그걸로 충분한 걸까요? 이런 사고는 근본적인 편견을 벗어나지 못합니다. 영어권의 주류 사 고에서는 언어가 세계를 다 담고 있다고 전제하는 것 같아요. 그래서 초거대 언어모델로 모든 걸 다 해결할 수 있다는 추세죠. 그런데 메타 인공지능 연구소 수석 과학자인 얀 르쿤은 프랑스 사람입니다. 입장 이 조금 다르죠. "AI는 편견만 강화할 뿐 절대 큰 도약을 이룰 수 없 다"라는 얘기를 매일같이 합니다. 미국의 오픈AI 최고경영자인 샘 알 트만과는 인공지능에 대한 접근 방식에서 확연히 차이가 나는 거죠.
- 인문학은 언어 사랑이다. 지금은 언어 자체가 확장했다. 수학, 과학, 예술, 디지털도 이 시대의 언어다. 더 이상 전과 같은 언어가 아니다. 따라서 지금 인문학은 확장된 언어를 다뤄야 한다. 나아가 언어 활용 능력, 즉 문해력의 성격도 바뀌었다. 종래의 문사철 언어 말고도 확장 된 언어까지 다룰 수 있어야 한다. 결국 확장된 인문학으로 응대해야 한다. 인간의 조건이 바뀌었고, 인간도 재정립되는 중이다. 역사를 거슬러 돌아보면, 새로운 기술은 항상 두려움의 대상이었다. 그러나 인 간은 금세 적응하고 재탄생했다. 사진이 처음 등장했을 때의 충격은 결국 현대 회화를 낳는 방식으로 화해했다. 디지털 사진이 등장하자 그건 진짜 사진이 아니라는 반발이 컸다. 어느새 사진이 일상에 완전 히 스며든 기술이 되었다는 징표였다. 일은 늘 이런 식이었다. 인공지 능이 새로운 인간의 일상에 잘 스며들게 하는 과정에 인문학이 제 역 할을 해야 한다.

 

'IT' 카테고리의 다른 글

박태웅의 AI강의  (1) 2023.12.05
로봇의 지배  (0) 2023.08.14
슈퍼개인의 탄생  (0) 2023.07.14
AI 지도책  (0) 2023.07.06
챗GPT 질문이 돈이 되는 세상  (0) 2023.06.04
Posted by dalai
,

슈퍼개인의 탄생

IT 2023. 7. 14. 12:25

- 아이폰이 탄생하는 순간 사람들이 멀티터치와 앱스토어에서 새 로운 경험을 한 것처럼, GPT가 탑재된 코파일럿을 경험한 순간 이 전의 모든 인터넷 기반의 생산성 도구들은 진부하게 느껴질 것이 다. 생성 인공지능이 기존의 도구와 만나 완전히 새로운 경험을 만 드는 중이다.
코파일럿 발표 5일 후 3월 21일, 마이크로소프트는 오픈AI의 이 미지 생성 인공지능 프로그램 '달리 DALL-E'를 빙과 엣지 브라우저에 적용한 '빙 이미지 크리에이터 Bing Image Creator'를 발표했다. 이제 채 팅창에 원하는 그림을 그려달라고 텍스트를 입력하거나, 음성으로 말하면 내가 원하는 그림이 나온다.
GPT의 불씨가 브라우저, 검색 엔진인 빙, 운영 체제인 윈도우, 생산성 도구인 워드, 엑셀, 파워포인트, 팀즈 등 계속 다른 도구에 붙고 있다. 프로메테우스를 장착한 마이크로소프트의 빙은 2023년 3월 기준, 하루 순 이용자가 1억 명을 넘어섰다. 1개월 만의 성과 다. 특히 주목할 점은 이용자 중 3분의 1이 빙을 처음 사용했다는 것이다. 마이크로소프트는 PC뿐 아니라 스마트폰의 빙 앱에도 인 공지능을 탑재하며 사용자를 늘리고 있다. 2022년 빙의 모바일 앱 다운로드 수는 80만 건이였으나, 오픈AI 챗GPT와 통합을 발표 한 후 일주일 동안 75만 건이 다운로드되었다. 가상의 불이 번지기 시작했다.
- 인공지능 기업 '스케일AI'에서 프롬프트 엔지니어로 일하는 라일리 굿사이드는 "프롬프트 엔지니어는 인간과 기계의 마음이 만나는 장소에서 소통하는 방식을 찾는 사람이며, 인간이 추론할 수 있고 기계가 따를 수 있는 언어를 만드는 이 직업은 사라지지 않을 것"이라고 말했다.
물론 반대 시각도 존재한다. 현대 언어학의 최고 거장인 노엄 촘스키 Noam Chomsky는 챗GPT와 같은 생성 언어 모델 기반의 인공지 능에 대해 부정적 의견을 제시했다. 촘스키는 "챗GPT와 같은 챗봇 은 코드를 작성하거나 여행을 계획하는 데는 유용할 수 있지만, 독 창적이고 심층적이며 잠재적으로 논쟁의 여지가 있는 토론은 결코 할 수 없을지도 모른다. 비록 초기 단계지만 인간 지능과 동등하거 나 능가할 수 있는 AI는 아직 멀었다"고 말했다.
- 인터넷 검색 서비스가 등장했을 때 인터넷 검색 자격증도 생기며 주목받았으나 지금은 그 의미가 퇴색했다는 의견도 존재 한다. 하지만 중요한 건 인터넷 시대에 검색 역량은 이미 필수라는 것이다. 고액 연봉을 받든, 필수 역량이 되든 새로운 미래가 시작 되고 있음에 유의할 필요가 있다.
현재 프롬프트 역량을 보유한 플랫폼 스타트업들이 막 출현 중 이며, 이들 중 투자유치를 통해 새롭게 비상할 기업이 생길 것이 다. 규모는 작지만 이 기업들이 성장하는 모습에서 새로운 투자 기회를 찾는 노력도 필요할 것이다.
- 2023년 2월 미국 저작권은 이미지 생성 인공지능 미드저니로 만들어진 디지털 만화, <여명의 자리야 Zarya of the Dawn>에서 크리스 카슈타노바 Kris Kashtanova 작가가 쓴 글, 이미지의 선택과 배치는 저작 권이 인정된다고 통보했다. 인공지능과 협업하는 새로운 디지털 만화 <여명의 자리야>는 작가가 대사를 쓰면, 미드저니가 그림을 생성하고 작가가 이를 배치하는 방식으로 제작됐다. 인공지능이 생성한 이미지에는 저작권을 인정하지 않았지만, 작가가 기여한 부분에는 저작권을 인정한 것이다. 미국 저작권청의 이번 결정은 최근 미드저니나 챗GPT 등 이미지나 텍스트 등 콘텐츠를 만들어내는 생성형 인공지능 관련 저작권과 관련해 처음 내린 것으로 알려 졌다.
- 2019년 매사추세츠 대학교는 초거대 인공지능 모델을 학습하는 데 이산화탄소가 얼마나 배출되는지 분석했다. 그 결과, 평균 미국 자동차 평생 배출량의 거의 5배에 해당하는 62만 파운드 이상의 이 산화탄소를 배출한다는 사실을 발견했다.
연구진은 초거대 인공지능 분야에서 두각을 내는 네 가지 모델, 즉 트랜스포머 · ELMOBERT.GPT-2를 대상으로 분석한 결과 인공지능 훈련에 드는 계산 및 환경 비용이 모델 크기에 비례해 증가하다가 모델의 최종 정확도를 높이기 위한 일종의 정제 작업을 거칠 때 폭발적으로 증가한다는 사실을 밝혀냈다. 중요한 것은, 이 수치는 탄소 배출 시작의 기준선일 뿐이라는 것이다. 단일 인공지능 모델을 훈련하는 건 최소한의 작업으로, 새로운 인공지능 모델을 처음부터 개발하거나 기존 모델을 새로운 데이터에 맞게 조정하는 경우에는 더 많은 학습과 튜닝이 필요하고 탄소 배출량은 더욱 늘 어난다. 연구팀은 논문에 실릴 만한 최종 모델을 구축하고 테스트 하는 과정에서 6개월 동안 4,789개의 모델을 훈련해야 한다고 설명했다. 전 세계 기업들이 너도나도 초거대 인공지능 모델을 개발 하고 있으니 여기서 배출되는 탄소량이 그야말로 어마어마한 것이 다.
인공지능 스타트업 허깅페이스가 대규모 언어모델 블룸BLOOM의 탄소 배출량을 계산해본 결과, 훈련과정에서 25톤의 탄소가 배출 된다고 밝혀냈다. 그러나 블룸을 실행하는 데 필요한 더 큰 규모의 하드웨어 및 인프라 관련 비용까지 고려하면 배출량은 두 배로 늘어난다. 같은 크기의 다른 초거대 인공지능의 탄소 배출량에 비하 면 상대적으로 적은데, 이는 블룸이 이산화탄소를 배출하지 않는 프랑스의 슈퍼컴퓨터로 훈련되었기 때문이다. 화석 연료에 더 많 이 의존하는 중국, 호주 또는 미국 일부 지역에서 훈련된 인공지능 모델은 더 많은 탄소를 배출할 것이다. 오픈AI의 GPT-3와 메타의 OPT는 훈련 중에 각각 500톤과 75톤 이상의 이산화탄소가 배출되 는 것으로 추정했다.
IT 전문 월간지 《와이어드Wired>는 생성 인공지능 경쟁에는 '더 러운 비밀 Dirty Secret'이 있다고 언급했는데, 이것이 바로 탄소 배출의 문제다. 초거대 인공지능이 검색 엔진에 통합되고 다양한 분야에 적용되면 탄소 배출량이 폭발적으로 증가한다는 것이다. 캐나다 데이터센터 회사인 큐스케일oscale의 공동설립자 마틴 부샤드는 검 색에 생성 인공지능을 추가하려면 최소한 검색당 최소 4~5배 이상 의 컴퓨팅이 필요하다고 예상했다. 구글에서 전 세계적으로 초당 4만 회, 연간 1조3,000억 회의 검색이 발생한다고 보면 이 검색 엔 진을 통해 연간 약 40만 톤의 탄소가 배출되는 셈이다. 단순 검색 을 넘어 인공지능까지 탑재되면 탄소 배출량은 가파르게 증가한 다. 이미 마이크로소프트의 검색 엔진 빙과 오픈AI의 챗GPT가 통 합되었고, 구글도 생성 인공지능 바드를 출시한 상황이다. 미래가 아닌 현실에서 일어나고 있는 일이다.
- 생성 인공지능이 '물 먹는 하마'라는 연구 결과도 나왔다. 콜로 라도 대학교와 텍사스 대학교 연구진이 초거대 인공지능 모델을 가동할 때 발생하는 열을 식히기 위해 필요한 냉각수의 양을 추정 하는 연구를 진행했는데, 챗GPT와 대화를 한 번 나누는 데 물 500 ml가 소요된다는 결론을 도출했다. 질문과 답변을 25~50개 정도 주고받는 대화를 기준으로 삼았을 때다. GPT-3를 훈련하는 데는 총 18만 5000갤런(70만 리터)의 물을 쓴 것으로 추정됐다. 데이터센터 가 작동할 때는 많은 열이 방출되기에 계속 운영하기 위해서는 냉각탑이 필요하다. 
- 처음 카메라가 발명되었을 때, 화가들은 이를 인간 예술성이 타 락한 것으로 여겼다. 19세기 프랑스 시인 겸 미술평론가 샤를 보들 레르Charles Baudelaire는 사진 기술을 "예술의 가장 치명적인 적"이라고 까지 비난했다. 20세기 들어서 디지털 이미지 편집 도구들이 비슷 한 이유로 비난받았다. 하지만 기술의 진화와 함께 등장한 새로운 도구들은 점차 세상의 중심으로 이동했고 독자적 세계를 형성하며 예술의 개념을 확장하며 새로운 시장을 열어갔다. 지난 80년간 늘 어난 일자리의 85% 이상이 신기술을 중심으로 한 새로운 직종에서 등장한 것처럼, 생성 인공지능으로 기존의 일은 재구성될 것이고, 새로운 직업과 방식이 등장할 것이다. 머스크의 말처럼 결국 우리 가 세계를 바라보는 방식에 변화가 필요할 뿐 아니라, 스스로 생각 하는 법을 익히지 못하면 통념이 인생을 조종하게 된다. 외면하면 또 다른 위기에 직면할 것이고, 지금 두려움에 직면하고 넘어선다 면 새로운 기회를 만날 것이다. 그리고 그러한 변화 속의 주인공은 바로 슈퍼 개인들이다.




'IT' 카테고리의 다른 글

로봇의 지배  (0) 2023.08.14
AI빅뱅  (0) 2023.08.14
AI 지도책  (0) 2023.07.06
챗GPT 질문이 돈이 되는 세상  (0) 2023.06.04
좋아요는 어떻게 지구를 파괴하는가  (7) 2023.06.02
Posted by dalai
,

AI 지도책

IT 2023. 7. 6. 16:34

- 인공지능을 정의하는 각각의 방식은 인공지능을 어떻게 이해하고 측정하고 평가하고 통제할 것인가에 대한 얼개를 짜는 것과 같 다. AI를 기업 인프라에 대한 소비재 브랜드로 정의한다면 그 지평 은 마케팅과 광고에 의해 결정된다. AI 시스템을 어느 인간 전문가 보다 신뢰할 만하거나 합리적이고 가능한 최선의 행동'을 취할 수 있는 행위자로 간주한다면 그것은 보건, 교육, 형사 같은 중대 사안 에 대해 결정권을 부여해야 한다는 뜻이다. 구체적 알고리즘 기법이 유일한 관심사라면 그것은 기술의 지속적 발전만이 중요하며 이 접 근법들의 연산 비용과 위기의 지구에 미치는 장기적 영향은 전혀 고 려하지 않는다는 의미다.
이에 반해 이 책에서는 AI가 '인공적이지도 않고 '지능'도 아니라고 주장한다. 오히려 인공지능은 체화되고 물질적인 지능이며 천연자원, 연료, 인간 노동, 하부 구조, 물류, 역사, 분류를 통해 만들어 진다. AI 시스템은 자율적이지도 합리적이지도 않으며 대규모 데이 터 집합이나 기존의 규칙 및 보상을 동원한 방대하고 (연산의 측면 에서) 집약적인 훈련 없이는 아무것도 분간하지 못한다. 사실 우리 가 아는 형태의 인공지능은 훨씬 폭넓은 정치적·사회적 구조에 전 적으로 의존한다. 또한 AI를 대규모로 구축할 자본과 AI를 최적화할 방법이 필요한 탓에 AI 시스템은 궁극적으로 기득권에 유리하게 설계된다. 이런 의미에서 인공지능은 권력의 등기부인 셈이다
- '인공지능'이라는 용어가 전산학계에서 거부감을 일으킬 수 있다는 사실은 언급해둘 만하다. 이 문구는 수십 년에 걸쳐 부침을 겪 었으며 연구보다는 마케팅에서 더 많이 쓰인다(전문적 논의에서는 '기계 학습'이 더 흔히 쓰인다). 하지만 자금 지원을 신청하는 기간이나 벤처 투 자가들이 수표장을 들고 찾아올 때, 연구자들이 새 연구 결과에 대 해 언론의 주목을 끌고 싶을 때는 AI라는 용어가 곧잘 동원된다. 이 때문에 AI라는 용어는 채택되기도 하고 거부되기도 하면서 의미가 끊임없이 달라진다. 이 책에서는 AI를 '정치, 노동, 문화, 자본을 아 우르는 대규모의 산업적 구성물'이라는 의미로 쓴다. 반면에 기계 학습을 언급할 때는 기술적 접근법(자주 언급되지는 않지만 이것은 사실 사회 적·토대적 접근법이기도 하다)에 대해 이야기하는 것이다.
하지만 인공지능 분야가 알고리즘적 혁신, 점진적 제품 개량, 편 의성 향상 같은 기술적 측면에 왜 그토록 집중해왔는지에는 중요한 '이유'가 있다. 이런 지엽적이고 추상적인 분석은 기술, 자본, 통치의 접점에 놓인 권력 구조에 훌륭히 이바지한다. AI가 어떻게 해서 기본적으로 정치적인지 이해하려면 신경망과 통계적 패턴 인식을 넘어서서 '무엇이 누구를 위해' 최적화되고 '누구에게' 결정권이 있는지 물어야 한다. 그런 뒤에야 우리는 그 선택들의 의미를 추적할 수 있다.
- 클레이턴 밸리와 실리콘밸리의 관계가 궁금하다면 19세기 금전金田(금광 지대)과 초창기 샌프란시스코의 관계를 떠올려보라. 채굴 의 역사는 그 뒤에 남는 폐허가 그렇듯 기술 발전의 이야기에 으레 동반되는 고의적 기억상실증에 의해 곧잘 간과된다. 역사지리학자 그레이 브레킨이 지적하듯 샌프란시스코는 1800년대 캘리포니아 와 네바다의 땅에서 금과 은을 캐내 얻은 수익으로 건설되었다.' 이 도시의 재료는 채굴이다. 캘리포니아와 네바다는 멕시코-아메리카 전쟁이 끝난 1848년 과달루페 이달고 조약에 따라 멕시코에서 미국 에 양도되었다. 이곳이 매우 귀중한 금전이 될 것임은 당시에 이미 정착민들에게 알려져 있었다. 브레킨의 말마따나 이 사건은 '무역 은 깃발을 따라가지만 깃발은 곡괭이를 따라간다" (상거래의 토대는 군 대이고 군대의 토대는 광업이라는 뜻이다-옮긴이)라는 옛 격언의 교과서적 사례였다. 미국 영토가 쑥쑥 늘어나는 동안 수천 명이 보금자리에서 내몰렸다. 미국의 제국주의적 침략에 뒤이어 광산업자가 몰려들었 다. 땅을 파헤친 탓에 물길이 오염되고 인근 숲이 파괴되었다.
예로부터 광업에서 이윤이 날 수 있었던 것은 환경 피해, 광부 들의 질병과 사망, 지역사회 해체 같은 진짜 비용을 감당하지 않아 도 되었기 때문이다. 광물학의 아버지로 불리는 게오르기우스 아그 리콜라는 1555년에 이렇게 말했다. '광업으로 인한 손실이 광업에 서 생산되는 금속의 가치보다 크다는 것은 누구나 아는 사실이다." 말하자면 광업에서 이익이 남는 것은 오로지 비용을 남들에게, 지금 살아 있는 사람들과 아직 태어나지 않은 사람들에게 떠넘기기 때문 이다. 
- 심층 시간의 관점에서 보자면 우리는 아마존 에코와 아이폰 같은 고작 몇 년 쓰고 버리는 기기를 만들어 현대 기술 시대라는 찰나 를 떠받치려고 지구의 지질학적 역사를 뽑아내고 있는 셈이다. 미국 소비자기술협회의 발표에 따르면 스마트폰의 평균 수명은 4.7년에 불과하다." 이 노후화 주기는 더 많은 기기의 구매를 유도하고 이윤 을 끌어올리고 지속 불가능한 추출 관행을 부추긴다. 광물, 성분, 원 료들의 개발 과정은 느릿느릿 진행되지만 그러한 과정만 끝나면 채굴, 처리, 혼합, 제련, (가공 과정에서 수천 킬로미터를 오가는) 물류 운송은 일사천리로 진행된다. 땅속에서 캐내 폐기물과 광미를 버리고 남은 원광석은 기기로 만들어져 이용되다가 폐기된다. 그리고 결국 가나와 파키스탄 같은 나라의 전자 폐기물 하치장에 매립되고 만다. 탄생에서 사멸에 이르는 AI 시스템의 일생에는 인간 노동과 천연자원의 착취, 기업 권력과 지정학적 권력의 거대 집중 등 여러 프랙털적 공급사슬이 존재한다. 그리고 처음부터 끝까지 지속적인 대규모의 에너지 소비가 이 사슬을 굴러가게 한다.
샌프란시스코의 토대가 된 채굴 방식은 오늘날 그곳에 기반을 둔 기술부문의 관행에서 그대로 반복된다." AI의 대규모 생태계는 우리 의 일상적 활동과 표정에서 데이터를 수집하는 활동부터 천연자원을 
고갈시키는 활동, 이 거대한 지구적 네트워크를 구축하고 유지하기 위해 전 세계에서 노동을 착취하는 활동까지 여러 종류의 추출에 의 존한다. AI는 널리 알려진 것보다 훨씬 많은 것을 우리와 지구로부터 뽑아낸다. 
- 내몽골 최대 도시 바오터우에는 유독한 검은색 진흙으로 메워진 인공 호수가 있다. 유황 냄새를 풍기는 그 호수는 끝이 보이지 않 는다. 지름은 9킬로미터를 넘는다. 그 검은 호수에는 원광석 가공과 정에서 발생한 부산물 가루가 1억 8,000만 톤 이상 쌓여 있다." 폐 기물은 인근의 바이윈 광산에서 유출되었는데, 이곳의 희토류는 전 세계 매장량의 70퍼센트에 이르는 것으로 추정된다. 바이윈 광산은 세계 최대의 희토류 매장지다.
중국은 전 세계 희토류의 95퍼센트를 공급한다. 저술가 팀 모 건의 말에 따르면 중국의 시장 지배는 지질학적 이점 때문이라기보다는 채굴의 환경 비용을 감내하려는 국가적 결의 때문이다. 네오디뮴과 세륨 같은 희토류는 비교적 흔하지만, 이것들을 쓸 만하게 만들려면 대량의 황산과 질산에 녹이는 위험한 공정을 거쳐야 한다. 이 산성 용액은 엄청난 양의 독성 폐기물이 되어 죽음의 호수 바오 터우를 메운다. 환경 연구자 마이라 허드가 우리가 잊고 싶어 하는 폐기물'이라고 부르는 것으로 가득한 장소는 이곳만이 아니다.
오늘날까지 희토류의 전자, 광학, 자력 측면에서의 쓰임새는 어 느 금속도 넘볼 수 없지만, 유용 광물 대비 폐기물 독소의 비율은 상 상을 초월한다. 천연자원 전략가 데이비드 에이브러햄은 중국 장시 의 디스프로슘과 터븀 채굴을 이렇게 묘사한다(두 광물은 각종 첨단 기기에 쓰인다. '채취된 점토의 희토류 함유량은 단지 0.2퍼센트에 불 과하다. 이것의 의미는 99.8퍼센트는 광미라고 불리는 찌꺼기 또는 폐기물이라는 것이다. 이 광미는 언덕이나 냇가에 버려진다." 이렇게 버려진 폐기물은 암모늄 같은 새로운 오염물질을 만들어낸다. '중국 희토류협회의 추정치에 의하면 이 같은 희토류 1톤을 정제해내기 위해서는 그 과정에서 7만 5,000리터의 산성 폐기물과 방사성 폐기물 1톤이 산출된다고 한다.'
바오터우 남쪽으로 약 4,800킬로미터 떨어진 곳에는 인도네 시아의 소도小 방카 섬과 벨리퉁 섬이 수마트라 연안에 자리 잡고 있다. 두 섬에서는 반도체에 쓰이는 주석이 생산되는데, 생산량이 인도네시아 전체의 90퍼센트에 이른다. 인도네시아는 중국에 이어 세계 2위의 주석 생산국이다. 인도네시아의 국영 주석 회사 PT 띠 마는 삼성 같은 기업에 주석을 직접 공급하기도 하고 청난이나 마 오 같은 땜납 제조사에 공급하기도 하는데, 이 제조사들은 소니, LG, 폭스콘에 원료를 공급하고 이 회사들은 다시 애플, 테슬라, 아마존에 부품을 공급한다."
- 지구적 연산의 과거 역사에는 어두운 역설이 있다. 현재의 대규모 AI 시스템은 환경적 · 데이터적 · 인간적 형태의 추출을 몰아붙이 고 있지만, 알고리즘적 연산은 빅토리아 시대 이후로 전쟁, 인구, 기 후변화를 관리하고 통제하려는 오랜 욕망에서 생겨났다. 역사가 시어도러 드라이어에 따르면 수리통계학의 창시자인 영국의 과학자 칼피어슨은 계획과 관리의 불확실성을 해소하기 위해 표준 편차와 상관 및 회귀 기법을 비롯한 새로운 자료 구성 수단을 개발하고자 했다. 한편 그의 방법은 인종학과 깊이 얽혀 있었는데, 피어슨은 통 계학자이자 우생학의 창시자인 자신의 멘토 프랜시스 골턴 경과 더 불어 통계학이 '인종의 모든 특징에 대해 선택 과정으로 어떤 효과 를 얻을 수 있는지 탐구하는 첫 단계'가 될 수 있으리라 믿었다.”
드라이어가 말한다. 1930년대 말이 되자 회귀 기법, 표준편차, 상관관계 같은 자료 구성법은 세계 무대에서 사회적 · 국가적 정보 를 해석하는 지배적 도구가 되었다. 세계 무역의 접점과 경로를 추 적함으로써 양차 대전 사이의 수리통계학 운동은 거대 제국이 되었다. 이 기획은 제2차 세계대전 이후 계속 확장되었으며, 대규모 산 업적 영농의 생산성을 끌어올리기 위한 갈수기 일기예보 등의 영역 에 새 연산 시스템이 도입되었다. 이 관점에서 보자면 알고리즘 연 산, 전산통계학, 인공지능은 20세기에 사회적·환경적 과제를 해결 하기 위해 개발되었지만 이후에는 산업적 추출과 착취를 배가하여 환경 자원을 더욱 고갈시키고 말았다.
- 후텅후이는 『클라우드의 과거 역사 A Prehistory of the Cloud』에서 이렇게 썼다. '클라우드는 자원 집약적인 추출식 기술로, 물과 전기를 연산 능력으로 전환하며 상당한 규모의 환경 피해를 일으키지만 이 것을 눈에 보이지 않도록 치운다." 이 에너지 집약적 인프라의 문 제를 해결하는 것은 중대 관심사가 되었다. AI 업계가 데이터 센터 의 에너지 효율을 높이고 재생에너지 비중을 늘리려고 나름 노력한 것은 사실이다. 하지만 전 세계 연산인프라의 탄소 발자국은 이미 항공업계의 최고치에 도달했으며 더욱 빠르게 증가하고 있다." 수 치에 편차가 있긴 하지만, 로트피 벨히르와 아메드 엘멜리기 같은 연구자들은 2040년이 되면 기술 부문이 전 세계 온실가스 배출량의 14퍼센트를 차지할 것이라고 추정하며 스웨덴 연구진은 2030년이 되면 데이터 센터의 전기 수요만도 약 열다섯 배 증가할 것이라고 예측한다.
- AI 모형을 제작하는 데 필요한 연산 능력을 면밀히 들여다보면 속도와 정확성 면에서 기하급수적 성장을 이루려는 욕구 때문에 지 구가 막대한 비용을 치르고 있음을 알 수 있다. AI 모형을 훈련하기 위한 연산 처리 수요와 이에 따르는 에너지 소비는 아직도 새로운 탐 구 분야다. 이 분야의 초창기 문헌 중 하나는 매사추세츠 대학교 애 머스트 캠퍼스의 AI 연구자 에마 스트루벨 연구진이 2019년에 발표 한 논문이다. 연구진은 자연어 처리NLP 모형의 탄소 발자국을 이해하 는 데 중점을 두고서 수십만 연산 시간 동안 AI 모형을 가동하여 잠재적 추정치를 파악하기 시작했다. 최초의 수치는 충격적이었다.
- 스트루벨 연구진은 NLP 모형을 하나만 가동했는데도 30만 킬로그 램의 이산화탄소가 배출된다는 사실을 발견했다. 이것은 휘발유 자 동차 다섯 대를 (제조 과정을 포함하여) 수명이 다할 때까지 몰거나 뉴욕에서 베이징까지 비행기로 125차례 왕복하는 것과 맞먹는다." 설상가상으로 연구자들은 이 모형이 최소한의 낙관적 추정치 라고 언급했다. 여기에는 애플과 아마존 같은 회사들이 시리와 알렉 사 같은 AI 시스템을 더 사람처럼 들리게 하려고 인터넷 전체에서 데이터 집합을 긁어모아 자사의 NLP 모형을 훈련시키는 실제 상업 적 규모가 반영되어 있지 않다. 기술 부문의 AI 모형에서 소비하는 정확한 에너지양은 알려져 있지 않다. 이 정보는 기업 비밀로서 철 통같이 보호받는다. 여기서도 데이터 경제는 환경을 계속해서 외면 하는 바탕 위에 존재하고 있음을 알 수 있다.
- 미셸 푸코의 감시와 처벌 이후로 교도소를 오늘날 감시 사회의 원점으로 제러미 벤담을 그 이념적 선구자로 간주하는 태도가 보편화되었다. 하지만 판옵티콘의 실제 원조는 초기 제조 시설이라 는 맥락에서 새뮤얼 벤담이 구현한 설계였다." 판옵티콘은 교도소 를 위한 개념으로 구상되기 오래전 작업장 메커니즘에서 출발했다. 새뮤얼 펜담의 감시 구조물 설계는 우리의 집단적 기억에서 거 의사라졌지만 그 뒤의 이야기는 우리가 공유하는 어휘의 일부로 남아 있다. 감시 구조물은 벤담의 고용주 포템킨 공이 추진한 전략의 일환이었다. 그는 농촌 국가 러시아를 근대화하고 농민을 근대식 제 조업 노동력으로 탈바꿈시킬 잠재력을 과시하여 예카테리나 2세 궁 정의 총애를 사고자 했다. 감시 구조물은 그곳을 방문하는 고위 관 리와 금융업자들을 위한 볼거리로 건설되었는데, 이른바 포템킨 마 을도 마찬가지였다. 포템킨 마을은 가난한 농촌 풍경을 시야에서 가 려 관찰자를 현혹하기 위해 설계된 장식용 허울에 불과했다.
계보는 여기에서 그치지 않는다. 그 밖에도 많은 노동의 역사가 감시와 통제의 관행을 빚어냈다. 아메리카 대륙의 식민지 대농장은 강제 노동을 동원하여 사탕수수 같은 환금작물을 재배했으며 노예 주들은 상시 감시 체제에 의존했다. 니컬러스 머조프가 『볼 권리The Right to Look』에서 묘사하듯 대농장 경제에서 핵심적 역할을 맡은 것은 감독관이었다. 그들은 식민지 노예 대농장에서 생산 과정을 감시했으며 그들의 감독은 극심한 폭력 체제 내에서 노예노동의 질서를 세우는 것을 의미했다. 1814년 한 농장주는 이렇게 말했다. '감독관 의 역할은 노예가 한순간도 가만히 있도록 내버려두지 않는 것이다.
그는 설탕 제조 과정을 늘 감시하며 한순간도 제당소를 벗어나지 않는다." 농장주들은 이 감시 체제를 지탱하기 위해 일부 노예들을 식량과 의복으로 매수하여 감시망을 확장함으로써 감독관이 다른 일에 정신이 팔렸을 때에도 규율과 작업 속도가 유지되도록 했다. 지금의 현대 작업장에서는 감시의 역할을 감시 기술이 주로 대 행하고 있다. 관리 직급은 앱으로 직원의 동선을 추적하고, 소셜 미 디어 게시물을 분석하고, 이메일 답장과 회의 일정 예약의 패턴을 비교하고, 직원들이 더 신속하고 효과적으로 일하도록 유도하는 등 다양한 기술을 동원하여 직원들을 감시한다. 직원 데이터는 (정량 화할 수 있는 소수의 매개변수에 따라) 누가 성공 가능성이 가장 높 은지, 누가 기업 목표에서 이탈할 것인지, 누가 다른 노동자를 조직 화할 것인지 예측하는 데 이용된다. 이를 위해 기계학습 기법을 이 용하기도 하고 더 단순한 알고리즘 시스템을 이용하기도 한다. 작업 장 AI가 널리 보급되면서 기본적인 감시·추적 시스템의 상당수가 확장되어 새로운 예측 능력을 갖추고 있으며 점점 더 개입적인 노동자관리, 자산관리, 가치 추출 메커니즘으로 바뀌고 있다.
- 저술가 애스트라 테일러는 실제로는 자동화되지 않은 첨단 시스템을 과대 포장하는 행위를 '포토메이션 fauxtomation'('가짜'를 뜻하는 'faux'와 '자동화'를 뜻하는 'automation'의 합성어 - 옮긴이)이라고 부른다." 자 동화된 시스템은 예전에 인간이 수행하던 작업을 똑같이 수행하는 것처럼 보이지만 실은 배후에서 인간 노동을 조율하는 것에 불과하 다. 테일러는 패스트푸드 식당의 셀프서비스 무인주문기와 슈퍼마 켓의 무인 계산대를 예로 들며 자동화된 시스템이 직원 노동을 대체한 것처럼 보이지만 사실은 데이터 입력 노동이 유급 직원에게서 고 객에게로 이전되었을 뿐이라고 말한다. 한편 중복 항목을 삭제하거 나 불쾌한 내용을 검열하는 등 겉보기에 자동화된 판단을 제공하는 많은 온라인 시스템을 떠받친 것은 사실 집에서 단조로운 작업을 끝 없이 처리하는 인간 노동자들이다." 포템킨의 장식용 마을이나 시 범 작업장과 마찬가지로 여러 중요한 자동화 시스템은 저임금 디지 털 삯꾼을 부리는 것과 더불어 소비자로 하여금 시스템의 작동에 필 요한 무급 노동을 하게 한다. 그러면서도 기업들은 지능형 기계가 작업을 수행한다며 투자자와 일반 대중을 설득하려 든다.
- 현대적 형태의 인공지능은 인공적이지도 않고 지능도 아니다. 오히려 우리는 광산노동자들의 고된 육체노동, 조립 라인의 반복적 공장 노동, 외주프로그래머의 정신적 노동착취공장 sweatshop에서 벌 어지는 컴퓨터상의 두뇌 노동, 메커니컬 터크 노동자들의 저임금 외 주 노동, 일반 이용자의 자질구레한 무급 노동 등에 대해 이야기할 수 있으며 그래야만 한다. 이 장소들에서 보듯 지구적 연산은 추출 의 모든 공급사슬에 걸쳐 인간 노동의 착취에 의존한다.
- 사회학 교수 주디 와이즈먼은 「실리콘밸리가 시간을 맞추는 방 법How Silicon Valley Sets Time」이라는 논문에서 시간 추적 도구의 목표와 실리콘밸리의 인구 구성이 결코 우연이 아니라고 주장한다." 실리 콘밸리의 엘리트 인력은 더 젊고 더 남성 위주이고 하루종일 일할각 오가 더 확고하며 최대 효율을 향한 가차 없는 승자독식 경주를 전제 한 생산성 도구를 만들어낸다." 이것은 젊고 대부분 남성인 엔지니어 들이 시간을 빼앗는 가족이나 공동체의 책임에 얽매이지 않은채) 자 신의 직장과 전혀 다른 작업장을 사찰하고 직원들의 생산성과 호감도 를 정량화하는 도구를 만들고 있다는 뜻이다. 기술 스타트업에서 곧 잘 찬미되는 일중독과 사생활 포기는 다른 노동자들을 평가하는 암묵 적 기준이 되고 남성적이고 편협하고 타인의 무급(또는 저임금) 돌봄 노동에 의존하는 노동자가 표준적이라는 이상을 만들어낸다.
- '데이터 마이닝' 같은 용어와 '데이터는 새로운 석유다'라는 문구는 데이터 개념을 개인적이고 내밀한 것, 또는 개인의 소유와 통 제에 종속되는 것에서 벗어나 보다 비활성이고 비인간적인 것으로 바꾼 수사적 수법의 일환이었다. 데이터는 소비해야 하는 자원으 로, 다스려야 하는 흐름으로, 활용해야 하는 투자로 묘사되기 시작 했다." '석유로서의 데이터'라는 표현이 일상화되었다. 여기에는 데 이터란 정제되지 않은 원료라는 이미지가 들어 있다. 하지만 기한계약노동 (노동자가 일정 기간 근무지를 떠날 수 없는 노동 형태 - 옮긴이), 지정학적 분쟁, 자원 고갈, 인류의 시간 척도를 뛰어넘어 확대되는 결과를 비롯한 석유 및 채굴 산업의 비용을 강조하는 데 이 표현이 쓰이는 일은 드물었다.
- 결국 '데이터'는 무색무취한 단어가 되어 자신의 물질적 기원과 종말을 둘 다 감추고 있다. 데이터가 추상적이고 비물질적인 것 으로 간주된다면 배려, 동의, 위험 등에 대한 전통적 이해와 책임을 더 쉽게 벗어날 수 있다. 연구자 루크 스타크와 애나 로런 호프먼이 주장하듯, 데이터를 그저 발견되기를 기다리는 '천연자원'에 빗대 는 은유는 식민주의 열강들이 수백 년간 써먹은 탄탄한 수사적 수법 이다." 원시적이고 '정제되지 않은' 출처에서 온 것이라면 추출은 정당화된다." 데이터를 그저 추출되기만 기다리는 석유로 치부한 다면 기계학습은 마땅히 필요한 정제 과정으로 간주할 수 있다.
시장을 원시적 형태의 가치 조직화로 여기는 포괄적 신자유주의적 구상에 발맞춰 데이터는 자본으로도 간주되기 시작했다. 인간활동은 일단 디지털 흔적을 통해 표현된 뒤에 득점 기준 내에서 집계되고 등수가 매겨지면 이제는 가치를 뽑아내는 수단의 역할을 하 게 된다. 푸르카드와 힐리에 따르면 올바른 데이터 신호를 보유한 사람들은 시장 어디에서든 보험료를 할인받고 더 높은 위치를 차지 하는 등의 이점을 누린다." 주류 경제에서의 고성과자는 데이터 득 점 경제에서도 승승장구하는 반면에 성과가 가장 낮은 사람들은 가 장 해로운 형태의 데이터 감시 및 추출의 표적이 된다. 데이터가 일 종의 자본으로 간주될 때는, 더 많이 모은다면 모든 것이 정당화된 다. 사회학자 제이선 서다우스키도 데이터가 이제 일종의 자본으로 작동한다며 비슷한 주장을 편다. 그는 모든 것이 데이터로 이해되 면 점점 증가하는 데이터 추출의 순환이 정당화된다고 말한다. '그리하여 데이터 수집은 자본 축적의 영구 순환에 의해 추동되며 이는 모든 것이 데이터로 이루어진 세계를 자본이 구성하고 여기에 의존 하도록 추동한다. 데이터의 보편성이라는 가정은 모든 것을 데이터 자본주의의 영역에 놓이도록 재배치한다. 모든 공간은 데이터화에 종속되어야 한다. 우주가 잠재적으로 무한한 데이터 저장고로 간주 된다면 그것은 데이터의 축적과 순환이 영원히 지속될 수 있음을 의 미한다. 
축적하고 순환하려는 이 충동은 데이터의 강력한 기저 이데올 로기다. 서다우스키는 대량 데이터 추출이 '축적의 새로운 전선이 자 자본주의의 다음 단계'이며 AI를 작동시키는 것은 이 기반이라 고 주장한다. 따라서 (데이터를 먼저 차지하는 사람이 임자인) 이 미개척지를 원하지 않는 산업, 기관, 개인은 모조리 의심받거나 불안정해진다.
기계학습 모형이 더 정확해지기 위해서는 데이터를 계속해서 공급받아야 한다. 하지만 기계는 점근적이어서 결코 완전한 정 확성에 도달하지 못한다. AI 제련소에 연료를 공급하기 위해 최대 한 많은 사람들에게서 더 많은 데이터를 추출하는 행위가 정당화되 는 것은 이런 까닭이다. 여기서 '인간 주체' (20세기 윤리 논쟁에서 생겨난 개념)에서 '데이터 주체'의 개념 변화가 일어났다. 이것은 주체성이나 맥락이나 명확히 정의된 권리 없이 수집된 자료점 덩어리를 일컫는다.
- 기본적으로, 오랜 데이터 축적 관행은 강력한 추출의 논리에 일 조했는데, 이 논리는 이제 AI 분야가 작동하는 방식의 핵심 특징이 다. 이 논리는 가장 큰 데이터 파이프라인으로 기술 기업들을 살찌 웠으며, 데이터 수집으로부터 자유로운 공간은 처참하게 쪼그라들 었다. 버니바 부시가 예견했듯 기계는 먹성이 무지막지하다. 하지만 기계가 무엇을 어떻게 공급받느냐는 그 기계가 세상을 어떻게 이해 하는가에 어마어마한 영향을 미치며 기계 주인들의 우선순위는 항 상 그 시야에서 어떻게 이익이 산출될 것인가를 만들어낼 것이다. AI 모형과 알고리즘을 형성하고 여기에 정보를 공급하는 훈련 데이 터의 층위들을 살펴보면 세계에 대한 데이터를 수집하고 라벨을 붙이는 일이 (순수한 기술적 행위를 가장하지만 실은) 사회적·정치적 개입임을 알 수 있다.
데이터가 이해되고 수집되고 분류되고 명명되는 방식은 기본 적으로 세계 만들기 world-making와 담기 containment의 행위다. 이것은 인 공지능이 세상에서 어떻게 작동하는지, 어떤 집단이 가장 큰 피해를 입는지에 엄청난 영향을 미친다. 전산학에서 데이터 수집이 선의의 행위라는 신화는 권력의 작동 실태를 가려, 가장 많은 이익을 얻으면서도 결과에 대한 책임을 모면하는 자들을 보호한다.
- 분류의 역사는 아파르트헤이트 체제에서 동성애의 질병화에 이르는 가장 해로운 형태의 인간 범주화가 과학적 연구와 윤리적 비 판의 빛 아래서 순순히 바래지 않았음을 우리에게 보여준다. 변화를 위해서는 정치적 조직화, 지속적 항의, 오랜 대중 운동이 필요했다. 분류 체계는 자신을 빚어낸 권력 구조를 확립하고 떠받치며 이것들 은 적잖은 노력 없이는 달라지지 않는다. 프레더릭 더글러스의 말 을 빌리자면, '권력은 요구하지 않으면 아무것도 양보하지 않는다. 결코 그러지 않았고 결코 그러지 않을 것이다." 기계학습의 보이지 않는 분류체계 내에서는 요구를 제시하고 내부의 논리에 반대하기 가 더 힘들다.
이미지넷, 유티케이페이스, DiF 같은 공개된 훈련 집합은 산업 용 AI 시스템과 연구 관행에 두루 퍼지고 있는 범주화 방식을 이해 할 실마리를 던진다. 하지만 정말로 거대한 분류 기관機關은 메타, 구 글, 틱톡, 바이두 같은 민간 기술 기업에서 지구적 규모로 운용하는 것들이다. 이 기업들은 이용자를 어떻게 범주화하고 표적화하는지에 대해 거의 감시받지 않으며 대중적 논쟁을 위한 유의미한 토론장을 제공하지도 않는다. AI의 짝짓기 과정이 정말로 감춰지고 사람들이 자기가 어떻게, 왜 이익이나 불이익을 받는지 알지 못한다면 집단적인 정치적 대응이 필요하다. 그 일이 더 힘들어지고 있지만 말이다.
- 얼굴에서 '감정을 읽는 접근법은 왜, 수많은 비판에도 불구하고 살아남았을까? 이 생각들의 역사를 분석하면 군사 연구 기금, 치 안 우선주의, 이윤 동기가 어떻게 감정 인식 분야를 형성했는지 실 마리를 얻을 수 있다. 1960년대 이후 국방부의 대규모 자금 지원에 힘입어 개발된 여러 시스템이 얼굴 움직임을 점차 정확히 측정하고 있었다. 얼굴 움직임을 측정하여 내적 상태를 판단할 수 있다는 이 론이 등장하고 측정 기술이 발전하자 사람들은 그 기반이 되는 전 제를 기꺼이 받아들였다. 이론은 도구가 할 수 있는 일과 맞아떨어 졌다. 에크먼의 이론이 신생 분야인 컴퓨터 시각에 이상적으로 보인 이유는 대규모의 자동화가 가능해졌기 때문이다.
기관과 기업들은 에크먼이 정립한 이론과 방법론의 타당성을 믿고서 막대한 투자를 실시했다. 감정이 쉽게 분류되지 않는다거나 표정으로부터 신뢰성 있게 탐지할 수 없다는 사실을 인정하는 것은 성장 중인 산업에 타격을 가하는 격이다. AI 분야에서는 마치 이 문 제가 해결된 것처럼 에크먼을 인용한다. 공학적 난제는 아직 직접 파고들지도 않았는데 말이다. 맥락, 조건화, 문화적 요인이라는 복잡한 요인들은 현행 전산학의 학제적 접근법이나 상업적 기술 부문의 야심과 어우러지기 힘들다. 그리하여 에크먼의 기본적 감정 범주가 표준이 되었다. 미드의 중간자적 입장 같은 더 미묘한 접근법들은 대체로 무시당했다. 이런 탓에 우리가 감정을 경험하고 드러내고 숨기는 여러 가지 방법, 우리가 타인의 표정을 해석하는 방법에 대한 더 거창한 질문들에 대처하기보다는 AI 시스템의 정확도를 끌어 올리는 데 초점이 맞춰졌다.
배럿이 말한다. '우리 분야에서 가장 영향력이 큰 모형 중 상당 수는 감정이 자연에 의해 정해진 생물학적 범주이며, 따라서 감정 범주가 인간 정신에 의해 구성되는 것이 아니라 인식된다고 가정한 다. 103 감정 탐지를 위한 AI 시스템은 이 생각을 전제로 삼는다. 하지 만 '인식'은 감정에 대해 생각할 때 완전히 틀린 토대인지도 모른다. 인식은 감정 범주가 생성적이고 관계적인 것이 아니라 주어진 것이 라고 가정하기 때문이다.
- 증거는 감정 탐지의 신뢰성 결여를 가리키고 있지만 기업들은 수십억 달러의 이익을 약속하는 이 부문에서 시장점유율을 높이려 고 여전히 얼굴 이미지화를 위한 새로운 채굴 원천을 찾고 있다. 사 람들의 얼굴에서 감정을 추론하는 작업 이면의 연구를 체계적으로 검토한 배럿은 다음과 같은 경고문으로 마무리한다. '더 일반적으 로 보자면 기술 기업들은 근본적으로 틀린 질문을 던지고 있는 듯하 다. 맥락의 다양한 측면을 고려하지 않은 채 얼굴 움직임을 분석하 는 것만으로 사람들의 내적 상태를 읽어내려는 노력은 잘해야 불완 전하며 최악의 경우에는 연산 알고리즘이 아무리 정교하더라도 타 당성을 완전히 잃을 수 있다. (......) 이 기술을 이용하여 얼굴 움직 임을 토대로 사람들이 무엇을 느끼는지에 대한 결론에 도달하려는 것은 시기상조다.
- 감정 인식을 자동화하려는 욕구에 저항하지 않는다면 우리는 입사 지원자가 자신의 미세 표정이 다른 직원들과 일치하지 않는다 는 이유로 부당한 평가를 받고, 학생들이 자신의 얼굴이 의욕 결핍 을 나타낸다는 이유로 동급생들보다 낮은 점수를 받고, 고객들이 AI시스템에 의해 얼굴 단서를 바탕으로 잠재적 좀도둑으로 판정되어 제지당할 위험을 감수해야 한다. 기술적으로 불완전할 뿐 아니라 미심쩍은 방법론을 토대로 한 시스템의 비용을 누군가는 짊어질 것이기 때문이다.
이 시스템이 작동하는 삶의 영역은 급속히 확장되고 있으며, 연구실과 기업들은 이를 위한 새로운 시장을 만들어내고 있다. 하지만 그들은 모두 분노, 기쁨, 놀람, 혐오, 슬픔, 공포라는 에크먼의 최초 집합에서 파생한 지엽적 감정 이해에 기대어 시공간을 아우르는 인 간 감정과 표현의 무한한 우주를 몇 가지 범주로 대신해버린다. 이 것은 세상의 복잡성을 단 하나의 분류 체계에 담는 앙상한 세계관으 로 회귀하는 꼴이다. 우리가 거듭 목격한 문제, 즉 지독히 복잡한 것 을 쉽게 연산하여 시장에 내놓을 수 있도록) 지나치게 단순화하려 는 욕망으로 돌아가는 셈이다. AI 시스템은 우리의 신체적 자아가 겪는 가변적이고 사적이고 다양한 경험을 추출하려 하지만 그 결과 물은 감정적 경험의 뉘앙스를 포착하지 못하는 만화적 스케치에 불과하다.
- 군사적 차원에서 지자체 차원에 이르기까지 국가가 이용하는 AI 시스템과 알고리즘 시스템을 뭉뚱그려 들여다보면 추출식 데이터 기법, 타기팅 논리, 감시의 조합을 통한 '총체적 인프라 지휘·통제의 은밀한 철학이 드러난다. 이 목표들은 수십 년간 정보기관들의 중심에 있었으나 이제는 지방정부의 치안에서 복지 배분에 이르는 그 밖의 여러 국가 기능에도 퍼져나갔다." 이것은 추출식 지구적 연 산을 통해 국가, 지자체, 기업의 논리가 깊숙이 얽혀 있는 현상의 일 각에 불과하다. 하지만 거북한 거래이기도 하다. 국가는 자신이 통 제할 수 없고 온전히 이해하지도 못하는 기술 기업들과 계약을 맺고 있으며 기술 기업들은 자신에게 적합하지 않고 미래의 어느 시점에 는 책임져야 할지도 모르는 국가적 · 초국가적 기능을 떠맡고 있다.
- 무차별적 감시에 쓰이는 모든 자금과 자원은 중앙 집중화된 통제라는 '열에 들뜬 꿈fever dream'의 일부이며, 그 대가로 사회구조에 대한 다른 시각들을 희생시키게 된다. 스노든의 폭로는 국가와 상업 부문이 결탁할 때 추출의 문화가 어디까지 치달을 수 있는지를 보여 주는 분수령이었지만, 네트워크 도표와 파워포인트 클립아트는 그 뒤로 일어난 모든 일에 비하면 구닥다리처럼 느껴진다. 국가안보 국의 독특한 방법과 도구는 교실, 경찰서, 직장, 고용지원센터에 스 며들었다. 이것은 막대한 투자, 사실상의 민영화, 위험과 공포를 이 용한 안보 정당화가 낳은 결과다. 여러 형태의 권력이 깊숙이 얽힌 현재의 상황은 제3차 상쇄 전략이 품은 희망이었다. 이것은 전장에 서의 전략적 우위라는 목표를 훌쩍 뛰어넘어, 선량한 시민이 어떻 게 소통하고 행동하고 지출해야 하는가에 대한 규범적 정의를 바탕 으로 (추적하고 점수를 매길 수 있는) 일상생활의 모든 측면을 아우 른다. 이 전환은 '기업의 알고리즘적 통치에 의해 조종되는 국가 주 권'이라는 것에 대한 새로운 관점을 동반하며 국가 기관들과 국가의 봉사를 받아야 하는) 국민 사이에 심각한 권력의 불균형을 강화한다.
- AI는 볼리비아의 소금 호수와 콩고의 광산에서 탄생하여, 크라우드 노동자들에 의해 라벨링되며 인간의 행동과 감정과 정체성을 분류하려 드는 데이터 집합으로부터 구성된다. 예멘 상공에 드론을 날리고 미국에서 이민자 단속을 지휘하고 전 세계에서 인간의 가치 와 위험에 대한 신용점수를 조정하는 데 이용된다. 이 중첩하는 체 제와 맞서려면 AI를 광각적이고 다규모적인 관점에서 바라보아야 한다.
- AI의 데이터 집합은 결코 알고리즘에 공급되는 원료가 아니다. 본질적으로 정치적인 개입이다. 데이터를 수집하고 범주화하고 라 벨링한 다음 시스템 훈련에 이용하는 전체 행위는 일종의 정치다. 이로 인해 이른바 운용 이미지 operational image, 즉 오로지 기계를 위해 만들어진 세계 표상으로의 전환이 일어났다." 편향은 증상이며 근 본 원인은 더 깊숙한 곳에 있다. 그것은 세상을 어떻게 보고 평가해 야 하는가를 결정하는 데 이용되는 광범위하고 중앙 집중적인 규범 논리다.
- 우주 식민지화와 우주 채굴이 기술 억만장자의 공통된 판타지 가 되었다는 사실은 이들이 지구와 맺고 있는 관계에 근본적 문제가 있음을 잘 보여준다. 그들의 미래상에는 석유·가스 채굴을 최소화 하거나, 자원 소비를 제한하거나, 심지어 자신들을 부자로 만든 노 동 착취 관행을 완화하는 것조차 들어 있지 않다. 오히려 기술 엘리 트의 언어에서는 지구의 인구를 이주시키고 광물 채굴을 위해 영토 를 획득하려는 정착식민주의 settler colonialism가 종종 엿보인다. 이와 마 찬가지로 실리콘밸리 억만장자들의 우주 경쟁에서도 최후의 공유 재인 우주에 가장 먼저 도달하는 제국이 그곳을 차지할 수 있다고 가정한다. 이것은 우주 채굴에 대한 주요 조약인 1967년 우주 조약 에 위배된다. 조약에서는 우주가 '인류의 공통 이익'이며 모든 탐사 나 이용이 '만인의 유익을 위해 실시되어야 한다고 규정한다."







'IT' 카테고리의 다른 글

AI빅뱅  (0) 2023.08.14
슈퍼개인의 탄생  (0) 2023.07.14
챗GPT 질문이 돈이 되는 세상  (0) 2023.06.04
좋아요는 어떻게 지구를 파괴하는가  (7) 2023.06.02
AI 혁명의 미래  (3) 2023.05.25
Posted by dalai
,

23년초부터 지금까지 IT분야뿐만 아니라 사회 전체로 화제가 되고 있는 것은 뭐니뭐니 해도 챗GPT일 것이다. 웹사이트에 회원가입 정도만 할 수 있으면, 누구나 챗GPT를 통해 질문을 하고, 답을 그 자리에서 확인할 수 있다. 더욱더 충격적인 것은 23년 3월 GPT-4가 발표된 이후 전격적으로 마이크로소프트사가 발표한 MS365 코파일럿이다. 요청만 하면 보고서도 기획서도, 데이터 정리도, 그래프 시각화도 못 하는 게 없다. 사무직 지식노동자들은 충격에 휩싸이고 직장인들의 위기감도 고조되며 전 세계인들이 챗GPR의 패닉에서 벗어나지 못하고 있다.

단순하게 질문에 답변을 하거나, 파워포인트로 문서를 만들어 주는 기능뿐만이 아니다. 미드저니나 달리2를 이용해서 내가 원하는 그림을 만들어내고, 망고보드로 만든 삽화르 동화책을 만들어 아마존에서 판매할 수 있는 시대가 되었다. 음악을 잘 몰라도 AI뮤직 제너레이터로 음악을 생성할 수 있고, 챗GPT플러스로 스키릅트를 만들어 AI음성으로 스크립트를 읽어 줄 수 있는 동영상을 제작하는 시대다. 동시에 챗GPT로 상징되는 AI의 발전은 창작자들의 창작물 혹은 데이터 도용이라는 저작원 이슈를 야기시키고 있다.

과거 인터넷이나 스마트폰이 등장했을 때 그 이상의 대혁명이 일어날 것이라고 예측하는 사람들도 많으며, 교육이나 직장 그리고 사회전에 몰아칠 변화의 쓰나미를 어떻게 헤쳐나아가야 할지 고민과 토론의 장이 벌어지고 있다.

이 책은 AI와 챗GPT같은 프로그램의 등장으로 야기된 세상의 혼란속에서 중심을 잡고 설 수 있는 미래전략을 제시하고 있다. 챗GPT의 사용법이나 알리는 단순한 활용서가 아니라, 챗GPT로 야기될 미래의 삶, 미래 직업, 미래 교육, 그리고 미래사회의 변화를 속속들이 분석하여 그에 대응할 수 있는 생존전략을 제시한다.

1장에서는 데이터 배당 시스템을 소개하고 있는데, 이는 양질의 데이터를 생산한 가치창출 기여자에게 부가가치 환원이 이루어지는 제도로 국민모두가 경제적 자립을 할 수 있는 신경제 시스템이 될 수도 있다.
2장에서는 지식노동자의 위기와 기회의 직업을 다루며 직업의식과 직업윤리, 미래 인재상에 대해 서술하고 있다
3장에서는 미래교육환경 변화를 파헤치며 지식을 재해석해야 하는 필요성, 새로운 교육과 평가방법에 대한 화두를 제시한다
4장에서는 인공지능 발전에 따른 AI반도체의 패권을 둔 국가관계,, 저작권 이슈, 데이터 정책 등을 통해 챗GPT가 우리 사회에 위기가 될지, 기회가 될지 그 윤리적 가치기준을 논하고 있다.
부록에는 정말로 초심자를 위한 챗GPT 사용설명서가 수록되어 있다. 만일 챗GPT에 대한 경험이 전혀 없는 독자라면, 책을 읽기 전에 챗GPT에 가입부터하고 재미삼아 몇가지 질문을 던져보는 것도 좋을 것이다.

 



* 본 리뷰는 출판사 도서지원 이후, 자유롭게 작성된 글입니다.

'IT' 카테고리의 다른 글

슈퍼개인의 탄생  (0) 2023.07.14
AI 지도책  (0) 2023.07.06
좋아요는 어떻게 지구를 파괴하는가  (7) 2023.06.02
AI 혁명의 미래  (3) 2023.05.25
인공지능 파운데이션  (4) 2023.05.13
Posted by dalai
,