- 오해 1 양자컴퓨터는 온갖 계산을 빠르게 처리한다?
이것이 양자컴퓨터에 관한 가장 흔한 오해다. 양자컴퓨터로 빨리 풀 수 있는 문제는 몇 종류밖에 없다. 그 밖의 문제는 지금의 컴퓨터와 양자컴퓨터의 계산 속도가 비슷하다.  컴퓨터군과 양자컴퓨터군이 어떤 수학 문제를 풀어야 한다고 하자. 컴퓨터군은 문제를 풀려면 어떤 순서로 계산해야 하는지 알 고 있다. 먼저 숫자 X와 숫자 Y를 더해서 그 결과에 숫자 Z를 곱한다. 는 식으로, 순서에 따라 사칙연산을 몇 번이고 반복해서 답을 계산한 다. 반면 양자컴퓨터군은 이러한 사칙연산을 해내는 속도가 빠른 것이 아니라 더 스마트한 해법을 알고 있다. 스마트한 해법을 사용하면 사칙 연산의 횟수를 확 줄일 수 있으므로 훨씬 짧은 시간에 답을 계산할 수 있다. 안타깝게도 컴퓨터군과 양자컴퓨터군은 뇌 구조가 서로 달라서 컴퓨터군이 이런 스마트한 해법을 흉내 내고 싶어도 불가능하다.
양자컴퓨터로 계산이 빨라지는 것은 계산 횟수를 줄일 수 있어서지 계산하는 속도가 빨라져서가 아니다. '양자'라는 플러스알파 역할을 하는 기능을 사용해서 현대의 컴퓨터보다 적은 계산 횟수만으로 답을 찾는 스마트한 방법을 사용하는 것이다. 어느 정도 계산 횟수를 줄일 수 있는지는 문제에 따라 달라지므로 '양자컴퓨터는 현대의 컴퓨터보다 배 빠르다'라고 말할 수는 없다. 게다가 양자컴퓨터 특유의 해 법이 발견되지 않은 문제에 관해서는 보통의 컴퓨터와 같은 해법을 사 용하므로 계산 횟수가 같다. 참고로 실제 계산에 필요한 시간은 계산 1회에 걸리는 시간과 필요한 계산 횟수의 곱인데, 계산 1회에 걸리는 시간이 얼마나 될지는 양자컴퓨터를 실제로 만들어보지 않으면 알 수 없으므로 지금은 고려하지 않는다.
- 오해 2 양자컴퓨터는 병렬 계산을 하기 때문에 빠르다?
양자컴퓨터에서 계산이 빨라지는 원리를 설명할 때 ‘병렬계산'으 로 여러 계산을 동시에 병행해서 할 수 있기 때문이라고 설명하는 경 우가 많은데, 이 설명은 정확하지 않다.  병렬계산은 현대의 컴퓨터도 고속 계산을 위해 사용하는 기술이다. 예를 들어 계산 문제 100개를 풀고 싶다고 하자, 한 명의 컴퓨터군이 모든 문제를 푼다면 시간이 제법 걸릴 것이다. 그래서 10명 의 컴퓨터군이 10문제씩 담당하기로 한다. 10명이 힘을 모으면 계산이 10배 빨라지므로 100문제를 푸는 데 혼자서 푸는 시간의 10분의 1이 길릴 것이다. 이렇게 계산을 여러 개로 나눠서 여러 대의 컴퓨터에서 동시에 계산하는 것이 병렬계산이다.
양자컴퓨터가 일종의 병렬계산을 하는 것은 사실이지만, 현대의 컴퓨터가 하는 병렬계산과는 의미가 다르다. 자세한 이야기는 2장에서 하겠지만, 양자컴퓨터의 병렬계산은 '양자'가 미시 세계에서 일으키는 '중첩'이라는 특유의 현상을 사용한다. 이 현상을 사용한 병렬계산은 병렬계산을 하는 것 만으로는 절대 빨라지지 않는다. 병렬계산한 많 은 후보 결과 중에서 취사선택하여 원하는 계산 결과만 골라내려 궁리해야 한다. 비유하자면, 갈림길이 많은 복잡한 미로를 떠올리면 이해하기 쉽다. 출발점부터 목적지까지의 경로를 알고 싶다고 하자. 컴퓨터군은 경로 후보를 하나씩 차례로 조사해서 답을 찾아낸다. 한 편 양자컴퓨터군은 머릿속에서 여러 경로 후보를 동시에 검토한다. 그 증에서 막다른 길에 도달하는 경로를 버리고 목적지에 도달하는 경로만 답으로 찾아낸다. 이렇듯 양자컴퓨터는 계산 결과에서 취사선택' 할 수 있는 경우에만 계산을 빨리할 수 있다. 그러므로 양자컴퓨터는 '병렬계산하므로 빠르다'라는 설명은 그다지 정확하지 않다. 병렬계산하는 것 만으로는 절대 계산이 빨라지지 않는다. 계산이 빠른 이유는 '병렬로 계산한 결과 중에 취사선택해서 원하는 결과만을 찾아낼 수 있는 경우가 있어서다.
- 양자컴퓨터가 미래에 가장 도움이 될 것으로 보이는 분야는 화학계산이다. 고등학교 화학에서 주변의 물체는 모두 원자로 이루어져 있다고 배운다. 플라스틱, 유리, 금속, 컴퓨터 부품으로 사용하는 반도체 등 쉽게 구할 수 있는 다양한 재료의 성질은 소재를 구성하는 원자의 조합에 의해 결정된다. 우리가 사용하고 있는 많은 신소재들이 여러 원자들의 다양한 조합으로 만들어졌다. 하지만 쓸 만한 기능을 가진 신소재를 만들고 싶다고 무턱대고 원자를 조합한들 원하는 기능을 얻지는 못할 것이다. 그래서 슈퍼컴퓨터를 사용해서 어떤 조합이 좋은지 미리 조사한다. 양자컴퓨터를 사용하면 이런 화학 계산을 더 효율적이고 정확하게 처리할 수 있다.
그러므로 양자컴퓨터가 실현되면 생활에 도움을 주는 기능을 가진 소재를 효율적으로 설계할 수 있다. 
- 양자컴퓨터가 빛을 발하는 특별한 용도의 또 다른 예로는 최적화 문제가 있다. 최적화 문제란 여러 가지 패턴 중에서 가장 좋은 패턴을 골라내는 문제다. 주변에서 쉽게 접할 수 있는 사례로는 택배 트럭의 배달 경로를 최적화하는 것이다(그림 1-10의 아래 그림), 창고에서 배달할 화물을 트럭에 실은 다음, A씨 집, B씨 집, C씨 집... 등 열 군데에 화물을 배달하고 창고로 돌아와야 한다면, 어떤 순서로 돌아야 최단 경로가 될까? 이것이 다양한 경로 중에서 최적 경로를 찾아내는 최적화 문제다. 이런 문제를 빨리 풀 수 있게 되면, 더 효율적으로, 더 빨리 화물을 배달할 수 있을 것이다.
이외에도 최적화 문제는 주변에서 많이 볼 수 있다. 제조업이라면 공장의 인력 배치와 제조 프로세스를 최적화해서 상품 제조 비용을 낮출 수 있고, 금융업에서는 주식과 부동산 등의 상품 중 어디에, 얼마만큼 투자할지 최적화하면 더 큰 이익을 거둘 수 있다. 이처럼 조합을 최적화해야 하는 분야는 많이 있으므로, 각 분야에서 효율을 높이는데 도움이 될 것이다.
- 양자컴퓨터가 계산을 빨리하는 원리는 다중 슬릿 실험과 같다. 하나씩 계산하는 대신에 몇 가지 계산을 중첩해서 동시에 한 다음, 간섭 을 통해 답에 해당하는 계산 패턴만 찾아내는 것이다. 간섭에는 꽤 많은 고안이 필요하지만, 잘만 하면 답을 찾아내는 수고를 확 줄일 수 있다. 현대의 컴퓨터는 양자역학을 사용하지 않으므로, 당연히 이런 계산을 할 수 없다. 이처럼 양자컴퓨터는 양자역학 특유의 현상을 이용 해서 완전히 새롭게 문제를 풀어낼 수 있다.
- - 현대의 컴퓨터는 비트로 정보를 나타내고, NOT과 AND 등의 논리연산을 조합해서 계산을 처리한다. 한편, 양자컴퓨터는 양자비트로 정보를 나타내고 양자 논리연산을 조 합해서 계산을 처리한다.
- 양자비트가 n개 있으면 2가지의 패턴 정보를 중첩해서 동시에 가질 수 있다. 이때, 단 순히 중첩할 뿐만 아니라 2가지 패턴의 중첩 방식에 따라 정보를 표현한다.
- 양자컴퓨터는 양자 논리연산을 사용해서 중첩 방식을 나타내는 많은 파동을 교체하게 나, 타이밍을 어긋하게 하거나, 간섭시켜서 답을 끌어내는, 파동을 사용한 계산 장치다.
- 양자컴퓨터는 중첩한 많은 패턴을 병렬로 계산할 수 있지만 마지막으로 얻을 수 있는 계산 결과는 하나이므로 병렬계산만으로는 계산이 빨라지지 않는다. 중첩만이 아니라 파동의 간섭을 잘 활용하는 것이 중요하다.
- - 문제의 규모가 커지면 계산이 들이는 수고가 폭발적으로 증가해서 현대의 컴퓨터로는 풀기 어려운 문제가 너무도 많다. 하지만 양자컴퓨터를 사용하면 계산 횟수를 줄여서 더 빨리 풀 수 있는 사례가 있다.
_ 그로버 해법은 데이터베이스 검색이나 최적화 문제 등에 사용하는 해법으로, 답이 될 수 있는 다양한 후보를 중첩해서 동시에 조사하면서 간섭을 통해 올바른 답을 추려내므 로 계산 횟수를 줄일 수 있다.
- 화학 계산에서는 전자가 궤도에 들어가는 방식을 계산할 수 있으면 그 물질의 성질을 알 수 있다. 전자는 양자역학 규칙을 따라서 궤도에 들어가므로, 마찬가지로 양자역학규칙을 따르는 양자컴퓨터를 사용하여 간단하게 계산할 수 있다.
- 양자컴퓨터로 고속화할 수 있는 계산은 여러 가지 발견되었지만, 전부 파동을 조종해서 문제를 푼다는 양자컴퓨터만의 풀이법을 사용하는 것이 고속화의 본질이다.
- 양자컴퓨터에서도 신뢰할 수 있는 계산 결과를 내기 위해서는 오류를 정정하는 구조가 필요하다. 하지만 양자비트의 정보를 정정하는 것은 간단한 작업이 아니다. 애초에 비트의 오류는 0과 1이 바뀌는 것 뿐이지만, 양자비트는 중첩 방식이 조금만 달라져도 오류가 발생한다. 그것을 전부 정정하는 것은 결코 쉬운 일이 아니다. 게다가 계산 도중 에 오류가 발생했는지 여부를 조사하려면, 양자비트가 어떤 값인지 측 정해서 확인해야 한다. 하지만 양자비트는 직접 측정하면 중첩이 깨지 는 성질을 가지므로 그것도 어렵다. 원래 1980년대에 파인만과 도이치가 양자컴퓨터라는 아이디어를 제안했을 무렵에는 양자컴퓨터에서 오류를 정정하는 방법이 발견되지 않았다. 그래서 일부 연구자는 “오류를 정정할 수 없다면 양자컴퓨터를 실현할 수 없다”며 냉담한 반응을 보였다. 그렇지만 다행히 1990년 대에 양자컴퓨터에서도 오류를 정정하는 방법이 발견되었다. 먼저 여러 양자비트를 연계해서 한 개 분량의 양자비트 정보를 표 시하도록 정보를 넣는다. 계산 도중에 오류가 발생하면 그 연계에 흐트러짐이 발생한다. 그래서 연계의 흐트러짐이 있는지에 관한 정보만 다른 양자비트에 잘 옮긴 후 측정하여 오류가 일어났는지 판정하는 것이다. 그래서 어떤 오류가 발생해도 이 방법으로 양자비트의 정보를 잃어 버리지 않고 오류를 검출해서 정정할 수 있음을 알게 되었다.
- - 양자컴퓨터를 만들기 어려운 이유는 예민한 양자 하나하나를 각종 방해물로부터 보호하고, 한없이 정확하게 조종해야 하기 때문이다.
- 현재의 양자컴퓨터는 아직 규모가 작고 오류 정정 기능도 없다. 앞으로는 규모와 오류  비율 모두 몇 배나 개량해서 오류 정정 기능을 갖춘 양자컴퓨터를 목표로 해야 한다.
- 대표적인 방식으로는 가장 주류이며 연구가 진행된 초전도 회로 방식, 이와 어깨를 나 란히 할 정도인 이온 방식, 집적화에 적합한 반도체 방식, 독특한 장점이 있는 광 방식 등이 있으며, 어느 방식이나 장단점이 있다.
- 양자컴퓨터 개발은 아직 출발 지점에 있어서 미해결 과제도 많이 있다. 아직 어느 방식이 최후의 승자가 될지 판단하기는 어렵고, 앞으로 어떻게 발전할지도 예상할 수 없다.

'IT' 카테고리의 다른 글

IT 잡학사전  (2) 2022.11.10
인터넷 때문에  (0) 2022.08.20
웹 3.0 레볼루션  (0) 2022.07.03
1일 1로그 IT지식  (0) 2022.06.01
블록체인 경제  (0) 2022.05.11
Posted by dalai
,

웹 3.0 레볼루션

IT 2022. 7. 3. 11:03

- 초창기 웹은 지금과는 사뭇 다른 양상을 보였다. 당시의 웹은 단순한 정보 열람과 저장의 역할을 수행했다. 초기에 개발된 웹 브라우저 와 웹 서버, HTTP, HTML과 같은 기술은 누구나 사용할 수 있는 개 방성을 기반으로 성장했다. 웹 1.0은 단순하고 정적인 웹 사이트를 특 징으로 하는데, 1999년 다르시 디누치 Darc DiNuci 가 웹 2.0' 이라는 용어 를 만들기 전까지는 존재하지 않던 용어였다. 당시 웹 1.0은 사용자 데이터를 따로 저장하지 않아 데이터를 수집 하거나 분석하는 것이 불가능했고, 요즘 인터넷 같은 강력한 프로토콜이나 플랫폼도 없었다. 표준화된 프로토콜이 없다 보니 그야말로 '읽는 것 외에는 할 수 있는 게 없었다. 지금처럼 온라인으로 쇼핑하 거나 결제하는 것은 상상도 못 할 일이었다.
정적 페이지는 웹 사이트의 방문자가 취하는 행동에 따라 변경되 는 대화형 기능을 제공하지 않았다. 그래서 웹 1.0 시대의 웹 사이트 는 대부분 정보 제공용에 그쳤다. 또한, 웹 사이트와 서버들의 호환성 이 낮아 웹 사이트에 지원되지 않는 브라우저를 사용하는 경우 특정 웹 사이트는 열람할 수 없었다. 웹 서버도 지원 가능한 경우와 그렇지 않은 경우가 있었다. 게다가 콘텐츠 생산자나 서비스 제공자도 웹 사 이트를 만들기 위해 서버에 대한 액세스, 프로그래밍 등과 관련해 IT 개발에 대한 전문적인 지식이 필요했다. 그래도 누구나 웹 페이지를 올릴 수 있었고, 누구나 브라우저만 있으면 접속할 수 있었다. 이것은 엄청난 혁신이었다.
- 웹 1.0은 모뎀Modem이라는 유선 음성 전화망을 이용하는 전화 접속 이 주를 이루었다. 그러나 전화 접속의 속도는 긴 연락처 목록을 불러 오기에 너무 느렸고, 그 때문에 당시 인기 있던 서비스 중 하나는 방 명록이었다. 웹 사이트의 전반적인 성능을 저해하지 않으면서 사용자가 의견을 남기고 이를 다른 사람이 볼 수 있는 서비스는 소셜 활동과 커뮤니케이션 욕구에 대한 효율적인 솔루션이 되었다. 웹 페이지를 읽고 방명록을 남기는 정도의 수준에서도 사람들은 웹 서비스라는 존재에 대해 감탄했다. 오프라인 세상이 전부였던 현실에 온라인 세상이 열렸기 때문이다. 이때 웹의 가능성을 알아본 선구자들은 이를 위한 기업을 세우고 각종 서비스를 만들기 시작했다.
- 그중 대표적인 것이 검색 서비스다. 지금 우리는 구글 Google, 네이버와 같은 검색 및 포털 사이트에서 쉽게 자료를 검색하고 다양한 자료 를 꺼내 볼 수 있다. 만약 이런 검색 엔진과 같은 서비스가 없었다면 정보를 원하는 사람들은 파일 하나하나를 뒤져가며 아주 오랫동안 자 료를 찾아야 했을 것이다. 이런 불편함을 해소하기 위해 탄생한 검색 서비스는, 개인들의 PC에 쌓인 자료들을 '인터넷을 통해 연결해 열 람할 수 있게 했다.
- 페이스북과 유튜브는 콘텐츠 생산자와 소비자가 명확했던 시대에 소비자도 생산자가 되는 시대의 문을 열었다. 이는 웹 2.0의 시작이자 웹 1.0 시대의 끝을 알렸다. 웹 1.0 시대는 콘텐츠 생산자와 소비자가 명확히 구별되는 특성을 보인다. 생산자가 만든 콘텐츠를 소비자가 일방적으로 소비하는(읽는) 것이 웹 1.0이다. 하지만 사람들은 점차 소셜 활동과 커뮤니케이션, 그리고 창작에 대한 욕구를 드러냈다. 웹 2.0과 같은 소셜 기반 서비스와 플랫폼, 크리에이터의 시대가 열리는 것은 당연한 수순이었다.
- 검색을 통해 자료를 열람하는 웹 1.0 시대를 지나 적극적인 참여, 공유, 커뮤니케이션이 가능한 웹 2.0 시대가 열렸다. 이제 누구나 콘텐 츠를 생성하고 공유할 수 있게 됐고, 사용자 간 커뮤니케이션을 통해 지속적으로 콘텐츠와 데이터가 생겨나기 시작했다. 웹 2.0의 대표 콘 텐츠로는 소셜 네트워크, 플랫폼 비즈니스, 댓글 및 메신저 서비스 등 을 꼽을 수 있다. 각종 개발 도구가 등장하면서 누구나 편리하게 블로 그나 웹 사이트를 제작할 수 있게 됐다. 웹 2.0은 다양한 온라인 도구와 플랫폼을 통해 사용자가 자신의 관점, 의견, 생각 및 경험을 공유할 수 있는 장을 제공함으로써 근본적인 변화를 가져왔다.
- ‘웹 2.0'이라는 용어는 2000년대 초 팀 오라일리가 콘퍼런스에서 웹 2.0의 개념에 대해 논의한 후 알려지기 시작했다. 이 용어는 사람 들이 웹 2.0이 인류에게 제공할 가능성에 대한 환상을 가지며 유행어 가 되었다. 웹 3.0이 유행어처럼 번지기 시작한 현재 상황과 별반 다 르지 않았다. 팀 오라일리는 웹 2.0을 플랫폼으로서의 웹으로 정의 했으며, 이후 웹 2.0은 소셜 웹이나 민주주의 같은 용어로 표현되기도 했다.
- 웹 2.0의 풀지 못한 숙제
나은 콘텐츠를 제공할 수 있도록 사용자 데이터를 서버에 저장하기 시작했다. 덕분에 데이터를 분석해 개인화 추천이 가능해졌고, 사용 자 정보와 취향에 기반한 맞춤형 서비스를 개발할 수 있게 됐다. 사용 자가 생성한 데이터와 콘텐츠가 웹 생태계의 핵심으로 자리 잡은 것 이다. 결과적으로 사용자는 그들의 웹 사이트, 모바일 서비스에 더 오 래 머물게 됐고, 회사는 더 많은 광고 수익을 벌어들일 수 있었다.
문제는 이러한 데이터가 온전히 콘텐츠 생산자에게 돌아가지 못하 고 중앙화된 웹 2.0의 IT 기업 것이 됐다는 점이다. 거대 IT 기업들은 개인 정보와 개인이 생성하는 데이터가 귀중한 자산이라는 사실을 인식했다. 페이스북과 구글, 아마존 같은 거대 플랫폼 기업들은 중앙화 서버에 데이터를 모았고 그것을 높은 가격에 판매해 막대한 이익을 얻었다. 회사는 광고주에게 사용자 정보를 판매하기도 하고 직접 그 것을 활용해 비즈니스를 확장해나갔다. 이렇듯 중앙화된 서비스는 사 용자에게 큰 편의성을 제공했지만, 사용자의 콘텐츠와 데이터에 대한 정당한 가치와 소유권을 제대로 인정하지 않았다.
- 월드와이드웹의 창시자이자 인터넷의 아버지로 불리는 팀 버너스 리는 웹 3.0을 시맨틱 웹Semantic Web 으로 정의했다. 시맨틱 웹이란 기계가 인간처럼 학습해 인간의 사고방식에 따라 데이터를 처리하는 웹을 의미한다. 이는 마치 현재의 인공지능이 웹에서 동작하는 것과 유사 하다. 팀 버너스 리는 2019년 진행된 월드와이드웹 30주년 기념 인터 뷰에서 현재의 웹은 제 기능을 하지 못하고 있다고 말하며, 사용자의 데이터가 조작되고 유출되는 사태를 우려했다. 사실 지금 통용되는 웹 3.0의 개념이 시맨틱 웹과 일치하지는 않지만 그 방식은 유사하다. 웹 3.0에서는 맞춤형 정보를 제공하는 개 인화된 웹 기술이 구현 가능하기 때문이다. 하지만 과거 웹 3.0의 개 념과 다르게 지금의 웹 3.0은 더 포괄적인 의미를 담고 있다. 암호화 폐 기반의 경제체제와 디지털 자산, 가상세계 등이 모두 웹 3.0을 구 성한다. 실리콘밸리의 유명 벤처캐피털 앤드리슨 호로위츠 Andreessen Horowitz (a16z)의 총괄 파트너이자 웹 3.0 전파자인 크리스 딕슨(Chris Dixon 은 웹 3.0에 대해 '사용자와 생산자가 토큰을 기반으로 공동소유하는 인터넷'이라고 정의했다. 이런 웹 3.0은 NFT, 암호화폐, 스마트 콘트랙트, DAO(탈중앙화 자율조직), 디파이 등의 개념을 모두 포괄한다.
- 웹 2.0은 기존 웹 1.0의 읽기(Read)'라는 핵심에 쓰기(Write)'를 더했다. 웹 3.0은 읽기와 쓰기는 기본이며 여기에 '개방(Open)'과 '소유 (Own)'가 추가된다. 웹 2.0 시대 대부분의 기업은 중앙화된 서비스를 제공하는 플랫폼 기업이다. 따라서 웹 2.0 기업이 웹 3.0 시대로 넘어 가려면 개방, 탈중앙, 소유와 같은 핵심 요소를 받아들여야 한다.  2010년대 후반인 2017~2020년에 블록체인이 떠오르며 암호화폐 와 NFT 등 디지털 자산을 다루는 기업들이 등장했다. 여기에 더해 앞 으로 대략 2025년까지는 웹 3.0 시대를 준비하는 기술이 개발되고 이와 관련한 서비스와 기업이 무수히 생겨날 것이다.
하지만 DAO도 몇 가지 단점이 있다. 가장 큰 문제는 '의사결정 비용'이다. 너무 많은 참가자의 의견을 모아야 하기 때문이다. 다양한 의견들은 정치적인 싸움으로 번질 수도 있고, 그로 인해 그룹이 분화 될 수도 있다. 이 과정에서 의사결정이 느리고 비효율적으로 진행될 가능성이 있다.
두 번째 문제는 '토큰을 인센티브로 받는 구조'에서 기인한다. 토큰 인센티브는 동기부여라는 좋은 목적이 있지만, 자칫 참여자들로 하여 금 토큰의 가격이나 수량 배분 문제와 같은 금전적인 목적의 활동에 매몰되게 만들 수 있다.
세 번째는 DAO의 '법적인 지위에 대한 해석'이 아직 분분하다는 점이다. 아직 규제의 범위나 토큰을 발행하며 발생한 수익의 세금 문 제 등이 정해지지 않았고, DAO가 사업을 진행하는 경우 법인으로 인 정해야 하는지 여부도 불명확하다.
- 기존 브라우저에 블록체인 기반 서비스를 연결하는 것이 현재의 추세라면, 브라우저 자체를 웹 3.0 환경에 맞게 만드는 것이 앞으로 진행될 방향이다. 탈중앙화 자율조직(DAO)이나 탈중앙 금융(De-Fi) 서비스 등을 구현하기 위한 도구로 브라우저가 떠오르고 있다. 지금 까지 웹 브라우저가 초기 인터넷을 연결하는 포털과 같은 역할을 했 다면 웹 3.0 시대에는 여기에 프로토콜, 탈중앙 애플리케이션(dApp) 에 대한 포털 역할을 추가한다. 브라우저는 웹을 사용하는 첫 단추 역 할에 충실하면서 동시에 웹 3.0의 방향성에 따라 새로운 단계로 나아 갈 필요가 있는 것이다. 앞으로 브라우저는 신원 인증과 디지털 지갑 제공, 보안 강화 등의 기능을 중심으로 웹 30 시대의 주요 도구가 될 예정이다.
- 웹 3.0 시대에 새로 등장할 웹 브라우저는 데이터를 분산해 보관하 거나 데이터 소유권을 사용자에게 제공하는 기반을 마련할 것으로 보인다. 암호화된 자체 디지털 지갑이 내장된 웹 브라우저와 다양한 확장 프로그램이 더해질 것이다. 이러한 방식의 시작은 '분산형파일 시스템(IPFS)' 프로토콜이다. 인터넷이 탄생한 이후 우리는 HTML과 HTTP 같은 기술을 통해 인터넷을 본격적으로 사용하게 됐다. 자료 를 보내거나 받기 위해서는 HTTP라는 표준화된 하나의 프로토콜(약 속)을 따라야 한다. 이러한 기술을 이용해 웹 페이지를 사용할 수 있 도록 돕는 소프트웨어가 웹 브라우저다.  IPFS는 HTTP를 대체할 새로운 프로토콜로 손꼽힌다. IPFS의 가장 큰 특징은 서버와 관련이 없다는 점이다. 기존 웹에서는 데이터를 관 리하는 서버에 문제가 생기면 인터넷 이용이 어렵고 파일을 다운로드 할 수 없었다. 반면 IPFS는 네트워크 참여자들끼리 데이터를 나눠 보유하기 때문에 이론적으로는 영구적인 데이터 보관 시스템을 만들 수 있다. 이러한 구조를 활용하는 것이 웹 3.0과 탈중앙화이며 이를 적극 적으로 받아들여 웹을 사용할 수 있도록 브라우저가 발전하고 있다. 오페라는 이미 IPFS 프로토콜을 브라우저에 도입했다.
- NFT는 단순한 JPEG 이미지가 아니다. NFT는 커뮤니티와 팬덤 기반의 크리에이터 이코노미를 만들어내는 핵심 매개체라 할 수 있다. NFT는 그 자체로 예술품이 되기도 하고 멤버십이 될 수도 있으며, 신 분증이 될 수도 있다. 또한 NFT는 담보 대출이 가능하고, 분할해서 판매할 수도 있는 디지털 자산이다.
이처럼 다양한 용도와 가능성이 드러나면서 NFT에 대한 관심은 지속되고 있다. 특히 자체 IP를 보유하고 있는 기업은 블록체인과 NFT 시장에 접근하기 유리하다. 쌓아온 수많은 저작물이 있고, 브랜드 인지도 또한 높기 때문이다. 실제로 NFT에 대한 관심이 커지며 많은 블록체인 프로젝트와 기업이 앞다퉈 NFT를 제작하기 시작했다. 나이키와 아디다스 Adidas 같은 패션 브랜드는 물론 루이비통, 구찌Gucci 등 명품 브랜드도 NFT를 제작했거나 지속적으로 제작할 계획을 세웠다. 코카콜라 Coca-Cola와 디즈니 Disney도 캐릭터와 브랜드를 앞세워 NFT를 제작했다. SK텔레콤과 삼성전자, KT 등의 국내 기업과 네이버와 카카오 등 IT 기업도 NFT 생태계에 뛰어들었다.
- 특히 국내 NFT는 게임사가 주도하는 모습이다. 넷마블과 엔씨소 프트, 위메이드는 이미 NFT 기반의 게임을 개발 중이다. 배틀그라운드로 유명한 크래프톤 역시 미래의 먹거리로 NFT를 언급하는 등 게임사들이 적극적인 모습을 보여주고 있다. 게임 아이템을 NFT로 만들어 가치를 부여하고 기존 과금 모델을 NFT로 확장할 수도 있다. NFT를 만들고 이를 활용해 P2E 게임을 제작하면 새로운 비즈니스 기회를 창출할 수 있을 것으로 보인다.
- 블록체인의 최대 단점인 느린 속도와 비효율성은 현재 여러 블록 체인 프로젝트에서 관련 기술을 개발하고 있다. 사이드 체인과 같이 메인 블록체인 옆에 별도의 체인을 만들어 데이터를 처리하는 방식이 대표적이다.
메인 선로에 큰 기차가 달리고 있다. 이 기차는 모든 짐을 싣고 달리기에는 속도가 너무 느리다. 그리고 기차 안에는 짐을 분류해야 하는 작업이 있다. 이때 바로 옆에 속도가 빠른 작은 기차가 함께 달린다. 간이역에 정차했을 때 메인 선로의 기차에서 작은 기차로 일부 짐 을 옮겨 싣는다. 다시 출발한 후 작은 기차는 빠르게 짐을 분류하고 그 내역을 큰 기차에게 알려준다. 다음 역에서 작은 기차는 분류가 끝난 짐을 큰 기차에 옮겨 싣는다. 아니면 계속 짐을 싣고 달린다. 기차의 예시로 설명한 사이드 체인처럼 메인 블록체인의 느린 속도를 보완할 기술들이 개발되고 있고 점차 그 쓰임새를 넓혀가는 중 이다. 가장 많이 쓰이는 블록체인인 이더리움은 수수료가 비싸다. 이더리움을 사용하고 싶어 하는 사람이 많아 한 기차에 짐을 꾸역꾸역 넣고 달리고 있기 때문이다. 몇몇 사람은 자신의 짐을 먼저 처리해달 라고 요구하며 더 많은 수수료를 낸다. 이렇게 짐이 많을 때는 우선순 위로 배정받기 위한 수수료가 계속 높아진다.
이때 적은 수수료로 빠르게 짐을 처리하는 작은 기차가 있다. 이런 작은 기차로는 폴리곤 Polygon, 옵티미즘Optimism, 아비트럼 Arbitrum 등이 있 다. 느리고 큰 기자인 이더리움은 레이어 1이라 하고 작고 빠른 기차 는 레이어2라 한다. 이러한 레이어2 기술이 블록체인의 확장성과 속도 개선에 앞장서고 있다. 앞으로는 레이어2 기술이 레이어1인 이더 리움의 문제를 해결하거나, 아니면 아예 빠른 속도와 확장성을 장점으로 내세운 레이어1이 나올 수도 있다.
블록체인은 대중 가까이로 다가가기 위해 효율성’ 개선과 더불어 '사용자 접근성'이 높은 구조를 개발할 것이다. 블록체인 사용에 필요 한 디지털 지갑을 생성하는 방법이나 자산을 전송하는 절차, 보안 키 보관 및 분실 대처 방법 등 여러 부분에서 사용자 친화적 구조가 만들 어져야 한다. 또한, 지속적으로 발생하는 해킹이나 보안 이슈에 대해 서도 더 나은 해결책을 제시할 필요가 있다.
웹 3.0에서 블록체인이 차지하는 지분은 굉장히 크다. 따라서 단순 히 암호화폐 가격의 움직임이나 국가 규제 등의 이슈만 바라보는 것 으로는 부족하다. 진정한 웹 3.0을 이해하는 것은 블록체인 기술 자체의 발전 내용을 확인하는 것에서 출발한다.
- 헤드리스 커머스는 쇼핑몰이나 이커머스 분야에서 프론트엔드 (사용자가 주문하는 화면 영역)와 백엔드(사용자에겐 보이지 않는 실제 주문을 처 리하는 서버 영역)가 분리된 개발 환경을 의미한다. 프론트엔드를 머리, 백엔드를 몸통으로 비유한 개념인데 몸통은 고정한 채로 머리만 원하 는 형태로 바꾸면서 고객에게 유연한 쇼핑 환경을 제공할 수 있다. 헤드리스 커머스에서 프론트엔드와 백엔드를 연결하는 매개체가 API다. 예를 들어 고객이 상품을 검색하고 장바구니에 담아 즉시 결제 버튼을 눌렀다면 프론트엔드에서 백엔드에게 API를 통해 주문 상황을 전달한다. 백엔드는 결제와 배송을 위한 처리를 진행하고 다시 API를 통해 상태를 프론트엔드로 전달한다. 프론트엔드는 상황에 따 라 화면이 자주 바뀌며 디자인이 중요하다. 백엔드는 이러한 변화에 맞춰 대응해야 한다. 이때 필요할 때마다 상황에 맞는 API를 만들어 변경한다. 프론트엔드의 화면은 바뀌지만 백엔드는 새로 개발할 필요 가 없는 것이다.  이런 방식을 사용하면 고객에 따라 추천 화면이 다양하게 제공되고 새로운 서비스를 사용하는 것 같은 느낌을 줄 수 있다. 이때 프론 트엔드를 개발자가 직접 일일이 수정하는 것이 아니라 마케터나 기획자가 선택하고 그 내용을 API를 통해 백엔드에 전달한다. 이처럼 기업 내부 업무 처리 과정에서 API는 중요한 역할을 한다. 그리고 이는 결국 기업 전체의 수익성을 높인다.



'IT' 카테고리의 다른 글

인터넷 때문에  (0) 2022.08.20
처음 읽는 양자컴퓨터 이야기  (0) 2022.07.07
1일 1로그 IT지식  (0) 2022.06.01
블록체인 경제  (0) 2022.05.11
포스트 메타버스  (0) 2022.05.11
Posted by dalai
,

1일 1로그 IT지식

IT 2022. 6. 1. 16:04

- 주 기억 장치 primary memory 
프로세서와 컴퓨터의 다른 부분이 현재 사용 중인 정보를 저장하는데, 저 장된 정보의 내용은 프로세서에 의해 변경될 수 있다. 주 기억 장치는 프 로세서가 현재 작업 중인 데이터뿐만 아니라 프로세서가 그 데이터로 무 엇을 해야 하는지 알려 주는 명령어도 저장한다. 이 점은 매우 중요하다. 메모리에 다른 명령어를 로드(적재)하여 프로세서가 다른 계산을 수행하 게 할 수 있다. 이러한 원리로 프로그램 내장식 stored-program 컴퓨터는 범용 장치가 된다. 같은 컴퓨터로 워드프로세서와 스프레드시트를 실행하고, 처리를 하고, 음악을 재생할 수 있는데, 이 모든 일이 적합한 명령어를 메 모리에 배치함으로써 가능해진다. 프로그램 내장식이라는 아이디어는 매 우 중요하다. 주 기억 장치는 컴퓨터가 실행되는 동안 정보를 저장할 장소를 제공한다. 주 기억 장치는 워드Word, 포토샵Photoshop, 브라우저 등 현재 활성화된 프로그램의 명령어를 저장한다. 아울러 그러한 프로그램의 데이터, 즉 편집 중인 문서, 화면에 표시된 사진, 웹에서 재생 중인 음악 등을 저장한다. 또한 애플리케이션 여러 개를 동시에 실행할 수 있도록 배후에서 작동하 는 운영체제(윈도우, 맥OS, 다른 운영체제)의 명령어도 저장한다. 
주 기억 장치를 RAM, 즉 '임의 접근 메모리'라고도 부르는 이유는 프로 세서가 정보에 접근할 때 메모리에 저장된 위치와 무관하게 같은 속도로 접근할 수 있기 때문이다. 지나친 단순화로 느껴질 수도 있겠지만, 메모리 의 어떤 위치에 무작위로 접근하더라도 접근 속도는 거의 비슷하다. 이제 자취를 감추기는 했지만 비디오테이프를 생각해 보자. 비디오테이프로 영화의 마지막 부분을 보려면 시작부터 전체를 빨리 감기(실제로는 느리다!)’ 해야만 했다. 이러한 방식은 순차적 접근sequential access 이라고 한다.
- 프로세서 간에 속도를 비교하는 것은 어려울 뿐만 아니라 그다지 의미 도 없다. 산술 연산 같은 기본적인 작업조차 일대일로 비교하기 어려울 만 큼 서로 다른 방식으로 처리되기도 한다. 예를 들어, 어떤 프로세서는 두 수를 더하고 다른 위치에 결과를 저장하기 위해 모형 프로세서처럼 세 개의 명령어가 필요하다. 다른 프로세서는 두 개의 명령어만 필요하고, 또 다른 프로세서는 그 연산을 단일 명령어로 처리한다. 하나의 프로세서가 몇 개의 명령어를 병렬적으로 처리하거나 겹쳐서 실행함으로써 명령어 처 리가 단계적으로 진행되도록 할 수도 있을 것이다. 프로세서가 전력 소모 를 낮추고자 빠른 실행 속도를 포기하기도 하며, 심지어 전력이 배터리에 서 공급되는지 아닌지에 따라 속도를 동적으로 조정하기도 한다. 일부 프 로세서는 고속 코어와 저속 코어의 조합으로 구성되며, 코어 유형별로 서 로 다른 작업을 할당하기도 한다. 그러므로 어떤 프로세서가 다른 것보다 빠르다'는 주장은 조심스럽게 받아들여야 한다. 요구사항에 따라 차이가 있을 수 있다.
- 프로세서에서 캐시는 용량이 작고 속도가 빠른 메모리로, 용량이 더 크지만 훨씬 느린 주 기억 장치에 매번 접근하는 것을 피하고자 최근에 사용된 정보를 저장하는 데 사용된다. 프로세서는 일반적으로 여러 그룹의 데이터와 명령어에 짧은 간격으로 잇달아 여러 번 접근한다. 예를 들어, 그림 1.20(71쪽)에 있는 프로그램에서 루프에 있는 명령어 다섯 개는 입력된 수 각각에 대해 한 번씩 실행된다. 만일 그 명령어들이 캐시에 저장되면 루프가 실행되는 동안 매번 메모리에서 인출하지 않아도 되고, 프로그램은 메모리 작업을 기다릴 필요가 없어져서 더 빨리 실행될 수 있을 것이다. 이와 유사하게 Sum을 데이터 캐시에 유지하는 것도 접근 속도를 높여 주기는 하겠지만, 실제로 이 프로그램에서 진짜 병목 현상은 데이터를 가져오는 과정에서 발생한다.  일반적인 프로세서에는 캐시가 2~3개 있는데, 흔히 L1, L2, L3 레벨이 라고 부르고 뒤로 갈수록 용량은 크지만 속도는 더 느리다. 가장 큰 캐시 는 데이터를 몇 MB 정도 담을 수 있다(내 노트북은 256KB짜리 L2 캐시가 각각의 코어에 있고, 4MB짜리 L3 캐시가 하나 있다). 캐싱이 효과적인 이 유는 최근에 사용된 정보가 곧 다시 사용될 가능성이 크기 때문이다. 캐시에 정보를 포함하고 있다는 사실은 메모리 작업을 기다리는 데 시간을 덜 쓴다는 것을 뜻한다. 캐싱 과정에서는 대개 정보를 블록 단위로 동시에 불 러온다. 예를 들어 단일 바이트에 대한 요청이 들어오면, 연속된 메모리 위치를 포함한 블록을 불러온다. 그 이유는 인접한 정보라면 곧 사용될 가 능성이 높으므로, 미리 불러와 두면 필요할 때 캐시에서 바로 꺼내 쓰기 쉽기 때문이다. 그렇게 되면 근처에 있는 정보를 참조할 때 기다리지 않고 바로 볼 수 있을 것이다.
- 분산 컴퓨팅distributed computing은 네트워크로 연결되어 서로 독립적으로 작동하는 여러 대의 컴퓨터를 일컫는 말이다. 분산 컴퓨팅 시스템은 메모 리를 공유하지 않고 물리적으로 넓게 흩어져 있다. 심지어 전 세계의 다양 한 지역에 퍼져 있기도 하다. 컴퓨터가 흩어져 있을수록 통신이 잠재적 병목 현상을 일으킬 가능성이 커질 수도 있지만, 사람과 컴퓨터가 공간적으로 멀리 떨어져 있어도 상호 협력해서 일할 수 있다는 장점이 있다. 검색 엔진, 온라인 쇼핑, SNS, 일반적인 클라우드 컴퓨팅 같은 대규모 웹 서비 스가 분산 컴퓨팅 시스템으로 이루어져 있고, 수천 대의 컴퓨터가 많은 사용자에게 결과를 빨리 제공하고자 상호작용한다. |이 모든 컴퓨터는 동일한 핵심 원칙을 갖는다. 즉, 한없이 다양한 작업 알고리즘은 추상적이고 이상적인 절차를 기술한 것으로, 구현에 필요한 세부 사항과 현실적인 고려 사항을 무시한다. 알고리즘은 정확하고 명료한 레시피이다. 의미가 완전히 알려져 있고 구체적으로 명시된 기본 연산 으로 표현된다. 이러한 기본 연산을 사용하여 각 단계를 상세히 설명하고 모든 가능한 상황을 다룬다. 그리고 알고리즘은 결국 멈춰야 한다.
이와 대조적으로 프로그램program은 추상적인 것과는 거리가 멀다. 프로그램은 실제 컴퓨터가 과제를 완료하기 위해 수행해야 하는 모든 단계를 구체적으로 서술한다. 알고리즘과 프로그램 간의 차이는 청사진과 건물 간의 차이와 비슷하다. 한쪽은 이상적인 것이고, 다른 쪽은 실재하는 것이다. 프로그램을 하나 이상의 알고리즘이 컴퓨터가 직접 처리할 수 있는 형태로 표현된 것이라고도 생각해 볼 수 있다. 프로그램은 알고리즘과 달리 실질적인 문제도 신경 써야 한다. 불충분한 메모리, 제한된 프로세서 속 도, 유효하지 않거나 악의적으로 잘못된 입력 데이터, 하드웨어 결함, 네 트워크 연결 불량, 그리고 (배후에서 작용하고 종종 다른 문제를 악화시키 는) 인간적인 약점 등의 문제가 포함된다. 따라서 알고리즘이 이상적인 요리 레시피라고 하면, 프로그램은 적군의 공격을 받는 동안 군인들이 먹을 1개월치 식사를 로봇에게 준비하도록 하는 상세한 명령어 모음이라고 할 수 있다.
- 특정한 처리를 수행하는 프로그램을 어셈블러assembler라고 한 다. 원래는 다른 프로그래머가 사전에 작성했던 프로그램에서 필요한 부 분을 모으는 역할을 하기도 했기에 붙은 이름이다. 이 프로그램 작성에 사 용되는 언어는 어셈블리 언어assembly language라고 하고, 이 수준의 프로그 래밍은 어셈블리 언어 프로그래밍assembly language programming이라고 한다. 1부에서 '모형 컴퓨터를 기술하고 프로그래밍하기 위해 사용했던 언어가 바로 어셈블리 언어다. 어셈블러는 프로그램을 수정하는 일을 훨씬 쉽게 해준다. 프로그래머가 명령어를 추가하거나 삭제할 때 변경 기록을 직접 관리하는 대신 어셈블러가 각 명령어와 데이터 값이 메모리상 어느 위치에 있을지 파악해 주기 때문이다.
- 특정 프로세서 아키텍처에서 사용되는 어셈블리 언어는 그 아키텍처에 특화된 언어다. 어셈블리 언어는 대개 프로세서의 명령어와 일대일로 연 결되고, 명령어가 이진수로 인코딩되는 특정한 방식과 메모리에 정보가 배치되는 방식 등을 알고 있다. 즉, 어떤 작업을 수행하기 위해 특정 종류 의 프로세서(예를 들면, 맥이나 PC의 인텔 프로세서)의 어셈블리 언어로 작성된 프로그램은 다른 프로세서(휴대전화의 ARM 프로세서)에 맞춰 작 성된 어셈블리 언어 프로그램과는 다르다는 뜻이다. 특정 프로세서용 어 셈블리 언어 프로그램을 다른 프로세서용으로 변환하고 싶다면 프로그램 을 완전히 새로 작성해야 한다.
- 1950년대 말, 1000년대 초에 컴퓨터가 프로그래머를 대신해서 더 많은 일을 수행하게 되는 또 다른 움직임이 일어났는데, 아마도 프로그래밍의 역사에서 가장 중요한 발걸음이었을 것이다. 바로 특정 프로세서 아키텍처에 독립적인 고수준 프로그래밍 언어 high-level programming language의 개발이다. 고수준 언어를 쓰면 사람이 표현하는 방식에 가까운 용어로 계산 과정 을 작성할 수 있다.  고수준 언어로 작성된 코드는 번역기 프로그램을 통해 대상 프로세서의 어셈블리 언어로 된 명령어로 변환된 다음, 어셈블러에 의해 비트로 변환 되어 메모리에 로드되고 실행된다. 여기서 번역기 프로그램은 보통 컴파 일러compiler라고 불리는데, 그다지 통찰력이나 직관이 느껴지지 않는 역사적 용어다.
- 프로그래밍 언어는 앞으로 어떻게 발전할까? 짐작건대 우리는 더 많은 컴퓨터 자원을 우리에게 유용한 방향으로 사용함으로써 프로그래밍을 계속 해서 쉽게 만들 것이다. 또한 프로그래머가 더 안전하게 사용할 수 있는 언어를 만드는 방향으로 나아갈 것이다. 예를 들어, C 언어는 매우 예리한 도 구다. C 언어로는 늦게까지 검출되지 않는 프로그래밍 에러를 무심코 만들 기 쉬운데, 이런 에러는 어쩌면 이미 흉악한 목적으로 이용된 다음에야 발 견될 수도 있다. C 이후에 나온 언어들은 이러한 에러를 일부 방지하거나 검출하기 쉽게 되어 있지만, 더 느리게 실행되거나 메모리를 더 많이 차지 하는 등의 희생이 따른다. 대체로는 이런 방향으로 나아가는 것이 정당한 트레이드오프지만, 자원을 덜 쓰면서 빠른 코드를 작성하는 것이 매우 중요 해서 C처럼 효율성이 높은 언어가 계속 사용될 응용 분야가 분명히 아직 많다. 예를 들면 자동차, 항공기, 우주선, 무기 등에 있는 제어 시스템이 그렇다.
- 연관된 함수들의 모음을 보통 라이브러리library라고 한다. 예를 들어, C 언어에는 디스크나 다른 위치에서 데이터를 읽고 쓰는 함수로 구성된 표 준 라이브러리가 있고, scanf와 printf도 이에 속한다.  함수 라이브러리가 제공하는 서비스는 애플리케이션 프로그래밍 인터 페이스Application Programming Interface, 즉 API로 프로그래머에게 제공된다. API는 포함하는 함수와 더불어 함수의 용도가 무엇인지, 함수를 어떻게 사용해야 하는지, 어떤 입력 데이터를 요구하는지, 어떤 값을 만들어 내는 지 나열한다. 또한 API는 시스템 내부에서 주고받는 데이터의 구조를 의 미하는 자료 구조와 기타 세부 사항도 기술할 수 있다. 이 모든 것이 모여 프로그래머가 서비스를 요청하기 위해 무엇을 해야 하고 결과적으로 무엇 이 계산될지 정의한다. 이러한 명세는 상세하고 정확해야 한다. 결국 프로그램을 해석하는 것은 친절하고 협조적인 사람이 아니라 말도 안 통하고 명령을 곧이곧대로 받아들이는 컴퓨터이기 때문이다.
- API는 구문과 관련된 기본 명세뿐만 아니라 시스템을 효과적으로 사용하도록 돕는 지원 문서도 포함한다. 요즘 대규모 시스템은 프로그래머들 이 복잡한 소프트웨어 라이브러리를 잘 다룰 수 있도록 소프트웨어 개발키트Software Development Kit, 즉 SDK를 포함한다. 예를 들어, 애플은 아이폰과 아이패드 코드를 작성하는 개발자를 위해 개발 환경과 지원 도구를 제공 한다. 구글은 안드로이드용 SDK를 제공한다. 마이크로소프트는 윈도우 코드를 여러 가지 장치에 대해 다양한 언어로 작성할 수 있는 폭넓은 개발 환경을 제공한다. SDK 자체도 대형 소프트웨어 시스템이다. 예를 들어, 안드로이드 개발 환경인 안드로이드 스튜디오Android Studio는 용량이 1.6GB 이고 애플 개발 환경인 Xcode는 그보다 훨씬 크다.
- 프로그래머가 작성하는 코드는 어셈블리 언어든 고수준 언어든 소스 코드 source code라고 한다. 소스 코드를 프로세서에서 실행하기에 적합한 형태로 컴파일한 결과는 오브젝트 코드object code라고 한다. 이런 구분이 너무 현학 적으로 보일지 모르겠지만, 용어 정의를 명확히 하는 것은 중요하다. 소스 코드는 약간의 수고가 따르더라도 프로그래머가 읽을 수 있는 형태라서, 코드를 연구하여 상황에 맞춰 수정할 수 있고 코드에 포함된 혁신적인 기 결이나 아이디어를 읽어 낼 수도 있다. 이와 달리 오브젝트 코드는 너무 많은 변환 과정을 거쳤기 때문에, 원래 소스 코드와 조금이라도 비슷하게 복한다든지, 근종을 만들거나 작동 방식을 이해하기 위해 이용할 수 있 는 통화로 추출하는 것조차 대개 불가능하다. 그래서 대부분의 상용 소프 트의 어는 오르게트 코드 형태로만 배포된다. 소스 코드는 가치가 큰 비밀 정도이므로 비유걱으로 혹은 말 그대로 자물쇠를 채워서 간수된다.
오픈소스는 연구와 개선 활동을 위해 다른 사람들도 소스 코드를 자유롭게 사용할 수 있도록 하는 대안을 일컫는 용어다.
- 1950년대 초에는 애플리케이션과 운영체제 간에 구별이 없었다. 컴퓨터는 한 번에 한 개의 프로그램만 실행할 수 있을 정도로 성능이 제한적이 었고, 그 프로그램이 컴퓨터 전체를 점유했다. 실제로 프로그래머들은 자 신이 짠 프로그램 한 개를 실행하기 위해 시간대별로 컴퓨터 사용 예약을 해야만 했다(일반 학생이라면 한밤중에나 사용할 수 있었다). 컴퓨터가 더 복잡해짐에 따라, 비전문가가 프로그램을 실행하는 일이 너무 비효율 적이라고 느껴져서 전문 운영자에게 맡겨졌고, 운영자는 프로그램을 컴퓨터에 입력하고 결과를 배부했다. 운영체제는 운영자가 이런 작업을 자동 화할 수 있도록 돕는 프로그램에서 시작됐다.
운영체제는 자신이 제어하는 하드웨어가 발전됨에 따라 꾸준히 더 정교해졌다. 하드웨어 성능이 더 좋아지고 복잡해지면서, 운영체제가 하드웨어를 제어하는 데 더 많은 자원을 투입할 수 있게 되었다. 처음으로 널리 사용된 운영체제는 1950년대 후반과 1960년대 초반에 등장했는데, 보통 은 하드웨어를 만드는 회사가 이를 같이 제공했고 어셈블리 언어로 작성 되어 하드웨어와 강하게 결부되었다. 이렇게 하여 IBM과 더불어 DECDigital Equipment Corp, 데이터 제너럴Data General Corp 같은 작은 회사들이 자사 하드 웨어를 위한 자체 운영체제를 제공했다. 앞에서 인용문에 언급한 프레더 릭 브룩스는 1965년부터 1978년까지 IBM의 시스템/360System/360 컴퓨터 시리즈와 당시 IBM의 최상위 운영체제인 OS/360 개발을 관리했다. 브룩 스는 컴퓨터 아키텍처, 운영체제, 소프트웨어 공학 분야에 기여한 공로로 1999년 튜링상을 받았다.
- 운영체제는 컴퓨터의 자원을 제어하고 할당한다. 첫째로, 프로세서를 관리하면서 현재 사용 중인 프로그램을 스케줄링하고 프로그램 간의 관계를 조정한다. 또한 특정 시점에 활발히 연산하는 프로그램 간에 프로세서 의 초점을 전환해 준다. 여기에는 애플리케이션뿐만 아니라 바이러스 검사 프로그램 같은 백그라운드 프로세스도 포함된다. 운영체제는 사용자가 대화 상자에서 확인 버튼을 클릭하는 것 등의 특정 이벤트를 기다리는 프 로그램을 대기 상태로 바꿔 준다. 또한 특정한 프로그램이 자원을 독차지 하는 것을 막아 준다. 만일 어떤 프로그램이 프로세서 시간을 너무 많이 차지하면 운영체제는 다른 작업도 일정한 몫을 나눠 받을 수 있도록 그 프 로그램의 속도를 낮춰 준다.  일반적인 운영체제에서는 프로세스 수백 개가 동시에 실행된다. 일부는 사용자가 실행한 프로그램이지만, 대부분은 일반 사용자에게는 보이지 않 는 시스템 작업이다. 무슨 일이 일어나고 있는지 확인하고 싶다면, 맥OS 에서는 활성 상태 보기 Activity Monitor, 윈도우에서는 작업 관리자Task Manager, 휴대전화에서는 그와 유사한 프로그램을 이용하면 된다. 
- 하드웨어 개발 시 원래 의도했던 것과는 다른 운영체제를 실행하기도 한다. 윈도우를 사용하려고 했던 컴퓨터에서 리눅스를 실행하는 것이 좋 은 예다. 디스크에 몇 개의 운영체제를 저장해 두고 컴퓨터를 켤 때마다. 어느 것을 실행할지 결정할 수 있다. 이 '멀티 부트multiple boot' 기능은 애플 에서도 부트 캠프Boot Camp라는 이름으로 지원하는데, 맥이 맥OS 대신 윈 도우를 실행하면서 시스템을 시작할 수 있도록 한다. 심지어 다른 운영체제의 관리하에 어떤 운영체제를 가상 운영체제virtual operating system로 실행할 수도 있다. VM웨어 VMware, 버추얼박스(virtualBox, 오 픈소스인 젠xen 같은 가상 운영체제 프로그램은 호스트 운영체제(가령 맥OS)에서 어떤 운영체제(윈도우나 리눅스)를 게스트 운영체제로 실행할 수 있게 해준다. 호스트는 게스트가 생성하는 요청 중 파일 시스템 접근이나 네트워크 접근 등 운영체제 권한이 필요한 요청을 가로챈다. 호스트는 작업을 수행한 다음 게스트로 되돌아간다. 호스트와 게스트가 둘 다 같은 하드웨어에 맞게 컴파일되면 게스트 운영체제는 대개 하드웨어가 낼 수 있는 최고 속도로 실행되고, 거의 실제 컴퓨터상에서 직접 실행되듯 반응하는 것처럼 느껴진다.
- 운영체제는 이러한 서비스를 표준화된 방식 또는 합의된 방식으로 이용할 수 있게 하고, 애플리케이션은 운영체제의 특정 부분에 통제권을 넘겨 주는 특별한 명령어를 실행함으로써 서비스를 요청한다. 운영체제는 요청에 포함된 어떤 일이든 처리하고, 통제권과 처리 결과를 애플리케이션에게 돌려준다. 운영체제에 서비스를 요청하는 이 진입점을 시스템 콜system call이라고 하며, 시스템 콜의 세부 명세에서 그 운영체제가 무엇인지를 규정한다. 최신 운영체제에는 보통 수백 개의 시스템 콜이 있다.
- 디바이스 드라이버 
운영체제와 프린터나 마우스 같은 특정 종류의 하드웨어 장치 간에 가교 역할을 하는 코드다. 드라이버 코드는 특정 장치가 어떤 일을 하도록 하는 방법을 자세히 알고 있다. 여기에는 마우스나 트랙패드에서 오는 움직임과 버튼 정보를 이용하는 방법, 드라이브가 집적회로나 회전하는 자성 표면에서 정보를 읽고 쓰게 하는 방법, 프린터가 종이에 인쇄하게 하는 방법, 특정 무선 칩이 전파 신호를 보내고 받게 하는 방법 등이 포함된다. 디바이스 드라이버는 특정 장치의 특이한 속성에서 시스템의 나머지 부 분을 분리한다. 예를 들어, 키보드처럼 종류는 다양하지만 동일한 역할을 하는 장치에는 운영체제가 필요로 하는 기본 속성과 동작이 있는데, 드라이버 인터페이스는 운영체제가 서로 다른 장치에 균일한 방식으로 접근하도록 해서 장치를 전환하기 쉽게 해준다.
- '휴지통 비우기'를 클릭해서 명시적으로 휴지통을 비운다고 가정해 보자. 그렇게 하면 휴지통 폴더 자체에 있는 폴더 엔트리는 삭제되고 해당 블록이 미사용 목록에 들어가지만, 그 내용은 아직 삭제되지 않은 상태다. 원래 파일에 할당된 각 블록의 모든 바이트는 아직 그대로 있다. 그 블록 이 미사용 목록에서 꺼내져서 새로운 파일에 할당되기 전까지는 새로운 내용으로 덮어 쓰이지 않는다.  이렇게 삭제가 바로 일어나지 않는다는 것은 여러분이 제거했다고 생각 한 정보가 아직 존재하고, 누군가 그 정보를 찾을 방법을 안다면 손쉽게 접근할 수 있음을 뜻한다. 물리적 블록 단위로 드라이브를 읽는 프로그램, 즉 파일 시스템 계층 구조를 통하지 않고 디스크를 읽는 프로그램이라면 예전 내용을 확인할 수 있다. 2020년 중반에 마이크로소프트가 발표한 윈도우 파일 복구(Windows File Recovery라는 무료 툴은 정확히 이러한 방식으로 수많은 파일 시스템과 저장 매체에 파일 복구를 수행한다.
여기에는 잠재적인 이점이 있다. 디스크에 뭔가 이상이 생겨 파일 시스템이 엉망이 되었을 때도 아직 정보를 복원할 수 있을지 모른다. 하지만 파일을 제거해도 데이터가 완전히 사라졌다는 보장이 없는 점은 데이터에 사적인 내용이 있거나 여러분이 뭔가 나쁜 일을 꾸미고 있어 진짜로 정보 가 제거되기를 바란다면 좋지 않은 일이다. 솜씨 좋은 적수나 법 집행 기 관은 그런 정보를 복원하는 데 전혀 어려움이 없을 것이다. 만일 범죄 행 위를 계획하고 있거나 그냥 집착이 심한 성격이라면 블록이 미사용 상태가 된 후에도 정보를 지우는 프로그램을 사용해야만 한다.  실제로는 그보다 더 꼼꼼히 처리해야 할 수도 있다. 정말로 끈질긴 적수인 데다 자원도 풍부하다면 기존 정보가 새로운 정보로 덮어 쓰였대도 약간이라도 남아 있는 정보를 추출할지도 모른다. 군 조직에서는 블록을 무작위 패턴으로 된 0과 1 값을 여러 번 덮어 씌움으로써 파일을 제거한다. 더 좋은 방법은 하드 디스크를 강한 자석 근처에 놓아 자성을 없애 버리는 것이다. 최선의 방법은 물리적으로 파괴하는 것이며, 저장한 정보를 확실 히 사라지게 하는 유일한 방법이다. 하지만 이마저 충분하지 않을 수 있다. 만일 데이터가 항상 자동으로 백 업되고 있거나 (직장에서의 컴퓨터가 그렇듯이) 자신의 드라이브 대신 네 트워크 파일 시스템이나 '클라우드' 어디엔가에 파일이 보관되고 있다면 말이다(오래된 컴퓨터나 휴대전화를 팔거나 양도할 때 데이터가 복구될 수 없게끔 확인해야 할 수도 있다).
- 외부에서 보면 브라우저는 웹 서버에 요청을 보내고 화면에 표시할 정 보를 웹 서버에서 받아 온다. 어떤 점이 복잡한 것일까?
우선 브라우저는 비동기적asynchronous 이벤트를 처리해야 한다. 비동기 적 이벤트란 예측할 수 없는 시점에 일정한 순서를 따르지 않고 발생하는 이벤트를 뜻한다. 예를 들어, 사용자가 링크를 클릭하면 브라우저는 페이 지에 대한 요청을 보내는데, 브라우저는 해당 응답을 기다리고 있을 수만 은 없다. 그 사이에 사용자가 현재 페이지를 스크롤하면 즉각 반응해야 하 고, 뒤로 가기 버튼을 누르거나 다른 링크를 클릭하면 요청된 페이지가 오 는 중일지라도 요청을 취소해야 한다. 사용자가 창의 모양을 바꾸면 디스 플레이를 갱신해야 하고, 데이터가 오는 동안에 사용자가 이리저리 모양을 계속 바꾸면 계속해서 갱신해 줘야 한다. 페이지에 소리나 동영상이 포함돼 있다면 브라우저는 그러한 미디어의 재생도 처리해야 한다. 비동기적인 시스템을 프로그래밍하는 것은 항상 어려운데, 브라우저는 많은 비동기성을 다뤄야만 한다. 브라우저는 정적인 텍스트부터 페이지의 내용을 계속해서 바꾸려고 하 는 대화형 프로그램에 이르기까지 많은 종류의 콘텐츠를 지원해야 한다. 이 중 일부는 확장 프로그램에 콘텐츠 처리를 위임할 수 있는데, PDF나 동영상 같은 표준 포맷을 처리하는 데는 이 방식이 일반적이다. 하지만 이 를 위해 브라우저는 해당하는 확장 프로그램을 시작하고, 데이터 자체와 데이터에 대한 요청을 보내고 받고, 처리된 데이터를 디스플레이에 표시 하기 위한 메커니즘을 제공해야 한다.
브라우저는 여러 개의 탭과 여러 개의 창을 관리하는데, 이들 각각은 아 마도 앞서 말한 작업 중 일부를 수행하고 있을 것이다. 브라우저는 수행한 작업의 이력과 함께 북마크, 즐겨찾기 등의 다른 데이터를 유지한다. 업로 드, 다운로드, 이미지 캐싱을 하기 위해 로컬 파일 시스템에 접근하기도한다.
브라우저는 여러 수준에서 기능을 확장하기 위한 플랫폼을 제공한다. 어도비 플래시Adobe Flash 같은 플러그인, 자바스크립트용 가상 머신, 애드 블록 플러스Adblock Plus와 고스터리 Ghostery 같은 애드온 프로그램 등이 확장 기능에 해당한다. 내부적으로 브라우저는 모바일 기기를 포함해서 다수 운영체제의 여러 버전에서 작동해야 한다.
이 모든 기능을 수행하기 위한 복잡한 코드를 포함하고 있기 때문에, 브라우저는 자체 구현 코드나 자신이 활성화하는 프로그램에 있는 버그를 이용한 공격에 취약하다. 사용자의 순진함, 무지함, 무분별한 행동도 브라 우저가 공격을 받는 데 한몫한다. 대부분의 사용자는(이 책의 독자를 제외 하고) 무슨 일이 일어나는지 또는 어떤 위험이 있을지조차 거의 이해하지 못한다. 쉬운 일이 아니다.  앞의 내용을 되짚어 보면 뭔가 떠오르지 않는가? 브라우저는 운영체제 와 비슷하다. 자원을 관리하고, 동시에 일어나는 활동을 제어하고 조정한 다. 또한 다수의 출처에 정보를 저장하고 가져오며, 애플리케이션 프로그램이 실행될 수 있는 플랫폼을 제공한다.
- 한동안 브라우저를 운영체제로 사용하는 것이 가능해 보였고, 그래서 아래에 있는 하드웨어를 제어하는 운영체제와 독립적으로 작용할 수 있을 것처럼 보였다. 그럴듯한 아이디어였지만 10~20년 전까지만 해도 현실적 인 장애물이 너무 많았다. 오늘날 이 아이디어는 실행 가능한 대안이 됐 다. 이미 수많은 서비스가 오로지 브라우저 인터페이스로만 접근할 수 있 고(이메일, 달력, 음악, 비디오, SNS가 명백한 사례다), 이러한 추세는 계 속될 것이다. 구글은 웹 기반 서비스에 주로 의존하는 크롬 OS라는 운영 체제를 제공한다. 크롬북은 크롬 OS를 실행하는 컴퓨터로, 로컬 저장 장 치의 용량은 제한적이며 대부분의 저장 기능은 웹을 사용한다. 또한 구글 문서 Google Docs 같은 브라우저 기반 애플리케이션만 실행한다.
- 이더넷에서 정보는 패킷으로 전송된다. 패킷packet은 정확하게 정의된 형식으로 된 정보를 담고 있는 일련의 비트 또는 바이트다. 발신자가 정보 를 패킷으로 싸서 보내면 수신자가 패킷을 열어서 정보를 확인할 수 있다. 패킷은 발신자 주소, 수신자 주소, 내용, 여러 가지 기타 정보가 표준 형식 으로 구성돼 있는 우편 봉투(또는 아마도 엽서)로 적절히 비유할 수 있는 데, 페덱스FedEx 같은 운송 회사에서 이용하는 표준화된 패키지를 떠올리 는 것도 괜찮다. 패킷 형식과 내용의 세부 사항은 네트워크에 따라 크게 다르다. 이더넷 패킷(그림 III.3)은 6바이트로 된 출발지 주소와 목적지 주소, 몇 가지 기타 정보, 최대 1,500바이트의 데이터로 구성된다.
이더넷은 아주 크게 성공을 거둔 기술이다. 가장 먼저 상용 제품으로 만들 어졌으며(제록스가 아니라 메트칼프가 설립한 회사인 쓰리컴3Com에 의 해), 그간 수십억 대의 이더넷 장치가 많은 공급 업체에서 판매됐다. 최초 의 이더넷은 3Mbps의 속도였지만, 요즘의 이더넷은 100Mbps에서 10Gbps까지 빨라졌다. 모뎀과 마찬가지로 처음 나온 이더넷 장치는 부피가 크고 비쌌지만, 오늘날 이더넷 인터페이스는 저렴한 단일 칩이다.  이더넷은 수백 미터 이내의 한정된 범위에서 작동한다. 원래 사용되던 동축 케이블은 표준 커넥터가 있는 8선 케이블로 대체되었다. 각 장치가 표준 커넥터로 스위치'(또는 '허브)에 연결되면 이더넷 스위치는 들어오 는 데이터를 다른 연결된 장치에 브로드캐스트한다. 데스크톱 컴퓨터에는 보통 이더넷 표준 커넥터를 연결할 수 있는 소켓이 있고, 이더넷의 작동 방식을 모방하는 무선 공유기와 케이블 모뎀 같은 장치에도 이러한 소켓이 있다. 이 소켓은 무선 네트워킹에 의존하는 최신 노트북에서는 거의 찾 아볼 수 없다.
- 각 휴대전화에는 IMELinternational Mobile Equipment Identity, 국제 모바일 기기 식별코드라 는 15자리 고유 식별 번호가 있는데, 이는 이더넷 주소와 비슷하다. 휴대 전화가 켜지면 식별 번호를 브로드캐스트하고, 가장 가까운 기지국이 그 정보를 받아 홈 시스템home system*을 통해 전화 유효성을 검사한다. 휴대전 화 위치가 여기저기 이동하면 기지국이 그 위치를 홈 시스템에 보고함으로써 전화의 위치 정보를 최신 상태로 유지한다. 누군가가 전화를 걸면 홈 시스템은 현재 어느 기지국이 그 전화와 접촉하고 있는지 알 수 있다.
휴대전화는 가장 강한 신호를 내는 기지국과 통신한다. 휴대전화는 기지국에 가까이 있을 때 더 적은 전력을 사용하도록 지속적으로 파워 레벨 을 조정한다. 이렇게 하면 배터리를 더 오래 유지하고 다른 휴대전화에 대 한 간섭을 줄일 수 있다. 기지국과 연결을 유지하기만 할 때는 통화할 때 보다 전력이 훨씬 적게 든다. 그래서 대기 시간은 일 단위로 측정되는 반면 통화 시간은 시간 단위로 측정되는 것이다. 하지만 휴대전화가 신호가 약하거나 존재하지 않는 영역에 있으면 부질없이 기지국을 찾느라 배터리 를 더 빨리 소모할 것이다.
모든 휴대전화는 데이터 압축을 통해 신호를 최대한 적은 수의 비트로 줄인 다음, 오류 수정 정보를 추가한다. 이 정보는 노이즈가 심한 무선 채 널을 통해 간섭을 받으면서 데이터를 보낼 때 불가피하게 발생하는 오류 에 대처하기 위해 필요하다.
- 가용 메모리와 대역폭을 더 효율적으로 활용하는 한 가지 방법은 데이터를 압축하는 것이다. 압축의 기본 아이디어는 군더더기 정보, 즉 연결 부분의 반대쪽에서 데이터를 수신했을 때 재현하거나 유추할 수 있는 정보는 저장하거나 보내지 않는 것이다. 압축의 목표는 같은 정보를 더 적은 비트 로 인코딩하는 것이다. 어떤 비트는 아무 정보도 전달하지 않아서 완전히 제거할 수 있다. 일부 비트는 다른 비트에서 계산될 수 있어 버리기도 한 다. 수신자에게 중요하지 않기 때문에 버려도 무방한 비트도 있다.
영어 텍스트를 고려해 보자. 영어에서도 모든 문자가 같은 빈도로 나타 나지 않는다. e가 가장 흔하며, 그다음에 대략 t, a, 0, i, n 순서로 자주 나 온다. Z, x, q는 훨씬 적게 사용된다. 텍스트를 아스키코드로 표현할 때 문 자 하나는 1바이트, 즉 8비트를 차지한다. 비트를 아끼는 한 가지 방법은 7비트만 사용하는 것이다. 미국 아스키코드에서 8번째 비트(즉, 가장 왼 쪽 비트)는 항상 0이므로 아무 정보도 전달하지 않는다.  한 단계 나아가서, 가장 흔히 나타나는 문자에는 더 적은 비트를 사용하 고, 자주 사용되지 않는 문자에는 더 많은 비트를 사용하면 총 비트 수를 대폭 줄일 수 있다. 모스 부호morse code가 취하는 방식과 비슷하다. 모스 부 호에서는 자주 쓰이는 문자 e를 하나의 점으로, 를 하나의 대시로 인코딩 하지만 드물게 쓰이는 q는 대시 대시 점-대시로 인코딩한다.
- 좀 더 구체적인 예를 보자. 《오만과 편견》 원문에 포함된 텍스트는 121, 000단어 또는 680,000바이트를 약간 웃돈다. 가장 흔한 문자는 단어 사이의 공백으로, 거의 110,000개가 있다. 다음으로 흔한 문자는 e(68,600번), t(45,900번), a(31,200번)이다. 가장 드물게 사용되는 문자를 보면 대문자 Z는 세 번 나오고 X는 한 번도 나오지 않는다. 소문자 중에서는 j(551번), q(627번), x(839번) 순서로 드물게 등장한다. 만약 공백 문자와 e, t, a 각 각에 2비트를 사용했다면 분명히 많은 비트를 절약할 수 있고, X, Z와 나 머지 드물게 나타나는 문자에 8비트 이상을 사용한다 해도 문제되지 않는 다. 허프만 코딩huffman coding이라는 알고리즘은 이러한 처리를 체계적으로 수행하여 개별 문자를 인코딩하는 가장 효율적인 압축 방법을 찾는다. 허 프만 코딩을 사용해서 《오만과 편견》을 압축하면 원래보다 44% 줄어든 390,000바이트가 되는데, 평균적으로 한 문자에 약 4.5 비트가 할당된 셈 이다.
단일 문자보다 큰 덩어리, 예를 들어 단어나 구 단위로 압축하고 원래 문 서의 특성에 따라 조정하면 더 나은 결과를 얻는다. 이를 잘 수행하는 여러 알고리즘이 있다. 널리 사용되는 ZIP 압축 알고리즘은 《오만과 편견》을 64% 줄여서 249,000바이트로 압축한다. 유닉스 프로그램인 bzip2는 175,000바이트까지 줄이는데, 원래 크기의 겨우 4분의 1 정도다.
- TCP는 두 컴퓨터 간에 데이터를 주고받는 신뢰성 있는 양방향 스트림을 제공한다. 인터넷 서비스와 애플리케이션은 TCP를 전송 메커니즘으로 사 용하지만, 기능별로 특정한 자신만의 프로토콜을 갖는다. 예를 들어, HTTPHypertext Transfer Protocol, 하이퍼텍스트 전송 프로토콜는 웹 브라우저와 서버에 사 용되는 특히 간단한 프로토콜이다(329쪽 참고), 사용자가 링크를 클릭하 면 브라우저는 서버(가령 amazon.com)의 80번 포트에 대해 TCP/IP 연결 을 열고 특정 페이지를 요청하는 짧은 메시지를 보낸다. 그림 III.15에서 브라우저는 왼쪽 상단의 클라이언트 애플리케이션이다. 메시지는 프로토콜 체인을 따라 내려가서 인터넷을 가로질러(보통 훨씬 더 많은 단계를 거친다), 반대쪽 끝에서 상응하는 서버 애플리케이션까지 올라간다.
아마존의 서버는 페이지를 준비한 다음, 페이지 인코딩 방식에 대한 정 보 같은 약간의 추가 데이터와 함께 사용자에게 보낸다. 돌아오는 경로는 원래 경로와 같을 필요는 없다. 브라우저는 이 응답을 읽고 그 정보를 이용하여 페이지 내용을 표시한다.
- 냅스터 프로토콜은 TCP/IP를 사용했으므로 사실상 HTTP나 SMTP와 동 일한 수준의 프로토콜이었다. 패닝의 작업 결과물을 중립적으로 평가하자 면(정말 깔끔하게 만들어졌다), 냅스터는 인터넷, TCP/IP, MP3를 포함한 인프라와 그래픽 사용자 인터페이스 구축 도구가 이미 마련된 상태라면 간단하게 만들 수 있는 시스템이다.
합법적이든 아니든 대부분의 최신 파일 공유 서비스는 2001년에 브램 코 언Bram Cohen이 개발한 비트토렌트BitTorrent라는 P2P 프로토콜을 사용한다. 비트토렌트는 영화와 TV 프로그램처럼 용량이 크고 인기 있는 파일을 공유할 때 특히 유용하다. 왜냐하면 비트토렌트로 파일을 다운로드하는 각각의 사용자는 같은 파일을 다운로드하려는 다른 사람에게도 본인이 가진 파 일 조각을 업로드해야 하기 때문이다. 비트토렌트에서는 분산된 디렉터리 를 검색하여 파일을 찾고, 용량이 작은 토렌트torrent 파일을 사용해서 누가 어떤 블록을 보내고 받았는지 기록을 유지하는 트래커를 식별한다. 비트 토렌트 사용자는 저작권 침해 탐지에 걸리기 쉽다. 다운로드만 하려는 사 람도 프로토콜 요구사항에 따라 파일 조각을 업로드해야 하므로 저작권이 적용되는 자료를 유포하는 과정에서 쉽게 식별되기 때문이다. P2P 네트워크는 합법성이 의심스러운 파일 공유 이외의 용도로도 쓰인다. 4부에서 이야기할 디지털 통화 및 결제 시스템인 비트코인 Bitcoins도 P2P 프로토콜을 사용한다.
- 스마트폰은 표준 전화 시스템을 사용할 수 있는 컴퓨터라고 볼 수 있다. 모든 최신 휴대전화는 이동통신사의 통신망이나 와이파이로 인터넷에 접근한다. 이렇게 휴대전화에서 인터넷에 접근하기 쉬워지면서 전화망과 인터넷의 구분이 모호해지고 있으며 이러한 구분은 결국 사라질 것이다.
오늘날 휴대전화를 세상 곳곳에 퍼지게 했던 것과 동일한 힘이 다른 디 지털 장치에도 작용하고 있다. 앞서 말했듯이 많은 기기와 장비에는 강력한 프로세서와 메모리가 있고, 흔히 무선 네트워크 연결도 지원된다. 자연 스럽게 이러한 장치들을 인터넷에 연결하려고 할 텐데, 필요한 모든 메커 니즘이 이미 마련되어 있고 한계 비용이 0에 가까우므로 이는 매우 간단 하다. 따라서 와이파이나 블루투스로 사진을 업로드하는 카메라, 위치 정보나 엔진의 원격 측정값을 업로드하는 동안 오락거리를 다운로드하는 자 동차, 주변 환경 정보를 측정하고 제어하여 외출 중인 집주인에게 알려주 는 온도 조절 장치, 아이와 보모, 방문객을 계속 관찰하는 비디오 모니터, 알렉사 같은 음성 응답 시스템, 그리고 앞에서 언급한 네트워크로 연결된 전구 같은 제품은 모두 인터넷 연결을 기반으로 한다. 이 모두를 일컫는 유행어가 사물인터넷, 즉 IoT이다. 여러모로 IoT는 훌륭한 아이디어이며 앞으로 점점 더 많은 종류의 IoT 기기가 생겨날 것임은 확실하다. 그러나 IoT에도 큰 단점이 있다. 이렇게 특정 용도를 가진 장치는 같은 종류의 범용 장치보다 보안 문제에 더 취약 하다. 즉 해킹이나 불법 침해를 당해서 손상을 입을 가능성이 더 높다. 사 실 IoT 관련 보안과 프라이버시에 대한 관심도 개인용 컴퓨터와 휴대전화 와 비교해 매우 낮은 수준이어서 더 위험하다. 일례로, 상당히 많은 장치 가 제조 국가에 있는 서버로 정보를 전송하는 방식으로 집으로 연락’ 한다.
다양한 IoT 보안 사고 사례 중 하나를 이야기하자면, 2016년 1월에 한 웹사이트에서 사용자가 웹캠을 검색하여 볼 수 있게 허용했는데, 촬영 영 상을 전혀 보호 처리하지 않고 송출했다. 이 사이트는 '마리화나 농장, 은행의 밀실, 아이방, 부엌, 거실, 차고, 앞마당, 뒷마당, 스키장, 수영장, 대학과 학교, 실험실, 소매점의 금전등록기' 등에 설치된 카메라 영상을 그대로 노출했다. 이런 보안 허점이 단순 관음 목적부터 훨씬 나쁜 의도로 사용되는 상황을 고려해 볼 수 있을 것이다.
일부 어린이 장난감은 인터넷 연결을 지원하는데, 이는 또 다른 잠재적 위험을 불러일으킨다. 한 연구에서는 몇몇 장난감에 아이들을 추적하는 데 사용할 수 있는 데이터 분석 코드와, 장난감을 다른 공격의 매개체로 쓸 수 있도록 허용하는 불안정한 메커니즘이 포함되어 있음을 밝혀냈다. (이런 장난감 중 하나는 인터넷에 연결되는 물병이었는데, 원래는 수분 공 급 상태를 모니터링할 용도였던 것으로 보인다). 이런 식의 아동 추적은 COPPAChildren's Online Privacy Protection Act, 어린이 온라인 사생활 보호법와 장난감에 명시된 개인정보 보호 정책을 위반하는 것이다.
- 웹캠 같은 제품은 제조사가 충분한 보안을 제공하지 않아 취약한 경우가 많다. 보안 기능을 추가하면 비용이 너무 많이 들어서, 또는 사용하기가 너무 복잡해진다고 판단해서 넣지 않았거나, 그냥 잘못 구현했을 수도 있다. 예를 들어, 2019년 말에 한 해커가 IoT 기기 50만 개의 IP 주소와 텔 넷 비밀번호를 게시한 사건이 있었다. 해커는 22번 포트로 응답하는 장치 를 훑어서 조사하고 admin'이나 'guest 같은 기본 계정과 비밀번호로 로 그인을 시도하여 이 정보를 찾아냈다고 한다.
전력, 통신, 운송을 포함한 다양한 인프라 시스템이 보안 면에서 충분히 주의를 기울이지 않은 채로 인터넷에 연결되기도 했다. 일례로 2015년 12 월에 보도된 바로는 특정 제조사의 풍력 터빈에 웹 기반 관리 인터페이스가 있는데, 매우 간단한 방식으로(단지 URL을 편집함으로써) 공격해서 터빈이 생성하는 전력을 차단할 수 있었다고 한다.
- 인터넷에서 가장 눈에 띄는 부분은 월드 와이드 웹World Wide Web 으로, 지금 은 그냥 '웹'이라고 한다. 인터넷과 웹을 하나로 보는 경향도 있지만, 둘은 서로 다르다. 인터넷은 전 세계의 수많은 컴퓨터가 서로 쉽게 정보를 교환할 수 있도록 하는 통신 인프라 또는 하위 계층이다. 웹은 정보를 제공하 는 컴퓨터(서버)와 정보를 요청하는 컴퓨터(여러분과 나 같은 클라이언 트)를 연결한다. 웹은 인터넷을 사용하여 연결을 맺고 정보를 전달하며 다른 인터넷 기반 서비스에 접근하기 위한 인터페이스를 제공한다.
많은 훌륭한 아이디어가 그렇듯, 웹도 본질적으로 간단하다. 어디에나 있고 효율적이며 개방적이고 기본적으로 무료인 하부 네트워크가 존재한다는 전제하에(매우 중요한 조건이다) 중요한 것은 다음 네 가지뿐이다.
첫 번째는 URLUniform Resource Locator, 균일 자원 지시자이다. URL은 http://WWW.amazon.com처럼 정보의 출처에 대한 이름을 지정한다.
두 번째는 HTTP Hypertext Transfer Protocol, 하이퍼텍스트 전송 프로토콜이다. HTTP는 상위 레벨 프로토콜의 예로 간략하게 언급한 바 있다. HTTP 클라이언트가 특정 URL에 대한 요청을 보내면 서버는 요청된 정보를 반환한다.
세 번째는 HTMLHypertext Markup Language, 하이퍼텍스트 마크업 언어이다. HTML은 서버가 반환하는 정보 서식이나 표시 방식을 설명하기 위한 언어다. HTML도 간단하며 조금만 알아도 기본적인 사용법을 익힐 수 있다.
마지막으로 브라우저browser가 있다. 브라우저는 컴퓨터에서 실행되는 크 롬, 파이어폭스, 사파리, 엣지 같은 프로그램으로, URL과 HTTP를 사용하 여 서버에 요청을 보내고 서버에서 보낸 HTML을 가져와서 표시한다.
- VPNVirtual Private Network, 가상 사설망은 두 컴퓨터 간에 암호화된 통신 경로를 설정하여 일반적으로는 정보 흐름을 양방향으로 안전하게 보호한다. 기업에서는 직원들이 집에서 일하거나 통신 네트워크 보안을 신뢰할 수 없는 국가에서 일할 수 있게 하고자 VPN을 자주 이용한다. 개인 사용자는 VPN을 사용하여 개방형 와이파이를 제공하는 카페나 다른 장소에서 더 안전하게 작업할 수 있다. 하지만 사용 중인 VPN을 어느 업체가 운영하는지 확인하고, 사용자 정보를 공개하라는 정부 압력에 그 업체가 얼마나 맞설 수 있을지 생각해 보기 바란다.
- 공개 키 암호 기법에는 다른 유용한 속성이 있다. 예를 들면, 공개 키 암호 기법은 디지털 서명 digital signature 방식을 구현하는 데 사용된다. 사기꾼이 아니라 앨리스가 메시지를 보냈음을 수신자가 확신할 수 있도록 앨리스가 메시지에 서명하고 싶다고 하자. 그녀가 자신의 개인 키로 메시지를 암호화하고 그 결과를 보내면 누구나 그녀의 공개 키로 메시지를 해독한 다. 앨리스가 자신의 개인 키를 아는 유일한 사람이라면 메시지는 분명히 앨리스에 의해 암호화되었을 것이다. 이 방식은 앨리스의 개인 키가 해킹 되지 않았을 때만 작동한다.
앨리스가 밥에게 보내는 비공개 메시지에 어떻게 서명할 수 있을까? 이 는 메시지가 앨리스가 보낸 것임을 분명히 하는 동시에, 밥 이외의 다른 사람이 메시지를 읽을 수 없게 하려면 꼭 필요한 절차다. 앨리스는 먼저 밥에게 보낼 메시지에 자신의 개인 키로 서명한 다음에 그 결과를 밥의 공 개 키로 암호화한다. 이브는 앨리스가 밥에게 무언가 보냈음을 알 수 있지 만, 밥만 그 메시지를 해독할 수 있다. 밥은 바깥쪽 메시지를 자신의 개인 키로 해독한 다음에 안쪽 메시지를 앨리스의 공개 키로 해독하여 메시지가 앨리스에게서 왔음을 확인한다.








'IT' 카테고리의 다른 글

처음 읽는 양자컴퓨터 이야기  (0) 2022.07.07
웹 3.0 레볼루션  (0) 2022.07.03
블록체인 경제  (0) 2022.05.11
포스트 메타버스  (0) 2022.05.11
빅데이터 사용 설명서  (0) 2022.05.07
Posted by dalai
,

블록체인 경제

IT 2022. 5. 11. 19:51

- ICO를 통해 자금을 조달하는 방식은 최근보다 진화되고 있다. 제2세대 블록체인 시대에서 백서만 제시하고 투자금을 유치하는 ICO 방식과는 달리 거래소와 ICO와 함께하는 자금 조달 방식으로 새롭게 부상하고 있는 IEO (Initial Exchange Offering)의 진행이 바로 그것이다. IEO는 MVP (Minimum Viable Product)를 개발한 후 자금을 유치하기 때문에 최소한의 개발 자금만 확 보한 후 거래소 상장 전에 Private Sale을 통해 자금을 확보하는 방식이다. 그 이후 암호화폐 거래소에 상장을 통해 공시를 하고 추가적인 소요 자금을 유 치하는 방법이다. 이 방식은 투자자 입장에서는 IEO 기업이 비즈니스 생태 계의 완성을 위해 어느 정도 필요한 기술, 인력, 조직체계 등을 가지고 있는 지 여부를 검증할 수 있다. 따라서 블록체인 기업들은 ICO 보다 투자에 대한 불안감이 줄어들 수 있는 IEO 방식을 투자 유치 방식으로 채택하는 경우가 증가하고 있다.
- STO (Security Token Offering)는 토큰을 발행하는 기업 자산에 대한 소유권을 의미한다. 자산은 현물로서 증권, 다이아몬드, 금·은, 부동산, 그림 등 다양 하다. 이들 현물을 토큰으로 만들어 크라우드 펀딩을 만드는 방식으로 국내 에서도 그 사례가 있다. 주식과 비슷한 개념으로 ICO를 통해 얻는 토큰은 유틸리티 토큰이 대부분이지만 STO로 얻는 토큰은 토큰 발행 기업의 이윤 일부를 배당받거나 경영권 일부를 소유할 수도 있다. 또한 큰 금액의 현물 자산을 구매할 수 없는 소비자도 작은 금액으로 가치 있는 현물 자산을 토 큰으로 구매할 수 있다. STO는 아직 초기시장이지만 블록체인 경제가 발전 하게 되면 이 분야의 수요와 비즈니스 모델도 증가할 것으로 예측된다.
- 런던대학교 경제학자인 Paolo 교수는 블록체인이 진정한 공유경제를 실 현할 수 있는 동인(enabler)으로 보고 있다. 그는 블록체인의 제도적 기술을 다음과 같이 설명하고 있다.
* 자본주의 시장의 기초
* 기술의 사회적 메가 트렌드(Mega Socio-Techno Trends)
* 새로운 경제 패러다임의 출현 
* 블록 체인은 진정한 공유 경제를 가능하게 만드는 촉매제
- 블록체인 상의 암호화 기술은 2가지 기법을 사용한다. 
첫째, 전자서명 기술이 사용된다. 암호화폐를 주고받으려면 은행에서 계좌이체와 비슷한 절차로 화폐의 지불 승인을 위한 전자서명 기술이 필요하다. 디지털 문서의 인증과 부인 방지를 목적으로 공개키 암호화 기술을 사용한다. 비트코인을 주고받을 때는 전자서명 (digital signature)이라는 공개키 기반의 암호기술을 이용 하여 자신의 개인키 (private key)로 본인 인증이 가능하도록 하였다. 여기에서 사용되는 공개키는 타인으로 부터 코인을 전송받을 때의 수취인의 지갑 주 소이며 개인키는 내 지갑에 담김 내용물(암호화폐 또는 콘텐츠)를 열 수 있는 (복 호화) 열쇠이다.
둘째, 해시(hash) 암호기술을 사용한다. 거래 내역을 블록화하여 분산 저장 하는 분산 장부 기술로 거래의 블록을 생성할 때, 해시는 해당 블록에 포함된 데이터와 이전 블록의 해시를 기반으로 생성된다. 이러한 해시 식별자는 블록체인 보안과 불변성을 유지하는 데 중요한 역할을 수행한다. 여기서 해시는 해시함수를 의미하는데 다양한 길이의 문장을 입력값으로 제공하더라도 함수의 출력값은 항상 일정한 길이를 갖는 일방향 함수이다. 해시함수는 암호화폐 거래 내역이 기록된 블록에 적용되고 블록체인을 연결하는 과정 에서 프로토콜로 정의하고 있다. 예를 들어 비트코인의 경우, SHA-256 암 호 해시 알고리즘을 사용하여 '작업(work)'증명을 한다. 일방향 해시 암호 알 고리즘으로 비트코인이 작동하는 것을 알 수 있다. 블록체인에서 사용되는 암호기술의 역할은 3가지로 요약해 볼 수 있다.
* 디지털화폐의 지불과 교환에 필요한 전자서명 기술
* 거래내역과 블록의 무결성을 유지
* 그밖의 외부 침입자로부터 위험을 예방하기 위한 플랫폼 보안관리

- 1974년 12월 빈튼서프(Vintoncerf)와 로버트 칸(Robert Kathan)은 혁신적인 전송제어 프로토콜/인터넷 프로토콜(Transmission Control/Internet Protocol)을 설계 한다. 이 프로토콜이 국제표준이 된 이후 디지털 경제 시대가 열리게 되었고 전세계 많은 사람들이 이용할 수 있는 공용 인프라가 되었다. 인터넷을 중심 으로 새롭고 혁신적인 비즈니스 방식을 도입함으로써 경제패러다임을 근본 적으로 바꾸는 계기가 되었으며, 다양한 비즈니스 모델 창출 및 상품과 서비 스의 거래방식에 엄청난 변화를 가져다주었다. 즉 디지털 기술이 비즈니스 의 모든 영역에 통합되어 운영 방식을 근본적으로 변화시키면서 고객에게 는 새로운 가치를 제공하는 디지털 트랜스포메이션 시대가 열린 것이다.
- 인터넷은 네트위그 기술 중 하나로 OST 7Layer 중 3층(TCP)과 4층(1P) 에 위치하는 TCP/IP 국제표준 바로토골이다. INTER와 NET가 합쳐진 합 성어로 서버와 클라이언트가 자율적으로 서비스하는 오픈시스템이다. 인 터넷은 프로토콜의 한 종류이다. 그러나 정보의 공유와 연결을 확대시켜 준 기술은 HTML(Hyper Text Markup) Language)이다. 이 언어는 월드와이드 웹 문서를 작성할 수 있는 마그업(markup) 언어이기도 하다. 월드와이드웹 (WorldWicle-Web)은 HTTP 프로토콜, 하이퍼텍스트(HYPERTEXT), HTML 형식 등을 사용하여 그림과 문자를 교환하는 전송방식이다. 이때 인터넷의 핵심은 바로 HYPERTEXT이며 이것은 인터넷을 움직이는 기술로서 누구나 인 터넷을 쉽게 사용할 수 있는 기술이 되었다.  이처럼 인터넷은 프로토콜(TCP/IP)이라는 표준화된 기술적 특성과 월드와이드웹이라는 언어가 서로 결합되어 새로운 경제 모델인 인터넷 경제를 탄생시킨 것이다. 1990년 인터넷이 전세계로 확산되어 e-비즈니스의 생태 계를 만들 수 있었던 이유도 바로 월드와이드웹(WWW)이 개발되어 상용화 되었기 때문이다. 이처럼 인터넷 프로토콜은 지금도 디지털 경제를 주도하 는 중심 축이 되고 있다. 
- 우리는 블록체인을 프로토콜 또는 프로토콜 경제라고 말한다. 왜 블록체 인을 프로토콜이라고 정의할까? 일반적으로 프로토콜은 통신규약으로 이해하고 있다. 그러나 여기서 말하는 블록체인 프로토콜이란 경제 시스템에 적용되는 모든 규칙 (protocol)이 프로그램을 통해 작동되는 것을 의미한다. 상 거래에 필요한 제도, 원칙, 거래방법, 거래주체, 지불방식, 거래조건 등은 블 록체인 프로토콜에서 적용되는 규칙으로서 블록체인의 핵심범용기술에 담 기게 된다. 이러한 범용기술은 현실세계의 비즈니스 로직을 쉽게 설계하여 적용할 수 있다.  블록체인을 프로토콜이라고 강조할 수 있는 계기는 바로 이더리움에서 스마트계약이 등장한 이후 블록체인 비즈니스 생태계가 형성되면서 시작된다. 전세계가 인터 기반의 비즈니스를 수행할 수 있었던 것은 인터넷 프로토콜의 국제표준화 작업과 오픈 소스화가 제공되었기 때문이다. 블록체인이  진정한 프로토콜이 되기 위해서는 국제표준화 단체에서 이에 대한 지속 적인 연구와 산학연 협업이 이루어져 프로토콜 표준화 및 오픈화가 이루어져야 할 것이다.  블록체인 프로토콜은 인터넷 프로토콜과 달리 아직 국제표준화 기구를 통해 공식적으로 표준화 작업이 이루어지지 않은 상태이다. 다만 자체 메인넷을 운영하고 있는 이더리움, 이오에스, 폴카닷 등은 해당 네트워크 생태계 내에서 표준 기술을 제공하고 있다. 블록체인 프로토콜이 국제표준화가 이루어진다면 블록체인 경제는 지금보다 더욱 빠른 속도로 비즈니스 생태계가 확산되고 관련 기술도 발전할 것으로 예측하고 있다.
- 인터넷 프로토콜과 블록체인 프로토콜의 레이어를 비교해보자. 블록체인 프로토콜의 범위는 인터넷의 프로토콜 범위보다 더 넓게 느껴진다. 그 이유는 인터넷은 정보 공유를 위해 노드간 연 결과 데이터 전송을 담당하는 역할을 수행하는 반면, 블록체인은 참여자의 노드에서 거래한 데이터를 저장하고 권한을 관리하며, 거래의 완성을 위해 노드들 간의 합의 기능 등을 포함하고 있다. 블록체인 프로토콜 영역에서 작 동되는 기능이 인터넷 프로토콜 기능보다 많다는 것을 짐작할 수 있다. 블록 체인은 경제 시스템의 규약을 처리하기 때문에 이처럼 다양한 기능을 반영 하고 있어 인터넷 레이어 층의 역할에 비해 프로토콜 층의 두께가 더 두터워 보인다.
- 인터넷 경제에서는 대부분의 가치는 응용 층에서 제공하였다. 즉 응용 층의 가치는 중앙화 된 데이터베이스가 차지하였기 때문이다. 그래서 RDB 데이터베이스를 판매한 벤더사들은 많은 수익을 얻 게 되었다. 그러나 블록체인 경제가 성장하면서 과거에 응용 층에 집중된 주요 데이터와 가치는 프로토콜 층으로 이동하는 것을 볼 수 있다. 따라서 프 로토콜에 의해 발행되는 토큰(암호화폐)의 가치는 아래 그림처럼 더욱 커질 것으로 예측된다. 따라서 그 혜택은 블록체인 네트워크를 생성하고 참여하 는 사람들에게 귀결될 것이다.
- 토큰은 독립된 블록체인 네트워크를 소유하지 않은 경우이다. 이더리움 네트워크에서 ERC-20 형태로 발행된 초기의 이오스(EOS)와 트론(TRX) 등 이 이러한 토큰에 해당될 수 있다. 토큰은 암호화폐가 상장되기 전 자신의 블록체인 네트워크가 없거나 완성되지 않아 기존의 다른 네트워크를 사용 하여 발행하는 암호화폐를 말한다. 이 토큰은 블록체인 프로젝트의 투자자 금을 모집하거나 생태계 확산 등의 목적으로 자체 메인넷의 완성 전에 발행 하는 것이 특징이다.
독립된 블록체인 네트워크 즉, 메인넷을 보유한 경우 그 메인넷에서 발행 된 토큰은 코인으로 부른다. 비트코인(BTC), 이더리움(ETH), 스팀(STEEM), 넴 (NEM) 등이 여기에 해당된다. 자체 블록체인 네트워크를 보유하고, 완성된 자신의 메인넷에서 발행되는 암호화폐가 코인이다. 거래소에서 이 코인은 공식적으로 수수료를 지불하면서 유통된다. 또한 해당 플랫폼(마켓플레이스)에 서 상품과 서비스 구매를 위한 지불 수단으로 사용된다. 위에서 살펴본 이오스(EOS)와 트론(TRX)도 자체 메인넷을 개발한 후 토큰에서 코인이 되었다.
따라서 토큰은 코인에 비해 더 넓은 기능을 가지고 있다. 코인의 분명 한 목적은 화폐처럼 사용되어, 가치의 저장, 가치의 이전 수단 등으로 활용하는 데 목적이 있다. 이더리움의 ERC-20 표준을 기반으로 많은 토큰들 이 탄생하였고 그 수는 계속해서 증가하고 있다. 이처럼 현재 수많은 토큰 이 ERC-20 표준을 기반으로 만들어지는 상황에서 이더리움 네트워크 토 큰들 간의 자유로운 탈중앙화 거래가 가능하도록 하는 오픈 프로토콜인 ON(ZR)가 있다.  블록체인 네트워크에서 제공하는 코인은 해당 플랫폼 또는 타 서비스에 서 교환이 가능하고 장차 실생활에서 현금처럼 사용될 수도 있다. 토큰 경제의 3가지 필수 요소를 위해 코인이 사용된다. 첫째, 상과 벌을 제공할 때 쓰인다. 둘째, 거래를 위한 교환 수단 또는 가치의 저장 수단으로 사용될 수 있 다. 셋째, 블록체인 네트워크 인프라 구축과 운영을 위한 경제적 유인책으로 사용된다. 따라서 적절히 구성된 토큰 경제는 코인 발행량, 참여자에 대한 보상, 부의 재분배 토큰의 편중에 대한 방어) 및 지속적인 서비스 참여까지를 고려하여 설계되어야 한다.
- 경제학 관점에서 비트코인의 가치는 학자들마다 약간의 차이는 있으나 공통점은 네 가지로 요약할 수 있겠다. 첫째, 비트코인은 개인 간의 송금 및 거래에서 결제 대용으로 사용되는 화폐로서의 가치를 지닌다. 둘째, 실물경제에서 화폐의 용도보다는 가치 저장이라는 자산의 성격을 포함하고 있다. 셋째, 금융기관, 비전통 금융(DeFi 등) 분야에서 다양한 파생상품 및 서비스 상품으로서 포트폴리오의 다각화에 우수한 수단이 되고 있다. 넷째, 금융 시 스템이 발달하지 못한 저개발국, 신흥국에서는 법정화폐로 인정되고 있다. 이처럼 비트코인이 담고 있는 가치는 이제 부인할 수 없는 현실이 되고 있음에 주목해야 한다.
- 비트코인은 지장 수단으로서, 암호화폐의 기축통화로서, 최초로 탄중앙화된 디지털 금융의 시초가 되었지만 금융 분야에서의 한정된 사용 성과 느린 기래 속도, 낮은 확장성, 그리고 분산화된 시스템에 의한 작업 증 명(POW)이라는 합의 도출 과정에서 많은 전력 소모와 컴퓨팅 자원을 사용 하는 단점을 지니고 있다. 이러한 문제점은 비금융산업으로 확산하는 데 제 해 요소로 작용하고 있다. 또한, 비트코인은 '스크립트 언어라는 튜링 불안 건성을 지니고 있기 때문에 이더리움의 스마트 컨트랙트와 달리 프로 그래 밍으로 모든 것을 구현하기 어렵다. 따라서 다양한 비즈니스 생태계를 구축 하는 것은 더욱 어려운 일이다. 그러나 초기에 등장한 1세대 블록체인 기술로서 비트코인은 단지 화폐의 교환과 기래에 초점을 둔 암호화폐로서 중개사 없이 기래의 신뢰를 보장하 고 김중하는 '글로벌 단일 금융 시스템'을 만들었다는 점에서 커다란 의의가 있다. 비트코인의 한계점은 2세대 블록체인인 이더리움이 등장과 함께 3세대에서 개선되민서 블록체인 경제를 만드는 인프라로 발전하게 된다.
- 2세대 블록체인인 이더리움(Ethereum)은 '스마트 컨트랙트'를 중심으로 계 약의 자동화가 이루어지는 단계이다. 블록체인 2.0에서는 이더리움의 스마 트 컨트랙트로 자율 계약을 구현할 수 있게 되었다. 스마트 계약은 블록체인 기술을 받쳐 주는 인프라로서 프로토콜 범주에 속한다. 이것은 블록체인 기반의 경제 모델을 솔리디티 (solidity) 언어로 코딩하여 거래 관련 업무가 자율 적으로 성사될 수 있도록 만드는 프로그램이다. 스마트 컨트랙트의 등장으로 블록체인 네트워크에서 암호화폐의 교환과 거래를 뛰어넘어 비즈니스를 실행할 수 있는 기반이 마련된 셈이다.
- 디지털 스마트 계약이 지니고 있는 특성을 토대로 경제 시스템 구축 및 운영 관점에서 토큰 경제의 생태계 발전 가능성을 정리하면 아래와 같다.
* 스마트 계약은 아직은 법이 아니다. 법적 구속력이 실현된다면 법준수 여부의 입증 자료로 활용될 수 있다. 
* 스마트 계약은 프로그래밍이 쉽다. 이더리움 솔리디티(solidity) 언 어 사용 시 몇줄의 코딩으로 복잡한 비즈니스 프로세스를 처리할 수 있다. 그러나 솔리디티 언어를 습득해야 한다. 
* 스마트 계약은 안전하다. 그리고 비즈니스 응용 범위가 다양하다.  현실 세계의 자산, 스마트 자산, 사물 인터넷, 금융 상품 등 다양한 관련 서비스 운영이 가능하다.
* 스마트 계약은 자산을 디지털화하여 통제 및 관리하기 때문에 계약위반시 비용이 크게 증가할 수 있다. 이것은 블록체인 기술 구조상 거래 정보를 원점으로 되돌리기는 어려운 문제로 앞으로 해결해야 할 과제 중의 하나이다.
- 이더리움 프로토콜은 여러 유형의 토큰을 발행할 수 있도록 ERC-20 (유틸리티 토큰), ERC-721 (NET), ERC-1400 (증권형 토콘) 등 표 준을 제공하고 있다. 이더리움에서 탄생한 DApp 서비스들은 바로 이러한 프로토콜을 사용하여 자신들이 원하는 성격의 토큰과 비즈니스 생태계를 만들고 있으며 이더리움에서 만들어진 그들의 토큰은 이더리움 가치가 상 승하면 영향을 받아 토큰의 가치가 함께 상승하는 효과를 얻기도 한다. 따라서 이더리움 플랫폼은 블록체인 비즈니스 생태계의 성장을 촉진하는 블록체인 경제 시스템의 한 인프라가 되는 셈이다.
- 블록체인 3.0은 기술이 사회 전반에 혁신·적용되는 시기로 정의할 수 있다. 3세대 블록체인 기술은 이전의 블록체인 기술이 가지고 있던 문제점을 개선하기 위해 블록체인 기업들이 기술적으로 다양한 시도와 변화를 추구 함에 따라 비즈니스 모델도 진화되고 있다. 또한, 비트코인의 처리 속도 및 성능을 개선하고 스마트 컨트랙트를 비즈니스 모델에 적용하면서 여러 유 형의 암호화폐가 등장한 것이다. 우리는 이것을 알트코인(Alternative Coin)이라고 부른다. 많은 알트코인들은 기존의 시장경제 모델과는 한 차원 다른 그 립토-파이낸스 축을 추가할 수 있게 함으로써 삼면시장의 모습으로 새로운 비즈니스 생태계를 구축할 수 있는 기회를 제공한다. 이 시기에 나타난 가장 큰 변화는 두 가지로 정리할 수 있다. 하나는 블록체인 기능 항상 측면의 기술 발전이며, 다른 하나는 블록체인 운영 측면에서의 제도적 발전이다.
- 샤딩이란 하나의 거대한 데이터베이스나 네트워크 시스템을 여러 개의 작은 조각으로 나누어 분산 저장하여 관리하는 것을 말한다. 이것은 데이터 를 수평 분할한다는 의미이며, 과도한 데이터 저장 문제로 용량 초과시 저장 공간 부족과 속도 저하 문제를 해결하기 위한 접근 방법이다. 2세대 블록체 인인 이더리움에서도 살펴보았듯이 P2P 네트워크에 참여하는 컴퓨터(Node) 가 많아질수록 전체 시스템의 효율성은 일반적으로 떨어지는 확장성 문제 가 존재하고 있다. 또한, 이더리움 네트워크 위에서 구현된 많은 DApp과 최 근 급증하는 DeFi DApp들로 인하여 이더리움 네트워크 속도가 심각하게 저하되었다. DApp이 많을수록 거래량이 많아지고 처리해야 할 합의 건수가 증가하기 때문에 높은 가스비 문제로 인한 성능의 이슈가 제기된 것이다. 이를 개선하기 위해 진행 중인 이더리움 2.0 프로젝트가 기대된다.
이더리움 2.0에서는 메인 네트워크를 하드포크하여 이중 레이어를 사용하고 있는데 1 레이어에서는 합의를 이루는 비콘체인 기술과 2 레이어에서는 샤딩 기술을 각각 적용하고 있다.
- 블록체인 오라클은 블록체인과 바깥 세계의 다리 역할로서 외부 데이터 자료를 요청하고, 검증하고, 증명하고, 해당 정보를 온체인에 전달하는 연결통로이다. 오라클을 통해 전송된 데이터는 가격 정보, 성공적인 결제 완료 정보 등 다양한 유형의 중요한 데이터가 될 수 있다. 중앙화된 외부 정보는 외부 공격에 취약할 수 있다. 반면, 탈 중앙화 오라클은 상대방의 거래 정보의 위험을 방지하며, 퍼블릭 블록체인과 같은 목표들을 일부 공유한다. 스마트 컨트랙트는 데이터 유효성과 정확성을 결정하기 위해 다수의 오라클에 요청을 보내어 오라클이 제공하는 데이터에 기반해 결정을 내린다.
- 지금까지 많은 블록체인 프로젝트가 런칭되고 개발되고 있다. 그 프로젝트들의 백서에는 나름의 토큰 경제 모델을 제시하고 있는데 이것은 백서의 핵심이 바로 토큰 경제 모델의 설계에 있으며, 미래 해당 생태계의 발전 가 능성을 그 모델에서 엿볼 수 있다. 또한, 블록체인 프로젝트에서 가장 어려 운 부분이 바로 토큰 경제 모델의 설계이다. 성공적인 암호화폐 생태계를 만 들고 유지하기 위해서 설계자는 비즈니스 관점, 기술 관점, 금융 관점 등에 대한 해박한 지식과 경험이 필요하다. 다음은 탈중앙화 구조에서 토큰 경제 모델을 설계하기 위해서 주목해야 할 사항들이다.
(1) 참여자들에게 부여되는 보상은 어떤 경제적인 유인 체계가 존재 하는가?
* 네트워크의 목적에 부합하는 인센티브 구조의 고안이 필요하다.
즉 보상(토큰)은 어떤 기준으로 참여자에게 줄 것인가? 
(2) 네트워크 수요와 토큰 수요를 연결하는 방법에 대해 고려해야 한다. 
* 토큰 발행량과 이 발행량을 어떻게 분배할 것인가? 
* 네트워크의 성장과 토큰의 가치 상승을 어떻게 연동할 것인가? 
* 경쟁통화 가격의 변화를 고려
(3) 경제활동 관련하여 정해진 정책, 규정 및 매개 변수를 변경할 경우, 어떤 기준으로 누가, 어떻게 변경할 것인가에 대한 거버넌스 체계 설계
(4) 블록체인 네트워크 밖에서 발생한 참여자의 행동과 관련 정보를 어떻게 입증할 것인가에 대한 데이터 오라클 관련 설계 등 
(5) 어떻게 토큰 경제가 지속적으로 성장하도록 할 것인가?
(6) 급격한 유동성에 대한 대응 전략을 수립하여야 한다.
* 토큰의 가격 변동성은 어떻게 해결할 것인가?
* 인플레이션 등 고려
- 토큰 발행 방식 
흔히 토큰은 DApp 실행을 통해 발행된다고 알고 있다. 토큰 발행은 발행 시점에 따라 두가지 방식을 취하는데 그것은 메인넷이 출시되기 이전과 메 인넷 출시 이후이며, 이 두가지 방식을 고려하여 토큰 이코노미를 설계하여야 한다.
메인넷 이전(Pre-Mainnet) 단계에도 토큰은 발행될 수 있다. 그것은 주로 크 라우드 펀딩 형태의 투자 자금 모금용 또는 회원 모집용으로 초기 블록체인 생태계의 시작 시점에 토큰 경제를 위한 토큰 메커니즘에서 활용한다. 메인 넷 이후 토큰은 알고리즘 방식에 의해 블록체인 네트워크에서 발행된다. 알고리즘 방식은 투자자용보다는 참여자 보상, 거버넌스의 안정적 운영 및 생태계 확산을 위한 토큰 메커니즘이다.
- 메인넷 이전 방식은 상장 전 이미 토큰을 발행하는 방식으로서 인센티브 용도로 얼마의 토큰을 할당하고, 주주에게 할당된 토큰량과 투자자에게 몇 %의 토큰을 제공할 것인가 등에 대한 정의가 사전에 이루어진다. 메인넷 이 전 단계에서는 흔히 ERC-20 형태의 토큰으로 토큰 이코노미가 운영되다. 가, 메인넷이 출시되는 단계에서는 해당 메인넷 코인이 발행되어 본격적인 플랫폼 코인 이코노미와 거버넌스가 작동하게 된다. 메인넷 이전 방식에서 토큰 이코노미가 운용됨에 따라 소각 등의 이유로 그 초기 수량이 감소했다. 면, 메인넷 출시 시점의 토큰 수량만큼 코인을 초기 발행하여 1:1로 스왑하 는 것이 일반적이다. 다른 방법으로는, 초기 메인넷 이전 발행량과 같은 수의 메인넷 코인을 발행하고 메인넷 이전 기간 동안 소각한 만큼의 코인은 소각한 뒤, 1:1로 스왑을 할 수도 있다.
- DeFi가 기존의 금융 서비스와 가장 큰 차이점은 4가지로 요약해볼 수 있겠다.
* DeFi는 특정 고객이 없다.
* 금융 시스템에서 제3의 신뢰기관 역할을 담당한 은행, 카드사 등 과 같은 중개인 없이 인터넷과 블록체인 기술에 의해 금융 서비스가 가능하다. 이 점이 중앙화된 시스템 안에서 법정화폐를 기반으 로 운영되는 핀테크나 CeFi (Centralized Finance)와 다르다.
* 탈중앙 네트워크에서 개인 간의 대출, 송금, 교환이 가능하며 투명성과 보안의 안정성도 제공된다.
* 대부분의 디파이는 블록체인의 디앱(DApp)에서 스마트 컨트랙트를 통해 구동된다. 즉 이 기능은 프로그래밍에 의해 작동된다.

- 오리진(Origin)은 P2P (Peer-to-Peer) 시장 및 전자 상거래 응용 프로그램을 만들 수 있는 오픈소스 플랫폼이다. 오리진 플랫폼은 글로벌 공유경제 시장 구축을 목표로 시작되었으며, 이 프로토콜이 지향하는 미래는 공유경제 시 장에 참여하는 구매자와 판매자가 자신이 소유하고 있는 재화와 서비스를 부분적으로 구매 및 판매할 수 있는 블록체인 기반의 공유경제 시장을 만드 는 데 두고 있다. 기존의 공유경제 모델과는 차별화된 블록체인 기반의 탈중 앙화된 분산구조로 이루어져 번거로운 거래 비용이 수반되지 않으며, 플랫 폼에 참여한 네트워크 참여자들에게 인센티브 체계에 따른 보상을 제공하고 있다.
- 삼면시장을 형성하는 시장경제를 만들겠다는 뜻이다. 이를 위해 오리진 프로토콜은 이더리움(Ethereum) 블록체인 및 IPFS (Interplanetary File System)를 사용하여 커뮤니티 참여자들이 오리진 플랫폼 상에서 서로 P2P 방식을 통 해 직접 상호작용이 가능하도록 하였고, 중개자 없이도 서비스와 제품을 직 접 거래할 수 있도록 상거래 네트워크를 활성화시키려고 노력하는 중이다.
또한 오리진의 OUSD (Origin Dollar)가 출시됨으로써 전체 디파이(DeFi) 생태계에서는 꼭 필요한 구성요소로 환영을 받고 있다.
- 블록체인 기반의 데이터 경제가 실현되기 위해서는 먼저 해결되어야 할 문제가 있다. 이것은 데이터 오라클(Oracle) 문제이다. 블록체인 네트워크를 기준으로 외부 오프체인 데이터가 블록체인 내부의 온체인 데이터와 상호 작용하기 위해서는 이런 환경을 만들어 줄 수 있는 중간 자가 필요하다. 그 것은 SW가 될 수 있고, 또 다른 인터페이스 장치 또는 수동으로 처리할 수 있는 사람이 될 수도 있다. 현실 세계와 블록체인의 중간에서 데이터를 블록 체인 안에 넣어줄 수 있는 역할이 필요한 것이다. 이것을 우리는 데이터 오 라클이라고 정의한다. 여기에서, 그 중간자 역할을 하는 사람이나 장치를 어 떻게 신뢰할 것인가 하는 문제가 발생된다. 오라클 문제는 하드웨어와 소프 트웨어 영역에 모두 존재한다. 하드웨어 문제는, 센서, IoT 디바이스, 내장형 디바이스 등의 오작동 문제이다. 소프트웨어 문제로는 자료를 수집하는 봇의 실수나 의도적인 왜곡, 빅데이터 분석기 에러, 인공지능의 오류, 소프트 웨어 버그, 해킹된 소프트웨어 등의 다양한 문제가 존재한다. 데이터 오라클 문제의 해결 방안에는 크게 세 가지가 있다.
첫째, 온체인 입장에서 암호화폐 소유자들의 투표로 선택할 오프체인 데이터를 결정하는 방법
둘째, 다양한 데이터의 중간값(Median)을 선택하는 방법 셋째, 신뢰할 수 있는 데이터를 제공해주는 중간자(Middleware)를 활용하는 방법이다.
제시하고 있는 3가지 방법은 현재 데이터 오라클 문제를 완전하게 해결하지는 못한 상태이다. 세번째 방법인 중간자 서비스 형태로 이 문제를 해결해 주는 사업체들이 각광을 받고 있다. 그 중에서도 Provable과 Chain Link에서 제공하는 데이터 오라클 서비스가 활발하다.
- 데이터 레이크의 특징은 원시 데이터(Raw Data)를 그대로 저장한다는 점 이다. DW에 데이터를 담기 위해서는 데이터를 추출 변형-적재(ETL)라는 과정을 거쳐야 했다. 구조가 각각 다른 DB에서 나온 데이터이기 때문에 하 나의 구조로 맞춰야 하기 때문이다. 그러나 데이터 레이크는 이런 ETL과 같 은 중간 과정이 필요없다. 다양한 원시 데이터를 저장해두고 있다가 분석을 할 때 필요한 형태로 데이터를 가공한다. 데이터를 저장하는 시점이 아니라 분석하는 시점에 정의하는 것이다. 이 때문에 즉시 ad-hoc) 분석이 가능하다. 대신 데이터 레이크에는 카탈로그'라는 기능이 필요하다. 어떤 데이터가 어 디에 저장돼 있는지 카탈로그를 만들어 놓고, 분석이 필요할 때 그것을 보고 필요한 데이터가 있는 곳의 데이터에 쉽게 접근하는 것이다.
데이터 레이크에서 한걸음 더 나아간 개념이 데이터 오션(Data Ocean)이다. 데이터 레이크가 그래도 약간의 특수한 비즈니스 영역별로 나누어 진다면, 데이터 오션은 그야말로 모든 영역의 데이터들이 표준화 형태인 사전처리 없이 저장되어 있는 곳이다. 의미 그대로 데이터의 바다인 셈이다.




'IT' 카테고리의 다른 글

웹 3.0 레볼루션  (0) 2022.07.03
1일 1로그 IT지식  (0) 2022.06.01
포스트 메타버스  (0) 2022.05.11
빅데이터 사용 설명서  (0) 2022.05.07
웹 3.0 메타버스  (0) 2022.05.07
Posted by dalai
,

포스트 메타버스

IT 2022. 5. 11. 19:50

- 가상현실, 증강현실 AR, 메타버스 같은 것들은 역사적으로 함께 발전해 오다가 최근 들어 더욱 주목을 받고 있다. 개념을 다시 한번 정리하고 넘어가자, 가상현실은 인간을 가상 세계로 들여보내는 것이고 증강현실은 거꾸로 컴퓨터 안의 가상 세계를 3차원 세계로 흩어내는 것이다. 개념적으로 보면 가상현실과 증강현실은 정반대라고도 볼 수 있다. 그리고 가상현실과 증강현실 사이의 적절한 혼합으로 혼합현실 MR이 존재하고, VR과 MR과 AR을 통틀어 확장현실R이라는 용어가 통용되고 있다.
- 현실 공간에 가상현실의 일부를 가져오는 것을 증강현실Augmented Reality , 가상 공간에 현실의 일부를 가져가는 것을 증강가상Augmented Virtuality 이라고 부른다. 우리가 보고 싶은 걸 보여주는 게 증강현실이라면, 보고 싶지 않은 걸 없애는 것은 감소현실 Diminished Reality 이라고 한다. 그리고 우리가 있는 공간이나 물리적 객체를 매개로 해서 새로운 정보나 공간을 연결하는 것을 매개현실 Mediated Reality 이라고 부르기도 한다. 가상과 현실을 넘나드는 이러한 개념이 메타버스와 연결되면 새로운 가치를 만들어낼 수 있을 것으로 기대 되고 있다. 그런 의미에서 메타버스는 매개현실 또는 현실과 가상을 융합 한 확장 가상 세계라고 할 수 있다. 이 확장 가상 세계는 키보드와 마우스로 접근할 수도 있지만, 아바타를 활용하여 탐색할 수도 있다. 동시에 일상의 현실과도 연결되어 있으므로 일상의 활동도 할 수 있는 공간이다. 따라서 혼합현실 Mixed Reality 을 기반으로 우리 상상력을 가미해 만들어내는 다양한 층위의 매개현실, 또는 확장 가상세계, 그것이 바로 메타버스라고 할 수 있다.
- 메타버스의 정의
사람들이 바라보는 메타버스라는 단어가 혼란스럽게 느껴질 수 있지만, 2007년에 메타버스에 대한 다양한 논의를 토대로 메타버스의 미래를 다룬 로드맵이 정리되었고 여기에 정확한 정의도 등장한다. '메타버스는 1가상으로 향상된 물리적 현실과 2 현실과의 연동으로 지속 가능한 가상 공간의 융합이라는 것이다.
- 보통 기술의 사이클에서 성공적으로 사람들의 관심을 모았다고 보는 수치를 1천만 명 정도라고 한다. 아이폰의 경우 처음 등장 한 것이 2007년이었는데, 2008년에 이미 판매량이 1천만 대를 넘 었다. 그리고 경제 활동이 가능한 규모인 1억 명을 언제 넘기느냐가 중요한데, 아이폰은 2011년에 1억 대가 팔렸고 2016년에는 10억 인구가 아이폰을 쓰고 있었다고 한다.
그렇다면 메타의 가상 세계를 경험할 수 있는 디바이스인 메타 퀘스트2의 판매 수치를 비교해볼 수 있을 것이다. 2020년 가을에 소개된 메타 퀘스트2가 아이폰보다 빨리 보급될 수 있을지 들여다봤을 때, 현재까지는 아이폰과 비슷한 보급 속도를 보이고 있다. 올해 중으로 1천만 대를 돌파할 것으로 보이는데, 얼리 어답터 외에 일반인들까지 구매에 동참해야 가능한 수치인 1억 대가 언제까지 팔릴지는 아직 미지수다. 하지만 1년에 10조 원씩 투입하여 2025년까지는 일상에서 메타버스를 경험하게 하겠다며 총력을 기울이고 있는 메타사의 비전을 보면, 1억 명까지도 가능하지 않을까 희망적인 전망을 기대할 수는 있을 것 같다.
그럼 10억 명까지는 어떨까. 아이폰의 경우를 벤치마킹해 본다면, 메타 퀘스트2가 2029년까지 10억 대가 팔리는지의 수치가 메타버스가 우리 일상에 스며들 수 있을지를 가늠하는 관건이 되지 않을까 싶다. 당장 메타버스가 실현되기를 기대하는 분들에게는 실망 스러운 통계일 수도 있겠지만, 냉정하게 봤을 때 메타버스가 정말일상적인 공간이 되기 위해서는 이 정도의 시각 프레임으로 느긋하게 바라볼 필요가 있다.
- 건축디자인 분야에서 우리는 아직 가상 공간의 이점을 활용하기보다는 기존의 패러다임에 갇혀있는 것 같다. 단순히 현실 세계를 모방하거나 현실에서 좋았던 공간을 가상 공간으로 옮기는 것이 아니라, 더 혁신적으로 예전의 것을 버리고 다양한 시도를 해보는 것이 필요하다. 건축물의 본래 목적은 사람들을 다양한 기후로부터 보호하는 목적을 가지고 있었다. 현실 공간과 가상 공간의 차이에서 언급했듯이 가상 공간은 기후에 영향을 받지 않는다. 결국, 가상 공간 안에서는 건축물의 필요성 자체부터 다시 생각해 봐야 할 것 이다. 또한 실제로 가상 공간 속 건축물이 필요하다면, 현실 세계의 연구 및 디자인 가이드라인을 따르는 것이 아닌 가상 공간 자체 안에서 어떤 공간에 더 만족감을 느끼고, 어떤 공간이 사람들의 창의성이나 퍼포먼스를 높여줄 수 있는지 등에 대한 많은 연구가 필요할 것이다. 그러한 가상 공간 가상 건축디자인 가이드라인이 만들어 진다면 공간의 기능성을 향상시키고 사람들에게 더욱 만족스러운 가상 공간이 되지 않을까. 이를 통해 메타버스가 우리의 일상에 스며든다면 지금보다 훨씬 많은 시간을 보내게 될 가상 세계가 사람들에게 보다 만족스러운 공간으로 구현될 수 있기를 바라본다.
- 메타버스가 현실 세계와 연결되려면 완전한 가상 요소보다는 증강현실이 특히 중요해질 것이다. 실생활에 가상의 것을 증강시키는 부분이 연결된다면 일상에서도 새로운 네트워크 세상이 열리는 셈이라고 본다. 지난 2년 전쯤 이런 부분에 대해 영국 에든버러 대학교의 로빈 윌리엄스 Robin Williams 교수 연구팀이 연구한 내용이 있다. 메타버스와 AR이 함께하는 것을 'Augmented duality'라고 표 현해서, 현실 세계에 있지만 동시에 증강된 새로운 세상을 느낄 수 있는 가능성을 메타버스가 제안한다는 것이었다.
그동안 많은 사람이 메타버스가 현실에 없는 새로운 세상을 만 드는 것처럼 여겨왔지만, 오히려 현실 부분을 증강된 현실에서 해볼 수 있는 새로운 기회로써 해석할 수도 있을 것이다.
장소성 연구는 공간이 지닌 여러 의미를 발견하고 지속적으로 학습하여 사람들이 원하는 공간에 최적의 서비스를 제공하는 메타버스와 결합하게 되면 새로운 기회를 제공할 수 있다. 이를 위해서는 첫 번째로 그 공간이 어떤 형태로 활용되는지를 이해해야 한다. 주말에 사람이 모이는 곳인지, 모여서 사회적인 행위를 하는 곳인지, 혹은 주로 어떤 놀이를 하는 곳인지 등 물리적인 공간에 축적된 다양한 의미를 발굴해야 한다. 두 번째는 현실 세계에 모여있는 사람들에게 어떤 장소성이 이 사람에게 가장 맞는 것인지 실시간 공간 의미를 추론할 수 있어야 하며, 마지막으로 그 내용에 따라 다양한 의미의 공간을 재구성할 수 있어야 할 것이다. 메타버스와 AR을 활용하면 일단 실제 공간에서 자신이 보지 못했던 장소의 다양한 의미를 이해하는 데 도움이 될 것이다. 예를 들면, 기존의 AR은 여행자에게 어떤 공간에 갔을 때 단순히 한 가지 종류의 정보를 전달하는 것 이상의 역할은 하지 못했다. 그런데 이 공간이 가지고 있는 사회적인 의미, 시간 축을 통해 다양하게 축적 된 사람들의 장소성을 경험할 수 있다면 공간에 대한 이해가 훨씬 새로워지지 않을까.
- 얼굴의 움직임 표현하기
이러한 가상 캐릭터들은 물론 몸의 움직임만이 아니라 얼굴의 움직임도 중요할 것이다. 디지털 세상에서 우리는 나를 있는 그대로 표현할 수도 있지만, 내가 표현하고 싶은 모습을 선택적으로 보여줄 수도 있다. 이를테면 나의 어린 시절 모습이나 혹은 나이 들었을 때 의 모습으로 얼굴을 표현할 수도 있는 것이다. 예전에는 이에 대한 데이터를 확보하는 것 자체가 쉽지 않았는데, 최근에 이르러서는 관련된 여러 기술이 발달하면서 다양한 표현이 가능해졌다. 사람의 얼굴을 보고 나이를 추정할 수 있는 기술이 개발되면서 거기에서 자동 으로 데이터를 만들어내고 학습할 수도 있게 된 것이다.
또 얼굴의 변화, 이를테면 하나의 형체가 전혀 다른 이미지로 변화하는 모핑 morphing 기술도 자연스럽게 표현할 수 있게 됐다. 한 예로 마이클 잭슨의 〈Black or White) 뮤직비디오를 보면 다양한 인종과 성별, 나이대의 사람들의 얼굴이 자연스럽게 바뀌면서 모든 사람이 평등하다는 메시지를 전한다. 최첨단 기술을 이용한 영상인 셈인데, 원래 이런 영상을 만들기 위해서는 앞사람의 눈코입이 다른 사람의 눈코입에 어떻게 대응되는지 일인이 손으로 지정을 해야 했다. 그래서 작년에 우리가 개발해 발표한 기술은 이런 모핑을 완전히 자동화시키는 것이다. 굳이 사람만이 아니라 동물이나 음식, 사물이라도 학습 네이터만 충분하다면 사람이 손을 전혀 대지 않고 무엇이든 자동으로 모평될 수 있도록 만든 프로그램이다. 마이클 잭슨의 뮤직비디오 같은 경우는 사람의 정면이 보여야 한다는 제약이 있 었지만, 이 프로그램에서는 얼굴만 보이는 강아지는 또는 몸 전체가 보이는 강아지는 알아서 대응되는 부분을 자동으로 계산해서 모핑이 이루어진다. 또 여러 개의 사진이 동시에 주어지더라도 그 안에 서 가장 적절한 모핑도 일어날 수 있다.
- 꿈을 해석한 대표적인 인물로는 정신분석학의 대가인 프로이 Sigmund Freud 와 라캉Jacques Lacan, 그리고 철학자 지젝 Slavoji Zizek 을 꼽을 수 있을 것 같다. 먼저 프로이트는 《꿈의 해석》이라는 책에서 꿈을 새로운 차원으로 해석한 유명한 학자이자 정신과 의사다. 프로이트가 새롭게 발견한 것이 바로 의식과 무의식의 세계다. 그는 무의식은 잠재된 욕망이며, 겉으로 드러난 의식보다 훨씬 큰 세계라고 보았다. 인간이 꿈을 꿀 때는 그 무의식에 담긴 욕망이 발현된다는 것이다. 라캉은 의식과 무의식의 세계를 3단계로 나눈다. 상상계 Imaginary는 인간이 태어나 언어를 배우기 전, 자신과 타인을 구분하지 못하는 단계다. 그러다 언어를 배우면서 상징계 Symbolic 에 들어오고, 그 상징계 너머에 인간이 실제로는 다다를 수 없는 가장 순수한 욕망의 세계가 실재계 Real라고 이야기한다. 그리고 꿈은 이 Real 세 계의 구현이라는 것이다. 현실 세계를 벗어나 진짜 꿈꾸고 싶은 자기 욕망을 구현하는 세계가 바로 Real의 세계다.
지젝은 이러한 라캉의 이론을 Sexuality에 빗대어 해석하기도 했다. 마스터베이션 Masturbation 과 실제 Sexual act를 비교해 보자. 마스터베이션은 상상 속의 파트너와 하는 행위이니 reall'은 아니고 당연히 파트너와 Sexual act를 하는 것이 실제 real'일 것이다. 그런데 지젝은 이런 의문을 제기한다. 실제로 우리의 이상적인 욕망을 가장 잘 구현하는 것은 마스터베이션일까, Sexual act일까? 사실 잠재적 인 욕망을 그대로 반영하는 마스터베이션이 Real 실재에 더 가까울지도 모른다. 그렇다면 실제로 일어나는 Sexual act는 실제 real이긴 하지만 라캉이 말하는 실재 Real의 세계는 아니지 않을까.  결국 우리가 현실이라고 믿고 있는 것이 현실이지만 '진짜'는 아니고, 반대로 가상이라고 믿고 있는 것은 현실이 아니지만 '진짜' 일 수도 있다는 이야기다. 우리의 욕망이 진짜 구체적으로 실현되는 곳이 현실이 아니라 꿈이라면, 그게 더 진짜 세계에 가까울 수도 있다는 것이다.
이처럼 가상 세계의 의미를 명쾌하게 해석하기는 쉽지 않다.
- 메타버스의 공간은 이러한 기상 세계의 이리 측면을 그대로 보여주고 있는 것이 아닐까, 어떤 민에서는 현실에서 억눌린 욕망을 가상 세계에서 구현하고자 하는 그 의지기 메티버스에서 다양한 형태로 니다니고 있다고 할 수도 있고, 다른 한편으로는 더 나아가 현실을 그대로 가상 공간에 옮기동이 더 현실 같은 공간으로 만드는 모습도 메타버스에 나타나기 때문이다. 요즘 메타버스에서 단순한 만남과 놀이 이외에도 다양한 비즈니스나 경제 활동이 벌어지고 있는 점이 그런 가능성을 말해주는 것은 아닐까. 가상 세계 메타버스의 해석은 지금부터가 시작인 셈이다.
- 보통 디지털 커뮤니케이션의 특징을 CMC Computer Mediated Communication 라고 이야기한다. 즉 면대면 커뮤니케이션이 아니라 컴퓨터를 매개로 하는 커뮤니케이션이라는 뜻이다. 그런데 어쩌면 앞으로는 CMC가 아니라 AMC Avatar Mediated Communication, (아바타 매개 커뮤니케이션)가 등장할 수도 있겠다는 생각이 든다. 아바타를 매개로 하는 가상공간의 커뮤니케이션이 굉장히 중요한 커뮤니케이션의 흐름이 될수도 있지 않을까. 실제로 가상의 아바타 모델이나 아바타 걸그룹이 등장하기도 했으니, AMC의 현실도 머지않아 실현될지도 모르겠다.
그런데 또 한편으로는 자기 캐릭터를 현실과 비슷하고 정교하게 만들려는 것과는 반대로, 최대한 단순하고 재미있게 만화처럼 바 꾸려고 하는 흐름도 있다. 특히 모바일 메타버스 게임에서 더욱 그런 특징이 발견된다. 이것은 아바타의 두 가지 상반된 측면인 셈이다. 왜 현실 세계의 인물과 비슷하지 않은 캐릭터 같은 모습을 취할까? 현실과 똑같은 아바타를 만들게 되면, 아바타에서 사람의 얼굴 부분이 굉장히 작은 비율로 그려질 수밖에 없기 때문이다. 사람과 사람이 대화할 때는 말뿐 아니라 표정이나 얼굴에 드러난 감정을 보는 것도 중요한데, 사람과 같은 비율로 만들어진 아바타의 얼굴로 는 풍부한 감정 표현을 나누기가 어렵다. 그래서 만화처럼 이등신이 나 삼등신의 캐릭터처럼 만드는 아바타가 선호되는 측면도 있는 것 이다.
어떻게 보면 자신을 꼭 닮은 아바타를 만드는 것이나 얼굴 모 양을 크게 만드는 것 양쪽 모두 메타버스 커뮤니케이션을 극대화하 기 위한 방식으로 볼 수 있다. 그러나 과연 어떤 것이 더 효과적이며 사용자의 욕망을 더 잘 구현할 수 있는지는 지켜볼 필요가 있을 것 같다.
- 언젠가 도래할지도 모르는 써로게이트〉의 세상은 과연 좋은 세상일까? 현실과 가상 세계가 합치되는 세계는 행복한 곳일까? 아 바타 매개 커뮤니케이션이 등장한다면 그것은 바람직한 변화일까? 이 대목에서 철학자 퍼트넘 Hilary Putnam 의 말을 되새겨 볼 필요가 있다. 그는 정보통신기술이 우리 생활을 더욱 개인화시킬 것이며, 인터넷의 확산으로 지구 반대편에 있는 사람들과는 더 가까운 관계 를 유지할 수 있겠지만, 정작 길 건너 사는 이웃과의 유대는 더욱 약 해질 것이라고 우려했다. 메타버스가 가져올 미래의 모습에는 아직 정답이 없다. 우리가 메타버스를 이야기할 때, 그곳이 즐거움을 느낄 수 있는 새로운 놀이공간일 수도 있지만 오히려 인간성이 상실 되고 소통이 단절되는 세계가 될 수도 있다는 측면도 함께 들여다봐야 한다.
- Ego or Alter Ego
사람들은 아바타를 어떻게 이용하고 있을까. Ego or Alter Ego, 자신을 표현하기 위해서 사용하거나, 아니면 또 다른 존재가 되기 의해서 사용한다. Microsoft Research에서 2016년에 공개한 데모를 보면, 어린아이가 움직이고 말하는 것을 여러 대의 카메라로 찍어서 바로 가상 아바타로 만든 다음에 어린아이의 아빠가 있는 별개의 공간에 전송한다. 그러면 아빠는 딸이 마치 자신과 같은 공간에 있는 것처럼 느끼고 대화할 수 있게 된다. 이럴 때 아바타는 사용자의 외양이나 움 직임 등을 그대로 모사하여 사용자의 Ego를 표현하는 것이다. 하지만 모든 아바타가 Ego를 표현하는 것은 아니고, 자신이 아니라 자신이 되고 싶은 Alter Ego를 표현하기도 한다. 미국에 일종의 복면가왕과 같은 프로그램 (Alter Ego)에서는 사람이 나오지 않고 아바타로 등장해서 심사위원 앞에서 노래를 부르는 장면을 볼 수 있다. 여기에서는 여러 여건 때문에 가수가 되지 못한 출연자들이 자신의 실제 모습이 아닌 아바타로 자신을 표현하며 노래를 부르는데, 이런 것이 아바타가 Alter Ego를 표현한 예라고 할 수 있다.
- 신체에 직접 자극을 주는 하드웨어적 방법 외에 소프트웨어적인 조작만으로 촉각 정보를 증강시킬 수도 있다. 예를 들어 VR 헤드셋을 착용한 상태에서 가상의 물체를 쥐고 들어올릴 때 내 실제 손의 위치보다 가상의 손의 위치를 더 아래쪽으로 보여주게 되면, 내 몸이 느끼는 손의 위치 정보와 내 눈에 보여지는 손의 위치 정보가 불일치하게 되고, 뇌에서는 이런 감각 정보 간의 충돌이나 불일치를 그 가상 물체가 무겁다고 착각하게 된다는 연구 결과가 있다. 이 경 우 촉각 정보는 아예 조작하지 않고 시각 정보만 왜곡해 제시함으로 써 뇌가 이것을 촉각 정보로 잘못 해석하도록 만드는 방법이다. 이런 방법을 Control/Display ratio 조작이라고 한다.
- 주의의 두 가지 종류
주의는 가장 일반적으로 하향식 주의와 상향식 주의로 나뉜다.
하향식 주의는 그 사람의 의지에 의해서 자발적으로 통제되는 주의기능이다. 예를 들어 공항에서 짐 가방을 찾을 때 보통 사람이라면 공항 바닥이나 천장에 집중하는 게 아니라 짐이 나오는 컨베이어 벨 트 위에 집중할 것이다. 짐 가방이 보통 그곳에서 나타난다는 지식 을 가지고 있어서 자발적으로 시선을 그쪽에 두기 때문이다.
반면 상향식 주의는 본인 의지가 아니라 외부 자극의 특성에 의해서 반사적으로 통제되는 주의 기능이다. 예를 들어 짐 가방을 찾는 도중 어딘가에서 큰 화재 경보 알람이 들린다면 내 의지와 상 관없이 소리가 나는 쪽을 쳐다보게 될 것이다. 이렇게 갑작스럽거나 아주 강한 자극의 특성 때문에 반사적으로 통제되는 주의를 상향식 주의라고 한다.
이 두 가지 주의 기능은 뇌에서 각각 다른 영역에 의해 작용하기 때문에, 주의를 유도하는 방법 역시 다르다. 하향식 주의 기능을 이용하는 가장 고전적 방법은 화살표 같은 내생적인 단서를 사용하 는 것이다. 우리는 어릴 때부터 학습을 통해 화살표의 의미를 너무 잘 알고 있기 때문에 오른쪽을 가리키는 화살표를 보는 순간 자발적 으로 화살표가 가리키는 오른쪽 방향으로 주의를 옮기게 된다. 화살 표 같은 단서들은 우리가 내적으로 의미를 해석한 결과로써 주의가 유도되기 때문에, 내생적 단서라고 부른다.
반면 상향식 주의를 이용하는 주의 유도 방법은, 주의를 유도하고 싶은 바로 그 위치에 매우 강하거나 갑작스러운 자극을 제시하 는 것이다. 갑자기 무엇이 움직이거나 빛이 깜빡이는 등의 자극이 나타나면 사람들이 반사적으로 그곳으로 주의를 옮기게 되는데, 이 경우 외부 자극의 특성에 의해서 주의가 유도되므로 외생적 단서라 고 부른다.
- 메타버스에서 아바타의 움직임과 인터랙션
이렇게 뇌의 운동 피질이 보내는 신호를 통해 신체의 움직임을 직접 통제할 수 있는 반면, 메타버스에서 아바타의 움직임은 그보다 훨씬 간접적으로 통제될 수밖에 없다. 사실 가장 기초적인 아바타 움직임의 통제 방법은 컨트롤러나 키보드 같은 간접적인 장치를 이용하는 것이다. 이 경우에 사용자가 버튼을 누르는 행위와 아바타의 움직임이 임의의 규칙으로 대응되어 있기 때문에, 규칙 자체를 익히 고 사용하는 데 사람의 많은 인지 자원이 소모되고 인터랙션의 효율 성이 떨어질 수밖에 없다.
그래서 최근에는 보다 직관적으로 아바타 움직임을 통제하는 방법이 많이 사용되고 있다. 즉, 트래킹이나 모션 캡처 방식을 사용해서 실제 사람의 움직임을 아바타의 움직임으로 재현하는 것이다. 실제 손의 움직임을 트래킹해서 아바타 움직임에 적용한다든지, 전 신의 움직임을 모션 캡처 기술로 추적해서 아바타 신체 움직임으로 재현해주기도 한다. 이러한 방법들은 본인의 신체 움직임 그대로 직접 아바타를 조종할 수 있기 때문에 중간 매개 장치를 이용하는 간 접적 통제 방법에 비해 훨씬 효율적이고 직관적이다.
하지만 현실 세계의 움직임과 달리, 메타버스에서의 움직임은 공간의 차이 때문에 여러 제약과 한계점도 지니고 있다. 특히 가상 현실을 생각해 보면, 실제 사용자의 몸이 위치하는 실내 공간은 협소하지만 가상 세계 공간은 끝없이 광활하다. 따라서 사용자의 실제 움직임을 트래킹해서 그대로 아바타 움직임으로 재현하기에는 큰 동작이나 이동 거리에 제한이 생길 수밖에 없다.
이런 한계점을 극복하기 위해서 크게 두 가지 방법이 사용되고 있다. 첫째는 트레드밀처럼 하드웨어적 장치를 사용해 걷거나 뛰거 나 점프하는 동작을 실제 이동 없이 제자리에서 하도록 하는 것 이다. 또 다른 방법은 리디렉티드 워킹 redirected walking 과 같이 실제 신 체의 이동과 시각적으로 주어지는 아바타의 움직임을 사용자가 지 각하지 못할 만큼만 조금 다르게 제공해서 실제 공간보다 더 큰 공 간을 탐험할 수 있도록 하는 방법이다.
- 가장 기본적인 청각 처리가 이루어진 다음에는 더 상위 레벨에서의 다양한 언어적인 이해 과정이 수반되어야 할 것이다. 이 때 먼저 음성 음운 분석이 이루어진다. 예를 들어서 'lion' 이라는 단 어를 들었다고 하면, 일단 'li'까지 들었을 때 여기에 매칭되는 모든 단어가 머릿속에 떠오르게 된다. 'lie, liar, lion 등의 단어들이 떠오 르다가 단어를 끝까지 다 듣고 나면 lion'을 제외한 나머지 단어들은 모두 탈락하고 내가 들은 단어를 인지하게 되는 것이다. 그 다음에 는 우리 머릿속에 있는 일종의 사전, 멘탈 렉시콘 mental lexicon 에서 이 단어의 발음과 의미, 문법 정보 등을 순식간에 끄집어낸다. 이렇게 음성이 나오기 시작해서 어휘 처리까지 이루어지는 과정은 약 400밀리초 정도, 즉 1초의 반도 안 되는 짧은 시간밖에 걸리지 않 는다. 특히 우리 머릿속에는 수도 없이 많은 어휘 정보가 들어있는 데, 이 단어들은 무작위로 존재하는 것이 아니라 의미상 연관이 있는 단어들끼리 더 긴밀한 네트워크를 형성한다. 그래서 'lion'이라는 단어를 들으면 '사자 갈기’, ‘고양이', '호랑이' 등의 단어가 같이 떠오 르며 활성화되고, 관련 단어에 대한 반응 속도도 훨씬 빨라지게 된다.
어휘 정보를 처리한 다음에는 당연히 문법 정보를 파악해야 할 것이다. 문장의 의미를 파악하기 위해서 통사 구조를 분석하게 된다. 예를 들면, 이 문장에서 무엇이 명사이고 동사이며, 무엇이 주어, 목적어인지 문장의 문법 정보를 이해하는 것이다. 또한 언어를 이해하기 위해서 우리는 여러 가지 상황이나 문맥 정보도 반영한다. 심지어 단어에는 나타나지 않는 숨은 화자의 의도까지 파악하는 것이 바로 우리가 하는 언어 처리 과정이다. 이러한 일련의 과정을 거쳐서 우리가 최종적으로 음성언어를 이해하게 되는 것이다.
- 메타버스에서 음성언어적 소통
음성학자로서 메타버스에서의 의사소통에 대해 생각해 보면, 언어적 표현과 비언어적 표현에 대한 기술적 개발이 모두 필요하지 않을까 싶다. 우선 언어적 측면을 살펴보면, 우리는 청각 정보와 시각 정보 를 동시에 활용하여 말소리를 인지한다. 그런데 메타버스에서 아바 타를 활용해 소통할 때 아바타에는 이런 시각적인 정보가 결여되어 있고, 따라서 음성 인지가 좀 더 어려워지며 듣기 노력이 증가할 수 밖에 없을 것이다. 듣기 노력이 증가하면 자연히 듣기의 피로도가 증가하는 것이기 때문에, 이것이 메타버스 사용의 피로도와도 연관 이 될 수 있다. 그래서 과연 이 피로도를 낮추고 좀 더 쉽게 이해할 수 있는 음성을 어떻게 구현할 수 있을 것인지, 시각 정보와 청각 정 보를 어떻게 일치시킬 수 있을 것인지와 관련된 기술 개발이 하나의 과제가 될 것으로 보인다.
하지만 반대로, 현실에서 겪는 음성언어 이해의 어려움을 메타버스에서 어느 정도 통제할 수도 있을 것 같다. 일반적인 환경에서는 우리가 컨트롤할 수 없는 요소가 상당히 많다. 예를 들어 사람들이 동시에 이야기할 경우에도 듣기 노력을 통해 집중도를 높여야 한다. 그런데 메타버스에서는 다양한 사람이 동시에 이야기할 경우 타깃 화자의 음성을 증폭시킨다든가 화자들 간의 공간적인 거리를 더 늘린다든가 하는 음성 기술을 통해 음성언어의 이해를 증진시킬 수 있는 방법을 시도해 볼 수 있다.
비언어적 측면에 대해서도 고려할 부분이 있다. 예를 들면, 아바타의 겉모습은 자유롭게 설정할 수 있기 때문에 굉장히 조그맣고 귀여운 몸집의 아바타에서 중후한 저음의 목소리가 날 수도 있을 것이다. 물론 그게 잘못된 것은 아니지만 실제로 몸의 사이즈와 목소리에 큰 상관관계가 있기 때문에, 그 사람의 음성에 어느 정도 일치하는 아바타를 추천하는 기능을 고려해 볼 수도 있을 것 같다. 또한, 기술을 통해 말소리의 공간적인 정보를 구현한다면 언어에 대한 실감도가 더 올라갈 수 있을 것이다.
- 메타버스에서 보다 자유롭게 체화된 음악을 즐기기 위해서는 인간이 음악을 할 때 뇌에서 어떤 일이 벌어지는지 이해할 필요가 있다. 메타버스에서 음악을 위한 커뮤니케이션을 할 때 이러한 뇌의 신호를 통해 커뮤니케이션의 질을 높일 수 있는 가능성이 있기 때문이다. 우리는 생각보다 많은 뇌의 영역을 음악을 위해 사용하고 있다. 당연히 먼저 귀를 통해 음악을 듣지만, 그 음악을 몸으로 표현 하기 위해서는 몸을 움직이는 운동 영역으로 신호가 전달된다. 또한 음악에 대한 고차원적 사고를 하거나 음악이 내게 어떤 의미로 다가 오는지 느끼는 과정은 전두엽에서 일어난다. 음악을 들어서 즐겁거 나 슬프거나 타인과 공감하는 등의 감정적인 과정은 뇌 안쪽의 보상회로를 통해 이루어진다. 즉, 우리는 다양한 뇌를 사용해 음악 활동을 하고 있다. 현재는 음악을 감상하거나 이해할 때 주로 시각과 청각에 의존하지만 음악을 할 때 사용되는 다양한 뇌 신호에 대한 이해가 높아진다면, 궁극적으로는 뇌와 뇌가 더 직접적으로 소통하여 마치 텔레파시처럼 향상된 형태의 커뮤니케이션도 가능할 것이다.
- 뇌의 청각 경로
구체적으로 음악을 할 때 우리 뇌에서 청각 피질과 운동 피질을 어떻게 사용하는지 살펴보자. 우리가 소리를 들을 때 소리는 귀를 통해 중뇌를 거쳐 대뇌피질로 가게 된다. 귀를 통해 소리를 듣지만 결국 뇌의 청각 피질에서 소리를 처리하는 것이다. 청각 피질에는 우리가 높은음을 들을 때와 낮은음을 들을 때 각각 응답하는 신경들이 따로 자리를 잡고 있다. 음고의 높낮이 변화 통해 선율이 만들어지는데, 우리가 높은 소리를 들을 때는 이를 담당하는 청각 신경이 활성화되고, 낮은 소리를 들을 때는 다른 쪽의 청각 신경이 활 성화된다.
- 소리에 대한 뇌파 응답
소리에 대한 뇌의 응답을 보기 위해서는 자기공명영상 MRI를 사 용해 뇌 영상을 찍거나, EEG와 같은 뇌파 장치를 통해 뇌에서 나오는 전기적 신호를 측정한다. 음악을 한다는 건 우리가 인식하는 차원에서는 소리를 통한 정보 전달이지만 사실 뇌에서는 전부 전기적 신호로 바뀌어 처리되기 때문에, 사실 뇌에서는 소리 그 자체가 아닌 전기적인 신호를 통한 커뮤니케이션이 이루어진다. 따라서 음악을 들을 때 뇌파를 측정해 그 전기 신호를 분석해 보면, 뇌에서 어떤 일이 일어났는지를 알 수 있는 것이다. 음악을 들을 때 뇌간 Brainstem 의 응답을 측정해 보면 원래 소리와 뇌파의 특징이 매우 유사하다. 예를 들어 첼로 소리를 들을 때 뇌파를 측정해 보면, 원래 첼로 소리 의 음높이와 음색 특징을 잘 반영하고 있다. 뇌파를 측정해 보면 실 제 그 사람이 지금 어떤 소리를 듣고 있는지 알아낼 수 있다는 것 이다. 마찬가지로, '다'라는 말소리를 들었을 때 뇌파는 '다'의 음향적 특징을 잘 반영한다. 따라서 뇌파를 분석해 보면 우리가 '다'라는 소리를 얼마나 정확하고 효율적으로 처리하고 있는지를 직접적으로 관찰할 수 있다. 실제로 어릴 때부터 10년 이상 음악을 해온 음악가와 음악을 전공하지 않은 일반인들이 같은 음악을 들었을 때 뇌파를 비교해 보면, 음악 훈련을 오랫동안 해온 사람은 신경이 기능적으로 발달되어 뇌파도 다르고 소리를 좀 더 효율적으로 처리하고 있다는 것을 알 수 있다.
- 청각 피질 외에도 음악을 할 때 중요한 뇌의 영역이 바로 운동 피질이다. 음악을 연주하거나 음악에 맞춰 춤을 출 때도 몸을 사용 하지만, 음악의 중요한 요소인 리듬을 들을 때도 몸과 관련된 운동피질을 사용한다. 운동 피질은 우리 몸의 다양한 부분과 연결되어 있으며, 실제로 내가 손을 움직여야겠다고 생각하면 운동 피질의 손 에 해당되는 부분에 신호를 보내 손을 움직인다. 만약 내가 손을 움 직이고 싶을 때 운동 피질에서 어떤 신호를 발생시키는지를 측정해 분석하면, 반대로 그 신호가 측정되었을 때 지금 이 사람이 어떤 움직임을 원하는지를 예측할 수 있다. 이러한 연구는 향후 메타버스
공간에 있는 가상의 악기를 인간이 연주할 때 손을 직접 움직일 필요 없이 운동 피질의 뇌파 신호만을 통해 가상 악기를 조절할 수 있는 가능성을 보여준다.
- ‘우리는 음악을 근육으로 듣는다'고 말한 니체의 말처럼, 음악이란 감상의 대상에 그치는 것이 아니라 직접 행위를 하는 것이고, 따라서 몸의 참여가 매우 중요하다. 음악에 대한 인지과학 및 신경 과학 연구들을 살펴보면, 앞으로 메타버스에서의 음악은 작곡가와 연주자, 감상자의 영역을 나누는 기존의 시스템을 재현하는 데 그치지 않고 귀뿐만 아니라 신체 움직임까지 아울러서 참여가 가능한 형태로 진화해야 할 것이다. 이를 통해 우리는 본연의 'Musicking' 에 한 발짝 더 가까워질 수 있을 것으로 예상한다.






'IT' 카테고리의 다른 글

1일 1로그 IT지식  (0) 2022.06.01
블록체인 경제  (0) 2022.05.11
빅데이터 사용 설명서  (0) 2022.05.07
웹 3.0 메타버스  (0) 2022.05.07
AI로 일하는 기술  (0) 2022.04.28
Posted by dalai
,

빅데이터 사용 설명서

IT 2022. 5. 7. 11:59

- 조직문화가 분석 지향적으 로 변화하려면 경영자의 압력, 즉 경영자가 의사결정의 근거가 되는 데이터를 만들라고 구성원을 독려하고 그 분석결과를 잘 활용하도록하는 압력이 절대적으로 필요하다.
구글, 아마존, 넷플릭스 등 글로벌 수준에서 최고 기업의 공통점은 무엇일까? 이들은 바로 데이터 분석적 경영으로 최고 경쟁력을 구가하는 기업이라는 사실이다. 그리고 그 성공의 배후에는 언제나 분석 지향적 조직문화를 구축하고 강요한 경영자가 있다. 이들 경영자의 공통된 신념은 “우리는 신을 믿는다. 하지만 (신이 아닌) 모든 다른 사람은 (그 근거가 되는)데이터를 가져와라 In God we trust, but all others must bring data" 라는 유명한 문구다.
- 1960년대 중반에 고무 발포로 만들어진 매트가 모래나 톱밥 대신 사용되기 시작했다. 이 매트는 부드러울 뿐만 아니라 모래나 톱밥보다 높이 쌓을 수 있었다. 따라서 착지할 때 선수들이 받는 충격 은 거의 없었다. 포스베리는 이런 환경 변화에 맞추어 과감한 기술을 시도했다. 다른 선수들은 관성에 젖어 기존 방법을 답습할 때 그는 머리로 착지하는 새로운 배면뛰기를 시도한 것이다. 그리고 그의 시도는 높이뛰기 역사를 바꾸는 엄청난 성공으로 이어졌다.
포스베리의 사례가 시사하는 바는 명확하다. 이미 우리 곁에 와 있는 기술과 환경 변화, 즉 빅데이터와 인공지능을 기업이 혁신의 도구 로 활용해야 한다는 것이다. 빅데이터 시대의 5대 핵심기술인 소셜, 모바일, 사물인터넷, 클라우드, 인공지능을 자기 사업을 혁신하는 새로운 도구로 활용하는 디지털 전환은 이제 선택이 아니라 필수다.
- 메일이 왔을 때 이 메일이 스팸인지 정상 메일인지 구분하는 스팸 필터 프로그램을 만든다고 하자. 규칙기반으 로 만들려면 스팸이 아닌지 스팸인지 고르는 규칙(조건문)을 나열해 야 한다. 하지만 예를 들어 대박, 할인, 공짜 등 스팸 필터는 최소한 1만 개 단어를 고려하는데 메일에 각 단어가 들어 있는지 확인하려 면 프로그램이 1만 줄 필요하다. 만약 두 단어 조합을 고려하는 규칙을 만들려면 프로그램이 약 5천만 줄이 더 필요하다. 규칙을 나열하는 것만도 수작업으로는 불가능한 것이다. 기계학습은 수작업으로 규칙을 만들기가(프로그래밍하기가) 불가능한 문제를 컴퓨터 알고리즘이 데이터에 내재하는 패턴을 스스로 학습 하는 것이다. 기계학습의 종류는 다음과 같이 구분할 수 있다.
* 데이터 마이닝 센서 데이터, 클릭기록, 의료기록, DNA 분석 등
*수작업으로 프로그래밍할 수 없는 것들: 글자 인식, 이미지 인식, 스팸 제거, 자율운행차, 헬기) 등
* 개인 최적화 추천 알고리즘
* 강화학습
- 기계학습의 문제는 데이터에 내재하는 패턴을 찾기 위해 정답이 붙은 많은 데이터가 필요하다는 것이다. 예를 들어 스팸 필터는 스팸과 메일 각각 몇천 개로는 학습의 정확성이 매우 낮으므로 최소한 각각 수십만 개 메일과 스팸이 필요하다. 또한 패턴을 찾으려면(예를 들어 스팸과 메일이 얼마나 다른지를 계산하려면) 엄청난 계산을 빠르게 수 행해야 하므로 고성능 컴퓨팅 파워도 필요하다. 데이터의 폭증과 함 께 컴퓨터 계산 능력과 알고리즘이 비약적으로 발전한 빅데이터 시대 에 기계학습이 안성맞춤의 궁합으로 눈부신 성과를 내는 이유가 바로 여기에 있다.
- 개리 매커스Gary Marcus는 딥러닝은 “많은 훈련 데이터가 필요하므로 탐욕적이고, 문제의 맥락이 달라지면 적용할 수 없으므로 불안정하며, 과정을 설명할 수 없으므로 불투명하고, 인지 기억 추론 등 실질적 지능이 없으므로 피상적이다"라고 비판했다. 
- 전통적으로 롤스로이스가 엔진을 항공사에 판매하면 항공사는 엔진에 대한 정비와 부품 조달 등의 모든 것을 책임졌다. 하지만 항공사는 이런 책임에서 벗어나 승객 서비스에만 전념하기를 원했 고 롤스로이스는 토털케어라는 인공지능 솔루션으로 응답했다. 토털 케어의 핵심은 엔진의 소유와 관리에 대한 리스크를 항공사가 아니라 롤스로이스가 책임지고 항공사는 엔진을 사용한 시간만큼만 power by the hour 비용을 내는 것이다. 따라서 롤스로이스는 엔진 정비와 부품 조달 등 모든 것을 책임지고 엔진의 신뢰성과 유용성을 최대로 보장 해야 했다. 그러려면 롤스로이스는 가능한 한 고장 나지 않는 엔진을 만들어야 하고, 운항중인 엔진의 상태도 실시간으로 측정하고 이상 을 조기에 탐지해 즉각 대응할 수 있어야 했다. 또한 정비도 신뢰성을 유지하면서 동시에 신속하게 해야 했다. 항공기가 운항중일 때 엔진에 장착된 센서는 주요 부품의 성능과 관련된 진동, 오일 압력, 온도 등의 데이터를 실시간으로 데이터 센터 에 전송한다. 전 세계 세 지역에 있는 데이터 센터에서는 엔진 상황을 실시간으로 모니터한다. 즉 실시간으로 유입되는 엔진 데이터를 인공 지능이 자동으로 분석해(부품 고장이나 교체 필요성 예측) 엔진의 이상을 조기에 탐지하는 것이다. 또한 이상이 탐지되는 경우 찾아가는 서비스를 제공한다. 즉 해당 항공기의 도착지에 미리 정비요원을 대기 시켜서 승객이 내리는 동안 정비를 완료함으로써 비가동시간downtime 을 최소화한다.
토털케어는 엔진뿐만 아니라 항공기 전체의 모든 시스템에 대한 주요 작동 데이터도 수집한다. 인공지능을 활용해 항공기의 운항 성 능과 관련된 데이터를 종합적으로 분석함으로써 연료 소비의 효율을 최적화하는 서비스도 제공하는데 이로써 연료비용이 1~2% 절약된 다. 이렇게 해서 절약되는 비용이 항공사 규모에 따라 2천만 달러에 서 2억 달러에 달한다.
현재 40여 개 대형항공사의 4천여 개 엔진이 토털케어 서비스에 가 입되어 있으며, 최신의 트렌트Trent 엔진은 95%가 가입되어 있다. 지난 10여 년간 롤스로이스 주가는 지속적으로 상승했는데 롤스로이스의 서비스 매출은 2003년에는 10%에 불과했지만 2012년부터는 50%를 초과했다. 롤스로이스에서 가장 큰 변화는 고객을 위한 기술과 서비스 개발, 즉 부품 고장이나 교체 필요성을 예측하는 예방 정비predictive maintenance, 신속한 정비를 위한 부품 공급망의 최적화, 자산관리asset management 의 효율 증대에서 철저하게 데이터 분석을 바탕으로 한 조직 문화가 자리 잡았다는 것이다. 사내에 서비스 개발 관련 석사학위 과정도 만들었다.
- 세계적으로 가장 창의적 기업이 데이터 분석에 기반을 두고 경쟁 우위를 구가하는 사실은 다음 두 가지를 시사한다. 첫째는 빅데이터 시대에 기업 창의성의 원천은 새로운 원유'라고 일컬어지는 데이터 분석에 있다는 것이다. 아마존 CEO 제프 베조스는 이런 흐름에 대해 "이 세상의 미래 주인은 분석에 뛰어난 기업들, 즉 사물들이 관련되어 있다는 것을 알 뿐만 아니라 왜 그리고 어떤 패턴으로 관련되어 있는 지 아는 기업들이다”라고 표현했다. 둘째는 개인의 창의성 또한 분석 능력을 키우려는 노력으로 기를 수 있다는 것이다. 즉 기업은 직원들을 대상으로 분석능력을 향상하는 프로그램을 운영하거나 분석이 일상화된 기업문화를 조성함으로써 창의성을 높일 수 있다.
- 디지털 혁신을 위해 가장 중요하고 비용도 들지 않는 출발점이 있다. 경영자가 직원들에게 숫자를 요구하는 것이다. 데이터에 근거하지 않은 보고는 받지 말고 그냥 던져버려라. 경영자가 매일매일 받는 보고(서)에는 종종 문제해결 대책이나 제안이 들어 있다. 하지만 그 제안이 데이터에 근거하지 않았다면 아예 보고서를 읽지도 마라. 정확한 증거에 입각해 보고와 의사소통을 하는 환경을 조성하려면 경영자가 먼저 데이터를 요구해야 하기 때문이다.



'IT' 카테고리의 다른 글

블록체인 경제  (0) 2022.05.11
포스트 메타버스  (0) 2022.05.11
웹 3.0 메타버스  (0) 2022.05.07
AI로 일하는 기술  (0) 2022.04.28
알고리즘이 지배한다는 착각  (0) 2022.04.28
Posted by dalai
,

웹 3.0 메타버스

IT 2022. 5. 7. 11:55

- 인공지능을 강한 AI와 약한 AI로 구분하듯이 메타버스를 광의와 협의의 개념으로 구분해 볼 수 있습니다. 넓게 는 웹 생태계 전체를 아우르는 개념이고, 좁게는 포트나이트, 로블록 스, 제페토, 디센트럴랜드 등 소위 메타버스 플랫폼을 지칭합니다.
'메타버스' 라는 용어는 학술용어나 공식적으로 합의된 명칭이 아 닙니다. 이전부터 사이버, 온라인, 멀티버스 다중우주, 디지털 트윈, 거울 세계, 가상현실, 증강현실, 혼합현실 MR 등등 다양한 이름으로 불 렸었지요. 2021년부터 '메타버스'가 대중적 용어로 자리 잡으면서 장르 명칭이 되고 있습니다. 그러다 보니 아직 범위나 개념 정의가 불명확하다는 문제가 남아 있긴 합니다.
- 2021년 말, 실리콘밸리에서 '웹3.0'이 뜨거운 감자로 부상했습니 다. 잭 도시와 일론 머스크가 웹3.0을 벤처캐피털들이 독점하려 한다고 비난하자, 마크 앤드리슨이 트위터 계정을 차단해 버리면서 설전이 일어난 겁니다. 웹3.0은 탈중앙화decentralized 거버넌스 구조를 가져야 하는데 소수 자본가가 소유하려 한다는 주장과 비즈니스 생태계의 현실을 고려해야 한다는 주장이 맞붙었지요.  일론 머스크 말대로 웹3.0은 본 사람이 없습니다. 시각적으로 보 이게 하려면 웹3.0에 형체를 만들어 씌워야 하겠지요. 웹3.0에 형체 를 입힌 것이 메타버스입니다. 뒤집어 말하면, 메타버스의 본질과 원 리가 웹3.0입니다. 1990년대 시작된 웹은 21세기 들어 웹2.0으로 진화했고, ICT와 과학기술의 발달로 입체적이고 역동적으로 변해 왔습니다. 거기에 지능 inteligence까지 얹어지면서 웹3.0시대로 진입하고 있 습니다.
나는 메타버스를 한마디로 웹3.0이라고 정의합니다. 1990년대 만들어진 웹 생태계가 입체적, 역동적, 그리고 지능화된 것이 메타 버스입니다. 이 책에서 논의하는 메타버스는 정확히 표현하자면, 웹 3.0 메타버스’ 입니다. 그리고 웹3.0 메타버스의 두 기둥은 NFT 대체불가토큰와 ARGAtternate Reality Game, 대체현실게임입니다. NFT는 메타버스의 경제를 떠받치고, ARG 는 메타버스를 역동적으로 만듭니다. 이 책의 부제처럼 NFT와 ARG 가 비즈니스의 법칙을 바꾸고 있습니다.
- 1990년대 대중에게 확산되기 시작한 인터넷이 웹이라는 가상의 땅field을 만든 것이고, 웹2.0 환경에서 플랫폼platform 으로, 그리고 디지털과 ICT 기술의 진화로 플랫폼이 입체적이고 다이내믹하고 지 . 능적인 모습으로 진화한 생태계가 메타버스 metaverse다. 그래서 메타버 스를 웹3.0이라 하는 것이다.
- '함께' DNA : 함께 만들라, 그러면 그들이 머물 것이다. 비트 세대, 히피 운동, 사이버펑크, 자유 소프트웨어 운동, 사이퍼펑크와 블록체인으로 이어지면서 유전된 웹3.0 메타버스의 DNA는 크게 두 단어로 요약할 수 있다. '함께'와 '거꾸로다.
첫째, 웹3.0 메타버스는 함께 만드는 세상이지 1% 리더들의 무대 가 아니다. 현실세계는 1%에게 권력과 이익을 누리게 해 주고 그들 이 연출하는 무대를 관전하는 구조지만, 메타버스는 99%의 집단지 성으로 함께 만들고 함께 즐기는 세상이다. 이것이 웹3.0 메타버스 게임의 법칙이다. 또 현실세계의 비즈니스가 “잘 만들라. 그러면 그들이 올 것이다.” 였다면 웹3.0 메타버스 비즈니스의 법칙은 “함께 만들라. 그러면 그 들이 머물 것이다.” 로 바뀐다.
- '거꾸로 DNA : 보이는 세상은 실재가 아니다.
두 번째 DNA는 '거꾸로'다. 웹3.0 메타버스는 현실세계의 물리법 칙이 적용되지 않는 이상한 나라 wonderland다. 시공간도 초월적이고, 패 러다임도 다르다. 메타버스에서는 거꾸로 생각해야 한다. 또 상식과 통념에도 저항해야 하고, 비즈니스도 다른 방식으로 해야 한다. | 물리학자 카를로 로벨리의 책 제목처럼 보이는 세상은 실재가 아 니다 Reality is not what it seems.” 그는 이 책에서 시간과 공간에 대한 일반인 들의 통념을 깨뜨린다. 시공간은 양자量子, quantum이며, 시간은 흐르지는 않는다고 역설한다.
- 블록체인은 공유경제의 끝판왕이다. 1%의 빅 브라더나 미들맨 없이 99%가 P2P 연결과 융합을 통해 집단지성을 발현할 수 있도록 만드는 알고리즘이다. 흔히 블록체인을 분산원장기술이라 정의하지만 그건 금융과 일부 분야에 국한된 단면일 뿐이다. 또 코인이나 토큰 등 가상화폐는 시스템을 유지하기 위한 부수적인 요소다. 본질은 공유 경제와 마찬가지로 집단지성의 발현이다. 이처럼 집단지성은 메타버 스에 피를 만들어 공급하는 심장과 같은 역할을 한다.
정리하자면 집단지성이라는 DNA가 공유경제, 블록체인, 그리고 메타버스로 이어지면서 유전되고 있다. 이것이 왜 웹3.0 메타버스에 는 생산자와 소비자의 경계가 없고, 협업을 통해 가치를 창출하는 위 키노믹스가 구현되는지를 알 수 있는 대목이다. 앞 장에서 강조했듯 이 웹3.0 메타버스의 유전자는 '함께' 즉, 집단지성이다.
- 메타버스의 역사를 돌이켜 보자. 1990년대 인터넷 이 지구를 거미줄Web처럼 연결시켰고, 집단지성이 생기면서 웹 환경 은 2.0으로 진화했다. 여기에 스마트폰이 혁명의 트리거를 당겼고, 2010년대 들어 인공지능과 블록체인, 그리고 VR 기술과 햅틱 인터 페이스, 센서 기술, 3D 데이터 처리기술, 유니티 Unity와 언리얼 등 쉽 게 게임을 구현할 수 있도록 도와주는 게임 엔진의 보급 등이 가세하 면서 생태계는 다시 웹3.0이라는 새로운 차원으로 도약할 수 있게 된 것이다. LTE나 5G 등 초고속 네트워크와 반도체 등 컴퓨팅 파워의 발달이 메타버스로 가는 인프라를 깔아 준 것은 말할 나위 없는 일이다. 
- 앞으로 기업들은 홈페이지나 앱 대신 봇 제작에 박차를 가할 것이다. 브랜드 봇 하나씩은 키워야 한다. 또 개인들도 비서 봇을 갖게 될 것이다. 일반인들이 봇을 만들 수 없으니 분양하거나 제작을 지원하는 소프트웨어들이 많아진다. 마치 개인 홈피나 블로그 저작도구들 이 생겨났었듯이. 봇은 메타버스 안에서는 아바타avatar로 불린다. 과거 웹2.0 환경으로 변하면서 웹에서 앱으로 중심이 이동했듯이, 웹3.0 메타버스 생태계에서는 앱에서 아바타 봇으로 이동할 것이 다. 앱의 시대가 가고 아바타 봇의 시대가 오는 것이다. 그리고 아바타는 단지 상징적인 그림 파일이 아니라 지능을 장착한 AI 로봇이다.
- 메타버스는 AI 아바타의 영역이다. 이 말은 인간이 개입하기 어려 워진다는 뜻이다. 자율주행차가 거리를 질주하는 시점이 되면 인간이 운전하는 차는 다닐 수 없게 된다. 신호체계나 거리가 운전 봇에 맞게 설계되어 있고 봇들끼리 정보를 주고받으면서 운행하는 가운데, 인간이 낄 수 없기 때문이다. 마찬가지로 아바타들이 활동하는 메타버스는 인간이 개입할 수 없는 영역이 될 수도 있다.
- 왜 페이스북은 사명까지 메타로 바꿔 가며 VR 웨어러블에 전력투구하는 것일까? 애플과 구글이 장악하고 있는 스마트폰 생태계에서 벗어나기 위함이다. 2021년 애플과 페이스북이 크게 한판 붙었다. 애플이 청천벽력 같은 선언을 했기 때문이다. 개인정보보호 정책 차 원에서 아이폰에 내장된 광고 IDIDFA : ID for advertisers를 통해 수집·제공해 온 사용자 트래킹 데이터를 모바일 앱 사업자들에게 제공하지 않겠 다는 내용이었다. 사용자에게 동의를 받아 오면 주겠단다. 이건 애플의 iOS 운영체제 위에서 만들어진 페이스북으로서는 사형선고다. 왜냐면, 페이스북의 주 수익은 사용자 데이터를 활용한 개인맞춤형 광고인데, 애플이 페이스북에게 아이폰 사용자들의 기본정보를 제공해 주지 않는다면 리타겟팅retargeting (페이스북을 보다 보면 조금 전 검색했던 상품광고가 계속 따라오는데 그게 리타겟팅 광고다) 이 불가능해지기 때문이다. 구글도 애플의 개인정보보호 정책에 동조하고 있다. 건축물에 비유하자면, 건물주가 전기를 끊겠다는 얘기다.
- 구글과 애플도 눈이 좋은 기업이다. 넥스트 스마트폰 시대를 대비 하고 있다. 2013년 AR 글래스를 발표했으나 당시에는 호응을 얻지 못했던 구글은 '구글 글라스 에디션2'로 재도약을 준비하는 한편 AR 스타트업 매직리프 Magic Leap에 대규모 투자를 하기도 했다. 애플은 아 이폰, 아이패드를 메타버스에 연결하려는 노력을 경주하고 있다. 특 히 증강현실 기술에 집중하고 있는데, 개발자들이 쉽게 AR 앱을 만 들 수 있는 AR 툴킷을 개발, 지속적으로 업그레이드하고 있다. 또 2022년 AR 글라스를 출시한다고 발표했다.
모바일 시대로 변하면서 왕좌의 자리를 빼앗겼던 마이크로소프트 는 메타버스로 재탈환을 노리고 있다. 2016년 혼합현실R 기반 웨어 러블 기기 홀로렌즈 Microsoft Hololens를 출시했고, 2014년 스웨덴 게임사모장Mojang 스튜디오로부터 인수한 마인크래프트는 메타버스행의 디 딤돌 역할을 하고 있다.
마이크로소프트는 윈도 오피스와 같은 사무용 애플리케이션을 활용하여 협업 메타버스 부문에서 비교우위점을 가질 수 있다. 2021년 에는 메타버스 협업 플랫폼인 메시Mesh를 출시했는데, 홀로렌즈를 착용하면 메시에서 물리적으로 다른 지역에 있는 사용자들이 한 방에서 회의하는 것처럼 느낄 수 있다.
- 누가 메타버스 왕좌의 게임 승자가 될까? 승자의 조건은, 현실세계와 메타버스를 융합할 수 있는 기술력technology과 세계관을 만들 수 있는 철학philosophy이다. 기술과 철학은 양대축이다. 기술만으로는 세상을 변화시킬 수 없다. 철학이 없는 기술은 사상누각처럼 오래가지 못하기 때문이다. 웹3.0 메타버스 게임은 세계관 전쟁이다. 〈왕좌의 게임) 시즌8에서 티리온 라니스터가 이런 말을 던진다. "무엇이 사람들을 하나로 만들unite 수 있을까요? 군대? 황금? 깃발? 아니, 스토리입니다.” 그가 의미하는 스토리는 단순한 서사가 아니라 삶의 철학이 융합된 히스토리 history다. 어느 세상이건 히스토리만큼 재미있는 게임은 없다.
- 메타버스 왕좌를 노리는 자들의 야심은 국가를 대체하겠다는 것이다. 2003년 미국 린든랩이 만들었던 세컨드라이프 Second Life도 국가를 가상현실로 옮기려는 시도였다. 창업자 필립 로즈데일은 “우리는 게임을 만드는 것이 아니라, 새로운 나라 country를 건설하고 있다.”라 는 말로 비전을 설명했다.
30억의 인구 최강국 메타前 페이스북가 메타버스를 향하는 이유도 이 런 맥락이다. 페이스북은 2018년부터 블록체인 프로젝트인 '리브 라Libra' 를 추진했지만, 미국 정부의 강한 반대에 부딪혔다. 왜 반대하 나? 리브라는 페이스북 플랫폼에서 통용되는 화폐이기 때문이다. 이 건 화폐발행권을 쥐고 있는 국가라는 체제를 근본부터 뒤흔드는 일이다. 페이스북 플랫폼에서 리브라는 자유롭게 국경을 넘나들 수 있고, 개별국가들의 통제권을 벗어난다. 리브라 프로젝트에 놀란 중국이 CBDC Central Bank Digital Currency를 서둘러 도입한 이유도 리브라에 대
비해 만리장성을 쌓아야 했기 때문이다.
페이스북은 2019년 메타버스 플랫폼 '호라이즌Horizon' 베타 버전 을 발표했다. 평면적인 페이스북, 왓츠앱, 인스타그램 등의 SNS 플랫 폼을 3D 메타버스로 업그레이드하고, 그 안의 콘텐츠도 보강해서 새로운 월드를 구축하겠다는 계획이다. 메타는 출전 채비를 차렸다. 리브라 프로젝트는 2021년 '디엠Diem’ 으로 개명해서 재추진하고 있고, AR 선글라스와 VR 디바이스 오큘러스 퀘스트를 출시했다. 만일 30억의 기존 사용자들이 호라이즌으로 이동한다면 메타는 국경 없는 세계최대의 커뮤니티가 될 수 있다. 메타의 야심은 글로벌국가다.
- 이더리움이 제공하는 ERC-20 표준을 따르면 누구나 쉽게 토큰대 체가능토큰을 민트할 수 있고, NFT와 같이 고유의 식별정보가 필요한 토 큰은 ERC-721이나 ERC-1155 표준을 따라 민트된다. 또 NFT를 판 매할 수 있는 관련 인프라도 잘 구축되어 있다. 예를 들어, 현재 NFT 의 최대거래소는 오픈시 opensea.io인데, 오픈시는 이더리움 블록체인의 메인넷 main network에서 돌아가는 애플리케이션이다.
또 여기서 잠깐, 코인과 토큰의 차이점을 알고 가야 한다. 대개는 혼용해서 쓰는 경우가 많지만 다른 차원의 개념이다. 메인넷을 운영 하는 블록체인은 블록 생성에 참여하는 노드들에게 작업에 대한 인센티브를 지급하는데, 그게 코인coin이다. 이 과정을 채굴이라 부른다. 마치 광부들이 노동해서 금을 채굴mining하듯이, 블록이 생성될 때마 다 노동의 대가로 가치가 창출되는 것이다. 코인은 대부분 발행되지 않고 채굴된다.
토큰token은 메인넷 운영체제상에서 만들어지는 애플리케이션들이 자신의 앱에서 사용할 수 있도록 발행하는 것이다. 일종의 유틸리티 토큰의 성격이다. 그러니까 코인과 토큰은 부모와 자식의 관계라 할 수도 있겠다.
또 메인넷OS을 도시에 비유한다면 앱pp은 건물이나 아파트, 도로 등이다. 인구가 늘고 건물들이 많이 들어서야 도시가 활성화되어 땅 값도 올라가듯이 메인넷 위에서 작동되는 앱들이 많아져야 해당 블록체인 생태계가 커진다.
- 이더리움 생태계에서 거래될 때에는 이더ETH로 결제가 이루어지는데, 이더의 사용량이 많아지면 가격도 올라간다. 현재로서는 이더리움이 가장 유리한 위치를 점하고 있지만, 이더리움의 처리속도TPS가 느려 실생활 사용에 한계가 있고 가스비 거래수수료가 높다는 약점을 파고들면서 경쟁 프로젝트들이 블록체인계의 안드로이드와 iOS 자리에 도전하고 있다. 이처럼 블록체인은 웹3.0 메타버스 경제의 운영체제다.
- 왜 스마트폰이 나오면서 ARG 열기가 식고 세컨드라이프는 몰락 했을까? ARG는 대체현실게임이고, 세컨드라이프는 가상현실게임이 라는 차이점은 있지만, 둘 다 소셜 게임이라는 공통점이 있다.
스마트폰 생태계가 조성되면서 소셜 미디어인 SNS 플랫폼들이 급격히 늘어났다. 페이스북, 트위터, 유튜브 등 외에 ARG의 원리가 접목된 포스퀘어나 옐프와 같은 위치기반 SNS도 나왔고, 왓츠앱이나 카톡 등의 메신저 기반의 SNS, 핀터레스트나 인스타그램 등의 이미 지 기반 SNS, 틱톡 같은 짤방 위주의 SNS 등 형태나 방식도 다양화 되면서 봇물 터지듯 쏟아져 나왔던 것이다.
SNS도 소셜 게임이다. 기업 입장에서는 별도의 ARG를 기획하는 것보다는 소셜 플랫폼을 활용하는 것이 비용이나 효과 측면에서 유리했을 것이다. 제1부 3장에서 언급했던 세컨드라이프의 실패도 스마트폰으로 인한 SNS의 활성화에서 직접적인 원인을 찾을 수 있다.
그러나 메타버스 시대가 본격화되면 양상이 달라지게 된다. SNS 와 같은 소셜 미디어들은 위기감을 느끼고 있다. 사람들의 SNS에 대한 피로도가 늘고 있고, 평면적인 형태에 흥미를 잃어 가고 있기 때문이다. 페이스북이 메타로 사명까지 바꾸면서 메타버스에 올인하는 이유도 여기에 있다.
세컨드라이프는 포트나이트, 로블록스, 제페토 등의 모습으로 부 활했다. 세컨드라이프가 문을 닫은 지 10년도 되지 않아 꺼진 줄 알았던 불씨가 2019년경부터 다시 지퍼진 것이다. 그럴 수밖에 없는 게 세컨드라이프와 이들의 심층구조 deep structure는 동일하기 때문이다.
- 광고의 역사는 길지 않다. 광고는 산업혁명의 산물이다. 광고는 산업혁명 이후 신문, 잡지, 라디오, TV 등 미디어media가 만들어지면 서 고안된 대량커뮤니케이션 수단이다. 그러나 무차별적이고 일방통 행식인 광고는 더 이상 유효하지 못하다. 그것은 이미 웹2.0 시대 들 면서부터 나타났던 조짐이고, 웹3.0 메타버스 시대가 본격화되면 광 고는 종말을 맞이할 수도 있다. | 이는 플랫폼기업들에게 위협요인이다. 플랫폼기업의 주 수익원은 광고이기 때문이다. 페이스북이 회사명을 바꾸면서 메타버스로 향하 는 속사정도 이것이다. 메타는 사용자들의 데이터를 기반으로 한 맞 춤형 광고로 돈 버는 회사다. 그런데 광고에 대한 기대감은 갈수록 식어 가고, 광고효과도 급하락하고 있다. 광고주들은 브랜드 이미지 높 이는 막연한 광고보다 직접적이고 현실적인 성과형performance 광고를 선호한다.
커뮤니케이션은 인류의 본능이기 때문에 광고의 심층구조는 변 하지 않는다. 그러나 메타버스에서 광고의 표피구조는 달라진다. 미디어 container를 구매해서 거기에 메시지 contents를 담아 송출하는 광고는 곧 사라질 것이다. 그런 분리적이고 순차적인 방식은 메타버스 게임 의 법칙에 위배되기 때문이다. 미디어와 메시지의 경계도 사라지면서 융합이 일어나고, 물리적 현실과 대체현실을 넘나드는 역동적이고 입체적인 미래모습을 ARG에서 엿볼 수 있다.
- 마케팅3.0 전략
'광고' 라는 용어 자체가 사라질 수도 있다. 메시지는 상품에 융합 되어 광고인지 아닌지 헷갈리게 되고, 생산자와 소비자의 경계도 사 라져 함께 어울리면서 게임을 벌이는 방식으로 변한다. 여기서 중요 한 포인트는 소비자도 경제적 이익을 얻을 수 있어야 한다는 점이다. | 이 과정에서 광고와 유통의 경계도 사라진다. 유통도 산업혁명의 결과, 생산자와 소비자가 분리되면서 생긴 개념이다. 시장market의 역 사도 길게 봐야 200~300년밖에 되지 않는다. 산업시대의 가치사슬 이 해체되면서 시장, 미디어 등의 존재 이유가 없어지고 플랫폼으로 융합되는 추세가 지속되고 있다.
메타버스에는 미디어도 시장도 존재하지 않는다. 거기는 우리가 알던 세상이 아니다. 게임의 법칙이 다르고 가치방정식도 고차 함수다. 비즈니스 생태계가 메타버스로 변하고 있는 시점에서 기업들이
체질을 바꿔 가야 한다. 달라진 룰을 숙지하고, 새로운 고차방정식 풀 이에 도전해야 한다. 또 실패가 권장되어야 한다. 현실세계에서의 실 패가 메타버스에서는 성공이기 때문이다.
대체현실에 주목해 보시라. 대체현실은 가상현실로 가는 가교이 고, 거기에 비밀를 푸는 열쇠가 숨겨져 있다. 대체상품을 기획하고, ARG를 설계해야 한다. 게임화gamification는 마케팅의 트렌드다.
메타버스는 상품과 스토리를 곳곳에 분산시켜 놓고 고객과 함께 그것을 찾는 게임을 벌이는 시공간이다. 웹3.0 메타버스 시대, 마케 팅3.0 전략으로 전환해야 한다. 마케팅3.0은 입체적이고 역동적인 3 차원 방식이다. 현실과 가상의 경계를 넘나들며 trans-media, 집단지성을 활용하는wiki 지능형 마케팅이다.
- '블루오션'의 저자 김위찬 교수는 한 인터뷰에서 이런 화두를 던졌다.
“전략을 짤 때 대개의 경우 경쟁과 기존 산업을 분석하고 전략 그룹을 살펴본 뒤 집중 공략할 고객을 정한다. 이런 과정을 무의식적으로 거친다면 당신은 레드오션에 빠져있는 것이다.” (한국경제, 2005.10.11)




'IT' 카테고리의 다른 글

포스트 메타버스  (0) 2022.05.11
빅데이터 사용 설명서  (0) 2022.05.07
AI로 일하는 기술  (0) 2022.04.28
알고리즘이 지배한다는 착각  (0) 2022.04.28
나는 메타버스에 살기로 했다  (0) 2022.04.20
Posted by dalai
,

AI로 일하는 기술

IT 2022. 4. 28. 20:23

- 인공지능은 언제, 어디서, 누구로부터 만들어졌나요?

역사적으로 보면 인공지능이라는 말은 1956년까지 거슬러 올라갑니다. 1956년 여름, 미국 다트머스 대학에서 <인공지능에 관한 다트머스 여름 연구 프로젝트 Dartmouth Summer Research Project on Artificial Intelligence>라는 워크숍이 열립니다. 이 워크숍은 1955년 당시 다트머스 대학에서 조교수로 일하던 존 매카시를 주축으로 마빈 민스키 Marvin Minsky, 나다니엘 로체스터 Nathaniel Rochester, 클로드 섀넌 Claude Shannon 등 당대 최고의 인공지능 전문가들이 모여 인공지 능의 미래를 토론하기 위한 자리로, 제안서에는 이렇게 쓰여 있습니다.

“우리는 1956년 여름 뉴햄프셔 주 하노버에 있는 다트머스 대학에서 2개월 동안의 인공지능 연구 수행을 10인에게 제안하는 바입니다. 이 연구는 학습의 다양한 측면과 지능의 특징을 매우 정확하게 설명할 수 있다는 전제하에 진행되며, 연구 내용을 바탕으로 한 시뮬레이션 기계를 만들 것입니다. 이 기계는 언어를 사용하고 추상화와 개념화를 할 수 있으며, 현재 인간에게 주어진 다양한 문제를 해결하는 것은 물론, 기계가 자신을 향상하는 방법 또한 찾을 것입니다. 선택된 10인의 과학자들이 함께 작업한다면 여러 과제 중 하나 이상에서 상당한 진전을 이룰 수 있다고 생각합니다.”

- 고객이 와서 신용대출을 해달라고 요청합니다. 은행에서 이미지정한 질문에 따라 데이터를 입력하면 전문가 시스템에 있는 추론 엔진이 돌아가면서 대출 여부를 결정합니다. 만약 대출이 거부되었다고 가정해 봅시다. 고객이 왜 대출이 안 되는지 물으면 전문가 시스템은 그런 의사결정 을 하게 된 과정과 어떤 규칙에 의해 대출 거부 결정을 하게 되었는지를 설 명해 줍니다. 상당히 좋아 보이지요.? 이러한 이론은 질병 진단 및 치료 방법, 대기오염 분석, 군사 작전, 광석 매장지를 찾는 지질탐구 분야 등에서 많이 사용되었습니다. 문제는 시간이 지나면서 규칙이 변경되고 늘어나 관계를 명확하게 정의하는 것이 어려워 지는 것은 물론, 새로운 규칙도 계속해서 다시 입력해야 합니다. 입력한 새 로운 규칙이 기존에 입력한 규칙과 충돌을 일으킬 수도 있습니다. 따라서 규칙을 유지보수할 때마다 각 분야의 전문가들이 필요합니다. 전문가 시스템 스스로가 데이터를 학습하여 규칙을 변경하는 능력이 있으면 좋을 텐데 그렇지 못합니다. 또한 많은 규칙을 추론하는 엔진을 돌리면 컴퓨터가 매우 느려집니다. 그래서 전문가 시스템은 초기에 성공을 거두었음에도 불구하고 점차 사용하지 않게 되었습니다.

뉴럴 네트워크는 전문가 시스템과는 달리 데이터를 학습해서 의사결정을 하는 방법으로, 데이터가 많아지고 복잡해지면서 엄청난 컴퓨팅 계산 능력이 필요했습니다. 그런데 1990년대에 그렇게 빠 른 컴퓨터는 너무 비쌌습니다. 그래서 인공지능이 약속한 원래 목적을 현실 적인 비용으로 감당할 수 없게 되자 또다시 인공지능 두 번째 겨울이 온 것입니다.

- 인간은 아주 뜨거운 것을 만지면 무의식중에 손을 급히 빱니다. 이것은 손에서 감각 뉴런에 전달된 뜨겁다' 라는 신호를 연합 뉴런에 전달하지 않 고 척수 반사 신경에서 바로 운동 뉴런에 전달한 것입니다. 또한 사람은 보 지 않고 듣지 않아도 본 것처럼 느끼고(환영), 들은 것처럼 느낄 수 있습니 다(환), 이것은 감각 뉴런을 통하지 않고 뇌의 작용만으로도 보고 들은 것 처럼 느끼는 것이죠. 매우 신비한 일입니다. 인간의 뇌만이 할 수 있는, 입력 데이터도 없이 무엇을 보거나 들은 것 같은 느낌을 어떻게 수학적인 모델로 구현할 수 있겠습니까?

- 사람이 일일이 학습 알고리즘을 짜는 것이 아니라 '알고리즘을 자동으 로 짜주는 인공지능' 도 개발되고 있습니다. 이것이 AutoML (자동화 머신러 닝)로, 앞에서 이야기한 메타 러닝 meta learning 분야 중 하나입니다. 사람이 학 습 모델을 만들고 학습시키려면 매우 많은 시간이 소요되고 컴퓨팅 시간도 오래 걸리므로 '인공지능이 인공지능을 학습시키는 모델'을 짜도록 한 것입 니다. 이것도 인공지능 모델의 여러 학습 방법 중 하나입니다.

- 2019년 3월, 딥러닝의 최고 선구자 중 한 사람인 요슈아 벤지오 교수는 다음과 같이 말했습니다.

“딥러닝이 기존의 상관관계만을 파악하는 수준을 넘어서서 원인과 결과에 대해 설명하지 못한다면 딥러닝의 잠재력을 충분히 발휘하지 못하고 진정한 AI 혁명을 일으키지 못할 것입니다. 다시 말해 딥러닝은 '왜 이런 결과가 나왔는지’, ‘원인이 무엇이었는지' 답할 수 있어야 한다는 것이죠. 딥러닝은 학습된 많은 데이터와 레이블(정답) 간의 상관관계를 알아내는 것은 잘하지만, 인과관계에 대한 추론은 잘하지 못합니다. 또한 딥러닝은 학습 데이터가 인공지능 시스템이 현실에 적용될 때의 데이터와 동일하다고 가정합니다. 그러나 실제로는 그렇지 않을 수도 있습니다.”

- 머신러닝과 딥러닝의 차이는 학습하는 데이터의 양입니다. 보통 머신러에서 학습하는 데이터의 양은 수만 건 이하입니다. 반면 딥러닝은 거의 한계가 없지요. 최근에 만들어진 GPT-3는 학습하는 데이터가 4,990억 건이나 됩니다. 이렇게 데이터 규모부터 큰 차이가 나기 때문에 딥러닝이 머신러닝 보다 더 많은 하드웨어가 필요합니다. GPT-3는 마이크로소프트에서 제공하 는 클라우드를 사용했는데, 학습할 때 사용한 클라우드 사용료만 160억 원 정도가 됐다고 합니다. 또 하나 중요한 차이점이 있습니다. 다음 페이지의 그림을 보겠습니다. 머신러닝은 은닉층 hidden layer 이라고 부르는 중간층이 하나밖에 없지만, 딥러닝은 은닉층이 2개 이상 있습니다. 딥러닝 알고리즘은 히든 레이어가 보통 10개 이상입니다. 레이어가 많고 구조가 복잡할수록 학습 시간은 더욱 길어지죠.

- 수학과 컴퓨터 공학 지식 중 어떤 게 더 많이 필요한가요?

그래도 다행인 것은 실제로 기업에서 딥러닝을 구현할 때에는 기존에 잘 정 리되어 있고 검증된 모델의 소스 코드를 변경해서 사용하는 경우가 대부분 이라는 것입니다. 소스 코드는 깃허브 (github.com)에서 쉽게 찾을 수 있기 때문에 파이썬, 리눅스, 셸 프로그래밍 등을 수학보다 잘 아는 것이 훨씬 중 요합니다. 다시 말해 컴퓨터 공학 지식이 더 많이 필요합니다. | 또한 딥러닝을 구현하기 위해서는 인공지능 프레임워크를 반드시 알아 야 합니다. 인공지능 프레임워크에는 구글이 개발한 텐서플로 TensorFlow와 페 이스북이 개발한 파이토치 PyTorch 가 있습니다. 둘 중 하나만 잘해도 됩니다.

- 인공지능 분야에서는 데이터를 만드는 일이 대단히 중요합니다. 실제 기업에 있는 시스템에서 데이터를 모으고, 합치고, 내용을 조사하고, 값이 없는 것은 채우고, 값이 틀린 것은 고쳐야 합니다. 그리고 데이터를 모두 숫 자로 바꾸어 학습 데이터를 만들어야 합니다. 이 과정이 시간이 많이 걸리 고 인내심이 필요한 부분입니다. 이때는 데이터베이스, SQL, 파이썬 등에 대한 지식이 필요합니다. 이것도 컴퓨터 공학 분야의 지식입니다.

요약하자면 보통 기업에서는 인공지능을 처음부터 개발하지 않고 이미 개발된 것을 상황에 맞게 변형해서 사용하기 때문에 수학 지식이 꼭 필수는 아닙니다. 그러나 대학원이나 연구기관 등에서 인공지능 모델을 처음부터 만들어 보겠다고 하면 수학은 당연히 필요합니다. 이는 논문에서 인공지능 모델의 원리와 구조를 밝히는 데 필요하기 때문입니다.

- 꼭 비싸고 좋은 사양의 컴퓨터가 필요한가요?

인공지능을 공부하는 데 반드시 고성능의 컴퓨터가 필요하지는 않습니다. 구글에서 무료로 제공하는 코랩(Colub이라는 클라우드 기반의 AI 개발 도구 가 있는데, 여기에서 모든 AI 프로그램을 파이썬으로 코딩하고 실행해 볼 수 있습니다. AI를 실행하려면 대단히 복잡하고 많은 프로그램을 설치해야 하지만, 코밭에는 이미 설치가 되어 있어서 그 사용하기만 하면 됩니다. 보통 딥 러닝 프로그램을 자신이 컴퓨터에서 돌리려면 비싼 GPU 카드를 구입해이 하는 데, GPU 카드가 탑재되어 있는 노트북은 보통 게이밍 노트북이라고 해 서 일반 노트북이나 데스 그톱 컴퓨터보다는 비니다. 그러니 구글 코램을 사용하면 GPU를 무료로 빌리주기 때문에 일반 컴퓨터에서도 AI를 코딩하고 실행할 수 있습니다. 물론 무료 비전에서는 한 번에 한 개의 프로그램만 실행할 수 있어 다소 불편할 수 있지만, 구글 코랩 프로를 신청하면 월 $10 정도를 내고 동시에 세 개의 프로그램을 실행할 수 있습니다. 게다가 무료 버전은 한 개의 프로그램을 최장 12시간까지만 돌릴 수 있지만, 코랩 프로 는 24시간 내내 돌릴 수 있습니다. 우리가 학습할 때에는 학습 시간이 대단히 오래 걸리는 편이기 때문에 코랩 프로를 쓰는 것이 더 낫습니다.

- 인공지능을 공부하려면 가장 먼저 파이썬 Python 을 충분히 공부해두는 것이 좋습니다. 파이썬은 인공지능을 실제로 컴퓨터에서 돌릴 수 있는 컴퓨터 언어입니다. 컴퓨터 언어는 수백 가지가 존재하는데, 인공지능은 대부분 파이썬에서만 돌아갑니다. 인공지능 소스 코드 또한 파이썬을 대단히 잘 알아야 이해할 수 있습니다. 특히 클래스와 데이터 핸들링 방법 및 파이썬의 대표 라이브러리인 판다스 Pandas, 넘파이 NumPy, 맷플로립 Matplotlib 등을 능숙하게 다룰 수 있어야 합니다. 인공지능 이론이나 수학을 먼저 공부하는 것보다는 파이썬을 고급 레벨까지 충분히 익히는 것을 권장합니다. 파이썬을 공부하는 방법은 매우 많습니다. 유튜브, 코딩 사이트, 온라인/오프라인 학원, 대학 등 넘쳐납니다. 기억하십시오. 인공지능의 첫걸음 은 파이썬입니다. 그래서 파이썬을 아주 잘하면 인공지능을 반쯤은 이해한 것입니다. 파이썬은 그만큼 중요합니다. 이미 파이썬을 잘 알고 있다면 인공지능 공부는 매우 수월할 것입니다.

그다음으로 인공지능 이론, 즉 머신러닝과 딥러닝을 배우면서 이를 실제로 텐서플로나 파이토치로 구현해봅니다. 

- 2017년 구글의 인공지능 전문가들이 트랜스포머 Transformer 라는 언어 모델을 발표했습니다. 기존의 인공지능은 영어 문장을 순서대로 한 단어씩 읽고 학습하느라 속도가 매우 느렸습니다. 또한 앞에서 읽은 단어들과 현재 읽고 있는 단어와의 상호관계를 기억할 수 없어 긴 문장이 들어오면 아예 이해를 하지 못했습니다. 이 문제를 해결하기 위해 나온 것이 트랜스포머입 니다. 트랜스포머는 단어마다 번호를 매겨 순서를 정하기 때문에 한꺼번에 수백 단어를 읽어도 순서를 헷갈릴 일이 없었습니다. 이로 인해 학습 속도 가 비약적으로 발전하면서 수천억 개나 되는 거대한 양의 문서들을 동시에 읽을 수 있게 된 것입니다.

또 하나의 이슈는 단어와 단어 사이의 의미를 어떻게 기억하게 만드냐 하는 문제였습니다. 트랜스포머는 단어와 단어 사이의 의미도 숫자로 표시 해 컴퓨터가 빠르게 계산할 수 있도록 했습니다. 예를 들어 한 문장에 20개 의 단어가 있다면 각 단어마다 20개의 숫자를 부여하고, 다른 단어 사이의 의미를 갖게 하는 숫자도 20개를 부여합니다. 이렇게 하면 20개×20개=400 개의 숫자가 존재합니다. 이것을 하나의 세트, 즉 어텐션 벡터 attention vector 라고 합니다. 이러한 숫자의 세트인 벡터 여러 개를 결합해 단어들 사이의 의 미를 그대로 보전하게 되는 것이죠. 이것으로 트랜스포머는 속도의 문제까지 함께 해결했습니다.

언어 모델의 성능을 겨루는 시험 중 BLEU Blingual Evaluation Understudy Score는 사람이 번역한 것과 비교해 인공지능 언어 모델이 얼마나 정확하게 번역했는가를 측정하는 테스트입니다. 트랜스포머는 이전에 나왔던 여타의 언어 모델이 성취하지 못했던 결과를 완전히 뛰어넘었습니다. BLEU에서 1등한 모델을 보통 '쏘타 SOTA; State of the Art' 라고 하는데, 이 말은 언어 분야뿐만 아니라 다른 분야의 인공지능 테스트에서도 1등한 모델을 지칭하는 말로 자리잡 았습니다. 인공지능에서 ‘쏘타'를 달성했다는 말은 곧 최고의 칭찬이 된 것 입니다.

- 트랜스포머가 개발된 이후 언어 모델은 획기적으로 발전합니다. 2018년 에 구글이 만든 BERT, 오픈AI가 만든 GPT가 나왔습니다. BERT는 번역에, GPT는 문장 생성에 강점을 둔 모델입니다. BERT는 또 무수한 업그레이드 버전을 내놓는데 ROBERTa는 페이스북이 만든 업그레이드 버전, ALBERT 는 BERT를 경량화한 버전입니다. 구글은 영어권 나라에서만 통용되는 BERT를 각 나라말로 번역할 수 있는 Multilingual BERT도 만듭니다. 우리나라에도 SKT가 개발한 코버트 KOBERT 와 한국전자통신연구원 ERTI이 개발한 한국어 버트 KorBERT가 있습니다. 트랜스포머 이후 또 한 번의 획기적인 변화가 찾아왔습니다. 2020년에 오픈AI에서 개발한 GPT-3입니다. GPT-3는 기존 모델 크기의 100배 이상인데다 학습하는 문서의 수도 100배가 넘었습니다. 따라서 학습시키는 하 드웨어의 크기 또한 어마어마했습니다. 결과물 또한 놀라웠습니다. 다음 내용은 커크 외멧 Kirk Ouimet 이라는 사람이 GPT-3와 대화한 내용을 재구성한 것입니다. GPT-3는 2019년 10월까지의 데이터를 학습했는데, 대화 시점은 2020년 7월이라 GPT-3가 코로나 팬데믹에 대해 학습하지 못한 상태입니다. 여기서 '연구원은 커크 외멧이고 현명한 존재'는 GPT-3입니다. GPT-3의 통찰력 있는 답변을 한번 보시지요.

- 이 대결에서 인공지능이 사용한 기술은 공개되지 않아 정확하게 평가하기는 어렵지만, 켄쇼와는 달리 전통적인 과거 주가와 거래 내용을 주로 학습한 것으로 추정됩니다. 앞서 살펴본 트로트 작곡 대결과 마찬가지로 사람은 급변하는 상황에 따라 민감하고 빠르게 대응하는 반면, 인공지능은 전반적으로 수익 위주의 안전한 거래를 한 것으로 보입니다. 이를 바탕으로 인공지능을 주식 거래에 활용한다면 순간의 감정에 휩쓸려 충동적으로 매매하는 일은 없겠지만 일반 투자자가 원하는 큰 수익률은 올리기 힘들 것이라는 평가가 나옵니다.

- 인공지능을 기업에서 어떻게 구현할까요?

이제 인공지능을 기업에서 실제로 구현하는 방법을 알아보겠습니다. 인공 지능 전문 업체의 방식도 이와 유사하므로 반드시 차이점을 이해하여 구현 하는 데 도움이 되었으면 합니다.

첫째, 인공지능 모델을 자체적으로 개발합니다. 사실 기업에서 처음부터 모델을 만드는 사례는 그리 많지 않습니다. 왜냐 하면 지금까지 유명한 학자나 구글, 오픈AI, 페이스북 같은 유명 기업들 이 이미 구현해놓은 모델이 많기 때문입니다. 구글의 텐서플로나 페이스북 의 파이토치 등이 이런 라이브러리입니다. 페이퍼위드코드 사이트(https://paperswithcode.com)에 가면 각 분야마다 어떤 모델을 어느 정도로 구현 했는지가 순위별로 나열되어 있고, 해당 논문과 소스 코드까지 전부 올라와 있습니다. 따라서 목적에 잘 맞는 모델을 선택해 소스만 조금씩 고쳐서 사 용하는 것이 일반적입니다.

그리고 파이썬의 패키지 저장소(https://pypi.org)나 깃허브(https:// github.com)에는 전 세계의 개발자들이 이미 만들어놓은 소스 코드가 모 여 있습니다. 여기에서 검색하면 활용할 수 있는 코드가 분명히 있을 것입 니다. 요즘은 백지부터 소스 코드를 작성하는 사람은 거의 없는 상황이죠.

둘째, 인공지능의 전이 학습 방식을 사용합니다. 인공지능에는 전이 학습 방식이 있습니다. 만일 우리가 ERPEnterprise 를 도입한다고 할 때 원하는 기능이 없다면 기업별로 커스터마이징을 통해 필요한 부분을 추가 개발합니다. 인공지능, 즉 딥러닝에도 이러한 커스터마 이징이 가능합니다. 이 역시도 유명 인공지능 학자들과 개발자들이 전이 하 습을 할 수 있도록 잘 만들어 놓았습니다. 이것은 다음과 같은 장점이 있습니다.

* 검증된 모델은 이미 많은 데이터를 가지고 학습이 완료된 것으로, 전이 학습을 위해 준비해야 하는 데이터 수도 훨씬 적습니다.

* 이미 검증된 모델을 사용하기 때문에 학습 속도가 빠르고 정확도도 높습니다.

* 추가로 고쳐야 하는 소스 코드도 수십 줄 미만 정도로 많지 않습니다. 

그리고 다음 사이트에서는 이미 만들어진 모델을 다양하게 찾아볼 수 있습니다.

* 텐서플로우 허브(tthub.dev) 

* 파이토치 허브 (pytorch.org/hub) · 

* 허깅페이스(huggingface.co/models)

이러한 전이 학습을 많이 이용하면 처음부터 인공지능 모델을 새로 개 발해야 하는 수고를 덜 수 있습니다.

셋째, 자동화 머신러닝 패키지를 활용합니다. 자동화 머신러닝 AutoML 이란 인공지능이 스스로 모델을 만들고 테스트하면 서 가장 성능이 좋은 모델을 골라주는 패키지입니다. 말로만 들으면 인공지 능 전문가가 따로 필요 없을 것 같지요. 그러나 이 방법을 쓴다 해도 인공지 능에 대한 기초 수준의 지식과 통계를 알아야 하고 패키지 사용법도 따로 배워야 합니다. 물론 텐서플로나 파이토치로 직접 코딩하는 것보다는 쉽습니다. 유명한 것으로는 구글 GCP의 AutoML, AWS SageMaker, Microsoft Azure ML, DataRobot, H2O 등이 있습니다. 각 패키지마다 장단점이 있고 유료이므로 잘 비교해보고 선택해야 합니다. 사용할 데이터는 당연히 자체 적으로 준비해야 합니다.

넷째, 다양한 인공지능 API를 활용합니다. 구글이나 네이버는 다양한 인공지능 모델을 만든 후 API로 연결만 하면 고 객이 서비스를 바로 이용할 수 있도록 했습니다. 이는 자체적으로 서비스를 개발하는 것보다 훨씬 노력이 적게 들고, 요금도 API를 통해 처리하는 데이 터 건수에 따라 부과하면 됩니다. 대표적으로 네이버의 클로바 API와 구글AI API가 있습니다. 이 방법을 활용하면 인공지능 전문가가 없어도 API와 프론트 엔드 개발자만으로 구현 가능합니다.

* 네이버 클로바 API(https://clova.ai): 음성 인식, 음성 합성, OCR, 챗봇, 이미지 분석, 텍스트 분석, 얼굴 분석, 동영상 인식 등으로 자체 서비스를 만들 수 있습니다.

* 구글 AI API(https://cloud.google.com/products/ai): STT, TTS, 챗봇, OCR, 번역 등으로 가게 서비스를 만들 수 있습니다.

 

'IT' 카테고리의 다른 글

빅데이터 사용 설명서  (0) 2022.05.07
웹 3.0 메타버스  (0) 2022.05.07
알고리즘이 지배한다는 착각  (0) 2022.04.28
나는 메타버스에 살기로 했다  (0) 2022.04.20
데이터는 어떻게 자산이 되는가  (0) 2022.02.22
Posted by dalai
,

- 케임브리지 애널리티카와 그 회사의 정치적 성격 분석 기법을 더 자세히 살펴본 결과, 나는 알고리즘의 정확도에 근본적 한계가 있다는 사실을 발견했다. 그 한계는 내가 인간 행동을 모형화하면 서 경험해온 바와 일치했다. 나는 응용수학 분야에서 20년 넘게 일했다. 회귀 모형, 신경망neural network, 기계학습, 주성분 분석, 그 밖에 지금 미디어에서 점점 더 많이 거론되는 많은 기법들을 사용해왔 다. 그리고 그 오랜 경험을 통해서, 나는 우리 주변의 세계를 이해하는 것이 과제일 때는 대개 인간이 수학적 모형보다 더 우수하다는 사실을 깨달았다.
- 나는 수학을 사용하여 세계를 예측하는 일을 하는 사람이므로, 나의 견해가 의아하게 느껴질 법도 하다. 현재 나는 이 책을 쓰고 있을 뿐 아니라 회사를 경영하고 있다. 그 회사는 모형들을 사용하 여 축구 경기의 결과를 이해하고 예측한다. 또한 나는 인간, 개미, 물고기, 새, 포유동물의 집단행동을 수학을 사용해서 설명하는 연 구팀의 지휘자다. 요컨대 모형들이 유용하다는 생각은 나의 이익을 위해 대단히 중요하다. 따라서 수학의 유용성에 대한 의심을 너무 많이 제기하는 것은 아마도 내 입장에서는 이롭지 않을 것이다. 하지만 정직할 필요가 있다. 축구에 관한 사업을 하면서 나는 최고의 팀들에서 일하는 분석가들과 만난다. 내가 특정 선수의 찬 스 만들기 chance creation 실적이나 경기 기여도에 관한 수치들을 그들 에게 말해주면, 그들은 그런 수치들이 나온 이유를 직관적으로 설명하여 나를 깜짝 놀라게 하곤 한다. 예컨대 나는 X 선수가 같은 포지션을 맡은 Y 선수보다 위협적인 패스를 34% 더 많이 했어요” 라고 말한다.
그러면 분석가는 이렇게 대꾸하곤 한다. “그렇군요. 그럼 수비기여도를 한번 봅시다. 그쪽에서는 Y 선수가 더 낫죠? 지금 상황에 서는 수비를 하라고 감독이 Y에게 지시하고 있어요. 그래서 Y가 찬 스를 만들 기회가 줄어드는 거예요.” 컴퓨터는 방대한 통계 수치들을 수집하는 일을 아주 잘하는 반면, 인간은 그 수치들의 바탕에 깔린 이유를 식별하는 일을 아주 잘한다.
- 회사들이 사적인 메시지들을 활용한다는 취지의 음모론은 옳을 개연성이 낮다. 더 그럴싸한 설명은, 데이터 연금술사들이 우리의 행동에서 발견한 통계학적 관련성을 이용하여 우리를 겨냥한다는 것이다. 이를테면 게임 마인크래프트Minecraft〉와 〈오버워치 Overwatch) 의 플레이 영상을 즐겨 보는 아이들은 저녁에 샌드위치를 먹는다는 식의 관련성이 이용된다. '으스스한 표적 광고의 또 다른 주요 원천은 '재조준'이다. 우리 는 알가르브 여행을 검색한 다음에 그 사실을 그냥 잊어버리지만, 웹브라우저는 그 사실을 기억하여 투이에 알려준다. 그러면 그 회사는 우리에게 알가르브의 최고급 호텔방을 예약하라고 제안한다.
우리는 엄청나게 많은 광고에 노출되고, 엄청나게 오랫동안 스 마트폰이나 컴퓨터 스크린을 들여다본다. 바로 그렇기 때문에 때때로 광고들이 우리의 마음을 읽었다고 느끼는 것이다.
실은 알고리즘이 영리한 것이 아니다. 영리함은 데이터 연금술 사들에게서 나온다. 그들은 데이터를 고객에 대한 자기네의 지식과 결합한다. 요한과 동료들의 전략은 영리하다. 왜냐하면 결과들을 산출하고 때로는 매출을 10배나 증가시키니까 말이다. 그러나 그 전략은 잘 정의된 과학적 방법론을 따르지는 않는다. 그들의 전략은 엄밀하지 않다. 요한이 내게 해준 말에 따르면, 고객들에 관한 상세한 모형을 연구한 경력이 10년에 달하는 아주 영리한 데이터 과학자가 어떤 전략을 제안했다고 하더라도, 그 전략에 투자할 가치가 있다고 확신할 수 없다. “우리의 전략은 대규모 인구 집단에서 타당 해야 해요. 데이터에만 의지해서 특정한 소집단들을 표적으로 삼는 것은 충분히 신뢰할 만한 방법이 아닙니다."
- 나는 인간의 행동과 성격을 측정하는 데 쓰이는 모든 알고리즘을 체계적으로 검사할 수 없다. 기본적으로 그럴 시간이 없다. 그러나 내가 비교적 자세히 탐구한 모형들 - 축구에서 골이 나올 확률, 음악적 취향, 범죄 확률, 정치적 성격을 예측하는 모형들에 대해 서 말하자면, 나는 다음과 같은 동일한 연구 결과에 도달했다. 알고 리즘의 정확도는 기껏해야 인간의 정확도와 대등하다.
그렇다고 해서 알고리즘이 무용한 것은 아니다. 비록 정확도는 인간과 대등하다 하더라도, 알고리즘은 속도의 측면에서 엄청나게 유용할 수 있다. 스포티파이는 수백만 명의 사용자를 보유하는데, 그들 각각의 음악적 취향을 파악하기 위해 인간 직원을 한 명씩 고용한다면 엄두도 못 낼 만큼의 비용이 들 것이다. 투이의 데이터 연금술사들은 우리에게 가장 잘 맞는 여름휴가 상품을 우리의 눈앞에 띄우기 위해 알고리즘을 사용한다.
알고리즘의 성능이 인간과 대등하다면, 컴퓨터가 인간을 이긴 다. 왜냐하면 컴퓨터는 인간보다 훨씬 더 빠르게 데이터를 처리할 수 있기 때문이다. 요컨대 모형들은, 전혀 완벽하지 않지만 확실히 매우 유용하다.
데이터 처리 규모의 확대를 옹호하는 이 논증을 피고인들의 재 범 성향 측정에 적용할 경우에는, 논증의 타당성이 감소한다. 콤파스 알고리즘의 작동에 필요한 데이터를 수집하는 작업은 복잡하고 비용이 많이 들며, 그 알고리즘이 처리해내는 사례의 수는 비교적 적다. 따라서 인간을 알고리즘으로 대체하는 것을 옹호하는 논증은 설득력이 약해진다. 게다가 알고리즘의 침습성invasiveness과 개인의 프 라이버시에 관한 중대한 질문도 있다. 머캐니컬 터크에서 모집한 일꾼들의 도움으로 수행한 연구에서, 일꾼들은 피고인들에 관한 공 개된 정보만 제공받았음에도 알고리즘과 대등한 정확도로 판단했 다. 강제로 면담과 알고리즘의 평가를 받는 일은 많은 피고인에게 굴욕적일 것이 틀림없다. 그럼에도 재범률 예측에서 그 일이 추가로 제공하는 혜택은 없는 것으로 보인다.
- 예측 결과들을 몇 개의 범주로 분류할 것을 강조하는 모나의 뜻 을 이어서 나는 모든 모형 예측 발표에 경고문을 덧붙이는 것을 의 무로 정하자고 제안한다. 경고문은 누구나 이해할 수 있게 작성되 어야 하며, 예측의 정확도를 알려주는 범주에 따라 이를테면 아래 와 같이 세분될 수 있을 것이다.
* 무작위 예측: 이 예측들은 다트를 던지는 침팬지를 능가하지 못함.
* 정확도가 낮은 예측: 이 예측들은 머캐니컬 터커에서 활동하는 저임금 일꾼들을 능가하지 못함. 
* 정확도가 중간인 예측: 이 예측들은 도박업자들을 능가하지 못함.
- 서던 캘리포니아 대학교 정보과학센터의 연구원 크리스티나 러먼Kristina Lerman이 나에게 해준 말에 따르면, 우리의 뇌는 '좋아요 추 가'를 아주 좋아한다. 그녀는 우리의 온라인 행동을 모형화할 때 한 가지 어림규칙을 사용한다. 그녀는 이렇게 말했다. “기본적으로 사 람들은 게으르다고 전제하세요. 그러면 사람들의 행동을 거의 다 예측할 수 있습니다.” 크리스티나는 매우 다양한 웹사이트를 연구한 끝에 그 결론에 도달했다. 어떤 웹사이트냐면, 페이스북과 트위터를 비롯한 사회연결망들, 스택 익스체인지Stack Exchange'를 비롯한 프로그래밍 사이트들, 야후 온라인 쇼핑, 학술 문헌 검색엔진 ‘구글 스칼러 Google Scholar 온라인 뉴스 사이트들이었다. 뉴스 기사들의 목록을 제공받으면 우 리는 목록의 꼭대기에 위치한 기사들을 읽을 개연성이 매우 높다. 3 프로그래밍 관련 문답 사이트인 스택 익스체인지'에 대한 연구에 서, 크리스티나는 사용자들이 답변을 받아들일 때 답변의 질에 대 한 평가에 기초해서가 아니라 그 답변이 웹페이지에서 얼마나 높은 곳에 있는지, 또 (얼마나 많은 단어들로 이루어졌는지가 아니라) 얼마나 큰 공간을 차지하는지에 기초해서 받아들이는 경향이 있음을 발견 했다.4 그녀는 나에게 이렇게 말했다. “이런 사이트에서 선택지들을 더 많이 보여줄수록, 사람들은 더 적은 선택지들을 주목하게 돼요." 우리에게 너무 많은 정보가 제공되면, 우리의 뇌는 그 정보를 그냥 무시하는 것이 최선이라고 판단한다.
- '블랙 햇'이라는 용어는 원래 사적인 이익을 위해 컴퓨터 시스템에 침입하여 그것을 조작하는 해커를 가리켰다. 그러나 '블랙 햇 월드'에 모이는 블랙 햇 제휴회사들은 구글에 침입하지 않는다. 대신에 그 회사들은 구글의 검색 알고리즘을 악용하여 돈을 벌기 위해 가능한 모든 수단을 동원한다. CCTV 사이먼은, 만일 구글의 검색 결과 가운데 제휴 웹사이트를 맨 위에 뜨게 만들 수 있다면 많은 트래픽이 아마존으로 향하는 도중에 그 사이트를 거칠 것이라는 사실을 깨달았다. 크리스티나 러먼이 보여주었듯이, 우리의 게으른 뇌는 검색 결과의 맨 윗부분에 관심을 기울인다. '블랙 햇 월드' 에 올라온 게시물들의 도움으로 사이먼은 한 전략을 개발했다. 그는 CCTV 카메라에 집중하기로 했다. 왜냐하면 영국에서 CCTV 시장은 한창 성장 중이며 수수료로 돈을 벌기에 충분할 만큼 크기 때문이다. 그는 '구글 애드워즈 Google AdWords' (현재는 '구글 애즈Google Ads')를 연구한 끝에 자신의 페이지에 집어넣을 핵심 검색 문구 몇 개를 고 안했다. 그는 한 페이지의 제목을 “CCTV 카메라를 살 때 범할 수 있는 최고의 실수 10가지"로 정함으로써 시장의 틈새를 선점했다. 그 검색 문구를 사용한 블랙 햇 제휴회사는 그때까지 없었다.
- 다음 단계는 구글 알고리즘을 속여서 사람들이 자신의 제휴 사이트에 정말로 관심이 있다고 믿게 만드는 것이다. 사이먼은 이 단 계를 “링크 주스link juice 창조하기”라고 부른다. 구글의 원조 알고리 즘인 '페이지랭크 PageRank'에서 한 사이트의 순위는 그 사이트를 통과 하는 클릭들의 흐름을 기준으로 매겨졌고, 그 흐름은 사이트를 오가는 하이퍼링크의 개수에 의존했다. 구글 알고리즘의 기본적인 원리는 '좋아요 추가 모형과 똑같다. 인기 있는 페이지일수록 검색 결 과에 뜰 확률이 더 높다. 한 페이지의 순위가 상승하면, 그 페이지 로 향하는 트래픽이 증가하고, 순위는 더욱 상승한다.
특정 페이지의 순위를 올리고자 할 때 블랙 햇 페이지로 향하는 링크들을 만들어낸다. 그러면 구글의 알고리즘은 그 페이지가 연결망에서 핵심적이라고 생각하면서 검색 결과에서 순위를 높인다. 일단 링크 주스가 흐르고 특정 사이트가 검색 결과 의 상위로 올라가기 시작하면, 진짜 사용자들의 클릭이 유발되면서 더 많은 링크 주스가 생산된다. 이때부터 블랙 햇 제휴회사들은 돈 을 벌기 시작하는데, 그 돈은 구글이 아니라 수수료를 지불하는 아 마존과 기타 제휴 사이트에 입력되는 클릭으로부터 나온다. | 구글이 가짜 링크를 식별하는 방법을 차츰 개발함에 따라, 구글 의 알고리즘을 속이기 위한 블랙 햇의 수법은 더 복잡해졌다. 현재 인기 있는 방법은 '사설 블로그 연결망private blog network, PBN'을 창조하 는 것이다. 그 연결망 안에서 한 개인은 예컨대 와이드스크린 TV에 관한 사이트 10개를 개설하고, 유령 저자들을 동원하여 그 주제를 다루는 다소 무의미한 글로 사이트들을 채운다. 그런 다음에 10개 의 사이트를 한 제휴 사이트와 연결하여 그 제휴 사이트가 최신 TV 를 다루는 가장 권위 있는 사이트인 것처럼 보이게 만든다. 외톨이 블랙 햇- 페이스북 '좋아요'들과 트위터 공유까지 완비한 - 이 온 라인 커뮤니티 전체를 창조하고 있다. 단지 구글의 알고리즘을 속이기 위해서 말이다.  사설 블로그 연결망이나 블랙 햇 아마존 제휴 사이트가 성공하 려면 일부는 진짜 문서 콘텐츠를 보유해야 한다. 구글은 단지 다른 사이트들을 베낄 뿐인 사이트를 차단하기 위해 표절 알고리즘을 사용하며, 게재된 글이 기초적인 문법 규칙을 따르는지 여부를 자동언어분석을 통해 확인한다. 사이먼이 내게 해준 말에 따르면, 그는 처음에 CCTV 카메라를 구입하고 진짜 리뷰를 썼다. 그러나 머지 않아 무언가를 깨달았다. “내가 카메라를 사건 말건, 구글은 사이트 의 순위를 바꾸지 않아요. 구글의 알고리즘이 하는 일은 키워드를 점검하는 것, 독창적인 내용을 찾아내는 것, 내 사이트에 그림이 있 는지 보는 것, 주스의 양을 측정하는 것이 전부죠.” 사이먼은 대학교 에서 공부한 덕분에 그 알고리즘이 어떻게 작동하는지 알고 있었지 만, 트래픽에 대한 구글의 접근법이 정말 얼마나 단순하고 엉성한지 실감하고는 깜짝 놀랐다. 그의 사이트는 금세 수십만 건의 방문을 유발하고 있었다.
- 상업적 이해관계가 끼어들 경우, 아마존과 구글의 집단적 신뢰성은 극적으로 추락할 수 있다. '좋아요 추가가 양의 피드백positive feedback을 창출하고 구글이 트래픽을 중시한다는 사실은, 실제로 모 든 와이드스크린 TV나 CCTV 카메라를 체계적으로 검토하는 진짜 화이트 햇 제휴 사이트가 그저 주스를 뿜어낼 뿐인 온갖 블랙 햇 사이트들 사이에서 금세 사라진다는 것을 의미한다. 사용자들이 더 우수한 예측을 하도록 독려하는 프리딕팃 알고리즘의 금전적 보상 과 달리, 온라인 쇼핑을 둘러싼 금전적 보상의 메커니즘은 소비자 들의 불확실성을 증가시키는 방향으로 작동한다.
온라인 쇼핑을 뒤덮은 온갖 왜곡을 보면서 나는 나 자신의 개인 적 성공에 대해서 잠깐 생각하지 않을 수 없었다. 이 책이 출판되면 잘 팔릴까? 나는 수많은 봇들을 만들어서 아마존 링크를 클릭하게 하거나, 사람들로 공동체를 꾸려 이 책을 추천하는 글을 웹사이트 굿리즈 Goodreads'에 올리게 할 생각이 없다. 내 책이 베스트셀러가 될 가망이 조금이라도 있을까?
- 애덤 모세리의 말마따나 처음에 사용자는 “아무것도 적혀 있지 않은 서판과 같다.” 그러나 사용자가 서판에 첫 메시지를 써넣자마자, 가시성과 관여 사이의 피드백이 시작된다. 가시성은 관여의 제 곱에 비례하므로, 서판은 사용자가 처음에 우연히 관심을 보인 신문의 기사들로 신속하게 채워진다. 필터’ 알고리즘은 버블(거품 방 울)을 창출한다. 심지어 처음에 편향이 없었던 사용자의 뉴스피드에 서도 그러하다.
이미 좌파 성향의 미디어나 우파 성향의 미디어를 선호하는 상태에서 페이스북을 사용하기 시작하는 사람들에게는 이 효과가 더 강력하게 나타난다. 필터' 알고리즘은 초기의 작은 차이를 포착하고 부풀려 약간 열등했던 한쪽 진영이 결국 사라지게 만든다. 사용자는 자기확증적 생각과 소규모 친구들과의 상호작용 안에 갇힌다.
- 구글 검색, 페이스북 필터링, 트위터 유행 목록은 문제점들을 안고 있다. 그러나 우리는 이것들이 정말로 경이로운 도구들이라 는 점도 잊지 말아야 한다. 때때로 검색 알고리즘은 공격적이며 틀 린 정보를 검색 결과의 상위에 올릴 것이다. 그것이 싫을 수도 있겠지만, 우리는 그것이 불가피한 현상이라는 점도 인정해야 한다. 그것은 구글 검색의 작동 방식 - ‘좋아요 추가'와 '필터링을 조합한 방식에 내재하는 한계다. 개미들이 원을 그리며 맴도는 것은 녀석들이 엄청나게 많은 먹이를 수집하기 위해 발휘하는 경이로운 능력의 부작용이다. 이와 마찬가지로 구글 검색 알고리즘의 실수들은 정보를 수집하여 우리에게 제공하는 그 알고리즘의 경이로운 능력에 내재한 한계다.
현재 구글, 페이스북, 트위터가 사용하는 알고리즘들의 가장 큰 한계는 우리가 주고받는 정보의 의미를 제대로 이해하지 못한다는 점이다. 그렇기 때문에 그 알고리즘들은, 독창적이며 문법도 올바르지만 결국 쓸모없는 텍스트로 채워진 CCTV 사이먼의 사이트에 지금도 계속 속고 있다. 결국 회사들은, 우리의 게시물을 감시하면서 게시물의 참된 의미에 대한 이해에 기초하여 그것들을 공유하는 것 이 적절한지 또 누구에게 전달해야 할지를 자동으로 판단할 수 있 는 알고리즘을 보유하기를 원할 것이다.  바로 이것이 지금 회사들이 추구하는 바다. 모든 회사들은 우리의 말을 이해하는 알고리즘을 개발하는 중이다. 목표는 인간 관리자에 대한 의존을 줄이는 것이다. 이를 위해 구글, 마이크로소프트, 페이스북은 미래의 알고리즘이 우리와 더 비슷해지기를 바란다.
- 하버드 대학교의 연구자들이 암묵적 연상 검사를 고안하고 대중화한 것은 우리 모두가 인종차별주의자이며 편견이 심함을 폭로 하기 위해서가 아니라, 우리의 무의식적 선입견들에 관하여 교훈을 주기 위해서였다. 암묵적 연상 검사의 기회를 제공하는 웹사이트는 연구자들의 취지를 이렇게 설명한다. “우리는 사람들에게 암묵적 선입견을 줄이는 전략을 권장하는 것이 아니라 암묵적 선입견이 작 동할 기회를 주지 않는 전략을 권장한다.” 알고리즘 세계의 언어로 번역하면, 알고리즘을 비판하는 것이 아니라 알고리즘이 지닌 선입 견을 제거할 길을 찾아내는 것에 집중해야 한다는 뜻이다.
- 알고리즘의 편견을 제거하는 어떤 전략은 알고리즘이 우리를 공간적 차원들로 표현하는 방식을 이용한다. 글로브는 수백 차원의 공간에서 작동하므로, 그 알고리즘이 단어들에 대해서 형성한 이해 를 온전히 가시화하는 것은 불가능하다. 그러나 알고리즘의 차원들 가운데 어떤 것들이 인종이나 젠더와 관련이 있는지 알아내는 것은 가능하다. 그래서 내가 연구해보기로 했다. 나는 글로브의 100차원 버전을 내 컴퓨터에 설치하고 어떤 차원들에서 남성 이름과 여성 이 름 사이의 거리가 가장 먼지 조사했다. 그런 다음에 간단한 조치를 취했다. 무슨 말이냐면, 그 젠더 관련 차원들을 0으로 설정했다는 뜻 이다. 그리하여 그 차원들에서는 수전, 에이미, 세라가 존, 데이비드, 스티브와 똑같은 점으로 나타나게 되었다. 이어서 나는 남성 이름과 여성 이름 사이의 거리가 꽤 먼 차원들을 추가로 찾아내어 그것들까지 총 10개의 차원을 모두 0으로 설정했다. 요컨대 나는 글로브 알고리즘에 내재한 성차별적 선입견의 대부분을 제거했다.
나의 조치는 유효했다. 젠더 차원 10개를 제거한 다음에 나는 알고리즘에게 나(데이비드)와 수전에 관한 질문들을 던졌다. 첫 질문은 '데이비드와 지능이 높음 사이의 관계는 수전과 무엇 사이의 관계와 같을까?'였다. 계산식으로 표현하면 '지능이 높음 - 데이비드+수전'의 결과를 물은 것이다. 대답은 명확했다. 영리함. 이와 유사하게 '영리함 - 데이비드 +수전의 결과는 '지능이 높음'이었다. 서로 비슷한 말인 '영리함'과 '지능이 높음'은 양방향으로 연결되어 있었다. 내가 데이비드인지 수전인지는 중요하지 않았다. 마지막으로 시험한 계산의 결과는 나를 놀라게 했다. '똑똑함 - 데이비드 + 수전 = 분방함Rambunctious.’ 나는 'Rambunctious'라는 단어를 몰라서 사전에서 찾아봐야 했다. 그 단어는 '통제할 수 없을 정도로 활기가 넘침'을 뜻한다. 새로운 수전은 데이비드에 못지않게 영리할뿐더러 새삼 발견한 자신의 지능에 뚜렷이 고무되어 있었다.
보스턴 대학교의 박사과정 학생 톨가 볼루크바시 Tolga Bolukbasi는 알고리즘의 공간적 차원들을 조작함으로써 성차별주의적 성향을 줄이는 방법을 더 본격적으로 연구했다. 구글이 사용하는 워드투벡 알고리즘은 글로브처럼 단어들을 다차원 공간에 배치하는데, 톨가 는 그 알고리즘이 다음과 같은 계산 결과를 내놓는 것에 충격을 받 았다. 남성 - 여성 = 컴퓨터 프로그래머 - 주부. 그리하여 그는 무언가 개선책을 강구하기로 했다.
- 톨가와 동료들은 여성 특유의 단어들(예컨대 ‘그녀’ ‘그녀의 여성’ '메리')의 위치에서 남성 특유의 단어들(그’ ‘그의' '남성' '존')의 위치 를 뺌으로써 체계적으로 차이들을 찾아냈다.10 이 방법으로 그들은 워드투벡 내부의 300차원 단어 공간에 내재한 편견의 방향을 알아 냈다. 그런 다음에 그들은 모든 단어들을 편견의 방향과 반대되는 방향으로 옮김으로써 그 편견을 제거하는 데 성공했다. 이 해법은 우아하면서도 효과적이다. 이렇게 젠더 편견을 제거하더라도 그 알고리즘이 구글의 표준 유추 검사에서 나타내는 전반적인 성능은 거의 그대로임을 연구자들은 보여주었다. 톨가가 개발한 방법은 단어에 관한 젠더 편견을 줄이거나 없애는 데 쓰일 수 있다. 그 방법이 만들어낸 새로운 단어 공간에서 모든 젠더 단어들은 모든 비젠더 단어들로부터 똑같은 거리만큼 떨어져 있다. 예컨대 '아기 돌보미’와 ‘할머니' 사이의 거리는 아기 돌보미’와 ‘할아버지’ 사이의 거리와 같다. 최종 결과는 완벽한 '정치적 올바름이다. 특정 동사나 명사에 한 젠더가 다른 젠더보다 더 가까이 위치한 경우는 전혀 없다.
우리가 알고리즘에게 요구해야 마땅한 정치적 올바름에 대해서 사람들은 다양한 견해를 가지고 있다. 개인적으로 나는 우리의 언어를 공간화하는 알고리즘에서 아기 돌봄'이 '할머니와 할아버지’로부터 똑같은 거리만큼 떨어져 있어야 한다고 생각한다. 할머니와 할아버지는 손주를 돌볼 능력을 동등하게 지녔으므로, 아기 돌봄'과 '할머니'와 '할아버지'가 그렇게 배치되는 것이 논리적으로 옳다.
하지만 어떤 이들은 '아기 돌봄'이 '할아버지'보다 '할머니'와 더 가 깝게 위치해야 한다고 주장할 것이다. 할머니가 손주를 돌보는 경 우가 더 많다는 현실을 부정하는 것은 경험적 관찰을 부정하는 것 이기 때문이라면서 말이다. 이 차이는 세계를 논리적 형태로 보는 사람과 경험적 형태로 보는 사람 사이의 차이다. 


'IT' 카테고리의 다른 글

웹 3.0 메타버스  (0) 2022.05.07
AI로 일하는 기술  (0) 2022.04.28
나는 메타버스에 살기로 했다  (0) 2022.04.20
데이터는 어떻게 자산이 되는가  (0) 2022.02.22
웰컴 투 인공지능  (0) 2022.02.20
Posted by dalai
,

- '메타버스Metaverse’는 ‘이후 또는 '그 너머'를 의미하는 그리스어 'Meta'와 '우주'를 의미하는 'Universe 의 합성어입니 다. 닐 스티븐스의 소설 '스노우 크래시 (1992)'에 처음으로 등장한 개념으로, 현실의 우주Universe를 넘어선 가상의 세계를 가리키는 말이지요. 그런데 여기서 '가상 세계'라는 함정에 빠져서는 안 됩니다. '가상 세계'는 곧 영어 Virtual world'에 대응하는 말입니다. 우리말에서의 가상假像은 '가짜’, ‘거짓’과 통하는 단어지만, 영어의 virtual은 '실제와 매우 유사한’, ‘실질적인' 이라는 뜻을 담고 있 습니다.
'virtual ruler'는 '가상의 통치자가 아니라, '거의 통치자의 역 할을 하고 있는 실질적 통치자'를 의미하지요. 가상 세계' 또한 실존하지 않는 가짜 세계'가 아닌, ‘거의 현실 세계와 유사한, 또 하나의 세계'인 것이지요. 그렇기에 머리로 공상만 한다고 해 서 그런 가상 세계'가 만들어지는 것이 아닙니다. 그 가상 세계는 어디까지나 '실재'합니다. 무엇을 통해서냐고요? 바로 컴퓨터나 스마트폰과 같은 디지털 매체를 통해서죠.
- 메타버스는 넓은 의미에서 인 터넷을 기반으로 한 SNS, 커뮤니티, 게임 등에 모두 해당된다고 도 할 수 있습니다. 실제로 미국의 기술 연구단체 ASFAcceleration Studies Foundation는 메타버스를 증강현실AR, 라이프 로깅 Life Logging, 거울 세계Mirror Worlds, 가상 세계Virtual World라는 네 가지 의 지표로 구분하면서 우리가 일상적으로 사용하는 SNS나 구글 어스 따위를 모두 메타버스의 범주에 포함시키고 있습니다.
하지만 단순히 메타버스가 '디지털 가상 세계'와 동일한 의미 를 가진다면, 이토록 주목받을 이유는 없었겠지요. 좁은 의미에 서의 메타버스는 조금 더 특별한 의미를 가집니다. 이 책에서 다 루는, 지금부터 다룰, 그리고 여러분들이 흔히 생각하는 메타버 스는 대개 좁은 의미의 메타버스입니다. 단순히 디지털 가상 세 계 전반을 가리키는 것은 아니란 거죠.
- 좁은 의미의 메타버스는 네 가지의 차별화된 요소로 설명할 수 있습니다. '아바타Avatar'와 '오픈월드Open World', '샌드박스 Sandbox' 그리고 '사회적 상호작용Social Interaction' 이죠. 이것들은 모두 메타버스 연구자들이 공통적으로 지적하는 메타버스의 핵심 개념입니다. '모든 사람들이 아바타를 이용하여 사회, 경제, 문화적 활동을 하게 되는 가상의 세계(손강민), '나를 대변하는 아 바타가 생산적인 활동을 영위하는 새로운 디지털 지구(김상균, 신병호)’가 대표적이지요. 
- 모든 장점을 갖춘 '궁극의 메타버스’는 존재하지 않습니다. 그렇기에 단일한 플랫폼으로 모든 것을 실현하겠다는 생각에서 도 벗어날 필요도 있습니다. 보조 플랫폼을 사용한다고 그것이 메타버스가 아니게 되는 것은 아닙니다. 보조 플랫폼의 사용은 메타버스에 더 많은 가능성과 체험의 기회를 열어줍니다. 가령, 마인크래프트의 경우 자체적으로 음성을 중개해주는 시스템을 제공하지 않습니다. 마인크래프트만 사용한다면 텍스트 채팅 정도의 소통만 가능하죠. 여기에 디스코드라는 음성 중개 플랫폼을 함께 사용함으로써 더 큰 시너지 효과를 발휘할 수 있습니다. LG전자 메타버스의 경우, 마인크래프트와 함께 Webex 회의 플랫폼을 사용하기도 했습니다. 보조 플랫폼이 필요한 이유가 그저 단점을 극복하기 위해서 만은 아닙니다. 일례로, 영남대 메타버스 캠퍼스에 들어온 한 학생은 절대로 '채팅 기능을 사용하지 않았습니다. 디스코드를 통한 음성 중개는 잘만 사용하면서도 글자로 치는 채팅은 단 한 마디도 하지 않았던 거죠. 의아하게 생각했는데, 나중에 물어보니 ‘채팅은 기록이 남을 것 같아 찝찝하다”고 말하더군요.

'IT' 카테고리의 다른 글

AI로 일하는 기술  (0) 2022.04.28
알고리즘이 지배한다는 착각  (0) 2022.04.28
데이터는 어떻게 자산이 되는가  (0) 2022.02.22
웰컴 투 인공지능  (0) 2022.02.20
가볍게 떠먹는 데이터 분석 프로젝트  (0) 2022.02.16
Posted by dalai
,