딥러닝 레볼루션

IT 2020. 6. 12. 13:01

- 알파고 제로는 인간의 전략을 배제했지만 그럼에도 그 프로그램이 바둑을 두기 위해 이용할 수 있는 바둑 지식은 수작업으로 입력된 상 태였다. 그렇다면 알파고 제로는 바둑에 대한 지식이 없어도 여전히 향상될 수 있을까? 이 의문에 대한 답을 찾기 위해 도출한 것이 알파 제로(AlphaZero)였다. 코카콜라 제로(Coca-Cola Zero)가 코카콜라에서 모든 칼로리를 제거한 것이듯 알파제로는 알파고 제로에서 바둑에 관한 특정 지식 모두를 제거한 것이었다. 결론부터 말하자면 알파제로는 알파고 제로보다 더욱 빠른 속도로 학습할 수 있었고, 알파고 제 로를 뛰어넘는 수준에 이르렀다. 또한 알파제로는 학습 매개변수를 단 하나도 변경하지 않은 상태에서 슈퍼맨 수준으로 체스를 배워 ‘적을수록 더 좋다(less is more)'는 요점을 보다 극적으로 보여줬다. 알파 제로는 인간이 전에 한 번도 시도한 적 없는 외계적 체스 수까지 선보이며 슈퍼맨 수준의 기존 체스 프로그램인 스톡피시(Stockfish)에게 단 한 차례도 승리를 허용하지 않았다. 한 체스 대국에서는 비숍 하나를 희생하는 대담한 수(때로 유리한 위치를 점유하기 위해 이용되는 수)를 둔 후 퀸까지 내줬다. 이런 행보는 치명적인 실수로 보였지만, 이후 적잖은 수가 진행된 후 체스 프로들도, 스톡피시도 예상하지 못했던 외통 수 장군이 나와 모두를 놀라게 했다. 외계인이 도착한 셈이었고, 이제 지구는 더 이상 전과 같지 않을 터였다.
- 컴퓨터 비전은 픽셀이 아닌 특징에 초점을 맞춤으로써 진보하기 시작했다. 예를 들어 조류 사육자나 관찰자들은 몇 가지 미묘한 무늬만 다른 경우가 많은 각각의 종을 구별할 줄 아는 전문가가 되어야 한다. 조류 구분법을 알려주는 실용적이고 대중적인 서적은 대개 각 각의 새에 대해 한 장의 사진을 소개하면서 그들 사이의 미묘한 차이 를 보여주는 스케치를 곁들인다(<그림 2.3) 특정 종에만 고유한 특징 이 있으면 수월한 경우에 해당하지만, 대개 많은 종에서 동일한 특징 들이 발견되기 때문에 새의 식별을 가능하게 하는 것은 날개의 횡대 나 눈의 줄무늬, 깃털의 반점 등과 같은 부위별 표식 몇 가지의 독특 한 조합이다. 그러한 부위별 표식이 밀접히 관련된 종들 사이에 공유 되는 경우에는 다시 울음소리나 노랫소리로 서로를 구별한다. 관련된 종들 사이의 특징에 주의를 집중시킬 때에는 사진보다 그림이나 스케치를 이용하는 것이 효과가 높다. 사진은 관련성이 낮은 수많은 특징까지 가득 포함하기 때문이다. 특징에 기초한 이 접근 방식의 문제점은 수없이 많은 세상의 서로 다른 객체에 대한 특징 감지기를 개발하는 일이 매우 노동 집약적이 라는 것뿐만 아니라 최상의 특징 감지기를 갖춘다 하더라도 객체의 일부가 가려지는 경우 그 이미지에서 모호성이 발생한다는 데 있다. 결국 여러 객체가 뒤섞여 모여 있는 경우 컴퓨터가 각각을 인지하는 일은 벅찬 작업이 될 수밖에 없는 것이다. 1960년대 컴퓨터 비전이 인간 수준의 수행력을 갖추는 데 이후 50 년의 세월에 걸쳐 컴퓨터 성능이 100만 배는 증가해야 될 것으로 짐 작한 사람은 거의 없었다. 컴퓨터 비전 프로그램을 작성하는 일이 수월할 것이라는 잘못된 직관은 우리 인간이 보고 듣고 움직이는 것과 같은 활동을 수월하게 행한다는 사실에 기초했다. 하지만 그런 활동 이 제대로 자리 잡히는 데 수백만 년이라는 진화의 세월이 걸리지 않 았던가. 원통하게도 초기의 인공지능 개척자들은 곧 컴퓨터 비전 문 제를 해결하는 일이 극도로 어렵다는 사실을 인정하지 않을 수 없었 다. 그에 반해 컴퓨터가 로직에서는 인간보다 훨씬 뛰어난 것으로 밝 혀졌기 때문에 그들은 수학적 정리를 증명하도록 컴퓨터를 프로그래 밍하는 일은 훨씬 쉽다는 것을 깨달았다. 수학적 정리의 증명은 최고 수준의 지능을 요하는 것으로 생각되는 과정이다. 논리적으로 생각하는 능력은 진화에서도 늦은 단계의 발달에 속하며, 심지어 인간의 경우에도 정확한 결론에 이르려면 일련의 논리적 명제를 체계적으로 따르도록 훈련을 받아야 하는 무엇이다. 반면에 우리가 생존을 위해 풀어야 할 대부분의 문제는 대개의 경우 이전 경험에 기초한 일반화만으로도 잘 해결할 수 있다.
- 1957년 소련이 스푸트니크 위성을 쏘아올렸을 때 미국의 반응과 흡사하게 2017년 알파고 와 대국을 펼친 중국의 바둑기사 커제의 패배는 베이징에서 2030년까지 전 세계에서 지배적 위치를 구축한다는 목표 아래 야심찬 프로젝트와 스타트업 그리고 학문적 연구 등을 지원하는 수십 억 달러 규 모의 새로운 인공지능 연구 계획이 시작되는 계기가 되었다. 방대 한 의학적, 개인적 데이터를 보유하고 있으며 서방 민주국가들에 비 해 사생활 침해에 대한 우려가 상대적으로 적은 중국이기에 개인정 보를 사유권으로 간주하는 국가들을 뛰어넘어 앞으로 도약하는 일이 충분히 가능하다. 중국은 또한 데이터 수집을 위한 최적의 재배 및 제조 시스템의 구축도 목표로 삼고 있다. 가장 많은 데이터를 보유하는 쪽이 승자가 된다. 중국은 그 점을 간파하고 판을 짜고 있다. 더욱 불길한 것은 중국이 '인공지능 기술을 유도미사일에 접목하 고, 폐쇄회로 카메라에 적용해 사람을 추적하는 데 이용하며, 인터넷 감시를 넘어 범죄 예측에까지 활용하기를 원한다는 점이다. 한편 미국의 정치 지도자들은 과학 기술 분야의 재정 삭감을 계획하고 있다. 1960년대 미국은 우주 개발에 1천 조 달러의 재정을 투입한 바 있다(물가 상승률을 감안해 조정한 금액이다). 덕분에 위성 산업이 발전했고 미국은 초소형전자공학과 재료공학 분야에서 선두로 나서며 과 학기술이 곧 국가의 힘이라는 정치적 선언까지 하지 않았던가. 그때 의 투자로 인한 성과는 오늘날까지 여전히 이어져오고 있다. 초소형 전자공학과 첨단소재 분야는 미국이 아직도 경쟁력을 유지하고 있는 몇몇 산업 분야에 속하기 때문이다. 따라서 인공지능 개발에 대한 중 국의 막대한 투자는 21세기를 지배하는 몇몇 핵심 산업 분야에서 선두를 차지하게 만들기에 충분하다. 바로 이 점이 우리에게 경종을 울리고 있다.
- 생물학자였던 스튜어트 카우프만(Stuart Kauffman)은 이른바 '전사 인자'라고 하는 단백질이 특정 유전자에 결합해 활성화 또는 비활성 화에 관여하는 유전자 네트워크에 흥미를 느끼게 되었다. 그의 가설 에 의해 구축된 모델은 자가 조직적이며 시간의 척도는 훨씬 느리지 만 어떤 측면에서는 뉴럴 네트워크와 흡사한 이진법 단위의 네트워크에 기초한다. 1980년대 후반 크리스토퍼 랭튼(Christopher Langton) 이 '인공 생명'이라는 용어를 처음 사용한 이래' 살아 있는 세포의 복 잡성과 복잡한 행동이 유발되는 원리를 이해하려는 시도가 봇물처럼 터져나왔다. 세포 내 분자 메커니즘의 고도로 진화된 복잡성에 대한 실마리를 찾고자 지금까지 이뤄낸 세포생물학과 분자유전학 분야의 발전에도 불구하고 생명의 신비는 여전히 우리 인간의 이해 범위를 벗어나고 있다.
- 알고리즘은 우리가 사는 세상과 비교해볼 수 있는 복잡한 세상을 만들어낼 새로운 기회를 제공한다. 실제로 20세기에 발견된 알고리즘으로 인해 우리는 복잡성의 특성을 새롭게 조명하게 된 바 있다. 1980년대의 뉴럴 네트워크 혁명 또한 그와 유사한 성격의 시도들이 주도한 것이다. 뇌의 복잡성을 이해하기 위한 시도들 말이다. 비록 우리가 만든 뉴럴 네트워크 모델은 뇌의 뉴런 회로에 비해 상당히 단순 하지만 학습 알고리즘 덕분에 방대한 뉴런으로의 정보 전달과 같은 일반 원칙에 대한 탐구가 가능해졌다. 어떻게 비교적 단순한 학습 규칙으로부터 네트워크 기능의 복잡성이 발생하는 것인가? 보다 쉽게 분석할 수 있는 복잡성을 보유한 보다 단순한 체계가 존재한다는 말인가?
- 주요 컴퓨터 칩 기업과 스타트업들은 너 나 할 것 없이 딥러닝을 위한 칩 개발에 상당한 투자를 하고 있다. 예를 들면 2016년 인텔 (Intel)은 4억 달러에 너바나를 인수했다. 너바나는 샌디에이 고에서 특수 목적 VLSI 칩을 설계하던 작은 스타트업 기업이다. 너바나의 전 CEO 나빈 라오(Naveen Rao)는 현재 인텔의 새로운 인공지능 제품 그룹을 이끌며 중간 단계를 거치지 않고 인텔 CEO에게 직접 보 고하는 위치에 있다. 2017년 인텔은 자율주행 자동차에 적용하는 감 지기와 컴퓨터 비전 분야에 특화된 기업 모빌아이(Mobileye)를 153억 달러에 인수했다. 그래픽 애플리케이션과 게임 구동에 최적화된 특 수 목적 디지털칩, 일명 ‘그래픽처리장치(GPUs)'를 개발한 앤비디아 (Nvidia)의 경우 현재 딥러닝과 클라우드 컴퓨팅을 위한 특수 목적 칩 의 판매량이 훨씬 더 많다. 구글은 자사의 인터넷 서비스에 사용되는 딥러닝 기능을 강화하기 위해 보다 효율적인 특수 목적칩인 텐서처 리장치(Tensor Processing Unit, TPU)를 자체 개발했다.
- 딥러닝 애플리케이션의 개발을 위해서는 특수한 소프트웨어 또한 못지않게 중요하다. 구글은 자사의 딥러닝 네트워크가 대중적으로 활용되도록 하기 위해 텐서플로우(TensorFlow) 프로그램을 제작했다. 비록 그 의도가 보이는 것처럼 이타적인 것은 아닐지라도 말이다. 예 를 들면 안드로이드 프로그램을 무상으로 이용하도록 한 결과 전 세 계에 사용되고 있는 거의 모든 스마트폰의 운영체제에 대한 통제권 이 구글의 손에 들어갔다. 그러나 지금은 구글의 텐서플로우를 대체 할 수 있고 무상으로 사용할 수 있는 대안도 존재한다. 마이크로소프 트의 인지툴킷(Cognitive Tool Kit, CNTK), 아마존을 비롯한 다른 주요 인터넷 기업들이 지원하는 엠브이넷(MVNet), 그 외에도 독자적으로 딥러닝 프로그램의 구동이 가능한 카페(Caffe), 테아노(Theano), 파이토치(PyTorch) 등이 그것이다.
- 자동차처럼 디지털과 뉴로모픽 설계의 융합이 부상하고 있다. 컴퓨팅을 위해 매우 낮은 전력만을 필요로 하는 뉴로모픽 설계의 장점과 커뮤니케이션에 유리한 고대역폭 디지털 칩의 장점을 취하는 새로운 하이브리드 구도 말이다.무어의 법칙은 칩의 처리 성능만을 고려했을 뿐이다. 향후 50년간 병렬 구조가 지속적으로 진화한다면 무어의 법칙은 에너지와 함께 처리량까지 고려하는 새로운 법칙으로 대체되어야 할 것이다. 인텔의 주관으로 오리건, 포틀랜드에서 열린 2018 NICE 콘퍼런스에서 미국과 유럽의 과학자들에 의해 세 가지 새로운 뉴로모픽 칩이 공개되었다. 그중 하나는 인텔이 개발한 로이히 리서치 칩(Loihi research chip)이고 나머지 두 개의 차세대 칩은 유럽의 인간두뇌프로젝트(European Human Brain Project)에서 발표한 것이다. 대량 병렬 구조의 발전과 함께 이 구조에서 작동할 수 있는 새로운 알고리즘 또한 만들어지고 있다. 그러나 이들 구조 내에 있는 칩들은 여전히 정보의 전달을 필요로 한다.
- 생명의 기원은 지구가 현재 우리가 알고 있는 것과는 완전히 다른, 우리가 알고 있는 것처럼 생명을 지탱하지 못했을 수십 억 년 전으로 시간을 거슬러 올라간다. 환경 은 혹독했고 대기 중에는 산소도 얼마 없었다. 고세균류는 박테리아 보다 먼저 지구상에 서식하고 있었다. 그렇다면 고세균류 이전에는 무엇이 있었을까? 오늘날 알려진 모든 세포에는 DNA가 있다. 그렇다. 면 DNA 이전에는 무엇이 있었는가? 1968년 오르겔과 크릭은 DNA 로부터 추출된 RNA가 전구체라고 추측했다. 그러나 그것은 RNA의 자기복제 능력을 전제로 하는 추측이었다. 그 가능성을 뒷받침하는 증거는 RNA 기반의 효소로 RNA 반응의 촉매 작용을 하는 리보자 임의 형태로 발견되었다. 오늘날 대다수의 학자들은 모든 생명체가 초기 'RNA 세상'으로부터 유래되었을 가능성이 충분하다고 믿고 있다. 그렇다면 RNA는 어디서 온 것인가? 불행하게도 그것을 증명할만한 자료는 그리 많지 않다.

Posted by dalai
,

빅나인

IT 2020. 5. 10. 15:10

- 알파벳(Alphabet 구글의 모회사)의 비즈니스 유닛인 딥마인드에는 700 명의 직원이 있으며, 그중 일부는 가능한 빠른 속도로 상용 제품을 개발하는 임무를 부여받았다. 2018년 3월, 구글의 클라우드 사업 부문은 딥마인드 엔진을 탑재한 문자 음성 지원 서비스를 텍스트 100만 자 처 리당 16달러에 제공한다고 발표했다. 구글의 2018년 I/O 콘퍼런스에서 주목받은 발표 중 하나는 고객을 대신해 자동으로 전화를 걸어 “음” 이나 “아하”소리까지 넣어 가며 인간에게 말을 걸고 식당이나 미용실을 예약하는 음성인식 비서인 듀플렉스(Duplex)였다. 이 상품은 딥마인드의 일부인 AI 기반 발성 장치인 웨이브넷(WaveNet 텍스트를 읽어 음성으로 재생하는 딥 러닝 네트워크)을 이용한다. 그동안 알파벳 산하 또 다른 부문의 AI 연구 그룹 구글 브레인(Google Brain AI의 심층 학습 연구 팀)은 AI를 만드는 AI를 만들었다고 공개했다. 오토ML(AutoML)로 불린 이 시스템은 강화 학습이라는 기술을 이용한 기계 학습 모델을 자동화했다. 오토ML은 일종의 '부모' 같은 최 고위층 관리자인 DNN으로서 특정 임무를 맡을 '자녀' AI 네트워크 생성 여부를 결정한다. 오토ML은 요청 없이도 나스넷(NASNet)이라 불리는 자녀를 생성해 비디오로 사람, 자동차, 교통 신호등, 지갑 등을 알 아볼 수 있도록 가르친다. 자아, 의심, 자신감 부족 최고의 컴퓨터 과학자에게서도 발견되는 특징이다 같은 인간적 결함 없이 나스넷은 82.7퍼센트의 확률로 이미지를 예측했다. 이는 이 시스템이 오리지널 부모 컴퓨터를 창조했던 사람을 포함한 인간 코딩 담당자를 능가한다는 이야기다.
- 그렇다. 기계는 생각할 수 있다. 튜링 테스트나 보다 최근인 2011년 헥터 레브스크가 제안한, 상식적인 추론에 초점을 맞춰 AI에게 애매모호한 대명사가 들어 있는 간단한 질문에 대답을 하도록 하는 위노그래드 도식(Winograd schema) 같은 대화체 시험이 다른 영역에서의 AI력을 측정하기 위해 반드시 필요한 게 아니다. 이는 기계가 인간처럼 언어 구조를 이용해 생각할 수 있음을 증명한 것이다. 아인슈타인이 천재라는 점에는 모두가 동의한다. 아인슈타인은 당시 자신을 담당한 교사들이 이해할 수 없는 방식으로 생각했으며, 이에 따라 그들은 당연히 아인슈타인이 지능이 낮다고 여겼다. 사실은 당시 아이슈타인의 강력한 사고력을 측정할 수 있는 의미 있는 방법이 없었다. AI도 그러하다. 생각하는 기계는 현실의 결과물에 영향을 끼치는 결정이나 선택을 할 수 있으며, 이를 위해서는 의도와 목적이 필요하다. 결국 그들은 판 단 감각을 개발했다. 철학자와 신학자 양측에 따르면 이런 것은 영혼 을 만드는 본질이다. 각각의 영혼은 신의 통찰력이자 의도의 표현으로, 유일한 창조주에 의해 만들어지고 부여되었다. 생각하는 기계도 창조주가 있다. 그들은 AI의 새로운 신인데, 대부분 남성이고, 압도적으로 미국과 서유럽 그리고 중국에 거주하며, 어떤 점에서는 빅 나인으로 연결돼 있다. AI의 영혼은 미래에 대한 그들의 통찰력이자 의도의 표현이다.
- AI와 한참 먼 분야에서 사례를 빌자면, 1970년대와 80년대, 샘 키 니슨, 앤드루 다이스 클레이, 짐 캐리, 마크 마론, 로빈 윌리엄스, 리처 드 프라이어는 모두 전설적인 코미디 스토어(미국 캘리포니아주 웨스트 할 리우드의 웨스트 선셋 불러바드에 있는 유명한 코미디 클럽) 바로 아래에 있는 크 레스트힐 로드에 살았다. 그들은 밥 호프(미국의 전설적인 코미디언)가 TV 에 나와 “나는 한 여자를 두고 두 번 생각한 적이 없어. 한 번이면 충분 하잖아” 같은 농담을 터트리는 시대에 무대에 올라갈 기회를 얻으려고 노력하면서 한 집에 살던 젊은이에 불과했다. 하지만 그들의 가치는 급진적으로 달랐다. 터부를 깨뜨리고, 사회적 불의에 맞서고, 관객의 피드백을 반영해 가며 초현실적인 이야기를 해댔다.
그들은 서로 특성과 관찰 내용을 공유했다. 그들은 무대에서 썰렁한 반응을 접하게 되면 서로 안타까워했다. 그들은 서로 실험했고 서로 배웠다. 이 획기적이고 재기 넘치는 희극배우로 이루어진 그룹이 미국 엔터테인먼트 미래의 초석을 놓았다. 이들의 영향력은 아직까지는 살아 있다. 마찬가지로, AI도 동일한 가치와 아이디어, 목적을 공유한 현재이 개발자 그룹 덕분에 비슷한 급진적 변화를 겪게 되었다. 앞에서 말했 던 세 명의 심층 학습 선구자 제프 힌턴, 얀 르꿩 그리고 요슈아 벤지오는 심층 신경망 초기 AI 세계의 샘 키니슨이고 리처드 프라이어다. 르꿩은 캐나다 고등 연구소(CIFAR)가 요슈아 벤지오를 포함한 소그룹의 연구자를 가르친 토론토 대학교 힌턴 밑에서 공부했다. 이들은 많은 시간을 함께 보냈고, 아이디어를 이리저리 궁리했으며, 이론을 시험했고, 차세대 AI를 만들어 나갔다.
- 개발자 그룹의 강력한 유대는 사람들이 밀접하게 함께 일하고 좌절을 겪고 성공을 축하하면서 형성된다. 그들은 일련의 경험을 공유하 고, 이는 공통의 어휘로 기록되며, 공통의 아이디어와 행동 그리고 목 표로 귀결된다. 수많은 스타트업 스토리, 정치적인 운동, 문화적인 거대한 흐름이 바로 이런 방식으로 시작된다. 몇 명의 친구, 기숙사 방이나 집이나 창고의 공유, 프로젝트에 집중하기 등이다. 현대 AI의 비즈니스 진앙은 실리콘밸리, 베이징, 항저우 그리고 선전이지만, 대학이야말로 AI 개발자 그룹의 원동력이다. 그 허브는 몇 개 안 된다. 미국에서는 카네기 멜런대, 스탠퍼드대, UC 버클리대, 워 싱턴대, 하버드대, 코넬대, 듀크대, MIT, 보스턴대, 맥길대 그리고 캐 나다의 몬트리올대를 포함한다. 이 대학은 산업과 강력한 유대를 맺고 활발한 학술적 연구를 진행하는 거점이다. 이들에겐 특유의 규칙과 관습이 있는데, 이는 가혹한 대학 교육에서 시작된다. 북미에선 대학이 R이나 파이선 같은 프로그래밍 언어 숙달, 자연어 처리, 응용 통계학, 컴퓨터 시각 장치, 컴퓨터 생명공학 그리고 게임이론 같은 고난도 기술을 강조한다. 밖에서 '마음의 철학이나 문학 속 무슬림 여성' 또는 '식민주의에 대한 강의를 듣는 것을 못마땅한 눈으로 바라본다. 만일 우리가 인간처럼 생각하는 능력을 갖춘 생각하는 기계를 만들려고 노력하면서 인간의 조건에 대해 배우는 것을 배제한다면 이는 직관에 어긋나는 일로 간주될 것이다. 하지만 이런 과목은 교과과정에서 의도적으로 배제되고 있는데, 전공 외의 분야에서 선택과목을 수강할 여지는 거의 없다고 할 수 있다.
- 페이스북은 아마 세계 최대의 소셜네트워크이겠지만, 텐센트 기술 은 여러 면에서 훨씬 우위에 있다. 텐센트는 샤오웨이(Xiaowei)라는 이 름의 휴대용 정보 단말기, 모바일 결제 시스템(텐페이 TenPay), 클라우드 서비스(웨이윈 Weiyun), 최근에는 무비 스튜디오(텐센트 픽처스 Tencent Pictures)를 내놨다. 텐센트의 유튜 연구소(YouTu Lab)는 안면과 사물 인식 분야에서 전 세계를 주도하면서 50개 이상의 다른 기업에 기술을 제공하고 있다. 이 역시 건강 산업 분야로 진출하고 있는데 영국의 헬스케어 업체로 원격의료 스타트업인 바빌론 헬스(Babylon Health)와 AI를 원격 환자의 모니터링에 이용하는 메도패드(Medopad) 두 업체와 파트너 관계다. 2018년 텐센트는 두 군데의 유망한 미국 스타트업인 아톰와이즈(Atomwise)와 엑스탈피(Xtalpi)에 큰 투자를 했는데, 이들은 AI를 의약품에 적용하는 데 초점을 맞추고 있다. 2018년 텐센트는 시장가치 5,500억 달러를 웃돈 최초의 아시아 기업이 되었고, 페이스북을 누르고 전 세계에서 가장 가치 있는 소셜미디어 기업에 올라섰다. 그중에서도 가장 놀라운 일은 텐센트 매출에서 온라인 광고가 차지하는 비율이 20퍼센트가 되지 않는다는 사실로, 이는 페이스북이 98퍼센트에 이르는 것과 비교된다.
- 중국에서 자본 투자의 대가로 지적 소유권을 요구하는 것은 기묘한 문화적 관습도, 투자자가 더 많은 걸 얻기 위한 탐욕도 아니다. 그것 은 정부에 대한 조직적인 협력의 일부다. 중국은 경제적, 지정학적, 군 사적으로 가까운 미래에 세계를 지배한다는 분명한 비전을 갖고 있다. 그래서 AI를 그 목표로 가는 통로로 여긴다. 이 목적을 위해선 정보의 절대적인 통제가 국가 지도자의 최고 관심사일 수밖에 없다. 따라서 중국은 미국 기업으로부터 중국의 사업 파트너로 지적 소유권을 이전 하도록 설계된 산업 정책을 채택했다. 그 사례에는 특정 데이터세트, 알고리즘 그리고 공정 디자인이 포함된다. 중국에서 사업을 하려는 수 많은 미국 기업은 반드시 자신이 소유한 기술부터 먼저 중국에 넘겨야 한다. 그 외에도 외국 기업이 연구와 개발을 중국 내에서 현지화하고, 현지에서 사용한 데이터를 저장하도록 강제하는 새로운 규제가 있다. 데이터를 현지에서 저장하게 하는 것은 외국 기업에는 어려운 요구다. 왜냐하면 중국 정부가 언제라도 데이터를 조사하고 암호를 해제할 수 있는 권한을 갖게 되기 때문이다. 베이징은 신중하게 장기 계획을 짜고 있다. 정부 지도자와 공산당 간부가 전략적인 전망을 총괄하면서 중국을 몇 십 년 뒤 미래까지 뻗어 나갈 종합적인 경제적, 정치적, 군사적 그리고 사회적인 계획과 설계를 하는 지구상에 몇 안 되는 나라로 만들기 위해서 말이다. 중국 정부는 어떤 계획을 이행하고 어떤 비용을 치르더라도 중국을 2030년까지 세계 최고의 AI 혁신 센터로 전환해 자국 경제에 1,500억 달러 규모의 산업을 창출할 2030 계획을 포함한 국가 전략을 실행할 굉장한 능력을 갖추고 있다. 이 계획은 정권이 바뀌어도 계속될 것으로 전망 되고 있다. 2018년 3월 중국은 임기 제한을 폐지해 시진핑이 권좌에 종신으로 머물 수 있는 길을 터주었기 때문이다. 시진핑 주석의 통치 아래 중국은 인상적인 권력 강화를 경험했다. 그는 공산당을 대담하게 만들었으며, 정보 흐름에 대한 통제를 강화하였고, 열매를 다음 세대에서 누릴 수 있을 것으로 기대하는 숱한 장기 계획을 진척시킬 새로운 정책을 수립했다. 중국 정부의 최상층에, AI는 최일선이자 가장 중심에 자리 잡고 있다. '능력을 숨기고 때를 기다 린다'라는 뜻의 도광양회(韜光養晦)를 정부 철학으로 삼았던 전 중국 공 산당 지도자 덩샤오핑(鄧小平)과 달리 시진핑 주석은 중국의 능력을 전 세계에 보여줄 준비가 되었으며, 글로벌 선두를 달리고 싶어 한다. 중국이 지도자들은 미래를 내다보며 대담하고 통합된 계획을 실행에 옮기고 있다. 이 같은 정책적 배경은 BAT에 슈퍼 파워를 안긴다.
- 명시된 규칙과 지시 사항이 없을 경우 팀이 선택한 선택 사항은 해 당 집단의 암묵적인 가치를 반영하는 경향이 있다고 주장하는 것이 콘웨이의 법칙이다. 1968년 컴퓨터 프로그래머이자 고등학교 수학 및 물리학 교사였던 멜빈 콘웨이는 시스템이 그것을 설계한 사람의 가치를 반영하는 경향이 있음을 알아냈다. 콘웨이는 조직이 내부적으로 소통하는 방식을 구체적으로 살펴보았지만 나중에 하버드와 MIT에서 진행된 연구를 통해 더욱 그의 주장에 힘이 실렸다. 하버드 비즈니스 스쿨은 동일한 목적을 위해 구축되었지만 다른 유형의 집단, 즉 엄격하게 통제된 소프트웨어와 보다 특별하고 개방적인 소프트웨어를 검토하면서 다양한 코드베이스를 분석했다. 위 연구의 주요 성과 중 하나는 집단의 설계방식은 집단이 어떻게 구성되어 있는지와 밀접한 관련이 있으며, 이것이 야기하는 편견이나 행사하는 영향력이 집단 내에서는 간과되는 경향이 있음을 알아낸 것이다. 결과적으로 집단에 속한 소수의 사람들의 초월적인 네트워크-그것이 무엇이건 간에는 집단 전체에 엄청난 영향력을 미친다. 콘웨이의 법칙은 AI에도 적용된다. 초창기 철학자, 수학자 그리고 오토마타 발명가가 마음과 기계를 논했을 당시 도구에 대한 인류의 동기와 목적을 설명하는 가치 알고리즘은 존재하지 않았다. 토대 연구 및 응용 프로그램에 대한 접근 방식에는 차이가 있었으며, 마찬가지로 현재에도 중국과 서구의 AI 개발 단계에도 간극이 존재한다. 콘웨이의 법칙은 집단의 신념, 태도, 행동이 숨겨진 편견이라고 확신하기 때문 에 중요하다. 콘웨이의 법칙의 맹점은 빅 나인이다. 왜냐하면 AI에 있어서 유전 성은 일정하기 때문이다. 현재 인류는 AI를 개발한 모든 단계를 그대 로 반복하고 있다. 그들의 개인적인 아이디어와 집단 이데올로기는 AI 생태계, 코드베이스, 알고리즘, 프레임 워크, 하드웨어 및 네트워크 설계에 고스란히 반영된다. 언어, 성별, 인종, 종교, 정치 및 문화가 개 인을 반영하지 않는다면, 그것들로 구축된 모든 부산물이 반영하는 것 은 아무것도 없을 것이다. 현실은 우리가 전문가가 아니기 때문에 AI 에만 국한되는 이야기는 아니다. 이는 업계와 상관없이 자금과 판매, 대담한 새로운 제안 사이의 지속되는 연결 고리다.
- 현재 AI의 발달로 자동화 및 효율성이 우선시되고 있는데, 이는 우리의 수천 가지 일상에 대한 통제와 선택의 폭이 그만큼 작다는 것을 의미한다. 만약 당신이 새로운 차를 운전한다면, 당신의 스테레오는 당신이 후진할 때마다 볼륨을 낮춰 줄 가능성이 있고, 그 결정을 거부 할 방법이 없다. 인간의 실수는 자동차 사고의 가장 큰 원인이다. 비 록 내가 차고로 후진할 때 어떤 것에 부딪히거나 넘어뜨리는 일은 결 코 없었지만 차고로 들어가는 순간 더 이상 '사운드가든'의 록 음악을 가장 큰 소리로 들을 수가 없다. AI 개발자 그룹은 내가 선택할 수 있 는 능력을 무시했고, 그들이 개인적인 결점으로 인식하는 것을 최적화했다. 아직 다루지 않은 것은 G-MAFIA나 BAT에선 공감을 위해 최적화하고 있다는 사실이다. 의사 결정 과정에서 공감대를 없애면 우리 인간성을 빼앗는 것이며, 때로 논리적으로 전혀 이해가 되지 않을 수 있 는 것도 어떤 특정 순간에는 우리에게 최선의 선택이 될 수 있다. 아픈 가족 구성원과 시간을 보내기 위해 일을 그만두거나 불타는 차에서 누 군가를 돕는 것처럼, 그 행동이 당신 자신의 삶을 위험에 빠뜨릴지라도 말이다. AI로 살아가는 우리의 미래는 작은 것에 대한 통제력 상실에서 시작된다. 내가 차고로 차를 몰고 들어가면서 크리스 코넬이 '블랙홀 태 양을 큰 소리로 듣지 못하는 것, 온라인 광고에 체포 기록과 연관된 당 신 이름이 나오는 것을 보는 것, 당황스러운 챗봇 사고 이후 주가가 하 락하는 것을 지켜보는 것, 종이에 베이는 것 같은 이 작은 사고는 현재 에는 별로 중요해 보이지 않지만, 앞으로 50년 동안 우리에게 많은 고통을 줄 수 있다. 우리는 하나의 재앙을 향해 가는 것이 아니라 오늘날 우리가 당연하게 여기는 인간성의 지속적인 침식을 향해 나아가고 있는 것이다.

 

Posted by dalai
,

- 왓슨은 현재 가장 인공지능에 가까운 플랫폼 중 하나입니다. 단, IBM은 왓슨을 절대 인공지능이라 부르지 않고 인지 체계'라고 부릅니다. IBM 입장에서는 인공지능을 '강한 AI'라 고 부르는 만큼 AI 관련 기술을 쓰고 있어도 전지전능하다고 할 수는 없는 왓슨을 인공지능이라고 부를 수 없다는 거겠죠. IT 업계에서는 '인지'가 스스로 생각할 수 있다'는 뜻으로 통합니다.
- 왓슨은 고객과 상담원의 대화를 음성 인식'으로 인식해 텍스트로 변환하고 그 것을 형태소로 분석(단어 및 문절로 변환)한 다음 자연어 처리 분류를 해서 문장 의 뜻과 의도를 이해합니다. 조작 매뉴얼, FAQ, 서포트 이력, 최근 많았던 사례 등의 데이터베이스를 검색해 적절해 보이는 여러 답변을 점수까지 매겨 골라주고 점수가 가장 높은 것을 최적의 답으로 판단해 상위 3개~5개의 답을 후보로 올려 화면에 표시합니다. 기본적인 이용 매뉴얼에 적혀 있는 내용을 보고 베테랑의 기량과 경험까지 학 습한 시스템이 상담원을 지원해 해결책을 조언해 주면, 설령 새내기라 해도 최적 의 답으로 고객 응대를 할 수 있으며 직무 수준을 통일할 수 있습니다. 또 새내기 도 더 빨리 실전에 들어가 베테랑 수준의 조언을 받아서 문제를 해결하는 경험을 할 수 있어 교육 기간이 단축된다는 장점도 있습니다.
- IBM 왓슨은 클라우드 서비스[PaaS (Platform as a service)]로 제공되기 때문에 물리적인 하드웨어나 서버군은 소프트뱅크가 운영 및 관리하는 데이터 센 터에 있습니다. IBM 왓슨을 이용하기 위한 30개가 넘는 기능을 가진 API가 이미 공개됐고, 거기에는 딥러닝 등의 AI 관련 기술뿐 아니라 50개 이상의 선진 테크놀 로지가 이용됐습니다. 이러한 API를 조합하면 누구나 쉽게 인지 애플리케이션을 만들 수 있습니다. IBM이 운영 중인 '블루믹스 (BlueMix)에서 공개 중이며, 이미 전 세계에서 8만 명 이상의 개발자가 사용하고 있습니다. 몇 가지의 계약 형태가 준비돼 있고 그에 따라 IBM 왓슨 사용 시 청구되는 금액이 다릅니다. '블루믹스'에서는 30일간 무료 시험판을 준비해 놓았기 때문에 본인이 개발한 시스템에 왓슨의 API를 넣어 성능 및 효과를 시험해 볼 수 있습니다.
- 마이크로소프트는 음성 비서로 린나와는 별개인 '코타나(Cortana)를 가지 고 있습니다. 윈도우폰용으로 개발됐고 최근에는 윈도우 10에도 탑재된 음성 입 력의 중요하고도 핵심적인 기능입니다. 말하자면 아이폰의 '시리'와 같은 기능인 데, 코타나에게 내일 날씨를 물으면 정확하게 지역별로 내일 날씨 정보를 대답해 줍니다. 즉, 코타나는 사용자에게 유익한 정보를, 린나는 유익성보다는 사용자를 즐겁게 해주는 관점에서 대답하도록 만들어진 것입니다. '린나'의 근간에 있는 기술은 마이크로소프트 애저' (Microsoft Azure)입니 다. 애저는 마이크로소프트에서 제공하는 비즈니스용의 본격적인 클라우드 플 랫폼입니다. Bing에서 수집한 방대한 데이터를 축적해 그것을 머신러닝 Azure Machine Learning' 등을 이용해 처리합니다. 애저 기반을 사용하면 갑작스럽게 접속량이 집중돼도 견딜 수 있는 구성을 갖추게 됩니다. '린나'가 오락성을 중시했다고 해서 라인과 마이크로소프트가 이 AI 관련 대화 기술을 재미로 끝내려던 것은 아닙니다. 2015년 8월, 라인은 기업용 API 솔루션 인 '라인 비즈니스 커넥트'와 '린나를 활용해 인공지능(AI)형 라인 공식 계정을 기 업에 제공하겠다고 발표했습니다. 라인에 따르면 '인공지능 린나의 대화 엔진 기술을 활용해 기업을 대상으로 한 새로운 마케팅 솔루션으로 제공하는 것이며, 트랜스 코스모스를 통해 '라인 비 즈니스 커넥트’ 지원 솔루션 중 하나로 '린나 API for Business'를 제공해 기업의 라인 공식 계정에 실질적으로 적용하면 도입할 수 있게 된다고 합니다. 기업용으 로는 오락성뿐 아니라 유용성이 높게 요구된다고 볼 수 있습니다.
- 예전에는 제품 사진을 다양한 각도에서 찍어 이미지로 데이터베이스상에 등록해 두고 방문자가 내민 이미지를 탐색해 전체 모습과 특징적 인 디자인 등 부분적으로 일치하는 것을 해당 제품으로 인식하게 하는 일반적인 시스템을 사용했습니다. 하지만 페퍼의 시연회 때 도입된 딥러닝에서는 상품의 영상을 인식시켜 자동 으로 '직선'을 구분하는 유사한 신경 세포와 '둥근 모양을 구분하는 유사한 신경 세 포 같은 다양한 유사 세포(형식 뉴런)가 소프트웨어적으로 만들어졌고 원시적인 (기초적인) 형상을 구분하는 유사한 신경 세포를 몇 겹이나 조합한 결과, 직선과 곡선 그리고 색의 조합 등을 통해 물질의 특징값을 발견한 뒤 예를 들어 이것은 OX 클린' 치약이겠네, 이것은 '와플'이겠네, 라는 식으로 식별할 수 있게 됩니다. 물론 이 해석 작업에 CG 데이터 같은 입체 도면 데이터가 쓰이는 것도 아닙니다. 딥러닝을 비롯한 인공지능 기술의 경우는 도입하는 기업이 취급할 상품과 서 비스에 맞게 적절한 특징값을 잡을 수 있게 트레이닝 (튜닝)하면 해석 및 인식의 정밀도(정답률)를 올릴 수 있다고 알려져 있습니다. 또한 가까운 미래에는 실제 로 제조업체 홈페이지를 통해 제품의 특징 등의 정보를 수집할 가능성도 있고, 그 렇게 되면 로봇은 자동으로 상품 정보를 학습하기 때문에 매장 측이 제품 정보를 등록하기 위해 들여야 할 수고도 현저하게 줄어들 것으로 기대됩니다.
- 2011년에 캘리포니아주 샌타크루즈 시 경찰청이 도입한 시스템 ‘프레드 폴(PredPol)은 지진의 여진 예측을 응용한 것으로서 차량 내 물건 도난 및 강도, 무기에 의한 범죄 등의 종류로 나눠 범죄가 발생할 확률이 높은 지역을 표시합니 다. 지역은 약 150m 사방으로 구역을 나눴으며 상당히 세세하게 명시돼 있습니 다. 경찰관은 지정된 지역을 중점적으로 순찰해 범죄에 발 빠르게 대처하고 미연 에 이를 방지할 수 있게 했습니다. 샌타크루즈 시 경찰청이 이 예측 시스템을 도입 할 수 있었던 것은 범죄 보고를 전자화했기 때문입니다. 즉, 그때까지의 범죄 데이터를 축적해놓은 덕에 범죄 예측에 사용할 빅데이터를 비교적 쉽게 준비할 수 있었던 겁니다.
오늘과 내일 일어날 범죄, 즉 미래의 범죄를 예측하려면 유효한 범죄 예측 모 델이 필요합니다. 모델은 연간 12만 건에 달하는 보고서와 범죄 기록 데이터는 물 론 그 지역의 범죄 발생률, 한 번 범죄가 있었던 지역에서 바로 다시 똑같은 범죄 가 일어날 확률과 경향, 범죄가 일어난 지역 가까이에서 범죄가 일어날 확률과 경 향, 범죄 이력이 있는 인물의 유무(또는 이사왔는지 여부), 비교적 치안이 나쁜 매 장의 유무, 빈집의 증감, 가로등 상황 등을 패턴화해 범죄를 예측하게 돼 있습니다.
샌타크루즈 시 경찰청의 발표에 의하면 다음 해인 2012년의 시내 범죄 발생 건수는 전년 대비 6% 감소했고 2013년에는 11% 감소했으며, 최근 보도에서는 체 포한 범죄자의 수가 50% 증가하고 범죄율은 20% 감소해 큰 성과를 올렸습니다. 2012년에는 빈집털이 사건이 11%, 강도 사건이 27% 감소했다고 하는데 빈집털 이 피해가 발생하면 그 주위에서도 연달아 발생할 확률이 높다는 점, 빈집 증감은 그 지역 치안의 좋고 나쁨에 관련돼 있다는 점 등이 수학 모델로도 증명됐습니다. 베테랑 경찰관도 발견하지 못한 데이터를 컴퓨터가 발견해 예측에 반영하는 경우 ' 도 많이 볼 수 있었다고 합니다.
그 후 로스앤젤레스와 애틀랜타 등, 약 60곳의 시 경찰청에서 이를 도입했습니다. 범죄를 미연에 방지해 치안을 좋게 만들 수 있다는 이점이 제일 먼저지만 실은 각 시 경찰청 모두 범죄의 급증과 함께 오랜 시간 경찰관의 인원 부족에 시달려 왔기 때문입니다. 범죄 예측 시스템을 도입해 더욱 효과적으로 경찰관을 배치할 수 있고 신속하게 범죄에 대처할 수 있다는 점은 인력 부족을 해소하는 데 공헌하고 있습니다.
- 히트곡 예측 사이트 'Music Xray'는 아티스트가 올린 곡을 들을 수 있는 사 이트입니다. 이 사이트는 소니와 워너, 유니버설 등과 같이 12,000개가 넘는 회사 들이 유력한 레이블 및 음악 프로듀서들과 제휴를 맺었습니다. 아티스트에게는 유 력한 음악 업계와 접촉할 기회가 제공되는 장이며, 올린 곡이 레코드 회사와 프로 듀서, 프로모터의 눈에 띄면 본격적으로 데뷔할 길이 열릴 수도 있습니다. Music Xray는 AI 시스템과 연관돼 있습니다. 올린 곡을 AI 시스템이 20초 동안 들어보 고 히트할 확률을 산출해 냅니다. 올린 곡의 경우는 항상 평가가 이뤄지며 매달 500~700곡이 계약 안건에 들 어간다고 합니다. AI가 듣고 평가해 히트하리라 판단한 곡은 우선 음악 업계에 소 개되는 시스템을 갖추고 있습니다. AI의 분석 기술을 이용해 재능을 인정받을 기회를 아직 접하지 못한 아티스트를 발굴하자는 것입니다. 이 AI 시스템은 클래식과 재즈 등 다양한 장르를 통해 300만 곡 이상의 곡들을 사전에 학습합니다. 히트곡에는 패턴이 있는데 AI에 의해 약 60개의 히트 클러스터라고 불리는 그룹으로 분류할 수 있다고 합니다. 바꿔 말해 과거에 히트한 곡의 패턴을 분석해 보면 대부분은 그중 하나의 히트 클러스터에 속해 있다는 것입니다. 올린 곡은 리듬, 멜로디, 하모니, 비트, 억양, 음색, 속도 등의 70개 요소로 분 루해 분석됩니다. 더 나아가 약 40개의 깊은 구조로 정보가 분류되어 AI가 패턴을 분석해 본 결과, 몇 개의 히트 클러스터에 자리를 잡으면 히트 확률이 올라가는 것 으로 판단됩니다. '그럼 처음부터 히트할 패턴으로 곡을 만들면 되는 거 아냐?'라고 생각할 수도 있지만 꼭 그렇지만도 않습니다. 그게 바로 머신러닝의 재미있는 점인데 개발자도 AI가 왜, 어디를 보고 그 곡을 히트 클러스터에 넣은 것인지 자세한 이유는 알지 못합니다. 바꿔 말해 어떤 곡이 히트곡이 될지는 개발자도 정확하게 알지 못한다는 것입니다.
- 머신러닝은 크게 분류 문제'와 '회귀 문제'로 나뉩니다.
'분류 문제는 글자 그대로 뭔가를 분류하는 것으로, 이미 실용화가 진행됐습니다. 예를 들어, 뭔가를 분류하는 기능이라고 하면 처음에는 쉬울 것 같다는 생각 을 합니다. 이미지 인식을 예로 들면 스캔한 이미지가 무엇인지 고양이 '개'차' 등 이라고 식별하는 그 분류를 말합니다. 텍스트의 경우 스팸 메일인지 정규 메일인 지 파악하고 뉴스 장르를 분류하며, 데이터 분석의 경우 잘 팔리는 상품이나 추천 상품을 분류하는 것 등이 한 예라고 할 수 있겠습니다.
분류 문제는 예측 대상이 개나 고양이 같은 이산값(연속되지 않는 값)인 데 비해 '회귀 문제는 예측 대상이 1.05m, 40.14$ 등의 실질적인 수치인 문제를 말 합니다. 계산을 통해 산출되는 수치, 추측 및 미지의 데이터를 예측, 그리고 시계 열로 변화하는 주가 데이터 같은 것들 말입니다.
- 머신러닝의 신경망에서는 식별해서 분류하기 위해 인간이 제시한 규칙이 아 니라 '어떤 “특징값을 산출합니다. 그리고 그 특징값이 개'라고 가르치면 개로 분 류합니다. 이를 반복하면 기계 스스로가 특징값을 산출해 개로 분류할 정보가 늘어납니다. 이처럼 학습 및 훈련, 트레이닝을 거치면 개에게 여러 가지 패턴이 있다는 것을 학습함과 동시에 어떤 특징값에 해당하는 것을 '개'라고 분류하면 되는지 를 이해합니다. 컴퓨터가 다루는 특징값은 실제로는 수치’ (벡터값)인데, 뉘앙스 로 설명하자면 인간처럼 개인지 고양이인지는 보면 안다'와 마찬가지로 어디가 어 떻다를 따지는 것이 아니라 '대충 보면 알죠, 이건 개예요'라는 애매한 특징값으로 구분하게 된다는 것입니다. 또한 이 특징들은 훈련을 통해 기계가 자동으로 학습 하기 때문에 개발자는 기존과 같이 세세한 규칙을 정의해야 하는 업무에서 해방될 수 있습니다.
- 이렇게 완성된 분류 시스템에 이 이미지는 개랑 고양이 중 무엇인가요?'라며 이미지를 입력하면 그 이미지의 특징값을 컴퓨터가 분석해 개의 특징값 내 범위와 일치할 경우 개라고 판단하고, 고양이의 특징값과 일치할 경우 고양이라고 판단해 분류합니다. 그리고 반복해서 말하지만, 중요한 건 개를 판단하는 기준(특징값) 을 인간이 만들어서 제공한 것이 아니라 기계가 학습을 통해 스스로 계산해 냈다. 는 것입니다. 이를 가능하게 한 것이 머신러닝의 신경망이며 높은 정밀도로 인식 하는 것이 심층 신경망입니다. '딥러닝으로는 머신러닝을 통해 특징값을 학습한다 나 '딥러닝으로 어떠한 특징값을 산출한다'는 이런 것을 의미합니다.
- 신경망(Neural Network)은 뉴런의 구조를 컴퓨터로 모방하는 것에 도전 한 것입니다(신경망은 NN'으로 줄여 부르기도 합니다). 신경망이라는 말은 생 체나 생물학, 신경학 분야에서도 이용되기 때문에 인공지능과 컴퓨터 업계에서 뇌 의 구조를 시물레이션한 시스템을 말하는 경우에는 일부러 '인공'이라는 말을 붙여 인공신경망 (인공신경 회로망) (ANN)이라고 구별하는 경우도 있습니다. 뇌는 신경 세포의 거대한 망이라고 불립니다. 네트워크를 구성하는 뉴런은 무수히 많고, 그 수는 100억~300억 개가 넘는 다는 설도 있습니다. 신경 세포의 역할은 정보를 처리하는 것과 다른 신경 세포로 경보를 건달(입출력)하는 것입니다. 다른 신경세포로는 신경전달물질에 의한 시냅스 결합을 통해 정보가 전달되어 기억 및 학습 등과 같은 지능적인 처리를 진행 합니다. 뇌 과학의 '단 하나의 학습 이론'(One Learning Theory)에 의하면 뇌는 다. 양한 기능을 가지고 있다고 생각하기 쉽지만 사실 공통된 패턴을 인식해 처리하고 있다고 합니다. 지극히 간단하게 말 하자면 인간은 사물을 보고 듣고 대화하고 뭔가를 느끼고 감정을 품고 답을 생각 하고 추측하는 다양한 것들을 해내고 있는 만큼 뇌에도 각각에 적합한 구조의 부위가 있고 그것들이 복잡한 처리를 하는 게 아니겠냐는 상상을 합니다. 하지만 사 실 뇌 내부에서는 모두 똑같은 패턴 인식을 통해 정보를 처리하고 있다는 이론이 있습니다. 그리고 신경망이 그러한 패턴 인식을 모방한다면 뇌와 같이 이미지 인식과 음 성 인식과 계산과 분류와 추론, 그리고 학습과 기억 모든 부분에서 범용적으로 능 력을 발휘할 가능성이 있지 않겠냐는 것입니다. 그것을 실천하고 있는 것이 바로 신경망과 그 알고리즘입니다. 인공신경망의 구조 자체는 새로울 것이 없습니다. 인공지능은 예로부터 연구 돼 온 분야이고 형식 뉴런’ 발표는 1943년, 시각과 뇌의 기능을 모델화한 '퍼셉트론' 발표는 1958년까지 거슬러 올라갑니다.
- 신경망은 뇌와 닮은 구조를 단순화해서 컴퓨터로 재현한 것입니다. 컴퓨터상에 뇌신경 세포를 시뮬레이션하는 '형식 뉴런과 '노드를 배치합니다. 입력된 정보는 각 뉴런에서 처리되어 다른 뉴런으로 전송됩니다. 정보를 받은 다른 뉴런은 처 리를 마친 후 또 다른 뉴런에 정보를 전달합니다. 이 처리를 반복했을 때 특징’ (특징값)이 산출되어 몇 가지 처리 결과를 출력하는 구조가 '신경망'의 기본입니다. 몇 가지 처리 결과라는 것은 표현이 좀 애매한데, 사물을 인식하고 분석하고 예측하고 대화하는 다양한 것들을 말합니다.
- 뻔히 정답을 알고 있는데 기계가 분석할 게 뭐가 있느냐고 묻는다면 왜 그게 개로 분류되는가?'에 대한 것을 생각하게 하는 것이라고 답할 수 있습니다. 즉, 기 계가 특징값을 스스로 발견하게 한다 → 그것은 '개'로 분류된다 → 그 특징값의 답은 '개'다, 라는 것입니다. 하지만 이미지를 한 장만 분석해 특징값을 기억한 시스템의 경우에는 다른 개 의 이미지를 보여줘도 어지간히 닮은 개의 이미지가 아니고서는 같은 견종이라는 것을 판별해내지 못할 겁니다. 그럼 만약에 개의 라벨링된 (정답) 데이터 이미지 1,000만 장을 읽게 해서 훈련한다면 어떻게 될까요? 이것이 바로 신경망의 공부법(중 하나)이며, 학습을 위해 방대한 빅데이터가 필요한 이유입니다. 이 개를 예로 든 것처럼 라벨링된 데이터로 학습하게 하는 방 법을 지도학습이라고 합니다. 머신러닝에는 지도 학습(Supervised Learning) 외에 '비지도 학습 또는 '자율 학습 (Unsupervised Learning)이 있습니다. 지도 학습은 이 이미지가 개라든가, 이런 경우 1시간 후의 주가는 얼마라든 가, 와 같이 입력 데이터와 정답이 1대 1로 결합돼 있는 훈련 데이터를 사용해 학 습하는 것입니다. '비지도 학습은 입력 이미지는 있지만 정답 데이터는 주어지지 않습니다. 예 측은 미래의 것이기 때문에 정답이 없습니다. 이처럼 추론, 분석과 같이 정답이 없 고 정답이 풀리지 않는 문제를 가지고 학습하는 것을 비지도 학습이라고 합니다. 지도 학습과 비지도 학습을 섞는 방법도 있습니다. 우선 기계가 지도 학습으 로 특징값을 학습하게 하고 그 이후 비지도 학습으로 방대한 훈련 데이터를 제공 해 자동으로 특징값을 산출하게 하며 반복 학습을 하는 방법입니다. 이를 준지도 학습 (Semi-Supervised Learning)이라 부르기도 합니다. ‘비지도 학습은 정답이 없는 데이터로 머신러닝을 하는 것입니다. 정답이 없 는 예측과 분석, 해석 등의 분야에서 사용되거나 방대한 데이터 안에서 컴퓨터 스 스로가 뭔가를 발견하게 하거나 방대한 훈련 데이터를 반복적으로 학습하게 할 때 쓰입니다. 비지도 학습은 컴퓨터가 이미지 및 음성, 수치 등의 방대한 데이터를 읽게 해 서 특징값을 구하고 그에 따라 패턴과 카테고리에 자동으로 분류하게 하거나 클러 스터 분석, 규칙성 및 상관성, 특징, 특이성, 경향 등을 분석하게 합니다(주성분 분석, 벡터 양자화/표본화 샘플링 등). 또한 데이터 마이닝 등 미지의 데이터의 특징을 발견하거나 예측하는 분야에 서는 필연적으로 비지도 학습의 방식을 채택하는 경우가 많아집니다. 또한 비지도 학습을 할 경우에도 가장 적합하다고 판단되는 초기 수치를 제공 해 학습을 시작하는 것이 효율적이라고 합니다.
- 지도학습과 비지도학습 비교
(1) 지도학습
- 훈련데이터 : 라벨 있음 (정답이 붙여져 있음)
- 방법 : 정답이 붙여진 데이터를 기계가 자동으로 분석하게 한 다음 산 출한 특징값을 정답이라고 분류 하게 하면 정답이라고 특징값의 관계성을 학습한다. 사물을 인식 및 분석하는 정의를 도출한다.
- 장단점 : 분류 문제는 효율적으로 학습할 수 있다. 초기 단계에서는 학습 성과를 내기 쉽다. 방대한 라벨링된 데이터 를 준비하는 데 손이 많이 간다.
(2) 비지도학습
- 훈련데이터 : 라벨없음
- 방법 : 방대한 데이터를 자동으로 분석 하게 하지만 정답이 없어 산출 한 특징값으로부터 구조, 법칙, 경향, 분류, 정의 등을 도출한다.
- 장단점 : 기계 스스로 특징이나 정의를 발견하 기 때문에 방대한 데이터가 있으면 라벨링된 데이터를 준비할 필요도 없 고 번거롭게 손을 댈 일도 없다. 정답 이 없는 대신 보상(득점) 등을 설정해 야 한다. 오토인코더 등으로 사전에 학습해야 효율이 좋은 경우가 많다.

- 강화학습은 기계가 시행착오를 거치게 해서 실패와 성공을 통해 학습해가는 방법입니다. 하지만 그냥 단순 히 방대한 훈련 문제를 제공해 기계를 학습시켰다고 해도 기계가 무엇이 성공인지 도 모르는 상태에서는 학습이 순조로울 리 만무합니다. 학습 목표로 성공이라고 판단할 수 있는 어떤 요소를 부여해야 합니다. 여기서 성공 및 성과에 대해 점수를 매깁니다. 이를 '보상' 혹은 득점이라고 합니다. 자전거를 예로 들자면, 1m를 달려 넘어지는 것보다 10m를 이동하는 쪽이 높은 점수를 얻을 수 있습니다.
- 강화학습은 위키피디아에서는 “어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법이다”라고 설명
- ‘오차역전파법 (Backpropagation)이란 컴퓨터가 내놓은 답이 정답이 아니 거나 기대했던 수치와 동떨어져 있는 경우, 그 오차를 출력 쪽에서 역방향으로 분 석하게 한 후 각 뉴런의 오류를 정정해 오차를 줄이는 로직입니다. 우리 생활 속에 서 예를 들자면 계산 문제에서 내놓은 답이 틀렸을 때 답을 보고 계산 식을 거슬러 올라가 계산 오류를 찾고 계산이 틀린 부분을 알아내면 틀리지 않도록 수정해 다 음번부터 정답률을 올린다, 같은 느낌이라고 보면 됩니다.
- 딥러닝의 과제인 과적합'의 회피
기존에 설명한 '구글의 고양이' DON' '알파고'와 세계적인 이미지 대회인 ILSVRC' 에서도 딥러닝은 좋은 성적을 거뒀습니다. 이 정도의 성과를 올리기 시 작한 배경에는 돌파구라고 할 만한 기술적인 진전이 있었습니다. 컴퓨터의 성능이 향상됐고 빅데이터를 이용할 수 있게 됐으며, 또 딥러닝 특유의 과제인 과적합을 회피할 수 있었던 것입니다. 심층 신경망은 중간층을 다층화시켜 더욱 깊이 사고할 수 있습니다. 다층이 되면 될수록 뉴런 처리와 전달, 산출되는 특징값이 늘어나며 이에 따라 답의 정확 도가 올라갈 것이라는 사실은 이전부터 연구된 것이고 이론적으로도 유효하다는 주장이 있었습니다. 과적합 (over-fitting)이라고 불리는 문제는 심층 신경망을 마구잡이로 다 층화해 파라미터의 수가 너무 많아질 때 발생하기 쉽다고 합니다. 과적합의 영향 으로 인한 악영향으로 낯익은 훈련 데이터에는 정확도가 높은 답을 할 수 있는 한 편, 훈련 데이터에 없는 미지의 데이터인 경우 정밀도가 내려가는 (훈련 데이터의 영향을 너무 많이 받음) 현상이 있습니다. 즉, 훈련할 때는 성적이 좋았는데 실전 에 가서는 성과를 내지 못한 상태를 말합니다. 이것은 범용성이 부족하다는 과제 를 낳았고 딥러닝에게는 정체기라고도 할 수 있는 시간을 불러왔습니다.
- 합성곱 신경망(CNN) : 이 과제의 구체적인 해결책이 바로 합성곱 신경망' 또는 '컨볼루션 신경 망(CNN)입니다. 뉴런이 많고 복잡해지면 원래는 아무 관계도 없던 결합이 늘어나고 그것이 결국 악영향을 미쳐 과적합의 원인을 만들기도 합니다. 기계 정답률을 올리려면 층 을 늘리는 한편 '아무 관계도 없는 결합을 끊어내는 것이 중요합니다. 하지만 무수 한 뉴런의 결합 중 어느 것이 유효하고 어느 것이 관계가 없는지 어떻게 판단해야 하는 걸까요? 또한 오차역전파법에 의해 출력 쪽에서 오차를 확인하게 하는 방법도 소개한 바 있는데, 모두 결합한 후 다층으로 만든 상태에서 오차역전파법을 써버리면 오 차 전파가 분산되어 전혀 학습이 진전되지 않기 때문에 그 사태를 피하기 위해서 는 아무 관계도 없는 결합을 잘라 버려야 한다는 이론도 있습니다. 합성곱 신경망의 특징 중 하나가 아무 관계도 없는 결합을 잘라 관계성이 높은 결합을 남긴다는 것입니다. 실제로 합성곱 신경망에서는 파라미터의 수가 격감 하며 많은 경우에서 성과가 향상됩니다. 합성곱 신경망 (Convolutional Neural Network)은 줄여서 CNN이라 고 부릅니다. 여기서 합성곱이라는 이름을 보고 합성해서 곱하는 구조가 뭔지 이 해하려고 하면 곤란합니다. 그 이유는 이 단어가 합성곱 적분과 같이 수학 용어로 자주 사용하던 단어에서 유래된 것이라서 일반적으로 합성'이나 '곱 등을 해석한 단어와는 의미 자체가 다르기 때문입니다.
- 순환 신경망(RNN) : 최근에는 '리커런트 뉴럴 네트워크 (RNN; Recurrent neural network)', 즉 순환 신경망'이 주목받고 있습니다. 기존의 신경망은 '정적 데이터로 취급하는 게 잘 어울렸기 때문에 '동적 데이 터는 익숙하지 않다고만 여겨져 왔습니다. 정적 데이터란 움직임이 없는, 혹은 움직임이 적은 데이터를 말하는데 예를 들면 정지 화면, 텍스트, 수치, 최신 통계 데 이터 같은 것이 여기에 해당합니다. 개와 고양이의 이미지를 식별하는 것은 정적 데이터입니다. 한편 동적 데이터란 움직임이 큰, 또는 시간적인 상관관계가 중요한 데이터와 시계열 데이터 등을 말합니다. 대화, 동영상, 음성, 시계열의 통계 데이터와 로그 데이터 같은 것들 말입니다. RNN은 이러한 시계열 분석을 가능하게 만들어 준 동 적 데이터와 호환되는 딥러닝입니다. 최근 자연어 대화 등의 분야에서 성과가 올 라가고 있는 만큼 향후 RNN' 이라는 용어를 IT 관련 뉴스나 일반 인공지능 정보에 서도 보게 될 기회가 늘어날지도 모릅니다.
- IBM에서는 왓슨을 인공지능이라고 부르지 않고 인지 시스템' 혹은 인지 컴퓨터' 라고 부릅니다. 인지란 인식해서 아는'이라는 의미로, IT 업계에서 는 스스로 사고할 수 있다는 의미로 씁니다. IBM은 인공지능이 인간과 같은 지능 을 가진 결푸터, 즉 강한 AI'라고 생각해서인지 왓슨에 인공지능이 필요로 하는 많 은 기술과 자연어 대화, 대화 분석, 딥러닝을 포함한 머신러닝, 데이터 분석, 추리와 추론 등의 기술이 쓰이고 있음에도 왓슨은 인공지능이 아니라 인지 컴퓨팅이라는 발언을 일관되게 하고 있습니다. 또한 왓슨 자체는 플랫플이기 때문에 방대한 데이터를 보유하지 않은 상태에 서 도입한 기업의 빅데이터로 머신러닝을 한 후 특훈을 거쳐 시스템을 구축하는 구 조로 되 있습니다. 이 때문에 잊슨은 계약해서 바로 실전에 들어가 이용하지는 못 하고 도입을 위한 학습과 훈련, 튜닝 기간에만 약 3개월~1년이 걸린다고 합니다.
- 지금까지는 비구조화 데이터를 구조화 데이터로 변환해 컴퓨터가 처리, 분석 할 수 있게 만들자는 노력이 꾸준히 진행됐지만 왓슨과 딥러닝을 이용한 인식 시 스템의 등장으로 상황이 크게 바뀌었습니다. 즉, 자연어를 이해하거나 디지털카메 라로 찍은 사진을 그대로 컴퓨터가 분석해 이해할 수 있게 하는 기술이 진보하고 있는 것입니다. 이 흐름은 이제 멈추지 않을 것입니다. 이제는 자연어를 정확하게 이해해 인간과 원활하게 대화하고 인터넷의 비구조화 데이터를 통해 학습할 수 있 는 시스템이 필요하기 때문입니다. 영어판으로는 이미 도입 실적이 발표됐는데, 일본어로 사용하려면 왓슨은 일 본어를 학습해 이해할 수 있어야 합니다. IBM은 일본어판 개발을 소프트뱅크와 협업해 진행했습니다. 그에 더해 왓슨의 시스템(서버군)을 설치 및 운영해 에코 파트너 개척, 일부 판매에 대한 부분까지 소프트뱅크와 제휴해 2016년 2월부터 서비스를 시작했습니다.
- 마이크로소프트는 키보드와 마우스, 터치 조작으로 바뀌는 다음 단계의 인터 페이스로 '대화'를 언급하고 있습니다. 그것이 실현된 것이 바로 음성 입력이 가능 한 개인 비서 '코타나', 대화를 즐기는 '린나', 중국의 '샤오아이스’, 영어의 '테이와 같은 풍부한 AI 대화 엔진 그룹입니다. 또한 마이크로소프트 리서치 (Microsoft Research)에서 연구 중인 머신러닝 을 이용한 통역 및 번역 기술이 주목을 모으고 있습니다. 통역 및 번역을 통해 대 화 기술도 적극적으로 연구해서 2020년의 도쿄 올림픽 때까지 외국어와 일본어의 동시통역을 실현하는 것이 목표입니다. 스카이프에서는 이미 일부 번역 기능에 이 통역 기술을 도입해 영어, 스페인어, 이탈리아어, 중국어, 프랑스어, 독일어 등의 언어를 지원하고 있습니다. 마찬가지로 윈도우 10 등에 탑재된 개인 비서 '코타나'에도 이 기술을 활용할 예정입니다. 마이크로소프트는 이러한 일련의 클라우드 서비스와 AI 관련 기술로 성과를 거두며 최고의 기업들이 활약하는 무대에서 두각을 드러내고 있습니다.
- 구글은 딜러닝을 이용한 머신러닝 라이브러리인 '텐서플로 (TensorFlow)를 그가 그프소화했습니다. 이에 따라 많은 개발자가 무료로 딥러닝 기술을 도입 한 시스템을 가사에서 개발할 수 있게 됐습니다. 딥러닝을 활용한 대화형 인터페이스 ‘구글 비서는 안드로이드 단말기를 통해 이미 친숙한 개인 비서, 구글 나우’(OK Google)에서도 이용되고 있습니다. 이 기술은 애플 iOS의 '시리', 아마존의 '알렉사', 마이크로소프트의 '코타나' 등과 경 쟁하는 기술입니다. 구글이 2016년 5월에 개최한 개발자 행사인 '구글 I/O'에서는 이러한 경쟁사 들 앞에서 새로운 도전을 선보였는데, 그중 하나로 '알로(Allo)가 발표되며 주목 을 받았습니다. 알로는 구글 비서가 탑재된 메시지 앱(채팅)의 일종으로, 채팅 대화의 의도 를 읽어내 여러 가지 대답을 예측해서 제안한다는 특징이 있습니다. 또 하나는 구 글의 검색 엔진이 채팅에 추가되는 것입니다. 원하는 정보가 있거나 상품을 찾고 있다는 것을 채팅에 전달하면 구글 검색 엔진과 연동해 답변해줄 뿐 아니라 택시 와 렌터카, 식당 예약까지 할 수 있습니다. 더 나아가 그룹 기능과 연동해 친구들 과 대화 중인 채팅창 안에서 구글 검색 엔진을 이용할 수 있습니다.
- 구글 I/O에서 또 하나 주목받은 발표가 바로 구글 비서와 알로를 탑재한 '구글 홈'(Google Home)입니다(2016년에 발매). 구글 홈은 스마트 홈을 실현하기 위한 허브 중 하나로 개발됐고, 사용자와는 음성으로 대화를 나눌 수 있습니다. 나중에 설명할 '아마존 에코'의 대항마라고 할 수 있습니다.
- 2016년 6월, 애플은 개발자 이벤트 WWDC에서 시리의 개발 키트(SDK) 를 공개하겠다고 발표했습니다. 시리의 SDK가 공개되면 서드파티에서 자사의 단 말기와 앱으로 시리를 이용할 수 있는 환경이 구축됩니다. 시리의 음성 대화가 보 여준 성능에 실망한 사람들도 많겠지만 채택되면 좀 더 수준 높은 대화를 할 수 있 게 될지도 모릅니다. '보컬아이큐의 전체 내용은 밝혀지지 않았으나 '시리'와 비교 했을 때 인식률이 3배 넘게 높다는 소문이 있습니다. 개인 비서인 SDK를 공개한 것은 아마존의 '알렉사, 구글의 구글 비서' (구 글 홈)에 대항하기 위해서인 것으로 알려져 있습니다. 구글이 '구글 나우 (OK Google 포함)를, 마이크로소프트가 '코타나'를 아이폰에서 실행되는 앱으로 제 공한다는 점만 봐도 알 수 있듯이 앞으로는 사용자가 단말기와 개인 비서를 선택해 조작하게 될지도 모릅니다. 개인 비서가 사용자의 성별과 성격, 신변 정보, 취 미 및 기호를 학습해 성장한다는 점을 생각하면 단말기를 바꿀 때마다(아이폰에 서 안드로이드 스마트폰으로 바꾸는 등) 개인 비서와의 관계를 처음부터 다시 시 작하는 것은 현명한 선택이라고 할 수 없습니다. 그런 의미에서도 디바이스에 의 존하지 않고 개인 비서를 선택할 수 있는 환경이 만들어지길 바라는 수요가 있습 니다. 애플은 자동차용 기능인 '애플 카플레이 (Apple CarPlay, iOS in the Car) 를 개발해 도입하기 시작했습니다. 자동차 안에서 아이폰의 기능을 쓰기 쉽게 융 합한다는 구상입니다. 시리의 음성 제어와 터치 패널, 맵과 연동, 메시지 읽기, 아이튠즈나 애플 뮤직으로 음악을 재생하는 기능을 차 안에서 이용하기 위한 시스템 으로, 이미 100가지 이상의 차종이 애플 카플레이를 지원하고 있습니다.
- 페퍼에는 중요한 인공지능 기술이 탑재돼 있습니다. 바로 로봇 스스로가 감정 을 지는 감정 생성 엔진임. IT업계에서 주목받고 있는 인공지능 관련 기술에는 여러 가지 종류가 있는 더 크게 다음과 같이 구분된다고 합니다.
* 지혜의 자식을 지을 학습하거나 분석 및 해석하는 타입
* 인간의 감정과 감성 감각을 학습하는 타입
페퍼의 감정 생성 엔진 (감정 엔진)을 개발한 코코로SB (cocoroSB)에 의하 면 전자는 인간의 뇌로 비유했을 때 대뇌신피질'에 해당하는 부분으로, 다시 말해 만능형 인공지능'이고, 후자는 대뇌변연계에 해당하는 부분으로 '인공 감성 지능 이라고 부르며 주로 인간의 감정 표현을 모방한 분야를 연구합니다. 인간처럼 행동하고 인간처럼 자연 대화를 나누려면 후자의 대뇌변연계 연구 와 개발이 매우 중요한 의미를 가집니다. 코코로SB는 감정 생성 엔진, 자연어 처리 잡담 엔진, 물체 인식 엔진 3개에 더해 산하 AGI (Advanced Generation Interface Japan)사가 담당하고 있는 감정 인식 엔진의 기술을 페퍼에게 탑재했습니다. 가족용 페퍼의 경우, 이 기능을 가족과 친목을 다지는 데 이용할 수 있습 니다. 반면 비즈니스용은 매장을 방문하는 고객들을 성별 및 연령별로 집계하거나 고객이 정보를 소개받은 후의 반응(표정 분석)을 읽어내 이 정보가 효과적이었는지 여부를 평가할 수 있어 광고 및 마케팅 방안으로도 기대를 받고 있습니다. 이 엔진들은 도쿄 대학 대학원 의학계 연구과 특임 강사, 과학자이자 수리 연 구자인 미쓰요시 슌지의 감정 지도'라는 발상에 기반을 두고 있습니다. 감정 지도는 심리학 사전 등에서 뽑아낸 약 4,500가지의 감정 표현을 영어로 번역할 수 있는 한계인 223개 장르로 나눈 결과를 원형 다이어그램으로 정리한 것인데 추가로 뇌내 전달 물질, 호르몬 등과 같은 정동의 관계를 논문 조사에 따라 매트릭스화했습니다. 일반 판매용 페퍼에는 AGI의 감정 지도를 근거로 한 감정 생성 엔진과 감정 인식 엔진이, 비즈니스용 페퍼에는 감정 인식 엔진이 탑재돼 있습니다. 또한 이 회사는 IBM 왓슨의 일본어화와 판매로 제휴를 맺고 있어 IBM 왓슨 비즈니스 시장의 날개 한 축을 담당하고 있을 뿐 아니라 IBM 왓슨과 페퍼를 연결 해 커뮤니케이션 로봇의 응대 및 정보 제공을 더욱 고도로 진화시킬 수 있다는 점을 강조하고 있습니다. 소프트뱅크 그룹에서는 2016년 4월, 소프트뱅크 커머스&서비스가 페퍼 외에 인공지능형 학습 엔진 '뮤즈' (MUSE)를 활용한 소형 로봇 '뮤지오’ (MUSIO, AKA LLC 제조)를 판매하고 유통하는 업무에 관한 제휴를 맺었다고 발표했습니다. 뮤지오는 일본 내에서 영어 학습용 로봇으로 이용될 예정입니다.

 

'IT' 카테고리의 다른 글

딥러닝 레볼루션  (0) 2020.06.12
빅나인  (0) 2020.05.10
세상을 읽는 새로운 언어 빅데이터  (0) 2020.02.20
프레디쿠스  (0) 2020.02.17
인공지능이 나하고 무슨 관계지  (0) 2020.02.17
Posted by dalai
,

- 일본의 건설 장비업체 고마츠는 건설 현장에서 사용되는 굴삭기에도 센서를 달아 판매하는데, 이상이 생기면 유지 보수를 해줌으로써 소비자들의 좋은 반응을 얻고 있다. 그런데 이와 같은 센서를 이용해서 고마츠는 다른 정보도 획득한다. 전 세계에 팔린 고마츠 굴삭기가 10만 대 정도 되는데, 여기에도 GPS가 있어서 판매된 모든 굴삭기가 언제 어느 정도 이용되는지 현황을 파악할 수 있다. 가령 지금 시베리아 쪽에서는 하루에 열 시간씩 일한다는 것, 중국에서는 밤낮 없이 기사를 바꿔가면서 24시간씩 일한다는 것, 한국에서는 주로 쉬고 있다는 것 등을 모두 파악한다.이로써 전 세계의 건설 경기 현황을 간접적으로 들여다볼 수 있는 것이다. 지금은 수많은 산업현장에서 그야말로 모든 것이 수치로 데이터화되고 있다.
- 중국 정부는 전 국민의 얼굴 사진을 확보한 것으로 알려졌는데, 인도는 실제로 세계에서 가장 큰 홍채 데이터베이스를 가지고 있다. 문맹률이 높은 인도에서는 극빈자들에게 지급하는 정부 보조금을 중간에 누군가가 신분증을 도용해 대신 받아 가는 문제가 있었다. 이를 막기 위해 인도 정부가 나서 전 국민의 홍채 사진을 확보해 신분증에 넣었고, 홍채가 확인되어야만 보조금을 지급하도록 한 것이다.
- 미국의 어떤 은행은 대출받는 이유를 글로 쓰게하고 그 글에 등장하는 단어를 분석해 대출 신청자가 돈을 잘 갚을 사람인지, 못 갚을 사람인지를 추정한다. 해당 은 행이 발견한 인사이트는 다음과 같다. 대출금을 잘 갚는 사 람들은 금리', '금리 차이' 등의 단어를 많이 사용했고, 잘 갚지 못하는 사람들은 절대로', '죽어도', '반드시', '하나님 께 맹세'와 같은 단어나 구문들을 많이 사용했다. 약속을 지키지 못하는 사람들이 어떻게라도 대출을 받으려고 과장된 모습을 보인 것이다
- 에어컨을 사용하는 소비자의 관심은 온도 조절 기능과 전기요금, 딱 두 가지다. 여름에 저렴한 전기요금으로 시원 하게 지내고 싶을 뿐, 기계 자체에는 사실 관심이 없다. 데 이터 분석을 통해 얻은 인사이트는 건물 에너지 관리실에 제공될 수도 있고, 아니면 아예 제조사가 인사이트를 기반 으로 서비스를 판매하고 관리를 맡을 수도 있다. 여기서도 80대20' 파레토 법칙이 성립한다. 전체 20퍼센트의 방에 서 전체 소비 에너지의 80퍼센트를 사용하기에, 해당 20퍼 센트 방을 찾아내면 에너지 효율을 획기적으로 올릴 수 있 다. 이때 모든 답은 실내기 데이터에 들어 있다. 일본의 '다이킨'은 에어컨 분야에서 세계 최고의 기술력 을 보유한 회사로서 시스템 에어컨이라는 개념도 이 회사 에서 만들었다. 그런데 다이킨이 최근에 실외기와 실내기 조합의 기계가 아닌 서비스를 판매하기 시작했다. 건물주 와 맺은 계약 내용은 이렇다. “우리가 이 건물을 전기요금 포함 월 얼마의 사용료에 1년 내내 22도에서 25도 사이로 유지해주겠다.” 건물주 입장에서는 기계 제품의 유지 및 보수 문제에 따로 신경 쓸 일이 없다. 실내기와 실외기 설 치에 관련된 모든 결정을 다이킨에서 알아서 하는 것이다.
- 하라스라는 라스베이거스의 오래된 카지노는 단골 회원 고객의 개개인에 대한 고통 커브 pain curve'를 추정해서 데이터로 가지고 있다. 오른쪽의 고통 커브 그래프를 보면, 가로축은 고객이 1회 방문 시 잃은 돈이고 세로축은 미래에 재방문할 확률이다. 여기서 재방문 확률 값은 일정하게 높이 유지되다가 어느 지점을 지나가면 급격히 감소하게 된다. 이 시점을 고통 포인트라고 한다. 물론 이 고통 포인트는 회원마다 다르다. 어떤 회원은 한 번에 100만 원을 잃어도 재미있었다고 생각할 수도 있고, 어떤 회원은 10만 원만 잃어도 너무도 실망하고 기분이 상하여 다시는 돌아오지 않을 수도 있다. 누구나 큰돈을 잃으면 다시는 안 돌아오겠지만 조금만 잃으면 대개는 돌아온다. 단지 큰돈과 작은 돈의 기준이 개인마다 조금씩 다른 것임. 여기서 하라스 카지노가 원하는 것은 후자의 사람들임. 한 번 와서 1000만원 잃고 평생 안 돌아오는 손님보다 주말마다 와서 매달 50만원씩 잃고 가는 손님을 원함. 그래서 하라스는 단골 손님이 입장하여 베팅을 시작하면 그 회원이 잃은 돈을 실시간 모니터링 하다가, 잃은 돈의 액수가 고통 포인트에 접근하면 더 이상 잃지 못하도록 도박 자체를 못하게 슬쩍 방해함. 직원을 시켜 음료수를 제공한다거나 디너 쇼 티켓을 서비스로 주면서 그 순간 흥분된 회원의 심리상태를 식혀줌. 그러면 게임에 몰입해 이성이 잠시 마비되어 있던 회원은 제정신을 차리고 현재 자신이 잃은 돈의 액수를 인지하고 그만 떠나게 된다. 물론 적절한 금액만 잃었으므로 그 고객은 다음 주에 다시 올 것이다.
- 소비자들의 말과 실제 행동이 다르다는 것은 여러 데이터로 알 수 있는 사실이다. 따라서 마케팅 전문가 들은 더 이상 소비자들에게 묻지 말아야 한다. 리서치업체 는 소비자들에게 무엇이 불만인지, 무엇을 원하는지, 신제 품을 구매할 것인지, 신제품의 가격이 얼마면 살 것인지 등 을 끝없이 묻는다. 이때 소비자가 하는 대답은 사실과 다른 경우가 허다하다. 정답을 말하기가 부담스럽기도 하고 본 인의 마음을 제대로 이해하지 못하기 때문이다.이제 소비자는 물어볼 대상이 아니라 관찰의 대상이다. 묻지 말고 관찰해야 한다. 그들의 글과 행동을 관찰해야 한 다. 그것이 훨씬 정확한 예측을 가져온다. 마케팅에서의 소비자 연구, 그 답은 소비자의 입이 아닌 행동에 있다.
- 제록스는 애널리틱스를 동원 해서 조기퇴사하는 사람들에 대한 특징들을 찾아냈다. 우 선 회사에서 멀리 거주하며 확실한 교통수단이 없는 사 람 가운데 조기퇴사자가 많았다. SNS 활동이 전혀 없거나 5개 이상의 소셜네트워크를 가진 사람들의 조기퇴사 가능 성도 매우 높았다. 또한 성격 검사에서 드러난 특징도 있다. 첫째, 궁금한 것이 너무 많은 타입 inquisitive type 이다. 예컨대 주변 사람들의 근황까지도 자신이 모든 것을 다 알아야 하는 사람들, 이것 저것 끊임없이 물어보는 사람들 가운데 조기퇴사자가 많았다. 둘째, 공감을 너무 잘하는 사람, 그리고 셋째, 창의력 이 낮은 사람들 가운데서도 조기퇴사자가 많았다. 이제 각각의 성격 유형에 대해 왜 이런 결과가 나왔는지 유추해보기로 하자. 궁금한 것이 너무 많은 성격의 직원은 퇴근 후 집에 가서 잠자리에 들어서도 호기심이 멈추지 않을 수 있다. 3시에 전화한 사람이 왜 자신에게 욕을 했는지 궁금함이 뇌리를 떠나지 않으면서 남들보다 더 스트레스 를 받지 않았을까 추정해볼 수 있다. 또한 과도한 공감 능 력을 가진 상담원은 지나치게 공감하다 보니 감정 노동이 너무 심해져서 힘들어지는 것이 아닐까 싶다. 끝으로 창의 력이 좋은 사람은 고객이 안 좋은 말을 해도 그걸 창의적으 로 해석해서 본인이나 제록스사의 문제가 아닌 전화를 걸 어온 고객의 문제로 보는 게 아닐까? 단지 고객이 이상한 사람이라서 그럴 것이라고 매우 창의적으로 치부하는 능 력이 뛰어난 것이 아닐까? 이러한 해석은 맞을 수도 있고 맞지 않을 수도 있다. 중요한 것은 우리가 데이터를 통해 도출한 인사이트는 상관관계만 밝혀진 것이라는 사실이다. 즉 인사이트는 상관관계다. 여기에서의 의미는 이런 저런 특징을 가진 사람들의 퇴사율이 훨씬 높다는 것으로, 그 이상도 이하도 아니다. 해당 특징이 직접적인 원인이 될 수도 있고 아닐 수도 있 다. 즉 인과관계가 있는지 없는지의 여부는 알 수 없다.
- 데이터마이닝은 금광에서 금을 캐는 것에 비유되기도 한다. 만 약 금광 안의 금 매장량이 100톤이라고 한다면 어떤 방법 을 써도 그곳에서 200톤의 금이 나오는 것은 불가능한 일 이다. 100톤을 다 캐내면 끝이다. 데이터도 그와 마찬가지 다. 데이터도 그 데이터가 포함하고 있는 잠재적인 인사이 트 양이 어느 정도인가에 따라 최대로 잘했을 때 그만큼의 인사이트가 도출되는 것이다. 따라서 제록스에서 이력서와 성격 검사 데이터만으로 20퍼센트의 조기퇴사자를 예방할 수 있었던 것은 괜찮은 성적이라고 할 수 있다. 실제 상황에서의 판단 기준은 20 퍼센트가 아니다. 중요한 것은 데이터를 모으고 분석하는 데 드는 비용과 20퍼센트의 조기퇴사 감소를 금액으로 환 산했을 때 절감되는 비용, 즉 편익을 비교해보는 것이다.
- 업이 투자자 회의 일시를 공표하고 전화할 곳을 알려주면 기업의 분기별 실적 전화 대 화가 시작된다. 그리고 전화 대화가 끝난 후 이 소식이 알 려지면 그때부터 주가가 움직이기 시작한다. | 이때 CEO와 애널리스트들이 무슨 대화를 나누었는지 를 자연어 처리 기술을 이용해 텍스트를 분석한다. 과연 CEO가 내년에도 실적이 좋을 것이라고 했는지, 아니면 약간 떨어질 수도 있다고 했는지 그 말을 컴퓨터에게 분석하도록 해서 주가를 예측하고자 한 것이다. 애널리스트들이 어떤 질문을 던지느냐 또한 CEO의 답변 못지않게 중요하다. 그 질문을 통해 일반인들이 잘 모르는 기업의 내밀한 사정을 알 수 있기 때문이다. 예를 들어 “내년에 경쟁사가 중국에 공장 20개를 더 짓는다고 하는데, 과연 버틸 수 있을까요?”라고 물어보는 것 자체가 매우 비 관적인 정서를 포함하고 있다. 질문의 정서가 중요한 인사 이트다. 어떤 연구팀은 목소리도 분석했다. 애널리스트가 “내년에는 실적이 안 좋겠죠>" 라고 물어볼 때 CEO가 편안한 목소리로 "그럴 리가 없다"고 하는지, 아니면 갑자기 흥분해서 말이 빨라지는지 그 음성을 분석한다. CEO의 말이 빨라지거나 돈이 올라간 경우, 주가가 떨어지는 경우가 많다고 한다. CEO가 보통 사람들은 도저히 알아들 수 없는 어려운 용어를 쓰면서 설명하는 경우에도 주가가 떨어지는 예가 많다는 것을 발견했다. 안 좋은 상황을 인정하기 싫어서 어려운 말과 복잡한 표현으로 적당히 피하려는 것이다.
- 이미지 데이터로부터 인사이트를 도출한다는 것은 해당 이미지에 어떠한 물체가 들어 있는지, 이들 간의 위치관계는 무엇인지, 색은 무엇인지 등을 이해하는 것임. 컴퓨터 비전 분야 전문가들은 이를 두고 이미지에 대한 표현을 도출한다고 한다. 과거 수십 년간 이 분야는 정말 많이 연구되었다. 특히 통계적 패턴 인식 분야는 매우 성공적이었고, 오늘날의 애널리틱스에도 많은 영향을 주었다. 방법은 이렇다. 사람 얼굴 이미지가 주어지고 이 얼굴의 주인공이 남자인지 여자인지 분류하는 문제를 생각해보자. 이를 해결하기 위해서는 1단계에서 눈, 코, 입 부분을 찾아내고, 2단계에서 각 부위의 크기, 각도, 상대적 위치 같은 소위 특징점을 도출한 후, 3단계에서 도출된 특징점들의 조합으로 최종 판정함. 이때는 딱히 기호주의라고 할 수는 없으나 사람얼굴, 남녀 얼굴의 차이에 대한 깊은 지식이 필요함. 그런데 만일 남녀 구분이 아니라 지문 인식이라면 어떻게 되겠는가? 3단계는 동일하겠지만 1,2 단계는 완전히 달라진다. 또는 항공기의 종류나 나무의 종류를 구분하는 것이라면? 매번 1,2 단계는 완전히 달라짐. 즉 이와 같은 접근방식의 어려운 점은 문제가 달라질 때마다 매버 분석가가 해당 분야 전문가를 찾아가서 특징점이 무엇이어야 하는지를 물어보고 그 사람의 머릿속에 들어 있는 암묵지를 발굴해 내야 한다는 것. 왜냐하면 보통의 사람이라면 이미지의 주인공이 남자인지 여자인지 인식은 하지만 자신이 어떻게 인식하는지 명제로 설명할 수 없기 때문. 하지만 최근에 빅데이터가 등장하면서 1,2 단계를 거치지 않고 곧바로 3단계로 가는 방식을 취하게 되었다. 즉 입력으로 넣고 직접 분류하는 것이다. 거대한 다층 퍼셉트론을 딥러닝으로 학습. 이 방법의 장점은 1,2 단계가 생략되었으므로 전문가와 의논해서 특징점을 고안해야 할 필요가 없다는 점. 사람얼굴이든 지문이든, 비행기든 나무 종류든 3단계로만 해결한다. 빅데이터만 있으면 마치 만병통치약처럼 여러 문제가 유사하게 해결되는 것이다
- 빅데이터 분석의 최종목표는 인사이트가 아니다. 최종목표는 가치만들기임. 따라서 그냥 눈앞에 있는 구하기 쉬운 데이터를 갖고 무작정 분석해서 인사이트를 도출하고, 이를 의사결정자에게 던져주는 접근법은 100% 실패함. 미리 어떠한 가치를 위해 어떠한 인사이트가 필요한지 가르쳐주지 않고 그저 데이터만 주면서 뭐든지 분석해보라고 하는 것은, 셰프에게 무얼 먹고 싶은지 말하지 않고 그냥 내가 맛있게 먹을 수 있는 것을 만들어오라고 하는 것과 같다. 실패확률 100%다.

 

'IT' 카테고리의 다른 글

빅나인  (0) 2020.05.10
최신 인공지능 쉽게 이해하고 넓게 활용하기  (0) 2020.02.23
프레디쿠스  (0) 2020.02.17
인공지능이 나하고 무슨 관계지  (0) 2020.02.17
당신은 데이터의 주인이 아니다  (0) 2020.02.08
Posted by dalai
,

프레디쿠스

IT 2020. 2. 17. 12:08

- 인공지능이라는 멋진 단어는 56년도 다트머스 회의에서 처음 등장했고, 이름에 걸맞은 연구도 이때부터 본격적으로 시작되었음. 당시 학자들은 체스를 두는 기계나 미로찾기 알고리즘 같은 것을 구현하기 위해 총력을 쏟아부었다. 초기에는 기호주의 혹은 규칙기반이란 방법론을 통하여 어느 정도 성공을 거두었다. 그러나 단순하게 외부에서 규칙을 컴퓨터에게 주입하는 방식으로 인간의 지능을 모방한다는 것은 현실적으로 불가능하다는 것이 드러났다. 이런 상황에서 인간의 기존지식을 잘 활용하여 지식을 추론할 수 있는 전문가 시스템이 등장하기도 했다. 한편 인간의 신경망을 모방하는 퍼셉트론이라는 인공신경망 컴퓨터가 57년도에 등장. 인공신경망은 기계가 학습한다는 의미의 머신러닝이라는 개념을 탄생시켰다. 머신러닝은 전통적 규칙기만 방법론과 함께 인공지능 연구의 양대 축으로 발전. 인공지능을 만들기 위하여 위 두가지 방법론은 서로 치열하게 대립하면서 나름의 역사를 만들어갔지만 결국 각자의 기술적 문제를 완전히 해결하지 못하고 90년대 이후 패망의 길로 들어선다 그런데 06년도 딥러닝이라는 것이 갑자기 등장하여 인공지능이 화려하게 부활하였다. 딥러닝은 인공신경망이 진화발전된 것이며 특별히 새로운 것이 아니다.
- 인공지능 연구자들은 우리가 아는 모든 것을 컴퓨터에 이식하면 컴퓨터가 지능을 갖고 인간처럼 생각할 수 있다고 생각했다. 언뜻 보면 이런 발상은 지극히 합리적이고 그럴듯하다. 데이터를 정리하고 검색하고 세금을 정산하고 비행 스케줄을 최적화하고 심지어 자동차를 만드는 작업까지 컴퓨터는 인간보다 월등히 뛰어난 성능을 자랑한다. 비록 지루하고 고통스러운 프로그래밍 작업이 선행되지만 어쨌든 컴퓨터는 잘 작동한다. 그런데 문제는 언어나 추론 같은 인간의 고등한 지능을 컴퓨터로 구현하자니 무한한 비용과 시간이 들어간다는 것이다. 더 심각한 것은 보고 듣고 움직이는 인간의 아주 기본적인 지능의 활동은 애초 그 규칙을 말로 설명할 수 없다는 것이다. 이것이 바로 널리 회자되는 폴라니의 역설이다. 66년 마이클 폴라니는인간의 인지특징을 "우리는 말할 수 있는 것보다 더 많이 안다"라고 요약하면서, 말로 설명할 수 없는 암묵지가 우리 지식의 대부분을 차지한다고 보았다. 예를 들어 우리는 반복학습을 통해 자전거를 타는 법을 터득한다. 그러나 타는 법을 모두 말로 설명할 수는 없다. 개와 고양이를 구별하는 것도 마찬가지다. 어떤 식으로 구별하는지 설명하기는 어렵지만 보면 안다. 이런 지식이나 지능은 말로 도두 설명할 수 없기 때문에 규칙이나 논리로 변형해서 프로그래밍하는 것이 불가능하다. 폴라니의 역설은 인간을 묘사하는 것이지만 '기계가 인간을 모방할 수 없다'는 이유가 되었다. 세상이 모두 놀란 알파고의 등장은 딥러닝이 폴라니의 역설을 돌파했다는 상징을 의미를 가지고 있다. 우리 인간이 암묵지의 형태로 지식을 흡수하면서 지능이 향상하듯이 이제 컴퓨터는 데이터를 통해서 스스로 학습을 하면서 세상의 규칙을 이해할 수 있다. 인간의 모든 규칙을 손수 컴퓨터에 가르치는 성가신 작업이 사라지는 순간이다. 아기가 말문이 처진 것처럼 딥러닝은 이제 알아서 암묵지를 형성해 나간다
- 예측적 지각 : 우리 시각 시스템은 과거의 정보를 바탕으로 0.1초 이후의 상황을 예측하여 미리 예상 이미지를 생성하는 방향으로 진화했음. (인지과학자 마크 창기지)
- 소송 전에 방대한 문서를 분석해야 하는 인간의 수작업 업무는 컴퓨터와 분석기술에 의해 조금씩 대체되고 있다. 전자증거개시제도가 도입되는 시기에 이미 블랙스톤 디스커버리같은 회사가 등장했고, 예츠코딩기술이 퍼지면서 관련 산업이 활성화됐다. 예측코딩 산업의 대표주자로 떠오른 에버로라는 회사 변호사가 원하는 대로 방대한 문서를 검색하고 관련문서를 추출해준다. 광범위한 사용자 제어 기능을 통해 변호사 및 법률 종사자는 검색결과를 60%, 75% 등 사용자가 지정한 예측률 범위내로 설정하여 검토할 수 있다. 에버로 사용자는 최종검색결과를 바탕으로 사용자가 직접 2차 검수한 문서를 바탕으로 검색범위를 좁히거나 확장시킬 수 있다. 한편, 예측기반 법률 시스템은 자료검색과 분류에 탁월한 예측코딩과는 달리 자료분석보다는 예측에 무게중심을 둔다. 예측기반도 본질적으로는 데이터 분석을 기반으로 하기 때문에 전통적인 데이터 마이닝 기술에 의존한다. 이 분야의 대표회사는 렉스 마키나다. 이 회사는 09년 설립됐는데, 데이터 마이닝을 기반으로 법률과 판례추이 등을 분석해 어떻게 판결이 날지를 예측하며 세심한 소송전략을 제시해준다. 또한 연방법원 판사들을 모두 분석해서 사건 경험, 평균소요시간, 관련 사건의 기각률, 손해배상 인용액 등의 자세한 판사비교표를 제공하고 있다. 렉스 마키나의 예측 분석 시스템이 큰 성공을 거둔 후 유사한 예측 시스템이 많이 등장했다. 주목할 만한 것은 송무와 괄년한 예측분석을 넘어 법률 자체를 예측하는 서비스 모델의 탄생이다. 미국의 피스컬노트라는 회사는 예측분석 기법을 입법으로 확장했다. 이 회사의 핵심 서비스는 연방정부와 50개주에서 발의된 법안을 추적하고 법안 통과가능성을 예측해주는 것이다. 온라인 인상에서 미국 연방정부 법과 50개주 법안, 그리고 법안을 만드는 데 참여한 상하원 의원들과 통과 여부를 확률로 보여준다. 입법 예측은 예측 법률세계에서 예측 본연의 개념에 가장 근접하고 있다.
- 17년 구글의 인공지능 챗봇 2대가 서로 대화를 하면서 수다를 떠는 모습이 실시간 방송됐다. 두 챗봇은 각각 블라디미르와 에스트라공이라는 이름표가 붙어 있다. 아일랜드 출신 극작가 사무엘 베케트의 희곡 고도를 기다리며에 등장하는 주인공들의 이름을 따서 만든 재치있는 별명이다.
- 기호주의 혹은 규칙기반 인공지응은 세상의 모든 것을 인간이 직접 기호화하거나 규칙으로 표현해야 하기 때문에 비용과 시간의 측면에서 근본적 한계를 지니고 있다. 이런 문제를 극복하기 위해 데이터를 통해 학습하는 인공신경망 같은 학습기반 혹은 연결주의 방식의 머신러닝 연구도 물밑에서 활발하게 진행됐다. 그러나 이런 도전들도 역시 기술적 벽을 넘지 못하고 2차 인공지능 겨울과 함께 시들해짐. 튜링 이후 인공지능에 대한 인류의 꿈은 이렇게 하나의 추억으로 사라졌다가 딥러닝이라는 이름으로 부활하고 있는 것이다. 우리가 보는 지금의 인공지능은 오랫동안 축적된 연구결과를 바탕으로 하는 것이며 특별히 새로운 것은 아니다.
- 법률은 의료분야와 함께 대표적인 전문지식 영역에 속한다. 두 종류의 전문가 시스템(규칙기반과 사례기반)의 형식을 잘 살펴보면 놀랍게도 법률세계와 궁합이 잘 맞는다는 것을 알 수 있다. 먼저 법률의 형식과 내용을 보면 그 자체로 이미 규칙으로 표현된 텍스트다. 민법, 형법, 저작권법 같은 법률은 개개의 논리와 체계를 가지고 있으며 엄격한 법적 규칙을 담고 있다. 법률은 그 자체가 컴퓨터 프로그래밍 코드처럼 작동하며 법적 분쟁해결과정도 법률을 기초로 하여 정교한 논리 추론 형식으로 진행된다. 법률가들은 이런 규칙덩어리를 갖고 그 규칙에 따라 연역적 추론을 하는 것처럼 보인다. 이런 이유로 학자들은 일찍부터 법률세계를 주목하면서 규칙기반 법률 시스템 연구를 시작했다. 그런데 법률가들은 법률규칙에 따라 컴퓨터 알고리즘처럼 추론하기도 하지만 유사한 사례를 기억에 떠올려서 귀납적으로 판단하는 경우도 있다. 이런 인지과정은 사례기반 시스템과 잘 어울린다. 결론적으로 법률세계는 규칙기반과 사례기반 모두 가능하다는 것이다. 그런데 역사적으로 보면 법률 전문가 시스템 연구는 규칙기반 시스템이 등장한 이후에 시간이 좀 더 흘러 사례기반 시스템 연구가 시작됐다. 규칙이냐 사례냐 하는 이분법은 오랫동안 대립하면서 격렬한 논쟁을 가져왔다. 법률추론이라는 것이 주로 연역의 과정이라는 관점과 법 이론을 유추하는 과정이라는 관점의 충돌이었다. 그러나 법률가의 추론은 어느 하나의 관점으로 설명할 수 없는 복합적인 면이 있다. 실제 변호사는 법률적 상담을 할 때 의뢰인이 처한 상홍을 분석하여 특징을 잡아낸 후 법률논리에 대입하게 된다. 그러나 법률용어의 추상성과 애매성 등의 이유로 규칙에 의해 일의적으로 분명하게 판단을 내릴 수 없는 경우도 많다. 이런 경우에는 과거 유사한 사례나 판례를 근거로 유추한다. 예를 들면 교통사고로 사람이 다치면 교통사고특례법, 도로교통법, 형법 등의 관련법을 잘 검토하고 조항 하나하나를 논리적으로 따지면서 추론을 한다. 그러나 변호사는 실제 처리했거나 기억 속에 있는 유사한 판례를 머릿속에서 검색하여 단번에 결론을 내기도 한다. 이런 변호사의 해결전략은 매우 일반적이다. 그러나 머릿속에 유추할 수 있는 사례가 부족하고 없다면 법률조항을 하나씩 따져가면서 법률 규칙 알고리즘을 작동시킬 수밖에 없다. 결국 변호사는 연역과 귀납을 동시에 사용하는 셈이다.
- 전문가 시스템 연구는 기존에 존재하는 지식과 인간의 상식을 모두 주입하면 인간 의사나 변호사처럼 추론하는 기계를 만들 수 있다는 믿음으로 출발했다. 그러나 예상과는 달리 전문가 시스템은 현실세계에서 인간의 능력과는 비교되지 못하며 매우 제한적으로만 작동한다. 전문가 시스템은 형식적으로 인간을 단순하게 모방한 것에 불과하며 실제 인간의 복잡한 인지과정을 그대로 반영한 것은 아님. 뇌과학이나 신경생물학 같은 학문이 고도로 발달한 지금도 우리는 뇌에 대해서 아는 것이 별로 없을 정도로 뇌는 난공불락의 세계다. 인간의 뇌를 모방해서 인공지능을 구현한다는 관점에서는 그 당시 학문 수준으로 인간처럼 추론하는 기계를 만드는 것은 애초 불가능한 도전이었는지 모른다. 또한 형식적으로나마 인간의 인지과정을 모방한다고 해도 지식을 추출하고 규칙을 입력하는 것은 결국 인간이 해야 하기 때문에 무한한 시간과 비용의 문제를 극복할 수 없다. 이것은 인공지능 구현에 학습개념이 절대적으로 필요하다는 것을 암시하고 있다. 이런저런 이유로 파이겐바움의 그 원대한 꿈은 끝이 났다. "어려운 것은 쉽고 쉬운 것은 어렵다"는 모라벡의 역설처럼 기계에게 복잡한 계산이나 연산은 쉽지만 걷고 움직이고 사물을 지각하는 것은 어려운 일이다. 사물을 보고 인식하거나 상식적인 것을 이해하는 것에는 특별한 규칙이 없어 보인다. 따라서 기계에게 어떤 규칙을 부여하는 것 자체가 너무나 애매하고 막막하다. 우리는 물, 나무, 바람 같은 것들을 상식적으로 이해하고 있으며, 그런 상식은 고도의 지능에 의존하기보다는 어린 시절에 별 생각없이 반복했던 언어훈련에서 부지불식간에 형성된 것이다. 단어의 상식적 의미나 개념은 다른 단어에 의해 논리적으로 설명되어지는 것이 아니라 우리 몸이 외부세계와 상호작용을 하는 과정에서 자연스럽게 감각적으로 체득되는 면이 있다. 따라서 몸이 없는 기계는 그런 것을 애초 가정할 수 없고 상식을 가르칠 뾰족한 방법도 없다.
- 전문가 시스템은 인간의 지식을 잘 표현하는 것이 핵심이라고 했다. 그런데 그 지식의 의미를 잡아내기 위해 또 다른 지식의 표현이 필요한데 이런 식으로 계속 연결하다 보면 상식 수준의 지식이 등장하게 된다. 그런데 이런 상식은 컴퓨터가 그 의미를 직접 잡아내지 못하므로 또 다른 지식이나 단어가 필요하고 끝없는 반복을 하게 된다. 이것은 우리가 지식을 표현하는 방법으로 추론지능을 만드는 것은 물리적으로 감당할 수 없는 작업임을 암시한다. 결국 초기의 생각하는 기계는 전문가 시스템으로 진화했지만 이런 본질적인 한계를 극복하지 못하고 머신러닝과 같은 학습기반 인공지능과 융합할 때까지 긴 정체기를 가진다. 법률 전문가 시스템도 이런 운명의 길을 걷는 것은 당연하다. 재미있는 것은 전문가 시스템이라는 개념이 등장하기 훨씬 전인 57년에 이미 컴퓨터를 이용한 법률 자동화연구가 시작되었다는 것이다. 법률의 자동화는 인공지능과 만나면서 자연스럽게 법률정보학, 법률 인공지능, 컴퓨테이션 법률학과 같은 다양한 종파들이 생겨났고 리걸테크라는 새로운 산업을 잉태하게 된다. 법률과 컴퓨터의 성공적 결합은 알고리즘과 컴퓨터를 이용하는 방법론이 세상의 모든 학문과 지식에도 적용가능함을 암시한다. 또한 '생각이 알고리즘이며 알고리즘이 곧 생각'이라는 컴퓨테이션 철학이 일종의 패러다임으로 작동하고 있다는 의미도 된다.
- 케플러 추측은 위대한 물리학자 케플러가 1611년 제안한 것으로 여러 개의 구를 가장 효율적으로 쌓는 방법은 과일가게가 오렌지를 진열하는 것과 같은 방법(피라미드식)이라는 것이다. 이 문제도 수많은 수학자가 도전했지만 일반적인 증명에 실패했고 300년이 더 지난 98년도에 와서 수학자 토마스 헤일스와 그의 제자 숀 맥러플린이 케플러 추측을 증명. 그런데 기존 방식과는 달리 증명은 컴퓨터를 이용하는 방식이었다. 헤일즈는 그들의 증명을 수학연보에 제출. 이후 12명의 수학자들이 심사위원으로 투입되어 증명의 오류를 검토하였고 4년 이상의 세월이 흘렀다. 그런데 헤일즈가 제출한 증명에는 컴퓨터 프로그래밍 파일도 있었는데, 심사위원들이 컴퓨터 프로그램 오류를 모두 검증하기 어려웠다. 최종적으로 수학연보는 증명이 참이라는 것은 99% 확신한다고 발표했다. 수학역사에서 보기 힘든 희대의 발표였다. 한편 헤일즈는 지루한 검토과정을 보면서 증명과정을 컴퓨터 알고리즘을 이용해 자동을 검토할 수 있는 프로그램을 만들기로 마음먹고 플라이스펙 프로젝트를 기획하게 된다. 이 프로젝트는 03년도에 시작하여 14년에 최종 마무리되었다. 결국 컴퓨터가 등장해서 헤일즈의 증명이 100% 참이라는 것을 증명한 것이다. 컴퓨테이션을 기반으로 증명의 증명, 소위 메타증명의 세계가 펼쳐지는 순간이었다. 이제 컴퓨테이션 수학은 이산수학처럼 컴퓨터를 위한 수학에서 나아가 수학자체를 위한 수학으로 진화하고 있다. 바야흐로 컴퓨터는 증명의 검토뿐 아니라 가설을 세우거나 증명을 하는 단계에서 인간과 협업할 준비를 하고 있다. 결론적으로 자동계산과 알고리즘을 바탕으로 하는 컴퓨테이션은 인간사고의 초절정 영역인 수학의 영역에 소리없이 침투하고 있다. 이제 컴퓨테이션은 수학과 과학을 넘어 인문학, 사회학, 예술, 법률에도 적용되면서 우리의 생각방식을 확장하고 있다. 소위 컴퓨테이셔니즘 시대가 오고 있는 것이다.
- 머신러닝에는 인공신경망 외에도 선형회귀, 로지스특회귀, 의사결정나무, 나이브베이즈, 서포트벡터머신 등 다양한 모델이 있다. 그런데 인공신경망 중에서 특별한 구조를 가지고 있는 것이 딥러닝이다. 우리는 보통 인공지능, 머신러닝, 딥러닝이라는 단어를 구별없이 사용한다. 이들은 비슷하면서도 조금씩 다른 의미를 가지고 있기 때문에 집합의 포함관계로 해석하는 것이 가장 간명하다. 즉 인공지능의 부분집합이 머신러닝이고 머신러닝의 부분집합이 딥러닝이다. 새로운 인공지능 시대를 열고 있는 딥러닝은 머신러닝의 일종이며 인공신경망의 후손인 셈이다.
- 초기의 신경망 모델인 퍼셉트론은 입력층과 출력층만을 가지는 간단한 형식이었지만 일반적으로 인공신경망은 입력층, 중간층(은닉층), 출력층 등 여러 개의 층으로 이루어진 다층 네트워크 구조를 가진다. 각층은 여러 개의 노드로 이루어져 있고 노드와 노드의 연결에 의해 전체 네트워크가 작동한다. 각 노드는 뉴런의 몸체이며 연결선은 축삭돌기이고 연결자체는 시냅스 연결을 의미한다. 정보의 전달과 연산은 실제 인간의 뉴런에서 일어나는 과정과 유사하다. 노드는 일정 크기 이상의 자극을 받으면 반응을 하는데 그 반응의 크기는 입력값과 노드 연결선의 계수(또는 가중치)를 곱한값에 비례. 일반적으로 노드는 여러 개의 입력을 받으며 입력마다 다른 계수를 가지고 있다. 이 계수가 바로 각 입력에 대한 가중치가 되며 실제 시냅스의 신호전달 가변성을 대변함. 각 노드는 들어오는 모든 입력값과 각 연결선의 가중치를 곱한 값들을 전부 더한 후 그 값을 입력값과 각 연결선의 가중치를 곱한 값들을 전부 더한 후 그 값을 최종 판결자인 활성함수의 입력으로 보낸다. 활성함수의 결과가 그 노드의 출력에 해당한다. 이런 식으로 노드는 층층이 배치되어 정보입력과 출력을 이어간다. 데이터를 입력받아서 학습한다는 것은 노드와 노드를 연결하는 연결선의 가중치를 변화시키면서 최종응답(출력)의 오류를 최소화하는 과정이다. 학습이 끝나면 이 가중치가 특정 수치로 결정된다. 인공신경망은 보통 2,3개의 중간층을 가지는 신경망 구조로도 좋은 성능을 보이며 학습도 쉽게 이루어진다. 그러나 언어지능이나 시각지능같이 복잡하고 어려운 영역에서는 중간층의 개수가 여러 개인 깊은 구조로 만들어진 네트워크가 필요하다. (다층신경망 혹은 심층신경망) 그러나 무작정 중간층(은닉층)을 많이 늘린다고 좋은 것은 아님. 층이 늘어나면 연산 양이 기하급수적으로 늘어나면 학습자체가 부족하면 오답을 학습할 가능성이 높아짐. 더 큰 문제는 융통성 없이 학습한다는 것. 주어진 학습 데이터에 기반을 두고 학습하다보니 조금이라도 변수가 생기면 적합한 답을 내놓지 못하는 경우가 생긴다. 이런 현상을 과적합이라고 하며 실제 데이터에 대한 오차가 급격하게 증가하는 현상. 다층신경망은 80년대부터 연구가 진행됐지만 실전에서 큰 활약을 못하고 역사속으로 사라지는 듯 했다.
- 힌튼이라는 영웅이 등장하여 수렁에 빠진 다층신경망을 구해낸다. 힌튼과 그의 동료들이 86년에 발표한 오차역전파 기법에 의해 다층신경망은 기적적으로 회생을 하게 됨. 이것이 바로 1차 신경망 구출작전이다. 극적으로 부활한 신경망은 영상처리, 제어분야, 자연어 처리 등에서 제법 활약을 하는 듯하였지만 과적합 같은 문제들을 해결하지 못하면서 2차인공지능 겨울과 함께 90년대 이후에 서서히 몰락하게 된다. 2차 인공지능 겨울은 대부분의 학자들과 투자자들이 인공지능을 외면하는 시대였고, 인공신경망은 더욱더 심한 냉대속에 있었다. 이런 싸늘한 분위기 속에서도 힌튼은 '인공신경망이 바로 인공지능이라는 신념을 굽히지 않았다. 불굴의 힌튼과 그의 동료들의 노력에 의해 꺼져가는 신경망의 불씨가 조금씩 살아나기 시작했다. 06년도에 와서 캐나다의 지원을 받아온 힌튼팀은 한편의 기념비적 논문을 발표하게 되는데 이것이 바로 딥 빌리프 넷을 위한 패스트 러닝 알고리즘이다. 이 논문은 인공신경망의 고질적인 문제가 데이터의 사전학습 등을 통해 해결될 수 있음을 밝혔고, 인공신경망 연구의 새로운 이정표를 세운다. 힌튼의 2차 신경망 구출작전이 성공한 것이다. 이 논문 이후에 딥러닝이란 말이 유행하기 시작. 흥미로운 것은 논문제목에서 신경망이란 단어대신 딥 빌리프 넷이 사용된 점이다. 2000년대 초기만 하더라도 논문에 신경망의 neural이란 단어만 들어가도 탈락당할 정도로 신경망은 죽은 분야였다. 이런 참단한 시기에 힌튼은 색다른 단어를 선택해서 악마의 프레임을 빠져나오고 있었다. 그후 6년의 세월이 지난 2012년 세계 최대의 이미지 인식 경연대회 ILSVRC에 출전한 힌튼 팀은 마치 다른 팀들을 비웃기라도 하듯 압도적 기록으로 우승하면서 딥러닝의 가공할 위력을 보여주게 된다. 힌튼의 신경망 구출작전이 성공하면서 우리가 보는 지금의 인공지능 시대가 열린 것이다.
- 과일 분류기와는 달리 아파트 가격예측의 경우만 하더라도 결정적 피처를 선택하기 위해서는 일반 상식보다 더 깊은 전문가의 지식이나 경험이 필요함을 알 수 있다. 좀 더 복잡한 경우를 생각해보자. 엑스레이 사진을 보고 암을 판정하는 기계를 머신러닝 방식으로 만드는 경우, 역시 일단 세포에 대한 이미지 데이터를 준비해야 하는 것이 급선무다. 그런데 암세포와 정상세포를 구별할 수 있는 피처(특징)를 어떤 식으로 정의해서 데이터를 모아야 할까? 정교한 의료지식이 없다면 이 단계에서 벌써 막히게 된다. 이제 눈치를 챘겠지만 머신러닝 방식의 결정적 단점은 도메인 특징을 반영하는 피처를 정의하거나 좋은 피처를 찾아내는 것이 쉬운 작업이 아니라는 것이다. 어느 정도 피처에 대한 감이 온다면 이미지 이식의 경우로 돌아가보자. 사물을 구별하는 것은 너무나 쉬운 일인 것 같은데 이미지의 어떤 것을 피처로잡아서 입력으로 사용해야 할지 분명하지가 않다. 이미지의 개별 픽셀 하나하나를 입력으로 해도 되고 털을 먼저 검출하여 그것을 피처로 잡아도 된다. 눈, 코, 입 등을 모듈로 구분하여 피처로 잡아도 될 것 같다. 그러나 좋은 성능을 내는 최적의 피처가 무엇인지 알 수 없기 때문에 인간이 수작업으로 하나씩 잡아서 모두 검토해야 한다. 또한 하나의 얼굴이라고 보는 각도 등에 따라 수많은 경우가 발생하므로 그것을 모두 반영하는 피처를 설계하는 것은 거의 불가능에 가깝다. 결국 머신러닝 방식도 고전적인 규칙기반 시스템이 갖고 있는 문제로 수렴한다.
- 여기서 자연스럽게 컴퓨터가 자동으로 피처를 잡아주는 시스템을 상상할 수 있다. 이런 상상이 현실이 된 것이 바로 딥러닝이다. 딥러닝은 피처를 사람이 선택하는 고전적인 머신러닝과는 달리 적절한 피처(입력값)를 스슬 생성해낸다. 딥러닝은 엄청난 양으 데이터를 학습하여 스스로 피처를 만들고 인간이 인식하지 못한 숨은 특징도 찾아낸다. 이런 의미에서 딥러닝을 표현학습 혹은 특징학습이라 한다. 고전적 머신러닝은 이미 만들어진 입력 피처를 받아서 분류기를 학습한다. 그러나 딥러닝은 입력 데이터에서 스스로 피처를 찾아내고 그것을 입력값으로 변환하여 다시 분류기로 넘기는 작업을 동시에 수행한다.
- 컨볼루션 신경망은 기계적 시각지능을 구현한 일등공신이며 딥러닝의 철학을 만든 장본인이다. 컨볼루션 신경망의 핵심은 피처를 자동을 잡아내는 것이라고 했다. 컨볼루션 신경망은 이미지의 특징이나 피처를 잡아내는 필터의 집합체다. 단계별로 나누어진 필터는 사물의 피처를 잘 잡아낼 수 있도록 학습을 통해 최적화된다. 피카소가 사물의 피처를 멋지게 잡아내서 표현하는 것처럼 기계는 학습을 통해 사물의 피처를 이해하는 것이다. 그러나 기계가 고양이와 개를 구별한다고 해서 그 의미를 이해하는 것은 아니다. 단지 이미지를 분류할 수 있을 뿐이다. 기계는 딱 거기까지 가능하다. 따라서 기계는 모나리자보다 피카소가 만든 얼굴이 더 인간적이라고 판단할 수도 있다.
- 이미지 인식의 신기원을 이룩한 컨볼루션 신경망은 입력 이미지에서 자동으로 피처를 뽑아내는 것이 주특기. 그렇다면 반대로 생각하여 피처맵을 이용하여 이미지를 뽑아내면 어떨까? 앞에서 살펴보았듯이 컨볼루션 신경망은 위계적인 구조를 바탕으로 단계별로 피처를 잡아낸다. 이런 피처를 역으로 이용하여 이미지를 복원하여 연구가 활발하게 진행되고 있다. 17년도에 들어와 구글 브레인 연구팀은 저해상도의 흐릿한 얼굴 이미지에서 뚜렷한 고해상도 이미지를 생성하는 알고리즘 '픽셀 리커시브 슈퍼 레졸루션'을 발표했다. 흐릿한 8*8 픽셀 사진을 입력하면 컴퓨터는 원본사진을 복원하여 출력으로 보낸다. 이미지 복원기술은 다양하게 응용될 수 있다. 사진을 확대할 때 사진이 깨지거나 일그러지는 현상을 막을 수 있다. 구글은 이미 고해상도 이미지 변경 기술을 통해 사진을 깨지지 않게 확대해주는 서비스를 시작한 상태. 한편 이런 이미지 기술들은 범죄 현장이나 범인의 얼굴을 찍은 CCTV 영상을 깨끗하게 복원하는 데 응용이 될 수도 있다. 최근에 차량 블랙박스의 흐린 이미지를 깨끗하게 복원하는 연구가 활발하다. 뺑소니 사고 등 크고 작은 교통사고를 해결하는 데 결정적 역할을 할 것이다.
- 컨볼루션 신경망은 자율자동차 개발에도 빠질 수 없다. 자율자동차는 전통적인 자동차 기술뿐 아니라 센서기술, 자동제어 기술, 이미지 인식기술 등 거의 모든 첨단 기술들이 필요. 특히 움직이는 주위 환경을 인식하는 기술은 자율자동차의 생명이다. 급변하는 환경과 빠른 속도로 지나가는 다른 차와 사람들을 올바르게 인식하지 못하면 곧바로 사고로 이어진다. 따라서 이미지를 분류하거나 이미지 속에서 한 객체의 위치를 알아내는 수준으로는 자율자동차에 적용하기 어렵다. 자율자동차의 영상정보에는 다양한 객체들이 다양한 위치에 존재함. 사람, 신호등, 차량, 표지판 등 수많은 객체들이 총 동원되어야 함. 객체의 위치를 특정해서 분류해야 하고(분류 및 구역화), 여러 객체들을 인식해야 하고(객체 탐지), 객체의 윤곽을 잡아서 독립된 파편으로 분할해야 하는(객체 분할) 등 자율자동차 등 거의 인간 수준의 시각지능이 필요하다. 여기서 객체분할은 객체의 윤곽을 잡아내는 것으로 세그멘테이션이라고 부르기도 한다. 15년 켐브리지 대학은 이 기술을 자율자동차에 적용할 수 있는 세그넷이라는 시스템을 공개했다. 이 시스템은 컨볼루션 신경망을 기반으로 만들어졌는데 위치추적 시스템을 통한 위치측정과 함께 도로위의 표지판과 도로표지, 거리의 모습, 보행자, 심지어 날씨까지 인식할 수 있다. 세그넷은 지금까지 본 적인 없는 거리의 풍경을 분석하고 도로 및 도로 표지판, 보행자, 건물, 자전거 등 12개의 다른 카테고리 별로 사물과 풍경을 분류한다. 요즘은 이 시스템을 능가하는 모델들이 계속 등장하면서 자율자동차의 가능성을 높이고 있다. 컨볼루션 신경망은 자율자동차의 꿈을 실현하는 데 일등공신임에 틀림없다.
- 인공신경망을 트윈모듈로 연결하여 경쟁을 시키는 적대적 생성 네트워크 모델은 한 방향으로 흐르는 기존 신경망과는 달리 실제 자연의 생태계처럼 진화할 수 있는 상호작용 시스템을 구현한 것이다. 이 아이디어를 경쟁하는 다중 모듈로 계속 확장한다면 점점 인간에 가까운 능력을 발휘할지도 모른다. 컨볼루션 신경망의 완성자 얀 르쿤 교수가 적대적 생성 네트워크는 최근 10년간 머신러밍 분야에서 가장 혁신적인 아이디어라고 극찬했을 정도로 응용분야가 무궁무진하다. 적대적 생성 네트워크를 만든 이언 굿펠로우는 대강의 그림만 그려놓으면 나머지는 인공지능이 완성하는 형태의 시스템이 구현가능함을 강조했다. 실제 적대적 생성 네트워크는 이미지 분야뿐 아니라 음성인식 분야나 예술분야 등으로 계속 응용되고 있으며 적대적 생성 네트워크의 변종들이 계속 탄생하고 있다. 시각지능은 이제 창조지능이 되고 있다.
- 리걸테크 산업의 종류는 변호사의 업무 영역만큼 다양하지만 서비스 형태를 기준으로 간단하게 나누어보면 다음과 같다. 지능형 법률정보 검색, 변호사 소개 서비스, 법률 데이터 분석 및 예측, 전자증거개시 분석, 법률 프로세스 자동화, 법률문서 자동화 등이다. 결국 인공지능 변호사라는 닉네임을 달고 나타나는 모든 서비스는 하나로 볼 수 있다. 리걸테크는 요즘 갑자기 등장한 것 같지만 그 뿌리는 매우 깊다. 컴퓨터와 법률의 만남 자체가 리걸테크의 시작이며 가시적으로는 법률정보검색 서비스이 형태로 나타났다. 50년대 이후에 컴퓨터는 문헌이나 자료를 검색하는 데 필수적인 도구로 자리잡았따. 법률 영역은 판례나 법률자료를 검색하는 것이 너무나 중요하기 때문에 다른 분야보다 일찍 컴퓨터가 응용되었다. 60년대에 이미 미국 오하이오 변호사협회는 판례를 검색하는 컴퓨터 시스템을 도입하였다. 이후에 민간영역에서 법률 정보검색 서비스가 본격화되었다. 렉시스 넥시스가 민간영역에서 최초로 법률검색 서비스를 시작하였고, 웨스트로가 방대한 법률문서의 데이터베이스를 기반으로 검색 서비스 사업에 뛰어들었다. 이 두 회사가 법률검색 서비스를 거의 독점하면서 리걸테크는 그 자체의 산업으로 다양성을 확보하지는 못하였다.

 

Posted by dalai
,

- 가장 큰 위험은 어떤 위험도 감수하지 않는 것이다. 급변하는 세상에서 위험을 감수하지 않는 건 곧 실패로 이어진다. (마크 주커버그)
- 다른 분야처럼 의료 분야에서도 인공지능과 인간의 융복합이 중요함. 또한 인공지능이 의사를 온전히 대체할 수도 없다. 구글에서 의료 인공지능을 연구하는 릴리 펭 프로덕트 매니저 역시 의사와 인공지능의 조합은 의료분야 문제를 개선하는 좋은 해결책은 될 수 있지만 명확한 판단을 내리기 어려운 영역이 있기 대문에 이를 인공지능으로 완전히 대체하긴 어렵다고 말한다. 하지만 머신러닝을 통해 반복작업을 수행하거나 의사의 판단을 돕는 좋은 도구는 될 수 있다고 했는데, 이는 데이터는 많지만 전문지식이 적은 분야에서 머신러닝 활용도가 높기 때문. 인공지능은 사람에 비해 월등히 많은 데이터를 짧은 시간에 훑어보고 파악할 수 있고, 사람은 기계로만 판단할 수 없는 세밀한 부분을 살펴볼 수 있는 능력이 있다. 따라서 서로 협력을 통해 의료 서비스가 더욱 발달하게 된다면 앞으로 못 고칠 병이나 놓치고 지나칠 병은 획기적으로 줄어들 수 있을 것이다. 이것이야말로 인공지능과 사람의 긍정적 협업의 모습일 것이다.
- 아마존 고 매장 천장에 달린 100여대의 고해상도 CCTV와 센서를 통해 무인상점이 이루어짐. 센서가 부착된 카메라가 고객의 동선을 따라다니며 구매목록을 확인하는 것이다. 이런 인공지능 무인점포는 중국에도 있음. 알리바바 그룹이 선보인 타오카페가 그것이다. 알리바바 그룹이 보유한 빅데이터아 인공지능 기술이 활용된 무인편의점으로 ,아마존 고와 비슷한 형태다. 타오바오 앱과 알리페이 앱만 있으면 현금이나 카드가 없어도 이용할 수 있으며, 매장 이용법도 아마존과 거의 동일하다. 타오카페를 시작으로 중국의 많은 기업들이 무인매장을 선보이고 있는데, 베이징에 위치한 중국 제2의 전자상거래인 징둥의 X무인슈퍼는 안면인식 기술까지 더해진 매장이다.아마존 고와 동일하게 매장에 들어가기 전에 앱을 깔고 QR코드를 활용하는데, 이때 고객의 얼굴과 QR코드를 매칭하는 작업이 이루어진다. 여기에 안면인식이 적용되는 것이다. 다음에 방문할 땐 핸드폰이 없어도 안면인식으로 출입이 가능하다. 결제는 계산구역에서 카메라로 얼굴 사진을 찍으면 이루어진다. 이 점이 아마존 고와는 차별화된 방식이다. 첫 방문 이후부터는 안면인식기술로 출입과 결제가 모두 가능한 것이다.
- JR동일본은 18년 10월부터 2개월간 동경 아카바네역에서 무인매점을 시범운영했음. 이용방법은 아마존고와 비슷한데, 스마트폰앱이 아닌 일본에서 대중적으로 이용되는 스이카 같은 교통카드를 입구에서 찍고 들어갈 수 있다는 점이 다르다. 물건을 골라 담고 매장에서 나올 때 카드를 한번 더 찍으면 자동으로 계산이 끝나고 열린 문으로 나올 수 있다. 매장 천장에 설치된 20대의 카메라가 3명으로 제한된 매장 내 고객들을 정확히 구분하고 매대마다 달려 있는 6대의 카메라가 구매물건을 촬영함. 수차례 들었다 놨다를 반복하거나 엉뚱한 곳에 가져다 놓아도 구매를 위해 갖고 나온 제품을 정확하게 계산해준다. 19년 9월 국내에서도 신세계 I&C가 계산대 없는 무인점포를 선보였다. 운영방식은 아마존고와 유사함
- 에드몽 등 벨라미의 초상화는 파리의 예술공학단체 오비우스의 프로그래머들이 개발한 것으로 14-20세기 그림 1만 5천여 작품을 학습한 끝에 이 그림을 그려냈다. 이 학습에는 상호 경쟁 방식의 생성적 대립 신경망 기술이 사용되었다. 쉽게 말하자면, 어떤 단어를 제시하고 그것을 그림으로 그려보라고 했을 때 사라들의 경우 자신만의 상상력으로 서로 다른 그림을 그려내듯, 인공지능 또한 스스로 학습한 결과에 해당하는 이미지를 그려내는 것이다. 이 방식은 14년에 처음 등장했는데, 객체에 대한 개념을 이해한 인공지능은 사람의 개입없이 실제와 똑같이 그려내게 된다. 인공지능을 구현하는 머신러닝은 사람이 데이터를 제공하고, 이에 대한 학습결과도 사람이 확인한다. 그러나 GAN의 경우는 다르다. 대립 쌍을 이루는 두 개의 네트워크가 서로 상호 대립과정에서 훈련 목표를 자동으로 생성하고 학습시킨다. 즉 인공지능 스스로가 반복적으로 평가하고 수정하며 데이터 자체에서 정보와 지식을 얻는다고 할 수 있다.
- 렘브란트는 인공지능과 친숙한 화가인 것 같다. 렘브란트로 오해할 만한 오비우스는 그림과는 달리 아예 렘브란트의 화풍을 그대로 살려낸 더 넥스트 렘브란트도 등장했기 때문이다. 인공지능 화가인 더 넥스트 렘브란트는 마이크로소프트로와 렘브란트 미술관, 네덜란드의 과학자들이 개발한 안면인식기술을 활용하는데, 렘브란트의 작품분석을 통해 얻은 데이터를 토대로 그가 자주 사용한 구도, 색감, 유화의 질감까지 그대로 살려 3D 프린팅으로 그림을 그려낸다. 렘브란트가 활용했던 붓질, 비례와 음영기법뿐 아니라 물감을 아낌없이 사용하는 화가로 유명했던 그만의 특성까지 그대로 느낄 수 있다. 여기에 딥러닝 기능으로 스스로 데이터를 쌓고 학습하며 원하는 형태의 그림을 그린다. 이를 통해 이 인공지능 화가는 렘브란트가 그렸던 수많은 40대 남성의 평균치인 한 남자의 초상화를 그려낸다. 그리하여 이 그림은 16년 세상을 놀라게 한 그림이 되었다.
- 구글의 인공지능화가 플랫폼인 딥드림은 특정 이미지를 입력하면 그 이미지를 재해석하여 반 고흐 화풍으로 그려준다. 결과물이 마치 꿈을 꾸는 듯한 추상적인 이미지를 닮았다고 하여 그 이름도 딥드림이다. 대상에 제한이 없어 내 사진을 업로드해 딥드림이 재해석한 고흐풍의 작품을 얻을 수도 있다. 16년 3월 미국 샌프란시스코에서는 딥드림을 통해 그려진 29점의 그림을 소개하는 전시회도 열렸다. 이렇게 창조적인 작품활동이 가능했던 것은 딥드림이 수백만개의 이미지를 소화하고 학습하여 이를 시각적 패턴으로 새롭게 창조할 수 있었기 때문이다.
- 인공지능이 너무 글을 잘 쓰는 바람에 오히려 비공개를 결정한 사례도 있음. 인공지능을 우려하는 일론 머스크 드잉 세운 오픈AI가 개발한 글짓기 인공지능이 바로 그것이다. 글짓기 인공지능인 GPT-2는 기사, 학교과제 등 모든 분야의 글짓기가 가능하다. 무려 800만개의 인터넷 페이지 속 15억개 단어를 학습한 GPT-2는 사용자가 특정 문장을 넣으면 그와 자연스럽게 연결되는 문장을 논리정연하게 만들어낸다. 이는 책 한페이지 분량을 어색하지 않게만들어낼 정도이며 인간과 유사한 수준이라고 한다. GPT-2의 글끄시 실력은 오픈AI 홈페이지에서 확인할 수 있는데, 기존 소설 중 한 문장을 넣으면 원작소설에는 없는 새로운 문장을 만들어낸다. 물론 그 문장은 전체적으로 작품 분위기와 유사한 것들로 이루어진다. 이처럼 능력이 너무 출중해 이를 악용할 여지가 있다 하여 원천 기술을 비공개하기로 결정한 것이다 모든 연구결과와 기술을 무료로 공유해온 오픈AI의 첫 비공개 사례다
- 인간에게 쉬운 것은 컴퓨터에게 어렵고, 반대로 인간에게 어려운 것은 컴퓨터에게 쉽다. (모라벡의 역설)
- AI가 보급된 사회에서 가장 희소성을 갖는 것은 타인과 공감할 수 있는 힘을 가진 인간이다. (사티아 나델라)
- 머신러닝의 경우 인간이 먼저 처리한다. 컴퓨터가 인식할 수 있도록 주어진 데이터를 알맞게 분류하는 것을 사람이 먼저 하고, 그 다음 컴퓨터가 데이터에 포함된 특징을 분석하여 그 내용을 축적한다. 이렇게 축적된 데이터를 바탕으로 이미지의 특징을 종합해 답을 내는 것이 머신러닝이다. 딥러닝은 이 머신러닝에서 사람이 하던 일도 모두 컴퓨터가 수행한다. 컨벌루션 신경망을 이용하여 스스로 분석한 후 답을 내는 것이다. 이렇게 서로 다른 특징을 보이는 머신러닝과 딥러닝은 사용하는 데에도 차이가 있다. 머신러닝의 경우는 자신의 연구를 포함시킬 여지가 남아 있고 처리시간이 짧은 반면, 딥러닝은 이용자의 많은 지식과 노력이 없어도 높은 정밀도를 얻을 수 있는 특징이 있다. 아울러 딥러닝과 머신러닝은 전문가에 따라 다르게 개념화하기도 한다. 토마 디트리히는 유럽에서 머신러닝은 엔지니어링에 감성을 결합한 기술의 형태에 뿌리를 두고, 미국에서는 인공지능이 대중의 인기를 바탕으로 한 과학소설의 느낌을 반영하고 있다고 이야기한다. 미국 국립과학재단의 정보 및 지능형 시스템 부문 책임자인 린 파커는 머신러닝은 데이터의 추세나 범주를 인식해 적절한 예측을 가능하게 하고, 딥러닝은 깊은 신경망, 즉 여러 계층에 배열된 대규모 신경시스템을 이용하여 학습하는 것을 의미한다고 말한다. 딥러닝은 인공지능에 있어서 현재 가능 진화된 알고리즘이다. 딥러닝을 통해 인공지능이 사람처럼 판단할 수 있으니 얼마나 대단한가. 또한 앞으로 얼마나 엄청난 결과를 가져올 것인지 쉽게 예측하기도 어렵다. 하지만 그럼에도 불구하고 문제는 존재한다. 인공지능도 간혹 어처구니없는 실수나 오류를 범할 때가 있다. 그런데 그 오류의 원인을 즉각적으로 알지 못하거나, 인공지능이 딥러닝을 통해 어떻게 이런 결정을 했는지 개발자조차 파악하지 못하는 경우가 있을 수 있다. 이것을 바로 인공지능 블랙박스라 부름. 이 때문에 설명가능한 인공지능(XAI, expalinable AI) 연구가 이어지고 있다. XAI는 인공지능 시스템의 동작과 최종결과를 해석하여 결과물이 생성되는 과정을 설명해주는 기술이다. 인공지능이 제대로 판단하고 있는지 차트와 분석을 통해 사용자에게 자세한 설명을 제공하는 것이다. 이를 통해 인공지능 블랙박스의 한게를 극복할 수 있다.
- 사업에 쓰이는 기술 모두에 적용되는 첫번째 규칙은, 효율저인 작업을 위해 적용된 자동화 방식은 효율을 극대화시킨다는 점이다 두번째는, 비효율적인 작업을 위해 적용된 자동화방식은 비효율화를 극대화시킨다는 것이다. (빌 게이츠)
- 기존 사업을 과거와 같은 방식으로 지속하는 것은 앉아서 재난을 기다리는 것과 같다. (피터 드러커)

 

'IT' 카테고리의 다른 글

세상을 읽는 새로운 언어 빅데이터  (0) 2020.02.20
프레디쿠스  (0) 2020.02.17
당신은 데이터의 주인이 아니다  (0) 2020.02.08
모바일 미래보고서 2020  (0) 2020.01.10
보이스 퍼스트 패러다임  (0) 2019.11.15
Posted by dalai
,

- 데이터와 메타데이터에 관해, 데이터가 내용이라면 메타데이터는 맥락이라는 식으로 생각할 수 있다. 메타데이터는 특히 전체적으로 수집될 경우에 데이터보다 훨씬 더 많은 것을 말해줄 수 있다. 특정 인물을 감시할 경우에는 대화와 문자 메시지, 이메일 내용이 메타데이터보다 중요할 수 있음. 하지만 집단 전체를 감시하고 있다면 메타데이터가 훨씬 더 의미있고 중요하고 유용하다. NSA에서 법률 고문으로 일한 스튜어트 베이커는 이렇게 말했다. "메타데이터는 누군가의 삶에 관한 모든 것을 완벽하게 말해준다. 메타데이터를 충분히 갖고 있다면, 내용은 필요하지 않다." NSA와 CIA에서 국장을 지낸 마이클 헤이든도 14년에 "우리는 메타데이터에 기반해 사람들을 죽인다"고 말했다. 하나는 내용, 하나는 맥락이라 크게 다를 것이라는 생각은 착각에 가깝다. 어쨌든 그것은 우리에 대한 데이터이기 때문이다.
- 감시가 눈에 보이지 않는 곳에서 이루어지기 때문에 그것을 무시하기도 쉬워짐. 그리고 더욱 거슬리는 감시 체제일수록 눈에 보이지 않는 곳에서 작동할 가능성이 더 높아짐. 우리는 대부분 사무직 채용을 앞두고 실시되는 약물검사는 거부할 테지만, 많은 기업은 채용가능성이 있는 모든 지원자를 상대로 사생활 침해적인 신원조회를 실시한다. 마찬가지로 한 번도 상대한 적이 없거나 들어본 적도 없는 수백 개 업체에게 인터넷에서 추적을 당하는 것은 메모지를 들고 사람들을 쫓아다니는 100명의 시장조사원보다 훨씬 더덜 거슬리게 느껴진다. 어떤 의미에서 우리는 아주 특이한 시대에 살고 있다. 아직은 많은 감시 체계가 우리 눈에 보이기 때무이다. 신분증 검사는 흔한 일이 되었지만 아직은 신분증을 보여달라고 요구해야 한다. 카메라는 도처에 있지만 아직 우리는 그 카메라들을 볼 수 있다. 가까운 미래에는 이런 감시체계가 눈에 보이지 않게 될 것이기 때문에 우리는 자신도 모르는 사이에 더욱 더 많은 감시를 묵인하게 될 수도 있다.
- 제러미 벤담은 1700년대 말에 돈이 많이 안드는 교도소를 짓는 방법으로 파놉티콘을 생각해냄. 그가 제안한 교도소는 모든 수감자가 자기도 모르는 사이에 언제나 감시당할 수 있는 교도소였다. 수감자는 자신이 항상 감시당하고 있다고 생각할 수밖에 없기 때문에 순응하게 된다. 이 개념은 인터넷에서든 아니든 개인 데이터의 대량 수집을 의미하는 은유로 사용되었음. 인터넷에서 감시는 어디에나 존재한다. 모든 사람이 항상 감시당하고 있고, 그 데이터는 영원히 저장되고 있다. 정보시대의 감시국가가 바로 이런 모습이며, 이 국가는 벤담이 꿈도 꾸지 못할 정도로 효율적이다.
- NSA가 휴대폰 데이터를 이용하는 방식을 보여주는 사례
(1) 휴대폰 위치정보를 이용하여, 이동경로가 서로 교차하는 사람들을 추적. 예를 들어 앨리스라는 여성에게 관심이 있다 치자. 어느날 저녁에 밥이 앨리스와 같은 식당에 있었고, 일주일 뒤에 앨리스와 같은 커피숍에 있었고, 한달 뒤에 같은 공항에 있었다면, 그 둘이 전자기기로 연락한 적이 없다고 해도 NSA 시스템은 밥을 앨리스의 잠재적 공모자로 표시함
(2) 해외에서 미국 요원들이 갖고 다니는 휴대폰 위치를 추적. 그런 다음 요원들의 전화 주위를 따라다니는 다른 휴대폰이 있는지 판단. 그 요원들을 미행하는 사람이 있는지 확인하는 것이다.
(3) 휴대폰 메타데이터를 통해 켜졌다가 잠시 사용되고 다시 꺼진 뒤 절대로 사용되지 않은 전화기를 찾아냄. 그리고 사용패턴을 통해 그 전화기들을 한데 엮는다. 이 기법은 적발되지 않으려는 사람들이 사용하는 대포폰을 찾아내는 데 이용됨
(4) 누가 전화를 끄는지, 그리고 얼마 동안 끄고 있는지에 관한 데이터를 수집. 그런 다음 전화를 껐을 때 그 사람들의 위치를 수집하고 그 주변에서 비슷한 시간동안 똑같이 전화를 끈 사람들을 찾아냄. 은밀한 만남을 찾아내는 것이다.
- 단 한번의 실수가 당신을 노출한다.
(1) 미국 정부와 기업들을 대대적으로 공격한 중국의 군사 해커들은 공격을 실행할 때 사용한 네트워크 인프라스트럭처를 통해 페이스북에 접속한 탓에 신원이 밝혀졌다
(2) 11년, 국제해커집단인 룰즈섹 지도부 일원이던 엑토르 몬세구르는 그들의 수많은 상업용 네트워크 해킹 협의를 수사중이던 FBI에 의해 발각되어 체포됨. 몬세구르는 대체로 컴퓨터 보안에 철저했고 자신의 신분을 보호하기 위해 익명의 중계 시스템을 사용했지만, 딱 한 번 실수를 저지르고 말았다. 수사관은 그가 채팅 중에 무심코 신분을 드러낸 틈을 타서 그의 자동차가 나오는 유튜브 영상을 찾아낼 수 있었고, 결국 그의 페이스북 페이지를 찾아냈다.
(3) 데이비드 퍼트레이어스 CIA국장과 불륜관계였던 폴라 브로드웰은 각별히 주의해서 자기 신분을 감췄다. 그녀는 자기집 네트워크에서는 절대로 익명의 이메일을 보내지 않았다. 대신 호텔이나 다른 공공장소의 네트워크를 이용. FBI는 여러 호텔의 체크인 데이터를 연관시켰고, 결국 그녀의 이름이 공통으로 등장한다는 사실을 알아냈다.
(4) 미국 법 집행기관의 웹사이트를 해킹한 혐의로 수배대상에 오른 어나니머스 소속 해커 w0rmer는 익명의 트위터 계정을 사용했다. 그런데 그 트위터 계정에는 아이폰으로 찍은 한 여인의 가슴사진이 링크되어 있었다. 사진에 담긴 GPS정보에 따르면 사진이 찍힌 곳은 오스트레일리아의 한 주택이었다. 그리고 e0RMER가 다시 한번 등장한 웹사이트에서 '이히니오 오초아'라는 이름이 언급되었다. 결국 경찰은 오초아의 페이스북 페이지를 찾아내어 그에게 오스트레일리아인 여자친구가 있다는 정보를 확인했다. 여자친구의 사진은 이 모든 사단의 단초가 된 맨 처음 사진과 일치했다. 경찰은 w0rmer 즉 오초아를 체포했다.
- 언뜻 생각하기에는 납득이 안 되겠지만, 신원을 알아내는 데는 우리가 생각하는 것만큼 많은 데이터가 필요하지 않다. 아무리 평범하다고해도 각자의 고유한 특징은 있기 마련. 사람들이 가장 많이 보는 순서대로 100개의 영화를 제거하고 나면 각자의 영화습관은 상당히 고유하다고 함. 독서습관과 인터넷 쇼핑습관, 전화습관, 인터넷 검색 습관에도 해당하는 이야기다. 우리가 맺는 인간관계에 의해서도 고유하게 식별됨. 당연히 위치정보로도 우리 각각을 식별할 수 있음. 휴대폰이 쉼 없이 발생시키는 위치정보를 이용하면 아주 큰 어려움 없이 이름을 알아낼 수 있다. 사실 그 데이터 전체가 필요하지도 않다. 단 네 개의 시간, 날짜, 위치정보로도 미국인 중 95%의 이름을 식별해낼 수 있다.
- 안타깝게도 확실한 대책은 부족함. 기업들은 일부 데이터를 제거하고 타임스탬프를 수정하거나 이름을 대체하는 ID 번호에 고의로 오류를 포함시키는 방법으로 데이터세트의 신원을 숨겨왔다. 하지만 이 정도 조치로는 신원 식별과정이 약간 더 어려워질 뿐이다. 그래서 개인식별정보라는 개념에 근거한 규제는 통하지 않는 것이다. PII는 주로 이름이나 고유의 계정번호 등으로 정의되며 여기에는 특별한 규정이 적용된다. 하지만 개인식별정보는 데이터의 양이 문제이기도 함. 익명의 정보라도 당신에 관한 정보를 가지면 가질수록 당신을 식별하기는 점점 더 쉬워짐. 대체로 개인정보 보호는 기술이나 수학에 의해서가 아니라 우리가 이용하는 기업의 프라이버시 정책에 따라 제한받음. 그리고 고유번호로 식별하는 방식으로는 그다지 보호가 되지 않는다. 데이터는 여전히 수집되고 연관 지어져서 사용될 수 있으며, 결국 우리는 언제든 무심코 그 익명의 데이턱 기록에 우리의 이름을 부착하게 된다. 모두가 시시때때로 우리에 대한 데이터를 수집함에 따라 도처에서 감시가 이루어지는 시대에서는 익명성이 취약할 수밖에 없다. 우리는 익명성을 지키기 위해 더욱 확실한 기법을 개발하든지, 아니면 익명성이라는 개념 자체를 완전히 포기해야 한다.
- 전통적으로 인터넷 감시는 쿠키라 불리는 것에 기초함. 쿠키라는 이름은 친근하고 무해하게 들리니, 끈질긴 식별자라는 기술적 설명이 훨씬 더 정확하다. 쿠키는 원래 감시가 아니라 웹서핑을 용이하게 하려고 만들어졌다. 본질적으로 웹사이트는 당신이 여러 번 방문하거나 클릭해도 기억하지 못한다. 쿠키는 이런 문제의 해결책이다. 각각의 쿠키에 고유번호가 들어 있는 덕에 사이트는 당신을 식별할 수 있다. 따라서 지금 당신이 어느 인터넷 쇼핑몰 사이트에서 여기저기 클릭하고 있다면, 당신은 내가 8*WHLG 고객입니다 라고 계속 이야기하고 있는 것이다. 그 덕에 사이트는 당신의 계정을 찾아내서 장바구니를 당신에게 계속 붙여놓고 다음번 방문했을 때도 기억할 수 있다. 기업들은 자신들의 쿠키를 다른 사이트에 속한 페이지에도 설정할 수 있음을 재빠르게 간파했다. 물론 그 사이트의 허락을 받고 돈을 치러야 했지만 말이다. 그 결과 제3사 쿠키가 탄생. 더블클릭 같은 업체들은 서로 다른 여러 사이트에서 웹 사용자들을 추적하기 시작. 이때부터 광고는 인터넷에서 사람들을 따라다니기 시작. 특정 자동차나 휴가지, 질병이름을 검색하면 당신이 방문하는 모든 상업적 인터넷 사이트에서 그 자동차나 도시, 의약품 광고를 몇 주간 보게될 것이다. 그리고 이것은 충격적일 정도로 광범위하고 확실하고 수익성 높은 감시 체계로 발전. 당신은 수많은 기업과 데이터브로커 업체에 의해 가는 곳마다 추적당하고 있다. 어느 사이트에서는 열 개의 업체들이, 다른 사이트에서는 스무개의 업체들이 당신을 추적하고 있다. 페이스북은 좋아요 버튼으로 모든 사이트에서 당신을 추적한다. 그리고 구글은 구글 플러스 +1 버튼이 있는 사이트나 웹 트래픽을 모니터링하기 위해 구글 애널리틱스를 사용하는 모든 사이트에서 당신을 추적한다.
- 스마트폰에 깔린 앱들도 당신을 추적. 그 앱들은 당신의 위치를 추적하고, 가끔은 당신의 주소록, 캘린더, 북마크, 검색내력을 다운로드함. 13년 제이지와 삼성은 특정앱을 다운로드한 사람들에게 발매 전인 제이지의 새 앨범을 들을 수 있게 해주는 대신, 스마트폰에 등록된 모든 계정을 보고 전화기의 위치를 추적하고 통화중인 상대를 추적하는 권한을 요구. 그리고 앵그리버드는 사용자가 게임을 하지 않을 때도 위치정보를 수집한다.
- 컴캐스트같은 브로드밴드 업체들도 자사 사용자들을 감시. 지금은 사용자가 저작권이 있는 노래와 영상물을 불법으로 다운로드하는지를 모니터링하는 작업에 치중하고 있지만, 다른 분야에도 곧 적용될 것임. 버라이즌, 마이크로소프트 같은 업체들은 사용자의 방에서 무슨 일이 일어나고 있는지 모니터링해서 그 정보를 근거로 광고를 제공하는 셋톱박스를 연구중. 빅 브라더 대신 고자질쟁이 리틀 브라더가 수백명 있는 것이다.
- 오늘날 인터넷 감시는 쿠키보다 훨씬 더 끈질기다. 사실상 소규모의 군비경쟁이 벌어지고 있는 셈인데, 당신의 브라우저는 쿠키를 차단하거나 삭제하는 광범위한 통제방법을 갖추고 있으며, 많은 사람들이 그 기능을 만든다. 대표적으로 두낫트랙미가 가장 인기 있는 브라우저 플러그인 중 하나다. 이런 플러그인이 인터넷 감시산업은 플래시 쿠키로 대응해왔다. 기본적으로 쿠키와 비슷한 파일인데 어도비 플래시 플레이어와 함께 저장되어 브라우저가 쿠키를 삭제할 때도 남아 있음. 이것들을 차단하려면 플래시 블록을 설치하면 됨. 하지만 이에 맞서 에버쿠키나 캔버스 핑거프린팅, 쿠키 싱킹 같이 난해한 이름이 붙은 방법들이 속속 등장하여 당신을 추적한다. 마케팅 분야에서만 그러는 것도 아니다. 14년 발표된 연구에 따르면, 백악관 웹사이트는 자체적 프라이버시 방침을 어겨가면서 에버쿠키를 사용했다
- 93년 이전에 인터넷은 완전히 비영리였고 무료가 온라인의 규범이었음. 상업적 서비스가 처음 인터넷에 등장하면서 서비스 요금을 부과할 방법에 관한 논의가 활발해짐. 그리고 곧 이어 투자나 포르노 웹사이트같은 몇 가지 단발적 상황을 제외하고는 사람들이 인터넷 접속비용을 지불할 의사가 전혀 없음이 확실해짐. 결국 텔레비전 사업모델과 아주 흡사하게 광고가 유일하게 타당한 수입원으로 부상했고, 감시는 그 광고를 더욱 더 돈벌이가 되는 사업으로 만들었다. 웹사이트들은 방송광고보다 개인을 겨냥한 광고에 더 높은 가격을 청구할 수 있다. 결국 우리는 서비스를 받는 대신 우리의 데이터를 수집하여 판매한 뒤 다시 광고로 우리를 공격하는, 명목상의 공짜 시스템을 얻고 말았다. 공짜는 특별한 가격이다. 심리학에서는 사람들이 공짜 앞에서 이성적으로 행동하지 않음을 입증하는 다양한 연구가 이루어졌다. 사람들은 공짜의 가치를 과대평가한다. 그래서 공짜 물건이 있으면 필요 이상으로 소비함. 그러면서 다른 사람들에게도 그것을 소비하라고 압박. 공짜는 비용대 편익에 관한 정상적 의식을 왜곡함. 그래서 결국 우리는 자신의 정보를 내주는 대신, 그 가치보다 더 적은 것을 받는다. 프라이버시의 가치를 과소평가하는 이런 경향은 고의로 사람들이 프라이버시에 무관심하게 만들려는 기업들에 의해 악화됨. 우리는 페이스북에 로그인할 때 얼마나 많은 개인정보를 페이스북에 드러내는지도 모르면서 친구들과 대화를 나눈다. 아침에 일어나서 자신이 어떻게 하루종일 수많은 기업들이 자신을 추적하게 놔둘지도 모르고 그냥 주머니에 휴대폰을 집어넣는다. 그 결과 인터넷 업체들은 사용자의 프라이버시를 축소함으로써 실제 고객에게 제공하는 상품을 개선할 수 있다. 페이스북은 프라이버시 방침을 정기적으로 업데이트하여 사용자의 데이터에 대한 접근권을 더 많이 확보하고 사용자의 프라이버시를 축소하면서 여러 해에 걸쳐 이 작업을 체계적으로 해왔다. 또 더 많은 사람들이 사용자의 이름과 사진, 게시물은 물론 사용자가 올린 사진과 좋아요 등을 볼 수 있도록 초기 설정을 바꾸었음. 구글도 똑같았다. 12년 구글은 대대적 변화를 선언했는데, 검색, 지메일, 유튜브, 구글 플러스 등에서 얻은 사용자의 데이터를 사용자에 대한 하나의 거대한 데이터 세트에 통합하겠다는 내용이었다. 애플은 이 부분에서 다소 예외적인 기업이다. 애플의 성격은 소비자 제품을 판매하는 업체이며, 애플은 아이클라우드 사용자의 이메일과 문자 메시지, 캘린더, 주소록, 사진을 감시할 수 있는데도 그렇게 하지 않음. 애플은 사용자가 좋아할 만한 노래나 영상을 추천하는 데만 아이튠즈 구매정보를 이용한다. 14년말부터 애플은 이 사실을 시장 차별화 요소로 내세우기 시작했다.
- 데이터 브로커 업체들은 당신이 거래하는 기업들에게서 개인정보를 사들인 뒤, 당신에 관해 더 많은 것을 알고 싶어 하는 기업들에게 다시 판다. 데이터 브로커들은 전산화의 물결을 제대로 활용함. 당신이 더 많은 데이터를 만들어낼수록 그들은 더 많은 데이터를 수집하고 더 정확하게 당신의 프로필을 만든다. 데이터브로커들이 보유한 정보는 놀라울만큼 폭넓고 자세하다. 그들은 이름, 주소, 전화번호, 이메일 주소, 성별, 연령, 혼인여부, 자녀의 연령, 교육수준, 직업, 소득수준, 정치적 성향, 운전하는 차종, 집이나 다른 재산에 관한 정보 등의 인구통계학상의 정보를 수집함. 그리고 구입한 물건, 구입시기, 지불방법까지 수집하며, 가족내 사망자나 이혼, 질병도 추적. 그리고 인터넷에서 무엇을 하는지에 관해서도 모든 정보를 수집함. 데이터 브로커 업체들은 데이터를 이용하여 당신을 팔릴만한 여러 범주로 나눔. 잠재 상속인, 고령의 부모를 둔 성인, 당뇨병에 관심이 많은 가구, 노년기 요구가 있는 가구 등등이다. 이런 것을 액시엄이 제공해줄 수 있다.
- 전체적으로는 인터넷 광고비는 증가하고 있지만 단일 광고의 가치는 급격히 떨어지고 있다. 이에 따라 광고주에게 전달되는 우리의 데이터가 갖는 가치도 급격하게 떨어지고 있다. 몇년 전만 해도 소비자의 상세한 프로필은 소중했다. 이제 너무 많은 기업과 데이터브로커들이 그 데이터를 갖고 있기 때문에 그것은 평범한 상품이 되었다. 13년 한 금융보고서 분석에 따르면, 구글에게 사용자 1명은 연간 40불 가치가 있으며, 페이스북, 링크드인, 야후의 경우에는 6불에 불과. 그래서 구글과 페이스북 같은 기업들은 밑돈을 올리고 있다. 그들은 광고주에게 판매할 데이터를 점점 더 많이 필요로 하기 때문에 경쟁업체들과 차별화를 시도한다. 어쩌면 수입원으로서 광고의 수익성이 이미 정점을 찍었기 때문에 이제는 떨어질 일밖에 없고, 결국 지속가능한 단일 사업모델이 아니게 될 수도 있다. 광고거품이 꺼지고 감시를 기반으로 한 마케팅이 효과적이지 않다고 판명되면서 인터넷 업체들이 사용자에게 요금을 부과하는 방식 같은 더욱 전통적 사업모델로 되돌아가야 한다면, 그때 인터넷은 어떤 모습일지 아는 사람은 없을 듯하다.
- 우리가 의존하는 많은 인터넷 업체들과 우리의 관계는 전통적 기업-고객관계가 아니다. 기본적으로 우리가 고객이 아니기 때문. 우리는 그 업체들이 자신들의 실제 고객에게 판매하는 상품이다. 이 관계는 상업적 관계가 아니라 봉건적 관계에 가까움. 기업은 봉건영주이고 우리는 그들의 가신이거나 농민이거나 일진이 사나운 날에는 농노가 된다. 우리는 기업이 소유한 땅에서 데이터를 생산하면서 일을 하는 소작농이며, 기업들은 우리가 생산한 데이터를 돈을 받고 판매함. 물론 비유지만 정말로 그렇게 느껴지는 때가 종종 있다. 구글에 충성을 맹세하는 사람들이 있다. 그들은 지메일 계정을 갖고 있고, 구글 캘린더와 구글 독스를 사용하고, 안드로이드 휴대폰을 갖고 있다. 마찬가지로 애플에 충성을 맹세하는 사람들도 있다. 그들은 아이맥, 아이폰, 아이패드를 갖고 있고, 아이클라우드가 자동으로 모든 것을 동기화하고 백업하도록 놔둔다. 모든 것을 마이크로소프트에 맡기는 사람들도 있고, 페이스북, 트위터, 인스타그램 때문에 이메일까지 모두 내주는 사람들도 있다. 우리는 특정 봉건영주를 좋아할 수도 있고, 이 중 몇몇에게 충성심을 분배할 수도 있고, 자신이 좋아하지 않는 특정 업체를 세심하게 피할수도 있다. 그러나 이 업체들 중 적어도 하나에 충성을 맹세하지 않고 살아가기는 점점 더 어려워지고 있다.
- 미국은 세가지 유리한 점 덕분에 세계에서 가장 광범위한 감시 네트워크를 갖추고 있음. 미국의 첩보 예산은 전 세계 국가들의 첩보예산을 모두 합한 것보다 많음. 전 세계 트래픽의 많은 부분이 인터넷의 물리적 배선장치로 인해 미국 국경선을 거쳐야 하는데, 다른 두 국가 간의 트래픽도 예외는 아님. 그리고 세계에서 가장 크고 인기있는 하드웨어, 소프트웨어, 인터넷 업체들이 미국에 본사를 두고 미국 법체계의 지배를 받는다. 한마디로, 미국은 주도권을 장악하고 있다. NSA가 감시를 통해 목표하는 바는 NSA의 극비 프레젠테이션에 등장하는 '모두 수집하라', '모두 알아내라', '모두 이용하라' 는 문구로 깔끔하게 표현되어 있다. NSA는 통신회사와 케이블 회사에서 인터넷을 감청하고, 이메일, 문자 메시지, 검색기록, 친구목록, 주소록, 위치정보 등 손에 넣을 수 있는 것은 모두 수집. NSA가 미국 내에서 오간느 모든 통화 내용을 기록하고 있다는 증거는 없지만, NSA가 소말겟 프로그램을 통해 적어도 아프가니스탄과 버뮤다에서 오가는 통화내용을 모두 기록하고 있다는 가실을 알려져 있다. NSA의 13년 예산은 108억불이었다. NSA가 직접 고용한 인원은 3.3만명 정도였고, 더 많은 인원을 하청으로 계약했다. 스노든이 공개한 문서 중 하나는 NSA를 비롯한 여러 정보기관의 은닉 예산에 관한 최고기밀문서였는데, 13년 총 예산이 530억불이었다. 일부 추산에 따르면 미국은 매년 정보활동에 720억불을 지출한다.
- "세상에서 가장 정직한 사람이 쓴 문장 여섯줄을 보여주면, 나는 거기서 그 살마을 교수형에 처할 만한 꼬투리를 잡아낼 수 있다." (17세기 프랑스 정치가 리슐리외 추기경), "그 사람을 내게 보여줘. 그럼 내가 당신에게 범죄를 보여줄께" (구소련 당시 스탈린의 비밀경찰국을 이끌던 라브렌티 베리야) 두 사람은 같은 말을 하고 있다. 누군가에 대한 충분한 데이터를 갖고 있다면, 그가 어떤 죄든 저질렀다고 판결할 만한 충분한 증거를 찾아낼 수 있다는 이야기. 많은 국가의 법원이 경찰의 투망식 수사를 금지하는 이유가 바로 이것이다. 그리고 경찰이 무엇이든 수색할 수 있도록 허용하는 일반영장을 미국 헌법이 특별히 금지하는 이유도 바로 이것이다. 일반영장은 극도로 악용될 수 있다. 영국은 과거 식민지 미국에서 일종의 사회통제 방법으로 일반영장을 이용했음. 도처에서 감시가 이루어진다는 것은 경찰이 마음만 먹으면 누구든 법률위반으로 유죄판결을 받을 수 있다는 의미. 일거수일투족이 저장되었다가. 나중에 어떤 시점에 자기에게 불리한 증거로 제시될 수 있는 세상에 살아가는 것은 엄청나게 위험함. 경찰이 거대한 데이터세트를 파헤쳐서 범법 행위의 증거를 찾아내도록 허용하는 것은 크게 위험할 수 있다.
- 사람들이 당연시하는 현재의 자유는 과거의 권력구조에 의해 종종 위협적이라고 간주되거나 심지어는 범죄로 여겨졌음. 권력당국이 감시를 통해 완벽한 사회통제에 성공했다면 그런 변화는 결코 일어나지 못했을 것임. 이것은 지금의 감시체계 때문에 모두가 개인적으로 나쁜 영향을 받는게 아니더라도 그런 체게가 새로이 생기고 있다는 사실을 우려해야 하는 주요한 이유 중 하나다. 우리는 감시 체계의 영향 때문에 손해를 입는다. 우리 주변의 사람들이 새로운 정치적, 사회적 사상을 공표한다거나 특이한 행동을 할 가능성이 줄어들기 때문. 만약 에드거 후버가 마틴 루터 킹 주니어를 감시해서 침묵시키는 데 성공했다면, 킹과 킹의 가족들 이외에도 훨씬 더 많은 사람들이 영향을 받았을 것임.
- 근본적으로 기업은 감시 데이터를 이용하여 차별화한다. 기업은 사람들을 여러 범주로 나누고 그 범주에 따라 다른 상품과 서비스를 판매한다. 60년대 용어인 레드라이닝은 오래전부터 존재해온 관행을 일컫는 표현으로, 은행이 주택을 구입하려는 소수인종 집단을 차별하는 것을 말함. 은행은 소수인종 집단이 사는 동네를 따라 지도에 붉은 선을 그어놓고 그 지역 사람들에게는 주담대를 승인해주지 않았다. 아니면 소수인종 사람들이 같은 동네에서 집을 구입하려는 경우에만 대출을 해줬다. 물론 불법적 행위지만 은행은 오래도록 처벌받지 않고 무사히 지내왔다. 더 일반적으로는 인종 대신 거주지역에 근거해 서비스를 거부하거나 더 많은 돈을 청구하는 관행을 일컫는데, 인터넷에서 이렇게 하기는 훨씬 더 쉽다. 2000년, 웰스파고 은행은 주담대를 홍보하는 웹사이트를 만들었음. 이 사이트에는 잠재 구매자가 거주할 동네를 검색하는 데 도움을 주는 지역사회 계산기라는 기능이 있었음. 이 계산기는 잠재 고객의 현 우편번호를 수집한 뒤에 해당지역에 많이 거주하는 인종을 근거로 고객을 안내했다. 백인에게는 백인동네를, 흑인에게는 흑인동네를 알려준 것이다. 이 관행은 웹라이닝이라 불리며 전통적 레드라이닝보다 훨씨 더 널리 퍼지고 더 차별적일 가능성이 있다. 기업은 개인의 데이터를 엄청나게 많이 수집하고 아주 상세한 프로필을 작성할 수 있기 때문에 여러 측면에서 사람들에게 영향을 미칠 수 있다.
- 12년 오비츠는 고객이 맥을 사용하는지 윈도우를 사용하는지에 따라 호텔 객실요금을 다릉게 보여주었음. 검색이력을 기초로 서로 다른 상품을 보여준 여행 사이트들도 있었음. 많은 사이트가 고객의 소득수준을 추정하고 그것을 기초로 다른 페이지를 보여줌. 이런 과정은 많은 부분 교묘하다. 고객에게 특정 항공요금이나 호텔 객실을 아예 보여주지 않은 게 아니라, 사이트가 보여주고 싶어하는 페이지를 더 클릭하게 쉽게 배치하는 것이기 때문. 우리는 연령이나 성별, 인종, 성적 신호, 연애상태 등을 예측하는 데이터에 우리의 데이터가 어떻게 사용되는지 살펴봤다. 기업들은 이런 과정을 통해 소비자보다 우위를 확보하며, 개개인과 각 계층에 관한 데이터를 더 많이 모을수록 그 차이는 점점 더 벌어짐. 예를 들어 마케터들은 여자들이 월요일에 자신을 덜 예쁘다고 생각한다는 사실을 안다. 따라서 월요일은 여성을 상대로 화장품을 광고하기에 가장 좋은 요일이다. 또 마케터들은 성별과 연령별로 각기 다른 광고에 더 잘 반응한다는 사실도 알고 있다. 머지 않아 그들은 특정이에 관해 충분히 많은 것을 알아내서 그 사람이 아침 8시에는 커피를 마시기 전이라 기분이 살아나지 않았기 때문에 상품에 크게 영향을 받지 않을 것이고, 아침 9시 30분 경에는 카페인을 잔뜩 섭취했기 때문에 영향을 잘 받을 것이고, 오전 11시에는 점심 직전에 혈당이 낮아진 관계로 다시 영향을 받지 않을 것임을 알게 될 것이다. 사람들은 각자의 사회적 관계에 따라서도 평가 받음. 렌도라는 필리핀 업체는 고객이 페북에서 자주 대하하는 이들의 신용도를 살펴보고 그 사람의 신용리스크를 평가함. 아멕스는 고객이 물건을 구입하는 매장유형에 근거하여 고객의 신용한도를 줄인 적도 있다.
- 프라이버시는 인간의 타고난 권리이며, 존엄과 존중 속에 인간의 조건을 유지하는 데 필수적임. 프라이버시는 자기에게 선택권이 있느냐, 세상에 자기 자신을 어떻게 내보일지 스스로 통제권을 갖느냐와 관련 있다. 인터넷 민속지학자인 다나 보이드는 프라이버시에 관해 다음과 같이 말했다. "프라이버시는 단순히 힘에 좌우되기만 하는 게 아니다. 프라이버시를 성취할 수 있다는 것 자체가 힘의 표현이다."
- 프라이버시에는 강력한 생리학적 배경이 있다. 생물학자 피터 와츠는 프라이버시에 대한 욕구는 타고나는 것이며, 특히 포유동물은 감시에 잘 대응하지 못한다고 주장. 자연계의 동물들은 포식자에게 감시당하기 때문에 사람들은 감시를 물리적으로 위협으로 느낌. 감시로 인해 감시자가 포식동물처럼 행동하게 되듯, 감시를 받는 사람들은 자기가 먹잇감이 된 것 같은 느낌을 받는다.
- 순간이 지나면 사라지는 대화를 나눈다는 것은 사람들이 더 편안하고 느긋하게 말할 수 있게 해주고 녹음기가 돌고 있다면 하지 못할 이야기도 털어놓게 해주는 사회규범이다. 장기간에 걸쳐 인간은 잊어버리고 틀리게 기억하면서 역사를 처리해왔다. 망각은 용서을 가능하게 하는 중요한 요소다. 개인적 기억과 사회적 기억이 희미해지면서 과거의 상처는 덜 아프고 덜 뼈저리게 된다. 이는 과거의 잘못을 용서하는 데 도움을 준다. 과거의 언쟁을 기록할 수 있다고 해서 내 결혼생활이 더 좋아질 거라 생각하지 않는다. 한순간도 놓치지 않는다는 것은 사회적으로, 심리적으로 큰 변화를 일으킬 것이다. 그리고 내 생각에 우리 사회는 그러한 변화에 준비가 되어있지 않다.

 

'IT' 카테고리의 다른 글

프레디쿠스  (0) 2020.02.17
인공지능이 나하고 무슨 관계지  (0) 2020.02.17
모바일 미래보고서 2020  (0) 2020.01.10
보이스 퍼스트 패러다임  (0) 2019.11.15
포노사피엔스  (0) 2019.10.10
Posted by dalai
,

모바일 미래보고서 2020

IT 2020. 1. 10. 12:37

- 휴대폰 제조사들은 오랜 기간에 걸쳐 보다 높은 화소 수의 카메라 렌즈를 도입하는 경쟁을 벌여왔는데, 이제는 이를 넘어 여러 기능에 특화된 눈 자체의 수를 늘리는 경쟁을 하고 있음. 표준렌즈와 광각, 망원, 심도 파악 등의 역할을 하는 렌즈들을 도입하면서 듀얼렌즈 시대를 거쳐 트리플 렌즈 시대에 진입했으며, 이제 네 개의 렌즈를 적용하는 쿼드러플 렌즈의 시대에 도달. 최근에는 ToF 센서가 주목받고 있다. 이것은 적외선 등의 빛이 물체에 닿았다가 반사되어 돌아오는 시간을 측정함으로써 피사체와의 거리를 측정하고 이를 기반으로 3D 이미지를 구성할 수 있게 한다. ToF 센서는 스마트폰 이용자의 얼굴을 닮은 이모지를 만들거나 얼굴인식을 통한 인증기능에도 적용되는 등 활용범위가 더욱 확대되고 있다.
- 이 외에 주목해야 할 기술은 바로 광학 줌 기술. 카메라 렌즈를 움직여 피사체를 확대하거나 축소하는 이 기술은 소프트웨어를 통해 화면을 확대하는 디지털 줌 방식에 비해 이미지의 화질이 저하되지 않는다는 장점. 다만 스마트폰의 두께가 고배율의 광학 줌 기술을 도입하는 데 걸림돌로 작용했었는데, 이제 그 부분도 극복되고 있다. 중국의 오포는 18년 2월 MWC 행사에서 무려 10배의 광학 줌 기술을 적용한 스마트폰을 공개하고 곧 상용화 오포의 기술은 빛의 진행방향을 90도 꺾어주는 프리즘 기술을 이용한 것이 특징이다. 이 기술은 오포와 이스라엘의 코어포토닉스가 공동개발했는데, 삼성전자는 19년 초 코어포토닉스를 1.5억불에 인수. 이는 빠르면 2020년 등장할 갤럭시 S11부터 고배율의 광학줌 기능이 도입된다는 것을 의미. 업계에서는 내년이면 광학줌(10배)과 디지털 줌(10배)을 조합해 100배 줌이 가능한 스마트폰이 등장할 것으로 예상하고 있다. 한편 구글이 개발해 판매하고 있는 픽셀 스마트폰은 저조도, 즉 어두운 환경에서 인공지능 기술을 이용해 매우 뛰어난 사진을 찍을 수 있는 나이트 사이트 기능으로 유명. 구글의 인공지능 기술이 적용된 기능으로서 스마트폰에서 좋은 이미지를 얻는 방법이 반드시 하드웨어에만 의존하는 것은 아니라는 점을 잘 보여준다.
- 게임은 모든 플랫폼에 걸친 영원한 킬러앱으로서, 모바일 게임은 이제 전체 게임 영역 중에서 가장 큰 규모를 형성하고 있음. 시장조사 업체 뉴주에 따르면 19년 스마트폰 기반의 모바일 게임시장 규모는 549억불 수준으로 콘솔이나 PC 게임보다 더 큰 규모를 보이고 있음. 이후에도 지속적 성장을 거듭해 2021년이 되면 전체 게임시장의 40%를 차지할 것으로 예상됨. 이처럼 모바일 게임은 향후에도 시장규모가 더욱 커질 전망이며, 이미 간단히 즐기는 캐주얼 게임뿐 아니라 PC나 콘솔게임과 같은 화려한 그래픽과 게임성을 제공하는 MMORPG가 등장해 인기를 끌고 있음. 그러나 스마트폰에서 고품질의 모바일 게임을 즐기는 것과 관련된 게이머들의 불만사항이 있음. 한정된 배터리 용량으로 인해 오랜 시간 게임을 즐길 수 없으며, 스마트폰이 뜨거워져서 게임을 하는 데 지장이 있는 것이다. 그래서 헤비 게이머들을 겨냥한 게미밍폰이 수년전 부터 각광을 받기 시작. 게이밍폰은 대용량 배터리와 단말기의 온도를 낮추어주는 여러 방식의 쿨링 시스템, 고성능 프로세서와 램, 고해상도 디스플레이 그리고 게임 조작성을 높일 수 있는 여러 전용버튼을 갖추고 있으며, 게이머들에게 어필할 수 있는 디자인을 도입한 것이 특징. 또한 게임을 할 때 팝업 메시지를 차단하는 기능과 특정 게임에 최적화된 플레이 모드 등의 편의 기능이 제공되며, 전용 컨트롤러나 도킹스테이션 등의 액세서리도 제공됨. 대만 에이숫의 ROG폰, 미국 레이저의 레이저폰, 샤오미의 블랙샤크, 화웨이의 아너플레이 등이 대표적인 게이밍폰으로서 17년말부터 본격적으로 등장. 19년 들어 샤오미가 블랙 샤크를 별도의 서브 브랜드로 분리하고, 비보 역시 아이큐라는 게이밍폰 전문 서브 브랜드를 만들 정도로 이 시장에 대한 관심은 더욱 높아지고 있다. 또한 2010년부터 2세대 게이밍폰이 본격적으로 등장하기 시작했는데, 특히 퀄컴이 직접적인 지원을 하고 있다. 19년 중반에 게임관련 성증을 한층 더 발전시킨 스냅드래곤855+ 프로세스를 발표한 것이다. 이 프로세서는 발표 직후 에이수스의 게이밍폰 ROG폰2에 처음 적용됨. 이 외에도 누비아 등의 도입 발표가 이어지고 있어 향후 등장할 최신 게이밍폰들의 상당수가 해당 프로세서를 도입할 예정임
- 이제 막 개화되기 시작한 5G 스마트폰 시장에서도 ODM방식이 확산될 가능성이 제기되고 있음. 중국 차이나모바일이 19년 8월말 파이어니어X1ㅇ라는 자체 브랜드의 5G 스마트폰을 출시. 해당 단말기는 스냅드래곤855 칩셋가 풀 HD 6.47인치 아몰레드 디스플레이, 듀얼 스피커를 탑재했으며, 판매가는 4988위안이다. 차이나 모바일이 해당 단말기을 처음부터 직접 개발하지 않았음은 당연함. 즉, 아직은 공개되지 않은 ODM업체를 적극 활용해서 자사가 추지하는 5G 관련 서비스들을 선탑재 하고 이를 통해 가입자를 확대하고 서비스를 활성화하려는 것. 차이나모바일은 18년 12월에도 뒷면에 차이나모바이르이 로고가 있는 스마트 허브라는 가정용 5G 단말기를 공개. 이 제품은 HTC가 제작한 단말기와 동일한 외형임. 차이나 모바일은 스마트허브와 동일한 방식으로 5G 스마트폰의 개발과 유통도 추진한 것. 아직은 태동기로 볼 수 있는 5G 시장에서 이통사의 자체 브랜드 제품이 등장한다는 것은 5G 스마트폰 시장에서도 ODM방식이 예상보다 빠르게 자리잡을 수 있음을 말해줌. 차이나모바일이 5G 스마트폰을 제작하는 전문 제작업체에서 자사의 상표를 부착한 제품을 공급받아 판매하는 것처럼 또 다른 자금력있는 회사가 해당 제조사를 통해 자신의 상표로 5G 스마트폰을 출시할 수 있는 것이다. 즉, 더 많은 업체들이 5G 단말기 경쟁에 초기부터 뛰어들 수 있으며 가격경쟁이 그만큼 더 빠르게 시작될 수 있다. 사실 이런 상황은 이미 18년부터 예고된 것. 퀄컴은 18년 1월 5G 단말기 개발의 지원 및 관련기술 공동개발을 위해 중국 제조사들과 협력해 5G 파이어니어 이니셔티브를 설립했는데, 여기에는 중국 최대의 ODM 업체 중 하나인 윙텍이 참여사로 이름을 올림. 즉, 윙텍이 5G 스마트폰의 레퍼런스 모델을 개발하고 이를 요청하는 여러 업체들의 브랜드로 공급하는 날이 예상보다 빨리 올 수도 있다는 의미
- 5G의 가장 중요한 특징은 초고속, 초저지연, 초연결. 5G의 데이터 전달속ㄷ는 기존 LTE 대비 20배 이상 빨라졌고, 서비스의 반응시간도 1000분의 1초 수준이며, 반경 1킬로이내의 5G 통신기기를 최대 100만대까지 연결 가능. 5G 의 주파수는 용도에 따라 크게 두 가지 영역으로 분류 가능. 먼저 광역 커버리지용으로 활용이 가능한 1기가헤르츠 이하의 저대역과 도심 커버리지용인 1-6기가 헤르츠의 중대역을 아우르는 서브 6-기가헤르츠와 다른 하나는 대용량 전송을 위한 초고대역 28기가헤르츠 안팎의 밀리미터파로 나뉨. 이는 기존 LTE의 850메가헤르츠~26기가헤르츠 대역보다 대폭 상승된 수준. 주파수가 높아지면 대역폭이 높아서 고속으로 데이터를 전송할 수 있는 반면, 파장이 짧아 신호가 전달되는 거리도 짧으며, 회절각도가 작아 건물이나 벽을 투과하지 못해 음영지역이 많이 발생함. 즉, 5G 주파수에서는 전송데이터 용량을 대폭 상승시킬 수 있지만, 커버리지가 좁아 반드시 충분한 인프라 구축이 수반되어야 함. 또한 5G 규격에서 가장 중요하게 다뤄지는 기술은 매시브 마이모(Massive Multi input multi output, 대용량 다중 입출력)다. 매시브 마이모 기지국은 32개이상의 안테나를 여러배열로 연결해 다중 입출력이 가능하도록 구성됨. 그리고 빔 포밍 기술을 활용해 많은 수의 안테나 전파를 특정 방향으로 집중시킴. 이를 통해 불필요한 방향으로 방사되는 전파 신호를 최소화함으로써 통신용량이 증가하고 에너지 효율도 개선됨. 또한 통신 상태가 불량한 통화자에게 다시 전파를 집중함으로써 통화 커버리지도 일부 개선할 수 있다. 그런데 현재 상용화 되고 있는 5G 로는 당장 초고속과 초저지연, 초연결의 특징들을 체감하기 어려움. 가장 큰 이유는 국제 이동통신 표준화 기구인 3GPP가 아직 완전하게 5G 표준 기준을 정립하지 않은 상태에서 상용화가 시작되었기 때문. 실제로 2011년 7월 LTE가 국내에서 처음 시작되었을 때도 3G 대비 요금은 비쌌지만 서비스 품질이 좋지 않았따. LTE 표준기술들이 진보하고 동시에 네트워크망이 확충되면서 점차적으로 서비스의 질이 향상되었다. 또한 여러 기술적 이유로 현재의 5G는 28기가 헤르츠 대역이 아닌 3.5기가 헤르츠 대역에서만 서비스 되고 있다. 국내 통신사들은 2019년 연말까지 28기가 헤르츠 대역의 5G를 제공할 수 있는 네트워크 인프라 개발을 완료하고 2020년 초에 상용화를 시작할 계획. 이에 따라 국내 5G 가입자들도 2020년부터는 더욱 향상된 초고속 5G 서비스를 경험할 수 있을 것으로 예상된다.
- SK텔레콤이 통화 품질에서 우수하다는 평을 받을 수 있었던 중요 이유는 800메가 헤르츠의 황금주파수 대역 덕분. 당시 한국통신프리텔과 LG텔레콤은 1.7기가 헤르츠의 주파수를 사용했는데, 주파수 특성으로 볼 때 800메가 헤르츠 황금 주파수가 더 넓은 영역을 구석구석 커버한다. 해외에서도 800메가 헤르츠는 반독점법이 적용될 정도로 귀한 주파수로 대접을 받음. 한석규가 걸었던 대나무숲에서도, 빌딩의 지하실이나 엘리베이터에서도, 언제 어디서든 끊임없는 통신망을 구현하기에 가장 적합. 그러나 통신망에 고용량의 데이터를 함께 쓰는 현재의 통신망에서는 이런 양태가 바뀌기 시작. 현재의 의 5G 이동통신에서는 더 많은 데이터를 담아내기 위해 3.5기가와 28기가 주파수 대역이 대폭 상승됨. 덕분에 최고 20기가비피에스의 초고속 데이터를 전송할 수 있게 되었지만 데이터 도달거리는 더욱 짧아지고, 음영지역은늘어나게 되었다. 기존 LTE 수준의 충분한 커버리지를 유지하기 위해서 5G의 기지국은 LTE 기지국보다 더욱 높은 밀도로 구성되어야 한다. 이 점은 5G 네트워크 장비업체에 중요한 호재다
- 대시버튼이 전송하는 데이터량은 수바이트 수준으로 매우 작은 대신, AAA 건전지 하나로도 1000회 이상 사용가능. 만일 대시버튼을 LTE나 5G로 구성했다면 단가도 매우 비싸고 수십 번도 채 쓰지 못하고 건전지를 교체해야 했을 것임. 5G는 넓은 영역을 이동하면서도 많은 데이터를 전송할 수 있기 때문에 스마트폰, 자율주행차, 비디오 촬영 드론 등에 적합. 하지만 고정된 위치에서 데이터를 전송하거나 전송 데이터양이 적은 스마트팩토리나 스마트홈에 활용되는 디바이스, 웨어러블 기기, 비콘과 같은 기기들은 모두 와이파이, 블루투스 같은 기타 무선통신 방식들을 활용하는 것이 제작비용 및 스펙 측면에서 효율적임. 또한 5G는 통신사업자의 네트워크 통신망을 사용하므로 데이터 사용량에 따른 과금이 발생하지만, 나머지 통신방식들은 통신망을 거칠 필요 없이 기기간 통신을 하기 때문에 요금 부분에서도 자유로움. 예를 들어 4K 화질의 VR 콘텐츠를 1시간 동안 플레이 하기 위해서는 총 7기가바이트의 통신 데이터가 필요한데, 많은 이용자는 5G 고용량 요금제를 이용하는 것보다 홈와이파이로 무료로 플레이하기를 선호할 것이다.
- 본래 IEEE 802.11ax라 명명되었던 와이파이6는 와이파이 진영에서 가장 최근에 발표된 규격이다. 와이파이 6는 대역폭 요구사항이 다른 여러 클라이언트들이 동시에 접속할 수 있도록 하는 OFDMA(orthogonal frequency division multiplex access) 기능과 제각기 하나 이상의 안테나를 갖춘 사용자들이 서로 통신하도록 하는 멀티 유저 마이모 기능을 제공함. 이를 통해 다중접속 환경에서도 서로 간의 연결경합을 최소화하면서 여러 명의 유저가 초고속 데이터를 주고받을 수 있도록 설계됨. 예를 들어 최대 여덟명의 인원이 한 공간에서 동시에 고용량 4K 화질의 VR 콘텐츠를 끊김이나 지연 없이 플레이할 수 있으며 카페, 지하철, 공항과 같이 와이파이 이용자수가 많은 공간에서도 속도 저하 없는 쾌적한 인터넷을 이용할 수 있음. 와이파이 6는 건전지만으로 장시간 저전력으로 동작하는 제품 안에 구성될 때 혹은 홈인터넷과 다이렉트로 연결하거나 고용량 영상이나 음악을 스티리밍으로 전송하는 기기에 가장 적합. 일례로 최근 화제가 되고 있는 와이파이 오디오가 기존의 블루투스 오디오 시장을 빠르게 교체하고 있다. 와이파이의 높은 대역폭을 활용해 원음에 가까운 음악을 출력할 수 있으며, 홈 인터넷과 다이렉트로 연결되어 유저의 음성명령어를 바로 홈인터넷으로 보내 날씨 정보를 알아보거나 쇼핑카트에 물건을 넣어두는 것도 가능. 또한 여러대의 와이파이 오디오가 서로 간의 와이파이 연결거리를 확장하면서 여러 방에 설치되어 있는 오디오들을 하나의 컨트롤러로 조종하는 것도 가능함
- 우리가 흔히 웨어러블 기기나 자동차 핸즈프리를 이용할 때 사용하는 블루투스도 블루투스5라는 이름으로 새롭게 진화. 블루투스가 지향하는 바는 단순히 스마트폰과 주변기기를 연결하는 역할을 넘어 가정, 산업 전반의 사물인터넷에 폭넓게 사용되는 것이다. 블루투스5는 기존 규격보다 네 배 길어진 전송거리, 여덟배 늘어난 데이터 통신속도, 그리고 메시 연결의 특징을 지님. 이제는 비교적 용량이 작은 동영상이나 고품질 오디오 데이터도 블루투스로 전송할 수 있게 되었으며, 1대1 페어링인 아닌 여러 대의 블루투스를 마치 그물망처럼 다중으로 연결하는 것도 가능해짐. 블루투스5 칩셋을 개발하고 공급하는 텍사스 인스트루먼츠사에서는 자사 블루투스5 제품이 1.61킬로미터 거리에서 동작하는 영상을 공개했음. 어재서 이렇게 긴 거리의 블루투스가 필요할까? 이 정도 거리면 3층 높이 단독주택에서도 모든 사물인터넷 기기를 최대한 음영지역 없이 연결할 수 있으며, 1000평 이상의 개방된 큰 작업장이나 마트에서도 충분히 가격표시기, 전자쿠폰, 감시장치, 전동 카트 등을 연결할 수 있기 때문. 블루투스가 산업용 사물인터넷에 사용되는 대표적 사례로 ESL(electronic shelf label)을 꼽는다. ESL이란 매장 각 선반에 있는 종이 가격표를 대체해 설치하는 전자가격표시기로서 중앙 서버와 연동해 오프라인 매장의 제품가를 실시간으로 다운로드하고 화면에 표시하는 기기임. 보통 ESL은 한 개의 건전지로 1-2년간 동작해야 하므로 저전력 기능이 매우 중요한데, 블루투스 5는 기존방식의 저전력기능을 유지하면서도 연결거리와 데이터양을 대폭 향상했다. 초연결 시대에 많은 사물이 인터넷과 연결되기 시작하면서 무선 연결방식이나 시나리오도 다양화되고 있다. 앞서 언급한 대시버튼, 와이파이오디오, ESL은 제품마다 데이터양, 연결 디바이스수, 연결거리, 보안수준, 지연속도, 저전력에 대해 요구되는 스펙이 모두 다르다. 5G, 와이파이, 블루투스와 같은 여러 무선 연결방식이 서로 다른 방식의 진화를 지향하고 있는 이유다.
- 자급제 시장이 확장될수록 제조사는 직접 단말기 유통에 관여해야 할 상황에 놓이게 됨. 기존에는 통신사가 제조사로부터 대량으로 단말기를 구매해서 유통했기 때문에, 제조사는 단말기를 생산하는데 집중하고 유통단계는 통신사가 맡아서 진행해 왔다. 그러나 무신사 사례에서 보듯, 자급제 시장에서는 제조사들이 발 벗고 나서서 직접 유통채널을 발굴해야 함. 무신사 판매가 성공한 것은 가성비를 따지는 10-20대를 타겟으로 파급력이 높은 인기 패션몰을 선택해서 저가형 스마트폰을 트렌디한 아이템으로 둔갑시켰기 때문에 가능했던 일이다. 홍미노트7이나 갤럭시 M20이나 모두 자급제 단말기로, 출시 초반에는 통신사가 유통하지 않고 제조사가 새로운 유통망을 직접 발굴해서 판매를 시도했다는 게 주목해야할 점이다. 2020년에는 무신사의 사례처럼 제조사가 직접 유통에 뛰어들어 예상하지 못했던 오픈마켓, 소셜커머스, 전문 쇼핑몰과 함께 대대적인 마케팅을 벌이며 단말기를 판매하는 상황이 종종 일어날 것으로 전망됨
- VR기술과 1인 미디어의 만남은 실제 사람이 아닌 VR 기반의 브이튜버(버추얼 유튜버)의 활약으로 이어질 것임. 과거 사이버가수 아담의 경우 인기를 얻었지만 지속적으로 활동하기에는 한계가 명확했음. 쌍방향 소통이 어려웠기 때문. 사전에 만들어진 내용을 재생할 수 밖에 없었던 아담과 달리 버추얼 유튜버는 생방중에도 시청자의 코멘트에 반응할 수 있음. 특히 일본에서는 버추얼 유튜버를 기업과 지자체의 홍보에 적극 활용하고 있다. 5G 시대 버추얼 유튜버가 더욱 주목받는 이유는 콘텐츠가 점점 더 몰입할 수 있는 방향으로 나아갈 것이기 때문. 정면만을 보며 이야기하는 데서 벗어나 극적인 움직임이 가능해지는 것이다. 이는 모션캡처의 가격이 낮아지고 3D 아바타의 제작 툴이 발전하는 등 기술발전에 기인. 특히 하이퍼센스라는 스타트업은 AI 기술에 기반해 2D 카메라로 실시간으로 얼굴을 인식하고, 이를 통해 뽑아낸 3D 정보를 캐릭터에 반영하는 기술을 갖고 있음. 5G 네트워크 기반 위에 좀 더 다양한 표현이 가능한 버추얼 유튜버가 등장함다면, 실제 사람이 등장하는 1인 미디어 못지 않은 콘텐츠를 제작할 수 있게 될 것이다. 1인 미디어 분야는 5G를 통해 더욱 실감나고 볼거리가 많은 매체가 될 것임. 일부 콘텐츠의 경우 기존 매스미디어와 경쟁할 수도 있음. 기존 방송들도 이런 기술을 적극적으로 받아들여 1인 미디어형 방송을 늘리는 추세. 앞으로는 마리텔에서 인기가수와 4K 야외 라이브 방송을 진행하고, 여행지에서 360도 생방송을 진행하게 될지도 모른다. 이처럼 5G 시대에 새롭게 변화딜 1인 미디어의 흐름을 제대로 분석하고 변화에 적응하는 콘텐츠만이 살아 남을 수 있음. 미래 인기 유튜버의 순위가 크게 요동칠 수 있는 이유다
- 확실히 게임을 IT 산업의 한 분류로 이해하고 기술발전에 정비례해 변화할 것이라고 보는 것은 무리한 시각임. 산업의 중심에 있는 코어 게이머들이 원하는 것은 기술발달로 느낄 수 있는 한순간의 신기한 경험이 아니기 때문. 그들의 관심은 게임을 통한 학습과 성장, 경쟁이 어떻게 이루어지는지, 성취감을 어떻게 느낄 수 있는지, 세계관과 그래픽을 포함해 어떤 방식으로 게임에 강하게 몰입할 수 있는지에 있다. 기술은 새로운 사용자 경험을 제공하며 콘텐츠 기획자들과 커뮤니티 관리자들이 이를 어떻게 적용할 수 있을지에 대한 힌트를 줄 뿐이다. 즉, 기술은 콘텐츠 자체에 간섭할 수 없지만 새로운 차원의 층위가 된다.
- 현재는 닌텐도와 소니 등이 자사 콘솔 기기에 한해 원격 서비스를 제공하는 수준이지만, 구글과 같은 회사들이 준비하고 있는 클라우드 게임 플랫폼에서는 기기에 구애받지 않고 어떤 기기로든 같은 게임을 즐길 수 있다. 이를테면 콘솔이나 PC게임을 스마트폰으로도 즐길 수 있게 된다. 디바이스의 경계를 넘는 경험이 시작되는 것이다. 디바이스뿐 아니라, 게임 콘텐츠를 넘어 서비스 플랫폼의 분류를 넘어서는 새로운 게임 경험도 펼쳐질 것임. 구글의 GDC 시연영상에서 볼 수 있었던 것처럼 게임 콘텐츠 크리에이터의 방송을 즐기다가 게임에 뛰어드는 것도 가능해짐. 게임을 둘러싼 모든 경험의 경계가 무너지고 이용자의 동선은 서비스에서 서비스로 옮기는 단절 없이 하나로 이어짐. 바로 이런 변화가 시장에 시사하는 바는 무얼까? 게임 시장은 어떤 형태로 또 얼마나 변동할 것이며, 게임사는 어떤 형태로 변화에 대응하는 콘텐츠를 만들어야 할까? 일부 언론은 클라우드 게임을 두고 게임의 넷플릭스화라 이야기함. 현재 클라우드게임 서비스를 준비중인 대부분의 기업이 다양한 게임 라인업을 확보해 이용자들이 마음껏 이용하게 하는, 월 이용료 기반의 비즈모델을 내세웠기 때문. 구글 스타디아는 스타디아 프로 버전을 월 9.99불에 서비스하고 일부 서비스에 추가 구매요금을 매기는 방식으로 제공하며, 유비소프트의 Uplay+는 14.99불에 서비스를 제공할 계획을 발표.
- 많은 사업자가 클라우드 게임에 열을 올리는 것이 단순히 구글 플레이를 대체할 새로운 게임 콘텐츠 유통시장을 장악하겠다는 포부 때문만은 아님. 이 새로운 플랫폼의 등장은 운하의 건설과 같다. 운하를 지나가는 배에 통행료를 받는 것처럼, 클라우드 플랫폼의 지배자들은 경계를 넘는 모든 경험에 대해 새로운 수익모델을 세울 수 있다. 또 운하를 지나가는 여객선과 주변 관광명소 개발에 빗댈 수 있는 부가수익을 창출할 수도 있을 것이다. 가장 쉽게 생각할 수 있는 것이 구글의 유튜브-스타디아 연계와 같은 라이브 스트링밍 방송을 이용한 사례다. 구글은 유튜브 라이브 방송을 보던 시청자가 해당 게임으로 뛰어들기 위해 크리에이터에게 별풍선 같은 플랫폼 화폐를 기부하고, 그 수익을 크리에이터와 나눠 갖는 시스템을 만들 수 있다. 그런데 수백에서 수천 명이 시청하는 인기 크리에이터의 방송에서 모두가 크리에이터와 직접 게임을 할 기회를 얻을 수 있을까? 게임 콘텐츠의 특성에 따라 모두 가능할 수도 있겠지만 대부분의 경우 제한된 자리를 놓고 경쟁해야 함. 그 경쟁 방식은 선착순이 될 수도 있지만, 경매 등 크리에이터의 수익과 플랫폼 매출에 기여하는 방식을 채택할 수도 있다. 또 나머지 시청자들이 게임의 승패를 놓고 베팅을 하거나 최종 점수를 맞힌 시청자에게 추첨을 통해 아이템을 지급하는 등 게임과 밀접하게 연계된 새로운 매출흐름을 만들수도 있을 것이다.
- 클라우드 게임 사업자들이 갖고 있는 기존 사업의 노하우를 할용하면 또 다른 성장이 가능. 구글의 경우 애드센스와 애드워즈 등 타겟 광고, 프로그래머틱 비딩 시스템을 포함한 고도화된 광고 서비스를 보유하고 있음. 게임 제공 플랫폼과 유튜브가 연계되면 크리에이터들은 자기 콘텐츠의 수용자들이 어떤 타겟인지, 연령이나 성별, 그들이 실제로 즐기는 게임 또는 클릭한 광고 분포를 모두 연결해 파악할 수 있게 된다. 이를 바탕으로 더욱 적합한 광고주를 선택해 효율적으로 수익을 창출할 수 있는 것임. 아마존의 경우 클라우드 게임 사업을 통해 게임 콘텐츠의 생산-유통-소비-2차 콘텐츠 소비까지 잇는 가치사슬을 확보할 수 있음. 유튜브와 당당히 경쟁하고 있는 게임중심의 동영상 스트리밍 서비스 트위치, 클라우드 서비스 AWS 등과 클라우드 게임사업의 시너지를 기대할 수 있기 때문. 아마존은 트위치 인수 이후 몇 년간 구독이나 기부 외에도 다양한 수익모델을 고민했다. 라이브 스트리밍 방송 중 버튼을 눌러 게임이나 게임 내 아이템을 구매할 수 있게 하는 등 여러 방법을 실험하고, 일부는 실제 도입하기도 했다. 이는 크리에이터의 수익기반을 키워 플랫폼 내 콘텐츠 공급을 활성화함과 동시에, AWS의 고객사인 수많은 게임사들과 크리에이터를 잇는 생태계를 만들기 위함이었다. 하지만 아마존은 아직 그 큰 꿈을 이루지 못했다. 게임 콘텐츠의 생산과 2차 콘텐츠의 게임방송 소비는 아마존을 통해 많은 부분이 이루어지지만, 구글 플레이와 같은 유통 및 소비 플랫폼을 보유하지 못했기 때문. 만약 아마존이 이와 같은 가치사슬을 완성한다면 게임시장의 흐름이 바뀔 뿐 아니라, 오프라인 소비재와 데이터, 콘텐츠, 미디어 등 여러 산업을 잇는 진정한 공룡으로 재탄생할 수 있을 것임. 클라우드 게임 서비스가 라이브 스트리밍 플랫폼이나 온라인 광고 사업 등 IT 자회사 사업과만 시너지를 낼 수 있는 것은 아님. 서비스사는 막강한 IP파워를 휘두르는 종합 컨텐츠 제작 스튜디오이자 유통 플랫폼이 될 수도 있다. 구독형 서비스가 매출을 올리는 방법은 가입자 증가뿐이므로 시장이 포화될수록 그 성장도 제한됨. 하지만 콘텐츠 제작업체 입장에서는 정기적이고 안정적인 현금흐름이 생기는 것이므로 질적으로 우수한 콘텐츠를 생산하는데 집중할 수 있는 수단이기도 함. 장기적으로 보면 이 기회를 집중공략하는 클라우드 게임 서비스사는 넷플릭스와 같이 제작자들가 긴밀히 협업해 다수의 오리지널 콘텐츠로 승부하거나, 더 나아가서는 다수의 산하 스튜디오를 거느리고 오리지널 콘텐츠를 생산할 수도 있다. 게임 IP의 유통을 책임지는 대신 판권을 갖고 IP를 활용한 영화, 드라마 등으로 2차 수익을 내며 성장을 꾀할 수도 있다.
- 에지 컴퓨팅이란 클라우드 컴퓨팅이 데이터를 한데 모아 처리하는 것과 달리 단말기 주변에서 데이터를 바로 처리하는 방식. 이용자와 멀리 있는 중앙 클라우드 서버와 데이터를 주고받지 않아 통신망 이용비용을 절감할 수 있으며, 데이터 처리속도 또한 크게 단축됨. 또 단말기 근처에서 데이터를 저장하고 처리하므로 보안성도 뛰어남. 이 때문에 아마존, 마이크로소프트 등은 물론 삼성전자, LG전자 등 제조업체, 통신업체까지 여기에 뛰어들고 있다. SK텔레콤은 5G 시대의 신기술로 에지 컴퓨팅을 이용한 클라우드 게임 서비스 계획을 공개하며, 이 기술로 인해 기존 지연시간을 3분의 1로 단축할 수 있다고 밝힘
- 보청기의 진화는 단순히 스마트폰과의 직접 무선연결에 그치지 않는다. 스마트폰과의 연동을 토대로 다양한 생활밀착형 기능들을 확장해가는 모습을 볼 수 있다. 전 세계 보청기 시장의 95%를 차지하고 있는 6대조청기 업체 중 하나인 스타키는 19년 7월 세계 최초 인공지능 보청기 리비오 AI를 국내에 출시. 보청기 본연의 기능인 소리증폭 기능에 최신 머신러닝 기술을 도입했을 뿐 아니라 아마존의 인공지능 비서 알렉사를 통한 가전기기 컨트롤 기능, 심박수와 걸음수, 낙상을 감지하는 헬스케어 기능, 27개 언어로의 실시간 통역기능 등을 추가해 보청기를 넘어 히어러블로 한단계 진화했다는 평을 듣고 있다.
- 2020년 글로벌 시장규모가 13조 9천억원에 달할 것으로 예상되는 보청기 시장은 새로운 전기를 맞이할 것으로 보임. 특히 4800만에 이르는 난청 인구를 보유한 북미 시장에서 진단서 없이 일반 마트에서도 쉽게 구매할 수 있는 OTC 보청기 법안이 시행될 경우, 가격으로 인한 진입장벽이 크게 낮아져 사용자층 역시 높은 볼륨의 음악감상으로 인해 청력이 손상된 젊은 세대로까지 확대될 것으로 예측됨. 저렴한 가격, 쉽게 구매할 수 있는 접근성, 스마트폰과의 연동, 다양한 기능지원으로 보청기가 히어러블로서 우리 생활 속에 더 가까이 다가올 수 있을지 귀추가 주목됨.
- 고가의 가격대와 청력센터에서의 검사 및 튜닝에 대한 물리적, 심리적 거리감으로 보청기 보급률이 20%에 그치고 있는 가운데 이에 대한 반대급부로 크게 성장하고 있는 시장이 있다. 바로 소리증폭기인 PSAP(personal sound amplifcation products)다. 우리나라 사람들에게는 다소 낯선 개념인 PSAP는 이어폰 내 마이크로 외부소리를 증폭해 경중도 난청인 또는 비난청인들이 외부소리를 더 크게 듣고자 할 때 사용하는 디바이스다. 강단에서 멀리 떨어진 교수의 목소리를 듣거나 숲속에서 새들이 지저귀는 소리, 늦은 시간 작게 틀어놓은 TV 소리 등을 듣는 목적으로 주로 사용됨. 비교적 단순한 사용용도지만, 보청기보다 가격이 저렴하고 구매절차가 간단해서 난청인뿐 아니라 보청기 구매에 대한 부담과 거부감이 있는 일반인들에게까지 인기가 있다. 이런 PSAP는 디바이스 내 마이크로 사용자가 듣고자 하는 특정 소리를 얼마나 자연스레 증폭시킬 수 있으냐가 중요한데, 스타트업들을 중심으로 다양한 시도와 기능들이 더해지면서 히어러블로 진화하는 양상을 보여주고 있다. 대표적 예로 19년 1월 국내에 출시된 누히어라의 아이큐 버즈 부스트를 주목해볼만 하다. 대부분의 무선이어폰이 여전히 음악감상을 위한 디바이스로 포지셔닝하고 있지만, 아이큐버즈는 주변소리를 선택하고 소리의 높낮이와 방향을 조절할 수 있다.
- 변화에 가장 적극적으로 대응하고 있는 오디오업체로 보스를 꼽을 수 있따. 이미 소음제거 기술로 시장에서 높은 인지도를 갖고 있는 보스는 목소리 증폭기능을 통해 원활한 커뮤니케이션에 도움을 주는 PSAP로 포지셔닝한 히어폰부터 수면시 착용하는 슬립버드, 세계 최초 오디오 AR 디바이스인 프레임까지 다양한 기능과 형태를 지닌 라인업을 구성해 다방면으로 히어러블 시대를 준비하는 모습. 이뿐만 아니라 자브라나 소니와 같은 전통적인 이어폰의 강자들도 에어팟에 빼앗긴 무선이어폰 시장에서의 지위를 찾기 위해 소음제거와 외부소리 전달기능을 기본으로 탑재하면서 차별화하고자 노력중이다.
- 최근 스마트폰 사용환경에서는 한계에 부딪힌 음성인식 인터페이스가 히어러블이라는 디바이스를 만나면서 새로운 기회를 맞이하고 있다. 히어러블 디바이스에 인공지능 음성비서가 잘 어울리는 첫번째 이유는 입과 귀의 거리가 가깝다는 데 있다. 통화를 할 정도의 작은 목소리로도 음성비서와 부담없이 대화가 가능. 여기에 앞서 언급한 소음제거와 소리인지기술, 지향성 마이크까지 더해지면 주변이 시끄러운 상황에서도 사용자의 목소리를 찾아내 깨끗하게 담아낼 수 있다.
- 애플 에어팟의 경우 혹평을 받았던 디자인이 사실은 주변 소음을 걸러내고 사용자의 음성을 깨끗하게 받아내는 빔포밍 마이크를 위한 것으로 알려짐. 여기에 19년 3월 출시한 에어팟2에서 활성화 동작없이 음성만으로 시리를 불러내는 기능을 추가하면서 영화 그녀의 사만다처럼 언제든 부를 수 있는 음성인식 개인비서의 시대를 열었다는 평을 받고 있다. 히어러블이 인공지능 음성비서와 찰떡궁합인 두번째 이유는 사용자에게 먼저 말을 건넬 수 있다는 점. 착용감이 개선되고 배터리사용시간이 확보되면 히어러블과 사용자는 일상의 대부분을 함께할 것이다. 이때 인공지능이 귓속에 사용자만 알아들을 수 있는 소리로 정보를 전달할 수 있으므로 상황에 따라 능동적으로 사용될 수 있다.
- 공유경제가 국경과 시간을 초월해 빠른 속도로 글로벌화되면서 공유경제 플랫폼에 종사하는 노동자들의 지위를 둘러싼 소위 긱경제 논란이 뜨거워지고 있다. 긱경제란 기업들이 정규직보다 필요에 따라 계약직 혹은 임시직으로 사람을 고용하는 경제상황. 20년대 미국 재즈 공연장에서 연주자를 그때그때 구해 단기 공연계약을 맺은 데서 유래. 19년 4월 긱경제 노동자의 지위를 규정하는 매우 의미있는 의견서가 한 건 제출됨. 미국 노동부는 의견서에서 긱경제 노동자는 피고용자가 아닌 자영업자라는 의견을 제시. 이는 공유경제 플랫폼을 개발, 유지, 운용하는 데 있어서 긱경제 노동자는 필수적인 요소가 아니기 때문이라는 것이 노동부의 입장이다. 미국 노동부의 해석이 중요한 이유는 다양한 공유경제 플랫폼에 종사하는 노동자들의 신분이 피고용자에서 자영업자로 바뀌게 되면 최저임금, 건강보험, 초과근무수당 등 노동법령에서 정한 고용기업들의 사회보장 의무가 사라지기 때문. 최근들어 공유경제 플랫폼이 발달함에 따라 차량공유, 대리운전, 음식배달 등 일상에 전방위로 긱경제 노동형태가 확산되고 있다. 한국은행은 글로벌 긱경제 현황 및 시사점이란 보고서에서 긱경제의 확산에 따른 역기능에 대비해야 한다고 밝힘. 공유경제는 고용측면에서 새로운 일자리를 창출하고 자유로운 근무환경으로 비경제 활동인구의 노동참여를 촉진하는 장점도 있지만, 반대급부로 고용의 질과 소득의 안정성을 떨어트리는 요인으로 작용하기도 한다.
- 국내에서는 숙박업에 대한 오래된 규제가 에어비앤비의 발목을 잡고 있다. 최근 농어촌의 비어있는 집을 활용해 공유숙박으로 이용하려는 수요가 증가하고 있으나, 90년에 도입된 농어촌정비법의 농어촌 민박규정에 따르면 실거주자만 농어촌 민박사업자로 등록 가능. 반대로 도시 지역의 경우는 도시민박 규정에 따라 외국인 이용자만 숙박객으로 받을 수 있음. 공유숙박에 대한 법규가 미비한 탓에 에어비앤비를 통한 도시, 농어촌 지역 숙박공유에서 다양한 불법이 양산되고 있음. 또한 최근 보건복지부가 불법숙박영업에 대한 단속을 추진하겠다고 밝혀 공유숙박에 대한 복잡한 상황이 연출되고 있음.
- 해외의 경우 에어비앤비의 급격한 성장으로 부동산 시장이 왜곡되는 사례까지 나타나고 있음. 프랑스 파리의 경우 집주인들이 관광객에게 에어비앤비로 집을 빌려주면서 오히려 파리주민들이 주택부족과 거주비 증가로 인해 도시 외곽으로 쫓겨나는 사례가 발생하고 있다. 미국 뉴욕은 인구 850만 수준에 에어비앤비 숙박상품이 5만개가 등록되어 있는 반면, 프랑스 파리는 인구 214만명 수준에 숙박상품이 6만개, 인구 82만명 수준의 암스테르담은 숙박상품이 1만 8000개 등록되어 있음. 특히 에어비앤비에 등록된 파리 숙박 업체의 90% 정도는 집전체를 임대하는 상품으로, 임대용 주택공급이 거주자 중심의 장기임대에서 여행객 중심의 단기임대로 바뀌면서 임대료 상승과 집값상승을 초래하고 있음. 전미경제연구소 소속 카일 배런의 연구에 따르면 미국에서 에어비앤비에 등록된 숙소가 10% 증가하면 임대료는 0.42% 인상되고 주택가격은 0.76% 상승하는 것으로 나타남. 파리뿐 아니라 암스테르담, 바르셀로나, 베를린 등 유럽 여러 도시에서도 비슷한 상황이 연출되고 있으며, 유럽뿐 아니라 숙박시설을 신규 증추갛기 어려운 전 세계 유명도시를 중심으로 이런 현상이 계속 확산될 것으로 예상됨
- 영상합성을 위한 인공지능은 기술적으로 난이도가 높은 딥러닝 기술로서 미, 중, 일, 한 등 일부 국가만 성공. 예전에는 텍스트를 음성으로 변환할 때 인공지능이 음소단위로 발음했기 때문에 사람들이 듣기에 어색한 부분이 많았다. 하지만 이제는 딥러닝 기술을 통해 아나운서의 발음과 말투 그리고 억양을 그대로 학습해 발음함으로써 한층 자연스레 전달할 수 있게 됨. 영상합성기술은 이제 막 시작되는 단계지만, 이미지 합성을 통해 가상의 인물을 창조하는 기술은 상당히 발전. 이런 이미지 생성기술은 GAN(generative adversarial network, 생성적 적대 신경망)에 기초하고 있으며, 14년 이언 굿펠로가 논문에서 처음 공개한 이후 급속한 발전을 거듭하고 있음. GAN을 간단히 설명하면 입력된 데이터를 기반으로 지금까지 존재하지 않았던 다수의 새로운 객체 이미지를 생성한 후, 자체검증 체계에서 수준 미달의 객체는 제거하고 엄선된 객체만을 추출하는 기술. 비유하자면 인공지능이 창조주로서 검증되고 엄선된 창조물들만 내놓는 것이다. 인공지능이 만들어내는 가상의 이미지는 이미 사람의 눈으로는 구분하기 힘들 정도로 발전했다.
- SDS의 인공지능기반 스마트팩토리 플랫폼인 넥스플랜드는 삼성전자 반도체 공장에 적용한 결과 고장원인 분석시간을 90% 줄이고, 공정지능화를 통해 공정품질을 30% 향상시켰으며, 인공지능을 이용한 가상품질 검사를 통해 수백대의 검사장비를 구입하지 않고도 생산품을 100% 검사하는 효과를 거뒀다고 알려졌다. 연간 설비투자규모가 15조원에 달하는 반도체 분야는 생산성을 1% 높이면 1500억원이 절감되는 고부가 영역이므로 스마트팩토리가 지니는 의미가 더욱 크다. 삼성 SDS 외에도 SK텔레콤이 MWC 2019에서 제조업공정에서 생산성을 높이는 인공지능 솔루션 슈퍼노바를 공개. SK텔레콤은 18년 10월부터 슈퍼노바를 SK하이닉스 반도체 제조공정에 시범적용 중. 또한 현대모비스도 최근 인공지능으로 품질 불량을 검출해내는 알고리즘을 개발해 생산현장에 적용했는데, 다양한 샘플을 인공지능에 학습시켜 98% 이상의 판별 성공률을 달성했다. 제조공정의 획기적 혁신을 가져다준 스마트팩토리는 고도화된 인공지능 기술과 결합해 활동영역을 넓히고 있다. 공장과 같은 대형 제조시스템뿐만 아니라 음식점, 연구실 등 소규모 작업장에도 적용되며 제조혁신을 촉진하고 있음. 이런 변화를 두고 인텔리전트 팩토리라 표현할 수 있음

 

 

'IT' 카테고리의 다른 글

인공지능이 나하고 무슨 관계지  (0) 2020.02.17
당신은 데이터의 주인이 아니다  (0) 2020.02.08
보이스 퍼스트 패러다임  (0) 2019.11.15
포노사피엔스  (0) 2019.10.10
모든 것이 연결된 세상 IT 레볼루션  (0) 2019.10.10
Posted by dalai
,

보이스 퍼스트 패러다임

IT 2019. 11. 15. 07:59

- 알렉사 스킬은 스마트폰의 앱에 해당. 알렉사 스킬 킷 공개를 통해 음악서비스 판도라, 스포티파이와 스마트폼 서비스 필립스 휴, 벨킨 위모가 알렉사, 에코 생태계에 첫 발을 내딛었다. 17년 7월 기준 알렉사 스킬의 수는 15000개를 넘어서고 있으며, 영어와 독일어 서비스를 제공하는 알렉사 스킬을 위한 스토어가 운영되고 있음. 16년 출범한 알렉사 펀드는 보이스 및 사물 인터넷 관련 기술기업에 대한 시드 및 시리즈A 투자를 중심에 두고 있음. 몸짓 제어기술 기업 탈믹 랩스, 로보틱스 기업 임바디드, 홈 자동화 기업 에코비, 유아 모니터링 기업 아울렛 베이비 케어에 시리즈B 투자, 초인종 제작기업 링에 시리즈C 투자를 진행. 이외에도 알렉사 펀드는 스프링쿨러, 인터컴, 스피커, 보안카메라, 부엌기기, 반려동물 먹이통 등 다양한 사물 인터넷 분야에 투자하고 있다. 알렉사 펀드는 알렉사와 수직 및 수평통합할 수 있는 서드파티의 범위 또는 영역을 확장하는 역할을 담당하고 있음.
- 알렉사, 에코의 진화과정은 알렉사가 플랫폼을 지향하고 있음을 쉽게 알 수 있음. 알렉사는 아마존 상거래 서비스의 보이스 인터페이스를 뛰어넘어 음악, 영상, 퀴즈 등 다양한 스킬을 제공하는 등, 스마트폰과 앱 생태계의 결합형태와 유사성을 갖고 있다. 그 기능영역 또한 전통적 의미의 스마트폰을 넘어 스마트홈, 자동차 등으로 확장하고 있음을 확인할 수 있다. 앞서 제시한 알렉사, 에코의 진화과정을 통해 이후 플랫폼으로서 알렉사가 어느 방향으로 발전할 수 있는지 추론 가능.
* 알렉사를 탑재한 다양한 전문기기의 출현. 에코쇼, 에코룩이 대표적이며, 이런 기기확장을 통한 수평통합은 아마존 틀 안에 제한되는 것이 아니라, 다른 기업이 제공하는 보이스 인공지능 서비스가 알렉사를 수용할 수 있음을 의미. 알렉사와 에코의 분리는 수평통합의 출발점으로 평가 가능.
* ASK의 공개와 알렉사 펀드는 알렉사가 보다 다양한 기능영역으로 확장하는 읟를 갖고 있음을 말함. 이와 대조적으로 17년 7월 중국 알리바바가 공개한 보이스 인공지능 서비스 티몰지니는 그 이름 자체에서 이미 보이스 인공지능 서비스를 상거래 영역에 제한하고 있다. 티몰지니라는 이름은, 알리바바가 제공하는 전자상거래 쇼핑몰 티몰의 이름을 딴 것으로 쇼핑기능 이상의 확장성을 고려하지 않은 이름이다. 만약 상거래뿐 아니라 공공요금 결제, 예약, 지불 등 다양한 서비스 영역을 포괄하는 메신저 기반 서비스 위챗의 텐센트가 보이스 인공지능 서비스를 제공한다면 이러한 제한은 치명적 한계로 작동 가능. 스마트폰의 앱생태계처럼 보이스 인공지능은 보다 포괄적이고 일반적인 서비스 영역을 확보할 때 플랫폼 지배력을 확보할 가능성이 높기 때문.
* 아마존의 보이스 인공지능 서비스는 쇼핑, 예약, 주문 등의 기능을 제공하면서 아마존이 갖고 있는 다양한 서비스로 수직통합을 시도. 한국에 등장하는 보이스 인공지능 서비스는 쇼핑, 예약, 주문 등의 기능을 제공하면서 아마존이 갖고 있는 다양한 서비스로 수직통합을 시도함. 한국에 등장하는 보이스 인공지능 서비스가 음악 서비스를 제공하는 모습 또한 수직통합으로 분류 가능. 그러나 알렉사가 에코라는 특정 스피커로부터 독립하면서 보이스 인공지능은 자동차 또는 파이어TV 등 생활 곳곳으로 스며들 수 있음. 이때 비로소 이용자가 머무르는 곳 어디든 보이스 인공지능 서비스가 존재할 수 있음. 또한 보이스 인공지능 서비스가 플랫폼으로 발전할 수 있는 전제조건은 수직통합이 아닌 SDK 공개에 기초한 수평통합이다. 여기서 뜨겁게 가열되고 있는 보이스 인공지능 서비스 경쟁구도의 방향을 가늠할 수 있다.
- 보이스 인터페이스의 궁극적 도달지점은 보이스컴퓨팅이다. 프로그램을 열고, 워드를 치고 파워포인트를 작성하고, 거래를 수행하는 그 이상의 생산적 활동들을 목소리로 처리함으로써 스크린과 키보드, 데스크탑이라는 입력장치를 불필요하게 만드는 지점이다. 이는 우리가 스마트폰과 컴퓨터로 해 왔던 그 모든 프로그램을 목소리를 다룰 수 있게 된다는 것을 의미. 만약 우리가 보이스 컴퓨팅을 하게 된다면, 간단한 말로도 충분한 작업들을 위해 좁은 스크린을 얼마나 많이 터치해왔었는지 실감하게 될 것임.
- 애플의 시리가 정체기를 겪는 동안, 구글은 나우 등 음성검색에 사용하던 자연어 처리와 봇 기술을 발전시켜 구글 홈을 출시. 구글 홈에 탑재된 구글 어시스튼트는 알렉사가 갖지 못한 강력한 검색기능과 맥락 이해, 목소리 구분 등으로 알렉사와 차별화된 서비스를 보였다. 구글 어시스턴트는 자회사 네스트를 통해 모바일 사물인터넷 플랫폼과 차량용 OS인 안드로이드 오토를 겨냥하고 있으며, 각종 콘텐츠를 스트리밍으로 추천받을 수 있는 크롬캐스터를 갖고 있다는 장점이 있다. 구글은 이렇게 이미 짜인 플랫폼을 어시스턴트로 통합하려 한다. 알렉사의 쇼핑기능 역시 놓칠 수 없었던 구글은 월마트, 코스트코, 스페이플스 등과 파트너십을 맺고 당일 배송 서비스인 구글 익스프레스를 운영하여 목소리로 생필품을 주문할 수 있도록 하고 있다.
- 아마존의 다양한 제품을 편리하게 주문할 수 있다는 점에서 알렉사의 쇼핑기능은 압도적임. 게다가 우버, 도미노, 캐피탈원 같은 서드파티 업체들이 참여하면서 실생활에 필요한 서비스를 제공하는 데 뛰어난 음성비서로서의 지위를 자리매김하고 있다. 반면에 알렉사의 몇몇 기능은 아직 제한적임. 번역이나 검색기능이 뒤떨어지며, 개개인의 목소리를 구별하지 못함. TV에서 흘러나온 "알렉사, 인형의 집 주문해줘"라는 음성에 반응해 방송을 시청하던 여러 가정에서 알렉사가 실제 인형의 집을 주문할 뻔했다는 뉴스는, 목소리를 구별하지 못하는 알렉사의 치명적 단점을 보여주었다. 현재 알렉사 팀은 목소리를 구분하는 서비스를 개발중. 하지만 구글은 이미 여섯개의 목소리 ID를 등록하여 개별적으로 이용할 수 있도록 하는 등, 알렉사의 부족한 점을 탁월하게 보완한 서비스를 선보임을써 보이스 인공지능 시장의 일부부능ㄹ 당당하게 차지했다.
- 모든 보이스 인공지능 서비스들은 자신을 낳은 테크기업의 정체성을 닮음. 아마존 알렉사는 쇼핑이 편리하고, 구글홈은 검색이 장점. 마이크로소프트는 코타나를 업무 및 비즈니스 활동에 최적화할 것으로 보임. 한국이라면 검색 및 번역, 지역정보 안내에는 네이버의 인공지능 서비스가, 메신저 이용이나 택시 호출에는 카카오 인공지능이 가장 유리한 인터페이스를 제공할 것이라는 예상은 어렵지 않다. 그리고 삼성 빅스비가 타 인공지능 서비스와 달리 스마트폰이라는 기계를 제어하는 데 있어 몇 가지 연속된 명령을 처리하는 등 하드웨어 제어에 매우 특화되어 있는 점도 흥미로움. 이 역시 오랫동안 하드웨어를 만들어온 삼성의 정체성과 무관하지 않다. 그렇다고 각 기겅븨 AI가 자사 서비스만 이용할 수 있도록 만들어진 것은 아님. 타사 서비스를 호출하여 사용할 수 있음. 그럼에도 불구하고 역시 자사 서비스를 이용할 때 가장 매끄러운 인터페이스를 제공함. 알렉사로 아이클라우드 캘린더를 이용할 수 있지만, 삭제할 권한은 없다. 시리로 텔레그램을 이용하여 메시지를 보낼 수는 있지만, 아이폰 디폴트 메시지를 이용할 때보다는 불편함. 구글 어시스턴트나 알렉사 모두 단어를 번역해 달라고 요청할 수 있지만, 자체 번역 서비스를 가진 구글은 요청에 바로 답하는 반면, 알렉사는 서드파티 앱을 호출한 뒤 물어보아야 한다.
- 현재 보이스 인공지능 서비스들은 호환성, 소프트웨어, 쇼핑, 하드웨어 등에서 각각의 차별화된 강점을 선보이며 조금씩 경쟁하고 있지만, 결국 서로 타사의 경쟁력 있는 서비스들을 점차 닮아가고 있음. 15년 애플은 기억하는 인공지능인 보컬 아이큐를 인수했는데, 이는 맥락이해에 있어 구글을 뛰어넘을 가능성을 시사. 알렉사는 목소리 구분서비스를 준비중이고, 구글 어시스턴트는 구글렌즈라는 이미지 인식 서비스를 연계함으로써 또 다른 도약을 준비중. 한편, 서비스 사이의 합종연횡 가능성도 높음. 17년 8월 아마존 알렉사와 마이크로소프트 코타나가 손을 잡음. 두 기업은 클라우드 산업에서 첨예한 대립구도를 이루는 경쟁사여서, 이번 제휴는 많은 저널리스트들을 놀라게 했음. '알렉사, 오픈 코타나', '코타나, 오픈 알렉사'라는 짧은 명령으로 두 보이스 인공지능의 통합이 가능해짐. 예컨대 알렉사로 아웃룩 캘린더와 이메일 서비스를 이용 가능
- 스마트 스피커라고도 불리는 이 디바이스의 중요한 특징은 '알렉사'나 '오케이, 구글' 과 같은 깨우기 단어 또는 활성화 구문을 인식한다는 것. 이용자의 '알렉사, 부엌 불을 켜줘'라는 음성 요청을 스피커가 이해하여 응답을 모두 처리하는 것은 아님. 이 스피커 디바이스 내에 내장된 작은 프로세서는 그러한 처리를 모두 할 만큼 강력하지는 않다. 우리가 접하는 음성인식 디바이스는 이용자가 부르는 '알렉사'라는 단어를 인식하여 이용자의 음성을 녹음하기 시작하며, 말하기를 마치면 '부엌불을 켜줘'와 같은 녹음된 음성을 인터넷을 통해 서버로 보내는 역할을 함. 그리고 전성한 음석에 대한 결과를 서버로부터 받아 명령을 수행하는 것임
- 시리를 개발했던 팀인 식스파이브 연구팀은 애플을 떠나 비브랩스에서 범용 인공지능을 위한 연구를 계속함. 현재의 인공지능이 '들려 줘', '켜 줘', '찾아 줘', '주문해 줘'와 같은 단순한 명령어로 이루어진 주문만 처리하는 데 반해 그들은 정말로 인공지능이 사람이 세상을 배워가듯 학습하는 것을 원했다. 비브랩스 연구팀은 인공지능이 스스로 문장 속의 영역을 파악하고 무엇을 찾아야 할지 학습하는 알고리즘을 개발
"동생 집으로 가는 길에 라자냐와 어울리는 저렴한 와인을 픽업해야겠어'
여기서 비브는 '동생'은 관계이고, '집'은 주소이며, '라자냐'는 음식이라는 것을 파악. 그래서 연락처에 동생과 집에 대한 정보를 합쳐 주소에 대한 길찾기 루트를 확보함. 그리고 라자냐가 어떤 종류의 음식인지 파악한 후 그것과 잘 어울리는 와인을 인터넷에서 찾는다. '피노누아'라는 와인이 추천되면 그것을 보유하고 있는 와이너리에 대한 정보를 앞서 찾은 길 찾기 정보와 합친다. 이 모든 과정에 이루어지는 데 20분의 1초가 걸림. 이런 방식으로 비브는 단어의 맥락을 파악하여 새로운 플랜을 스스로 세워 임무를 수행함. 비브는 시공간적 맥락을 이햐하며, 사물에 대한 좌표를 이해함. 이것은 인간이 세상을 학습해 나가는 과정과 유사. 비브는 영역, 온톨로지, 택소노미를 배운다. 온톨로지는 하나의 개념이 어떤 개념들과 연결되어있는지 파악하는 것을 의미하고, 택소노미는 생물-동물-조류-꾀꼬리 처럼 사물에 대해 종과 속을 분류하는 것을 말함
- 우리는 데이터를 입력하기 위해 웹페이지를 방문하거나 스마트폰에서 앱을 열어야 했다. 지금까지 앱과 같은 서비스가 사람들로 하여금 데이터를 입력하도록 끌어당겼다면(pull-based), 이제는 모든 서비스가 사람들에게 다가올(push-based) 것이다. 이러한 빅 리버스와 함께 애플리케이션들은 전기나 수도처럼 눈에 보이지 않지만 항상 존재하는 형태가 될 것이다. (가우라브 샤르마)
- MIT 미디어랩에서 플루이드 인터페이스 그룹을 이끌고 있는 패티 메이즈는 현재의 인터페이스 방식은 주어진 상황과 맥락을 이해하지 못하고, 이용자 명령에 반응하는 수동적 방식이며, 이용자가 기기와 상호작용하기 위해서는 잠시라도 하던 일을 멈추어야 하는 한계를 가지고 있다고 주장. 그에 따르면 미래의 인터페이스는 상황과 맥락을 해석하여 이해하고, 이용자 시점에서 정보를 능동적으로 제공하고 이용자 개입은 최소화되어야 하며, 인터페이스가 주의를 분산하지 않고, 이용자에게 끊김없이 통합적인 경험을 제공하는 방향으로 발전해야 한다고 한다. 같은 맥락에서 음성인터페이스는 인터페이스의 역사에 메이즈가 주장하는 의미있는 변화를 유발할 수 있는 잠재력을 갖고 있다. 멀티터치 인터페이스가 그래픽 기반의 상호작용에서 가장 직관적 지점에 도달했다면, 보이스 인터페이스는 텍스트 기반에 있어 근본적 변화를 불러오고 있기 때문이며, 인간이 컴퓨터의 언어를 배우는 것이 아니라 컴퓨터가 인간을 이해하기 위해 노력하는 방향으로 인터페이스는 진화하고 있기 때문
- 보이스 인터페이스는 모니터와 본체, 키보드와 마우스로 이루어진 전통적 형태의 컴퓨터와 인터페이스를 해체하기 시작. 키보드나 터치가 인간의 의도적 노력을 필요로 하는 입력방식이라면, 음성은 보다 자연스레 존재하는 방식이다. 현재 보이스 인터페이스는 시리처럼 아이폰에 장착되어 있거나 에코나 구글홈 같은 스피커 형태를 띠지만, 가까운 미래에는 언제 어디서든 이용자가 원하는 형태로 존재할 수 있다.
- 갤러웨이는 알렉사가 제안해준 배터리 가격이 아마존 웹사이트에서 볼 수 있는 가장 저렴한 배터리 가격보다 비싸다는 점을 지적하며, 알렉사를 통한 음성구매가 소비자에게는 최선이 아닐 수도 있다고 이야기한다. 보이스 기술의 발전으로 가격 선택권이 소비자에서 아마존이라는 유통업체로 넘어갈 수 있음을 상징적으로 보여주는 사례다. 이렇게 모바일에서 보이스로 넘어가는 변화에서 소비자들의 가격에 대한 민감도가 줄어든다는 사실은 주목할 필요가 있다. 특히 음성 인터페이스 외에도 다양한 경로로 소비자 개개인의 데이터를 수집한 유통업체들은 훨씬 더 고도화된 데이터 분석을 이용하여 소비자 개개인의 소비성향을 면밀히 파악할 것이다. 분석한 정보를 이용하여 유통업체는 각각의 소비자 제품에 대한 가격 탄력성을 파악할 수 있게 된다. 이는 개인별, 상품별로 유통업체의 이익에 가장 유리한 가격에 판매하는 전략의 실행을 점점 용이하게 해줄 것이다.
- 에즈라히와 스투케는 16년 그들의 저서 '가상경쟁 : 알고리즘 기반 경제의 미래와 위험'에서 기술을 이용하여 소비자에 대한 정보를 더 자세하게 수집한 전자상거래 업체들이 어떤 식으로 동일한 상품을 소비자에 따라 다른 가격에 팔아왔는지 조사. 물론 개인 데이터의 추적과 수집을 통해 유통업체들이 감성적 호소와 함께 적당히 높은 가격에 제품을 판매할 수 있음은 누구나 예상 가능. 하지만 저자들은 거기서 더 나아가 전자상거래 업체들이 다른 소비자에게 각각 다른 가격을 부과할 수 있다는 사실을 밝혀냄. 개인 데이터가 더 정교하게 축적되면 개별 고객이 기꺼이 지불하고자 하는 액수를 추정 가능
- 개인별로 상이한 가격으로 판매하는 것은 반독점법 위반이라는 이슈를 불러일으킬 수도 있지만, 만약 업체가 '탄력적 가격정책이 소비자에게도 많은 혜택을 준다'는 주장을 내세운다면, 이러한 가격정책은 저항없이 널리 받아들여질 수도 있다. 결국 소비자들은 유통업체가 정하는 가격을 따를 수밖에 없는 프라이스 테이커의 운명이 될 수도 있다.
- 아마존은 핸드폰이나 인터넷이 연결된 TV 셋톱박스를 선보이게 될까? 그렇다. 아마존은 자기 고객들이 경쟁자 하드웨어에 전적으로 의존하지 않고도 고객들이 사용하는 인터넷 연결기기에서 아마존 서비스를 사용하길 원하기 때문이다. (아마존, 세상의 모든 것을 팝니다)
- 아직까지는 신기한 기계 수준으로 인식되는 음성인식 기기들이 본격적으로 돈버는 기기로 탈바꿈하기 위해서는 음성 인식 기술을 소비자들의 구매행위와 연결시키거나(아마존), 음성인식 기술을 통해 전달하려는 정보의 제공자에게 비용을 받아야 함(구글). 음성인식기술을 쇼핑과 직접적으로 연결하는 데는 이미 음성인식기기 시장에서 압도적 1위를 차지하고 있는 아마존을 따라올 경쟁자는 아직 없다. 그 배경에는 생필품, 식료품, 의류 등 미국 내 온라인 쇼핑의 확대가 더뎠던 상품분야에 대한 아마존의 꾸준한 투자가 있었다. 아마존은 이들 상품군들을 직매입(생필품)하거나 자체제작(의류)하고 가격경쟁력을 확보하여 스크린과는 전혀 다른 음성주문 분야에서도 어떤 상품을 노출할지에 대한 고민 자체를 없앴음. 새롭게 선보인 대시 완드는 프라임 회원 기준 가격이 20불에 불과해 경쟁기기들과는 상대가 안될 정도로 저렴할 뿐만 아니라, 첫 주문시 아마존에서 캐시백으로 20불을 되돌려주기 때문에 실질적으로는 공짜. 그러나 좀 더 확장된 쇼핑음식 배달, 콜택시, 여행정보 등에 있어서는 16년 10월 선보인 구글 홈에 보다 많은 기회가 있을 수도 있음. 17년 1분기 기준 구글 매출의 87%는 검색광고 수익. 구글이 그동안 구축한 광범위한 검색 쿼리를 성공적으로 음성 인터페이스로 옮겨갈 수 있다면 구글의 검색광고 불패 신화는 이어질 것이다. 구글 홈에는 아직 직접적 광고가 없지만, 곧 광고를 탑재할 것이라는 추측이 일반적. 단, 구글에는 세가지 위험이 있다.
첫째, 음성기기를 통한 광고 기회는 스크린을 통해 다양한 정보를 한꺼번에 눈으로 확인하는 PC나 모바일에 비해 양적으로 적을 수밖에 없다.
둘째, 이미 광고시장을 장악하고 있는 구글로서는 음성광고가 자사의 PC나 모바일 광고를 잠식할 가능성을 배제할 수 없다.
셋째, 미녀와 야수 광고소동에서 알 수 있듯이 음성 인식기기에서 나오는 광고를 이용자들이 불쾌하거나 거추장스럽게 받아들이는 경우, 아예 해당 기기를 사용하지 않거나 경계하는 결과를 가져올 수 있다.

'IT' 카테고리의 다른 글

당신은 데이터의 주인이 아니다  (0) 2020.02.08
모바일 미래보고서 2020  (0) 2020.01.10
포노사피엔스  (0) 2019.10.10
모든 것이 연결된 세상 IT 레볼루션  (0) 2019.10.10
AI 사람에게 배우다  (0) 2019.09.15
Posted by dalai
,

포노사피엔스

IT 2019. 10. 10. 12:43

- 우리나라 세대별 특징
(1) 베이비붐세대 (55-63년 출생)
* 국민소득 100불 이하의 시대적 상황
* 대다수가 성장과정에서 빈곤, 군사문화, 분단과 냉전을 경험
* 마지막 주산세대, 컴맹 1세대
* 현재 우리 사회 상위 리더계층
* 19년부터 은퇴가 본격화하면서 경제활동 인구가 줄어드는 추세
(2) X세대 (60년대중반~70년대후반 출생)
* 청소년기에 6.10 민주화항쟁을 경험, 민주화 시기에 성장
* 물질적, 경제적 풍요 속에서 성장
* 90년대 오렌지족으로 불리는 독특한 문화 형성
* 93년 아모레화장품 트윈엑스의 광고로 X세대=신세대로 사용됨
(3) 밀레니얼 세대 (80년대 초반~2000년대 초반 출생)
* 대부분 베이비붐 세대의 자녀들
* IT에 능통하고 대학진학률이 높음
* 청소년기부터 인터넷을 접해 모바일과 SNS 이용에 능숙
* 고용감소, 일자리 질저하 등 악조건 속 사회진출
* 결혼과 내집 마련을 포기하거나 미루는 경향
- 중국에 새로운 무기와 문명이 발생할 때마다 서구대륙에서 탄생한 과학기술이 엄청난 힘을 발전시킬 때마다 변방의 작은 나라였던 우리는 엄청난 좌절과 고통을 맛봐야 했따. 이미 대륙은 새로운 문화와 문명을 선택했다. 미국에서 시작된 이 문명은 중국을 휩쓸고 동남아로 번진 지 모래. 그리고 그 신문명은 우리 시장에도 깊숙이 들어옴. 해외에서 신문명을 경험한 사람들은 이제 소비자에게 새로운 선택권을 달라고 강력히 주장. 역사의 발전에는 예외가 없고 인류의 자발적 선택에 기반한 진화에는 역변이 없다. 그것이 글로벌 시장 변화가 전하는 혁명의 메시지다.
- 밀레니얼 세대는 나이가 어리다고 해서 언제나 그렇게 바보처럼 게임만 하고 시간만 낭비하는 존재가 아님. 게임을 통해 축적한 경험을 바탕으로 새로운 의미의 창조적인 일들을 찾아내기 시작한 것. 세상의 모든 사람들이 인터넷 게임기를 들고 있다면 어떤 사업을 할 수 있을까? 라는 생각은 새로운 비즈니스를 만들어내는 출발점이 됨. 그래서 가상의 세계관이 없는 기성세대의 머리로는 만들 수 없는 다양한 비즈니스 모델을 밀레니얼 세대가 만들어냄. 그 대표적 사업이 우버다. 모든 사람들에게 휴대형 인터넷 게임기가 있다면, 게임의 방식으로 택시사업을 할 수도 있겠다는 게 출발점. 08년 창업한 에어비앤비도 출발점이 같음. 에어비앤비의 시작엔 모든 사람이 스마트폰을 갖고 있다면 여행을 어떻게 바꿀 수 있을까? 집에서 놀고 있는 방을 새로운 수익원으로 만들 수 있지 않을까? 라는 고민이 있었다. 포노 사피엔스라는 새로운 인류의 사고방식과 생활방식이 적용될 수 있는 모든 것을 고민하면 시작된 사업인 것. 그러니 기성세대에게 에어비앤비는 기획부터 이해할 수 없는, 어렵고 상식적인 것으로는 말도 안되는 사업으로 들렸다.
- 지난 10년간 우버와 리프트의 성장으로 미국 택시시장은 무려 1.5배성장. 편리한 서비스에 매료된 소비자가 뜨겁게 반응하면서 만들어낸 변화임. 이 변화는 엉뚱하게도 자동차 산업을 어렵게 만들었다. 차량공유택시와 공유서비스에익숙해진 미국의 10대아 20대가 차를 구매하지 않는 것이다. 여기에다 친환경 차에 대한 수요가 늘면서 일반 자동차를 생산하는 GM의 입지가 줄어듬. 다급해진 GM은 리프트에 거액을 투자해 25년까지 무인택시를 공동개발하겠다고 선언. 자동차 제조기업에서 이제는 이동서비스를 제공하는 모빌리티 기업으로 전환하겠다고까지 이야기한 것. 생존의 전략이 무엇인지를 분명히 밝힌 셈. 이 전략을 토요타가 이어받음. 18년 토요타 CEO가 나아 "우리는 이제 모빌리티 컴퍼니"라고 선언. 실제로 토요타는 그랩에 10억불을, 또 그 이상을 디디추싱에 투자. 이들과 함께 인공지능이 운전하는 자율주행 서비스를 선도하는 기업이 되겠다고 발표. 들고 나온 미래의 차 이팔레트도 자율주행차량임. 부르면 오고, 오면 사용하고, 사용한 후 다시 보내면 스스로 돌아가는 차량이다. 이것이 미래의 자동차 트렌드임을 세계1위의 자동차 회사가 제시한 것. 다급해진 현대차는 우리나라 카셰어링 스타트업 풀러스를 포기하고 동남아 그랩에 3600억을 투자. 세계 자동차 회사들의 전략을 감안할 때, 모빌리티 컴퍼니로의 전환이 안되면 생존은 어렵다고 판단한 것임.
- 18년 GM은 추가적으로 5개의 공장을 더 폐쇄하겠다고 선언. 그만큼 기존방식의 자동차 수요가 줄어들고 있다는 의미. 우리에게는 극히 유감스러운 일이지만 자동차 업계의 모든 수정전략은 소비자의 선택에 따른 생태계 변화를 반영한 생존전략임. 더 확대해서 크게 성장하겠다는 것이 아니라 자동차 문화의 변화에 대응해 적어도 멸종하지는 않겠다는 위기대응 전략이다.
- 28년 3월 14일 조선일보에 이런 기사가 게재됨. 서울시에서 부영버스라는 저가의 대중교통 서비스를 운영하겠다고 발표하자, 인력거꾼들이 시청으로 대거 몰려들어가 항의시위를 합니다. 당시에도 서민을 보호하는 일은 중요한 정치이슈였다. 경성부는 버스사업을 백지화한다고 발표. 그러나 불과 1년 사이 택시가 증가하고 버스운행이 시작되면서 인력거꾼은 그 수가 급격히 줄어들고 결국 사라짐. 이 모든 것을 바꾼 것은 바로 소비자의 선택이었다. 새로운 문명을 경험한 인류는 그 전의 경험을 순식간에 백지화하고 신문명으로 옮겨간다. 그리고 곧 생활의 표준이 바뀜. 그 당시와 지금은 기술적 차이가 있은니 상황이 다르다고들 이야기함. 다르지 않다. 차이는 기술이 아니라 경험이다. 새로운 서비스를 경험한 포노 사피엔스들은 이제 표준을 바꾸고 있음. 인류문명의 표준이 바뀌면 그 여파는 모든 영역으로 확대됨. 안타깝지만 규제로 막아낼 수없다. 택시와 우버의 다툼은 곧 내 일자리에도 닥치게될 운명이다. 그래서 미리 많은 생각을 해야 한다. 카카오뱅크가 만들어진 지 불과 1년 사이에 680만명이 넘는 고객을 확보한 이유는 무엇일까 고민해야 함. 그 차이는 미묘하다. 늘 친숙했던 캐릭터가 귀여워서 가입했다는 사람에게 당신이 틀린 거라 이야기할 수 없다. 귀여운 캐릭터와 포노사피엔스들이 요구하던 서비스만을 담아낸 차이를 이해해야 함.
- 프랑스의 대표적 지성이자 미래학자인 자크 아탈리는 음악소비의 변화가 미래산업변화를 예측하는 가장 좋은 지표라고 이야기함. 그는 지난 30년간 이 방법을 통해 실제산업과 사회의 변화를 잘 예측하면서 유명해짐. 그의 가설은 지금까지도 잘 맞고 있다. 사실 음악은 인류의 가장 오래된, 그리고 공통적 소비재임. 거의 모든 사람들이 음악을 좋아하며, 그래서 소비량이 엄청날 뿐 아니라 그 취향도 매우 다양함. 때문에 음악산업의 변화는 모든 소비분야 중 가장 빠르게 기술을 흡수하는 분야. 80년대 이후 첨단과학이 반영된 제품의 제조기술은 음악이 선도해옴. 음악을 듣는 모든 경우를 위해 다양한 첨단 IT제품들이 등장. 집집마다 오디오는 다 있었고 길에서도 좋은 음질의 음악을 들을 수 있도록 워크맨이라는 혁신적 제품이 등장. 차에서도 오디오 시스템이 중요해졌고, 피크닉을 갈 때도 격에 맞는 제품이 필수였음. 2000년대 본격적인 인터넷 시대가 오기 전까지는 그야말로 제품의 전성시대, 제조의 전성시대였다고 할 수 있다. 소니가 세계 최고의 기업으로 성장한 것도 이때. 음악에서 비디오에 이르기까지 미디어를 소비하는 모든 기기가 첨단 IT 산업시대를 선도하며 새로운 문명을 제품으로써 만들어가던 시대였음. 음악 자체도 카세트테이프나 CD같은 제품에 담겨 팔리는 게 상식이었다. 그런데 MP3 플레이어와 아이팟이 등장하면서 음악소비의 근간이 바뀌기 시작. 음악을 듣기 위한 제품은 여전히 필요했지만, 음악자체는 제품이 아닌 디지털 플랫폼을 통해 유통되기 시작. 그리고 비즈니스의 플랫폼은 스마트폰이 탄생한지 10년 만에 더 급격하게 올라감. 이제 우리나라에서는 디지털 플랫폼에 기반한 음악소비가 표준이 되었음. 물론 아직도 CD를 사거나 LP를 사서 음악을 듣는 사람도 있지만, 마니아라 불러야 할 정도로 그 수가 감소.
- 디지털 플랫폼에 기반한 음악소비가 보편화되면서 제품산업은 몰락함. 샤프, 도시바, 제이브이씨, 산요와 같은 일본 대표적 기업도 사라짐. 그뿐이 아니다. CD를 만드는 기업, CD플레이어를 만드는 기업도 사라짐. 그러고 보니 생각도 못하는 사이 사라진 제품도 있다. VCR과 그 뒤를 이은 DVD다. 우리나라에서도 이제 DVD로 영화를 보는 사람들은 거의 사라짐. 어느새 미디어는 디지털 플랫폼을 통해 다운로드해서 소비하는 것이 상식. 음악 소비가 다른 소비문화의 변화를 미리보여주는 것이라면, 디지털 플랫폼에 기반한 소비는 거의 모든 분야로 확산될 것이 분명함. 그리고 그 속도와 확산의 범위는 엄청날 것이다. 음악소비시장을 기준으로, 오프라인 상점에서 팔리는 음반 매출의 비중과 다운로드로 소비되는 음원매출의 비중은 어느정도일까? 우리나라는 이미 음원매출이 음반매출보다 10배이상 높다. 미국은 음원매출이 약 3배정도. 일본은 아직도 음반매출이 음원보다 많음. 전 세계적으로는 18년 음원매출이 드디어 음반매출을 넘어서는 첫해로 본다. 음악소비가 디지털 플랫폼으로 옮겨가면 다른 소비도 곧 익숙해짐.
- 16년 네이버는 광고매출이 지속적으로 증가하면서, 종국엔 지상파 TV3사 그리고 신문 3700개사의 광고비를 추월함. 네이버의 영향력이 신문과 지상파 TV보다 더 커짐. 네이버가 광고의 대세가 되었다고 생각하는 사람이, 16년부터 유튜브의 사용시간도 폭발적으로증가. 18년에는 유튜브앱의 하루사용시간이 네이버에 비해 무려 2배나 많음. 명실공히 유튜브는 우리나라 미디어 소비의 대표 플랫폼이 됨
- 이런 데이터들은 무얼 의미할까? 만약 소비자를 대상으로 하는 광고를 기획한다면 TV와 신문 비중을 줄여 네이버로 이동한 후, 18년부터는 유튜브 광고를 네이버보다 2배 늘려야 한다는 것을 의미. 사실 우리나라의 많은 기업들은 이 방식을 따르지 않음. 광고주와 언론의 특수적 관계까지 감안해서 여전히 TV와 신문에 광고를 게재함. 그러나 아무래도, 그 비율은 현저히 줄긴 했다. 이제는 TV와 신문의 위기가 기업들에게도 본격화되었기 때문에 다른 곳을 배려해줄 여유가 없어진 것. 실제로 미국에서는 이미 이런 현상이 시장을 지배한지 오래되었음. 심지어 아마존은 01년부터 07년까지 TV 광고를 중단. TV광고와 매출의 연계성이 높지 않다는 테스트까지 거쳐 내린 결론이었음. TV 광고를 하면서 매출효과를 분석한 다음 ROI가 만족스럽지 않으면 비용을 축소. 동시에 구글, 페이스북, 인스타그램, 유튜브 등 온라인 매체를 통한 광고는 확대. 그리고 이 결정은 거의 모든 플랫폼기업들의 교과서가 됨. 사실 플랫폼 광고는 이미 데이터를 기반으로 움직인 지 오래임. 많은 대기업들의 광고가 기존 미디어 플랫폼에서 온라인 미디어 플랫폼으로 대거 이동했고, 또 지속적으로 이동 중임. 그런데 여기서 문제가 발생. TV 광고를 유튜브에 올려놨더니 보는 사람도 많지 않고, 광고효과도 TV에 비해서는 미미했던 것. 원인은 미디어 소비문명의 변화를 인지하지 못한 데 있었다. 포노 사피엔스들은 TV와 신문에 익숙한 세대아는 미디어 소비방식도, 콘텐츠 특성도 아주 다름. 그러니 기존방식으로 제작된 광고를 자꾸 떠먹여봤자 효과가 나지 않는 것. 이들은 무엇을 사야한다고 강요하는 광고에 대해 그리 익숙하지 않은 세대임. 광고가 매출로 이어지지 않는 이유다
- 신을 데려와라. 신은 내가 믿겠다. 신을 데려올 수 없다면 데이터를 가져와라. (제프 베조스)
- 우리가 계속 부작용만 바라보고 있다면 새로운 세대와의 갈등만 더 크게 만들 뿐. 이제 뒤를 돌아 부작용만큼 강력한 디지털 문명의 혁신성에 눈을 뜨고 새로운 기회를 찾아야 함. 어렵지만 배우고 깊은 관심으로 받아주어야 함. 특히 기성세대가 생각을 바꾸어야 함. 글로벌 시장의 문명은 이미 새로운 방향을 정했고, 우리는 미래세대를 그리로 인도할 책임이 있기 때문. 우리나라를 문명의 갈라파고스로 만들어서는 안된다. 그러기 위해서는 새로운 문명에 대한 갈등이 생길 때마다 부작용의 반대급부도 함께 생각해야 함.
- 디제이아이의 성공의 핵심은 영상의 퀄리티를 지켜주는 다양한 기술의 디테일임. 결국 스토리의 완성은 기술이 만들어낸 것. 영상의 해상도, 비행속도, 정지능력 등 수치만으로는 '환상적인 영상을 찍어내는 드론'에 대해 정의하기 어려움. 그래서 그 감성의 디테일을 이해하고 그걸 풀어낼 수 있는 엔지니어가 필요한 것. 아티스트와 함께 일할 수 있는 엔지니어가 필요함. 이제 거의 모든 제품의 개발에는 융합이 필수. 고객을 감동시킬 수 있는 스토리에서 출발해 디자이너, 엔지니어, 마케터 세일즈맨까지 모든 직원들이 디테일의 환성을 위해 집착해야 성공을 만들어낼 수 있는 시대임

 

'IT' 카테고리의 다른 글

모바일 미래보고서 2020  (0) 2020.01.10
보이스 퍼스트 패러다임  (0) 2019.11.15
모든 것이 연결된 세상 IT 레볼루션  (0) 2019.10.10
AI 사람에게 배우다  (0) 2019.09.15
디지털 미니멀리즘  (0) 2019.08.05
Posted by dalai
,