디지털의 배신

IT 2020. 10. 27. 08:28

- 잘 드러나지 않는 가상의 데이터 논리가 현실 세계 에 거꾸로 미치는 관계망을 피지털 phygital 이라고 부르자. 원래 피지털은 온·오프라인 소비 경험 차이를 줄이려는 소 위 블렌딩 마케팅 용어로 쓰이고 있었다. 이 용어를 비물질 의 '디지털digital' 세계와 물질의 '피지컬physical' 세계가 부 딪쳐 생성되는 새로운 교접 영역으로 일반화해보자. 즉, '피지털'은 물질계와 디지털계 사이에 관계 밀도가 높아진 것 에 착안한 용어라고 보면 좋겠다. 그 둘 사이에 끼인’ 무수 한 상호 관계 흐름에 의해 새롭게 구성된 혼종hybrid의 접경지를 일종의 '피지털게界'라고 부를 수 있다.
- 빅데이터 문화가 그저 표준화된 문화산업 질서에 더해 현대 인의 창의적 표현과 자유의 영역을 신장하기만 하는 것은 아니다. 동일한 데이터 기술 원리로 인해서 대중 표현과 제 작의 자유를 거스르는 퇴행의 경향도 커진다. 한쪽에서 대중 의 빅데이터 문화 생산이 늘면서 시민 창의력을 확대하기도 하지만, 한쪽에서는 기업 데이터로 곧바로 흡수되어 플랫폼 운영자의 부를 확대하는 닷컴 산업 질서를 만들어낸다.
첫째, 유튜브 · 페이스북 · 인스타그램 등에서 이용자들 각자 자발적으로 데이터와 문화 콘텐츠를 생산해 업로드하 면서 우리가 '재미'와 '놀이'를 즐기는 듯 보이지만, 이 자발적 문화 '활동'과 결과물은 거의 모두 플랫폼 장치 안으로 흡수되면서 문화나 정보 '노동'으로 포획되고 귀속되는 결과를 초래하고 있다. 즉, 우리 스스로 생산한 데이터 활동에 대한 적정한 보상이 이루어지거나 개별 소유로 남기보다는 주요 플랫폼 업자들의 데이터 분석을 위해 혹은 데이터의 사유화 속으로 흡수되는 과정을 거친다. 가령, 꿀벌과 양봉업자의 비유는 이에 꽤 잘 들어맞는 다. 소셜미디어 플랫폼에서 이용자들은 꿀벌처럼 즐겁게 화수분을 행하면서 부단히 꿀을 모아 꿀통(개인 계정과 스토리라 인)에 담지만, 곧 그 수확물이 양봉업자(플랫폼 사업자)에 의해 포획capture되는 아이러니한 현실 말이다.
둘째, 플랫폼 알고리즘 분석과 취향 예측에 최적화된 문화 소비 주체가 되는 '알고리즘 주체algorithmic subject' 의 탄생은 개별 주체들이 세분화된 문화 선호를 꾀하지만, 정 반대로 심히 우려할 만한 계기도 갖고 있다. 가령, 맞춤형 콘 텐츠를 서비스하는 넷플릭스나 유튜브 등은 이용자 취향을 세분화하고 최적화된 맞춤형 콘텐츠를 제공하면서 세분화 한 문화 취향을 만들어냈지만, 동시에 우리 취향을 한곳에 가두면서 점점 납작하게 만들고 정해진 경로 안에서만 가둘 확률도 높인다.플랫폼 알고리즘 기계는 이용자 활동을 분석해 그들을 유형화하고 그들이 좋아할 만한 것들을 예측해 추천하면서, 각자가 좋아하는 것의 경계 밖 이질적이고 낯설고 타자화된 문화들에 대한 관찰 자체를 각자의 시야에서 아예 처음부터 자동 배제할 공산이 커졌다. 다시 말해, 빅데이터 기술 문화는 이미 존재하는 문화적 선호와 편견을 더 단단히 만드는 반면, 새롭고 이질적인 것들에 대한 대중의 접촉면을 현저 히 낮춘다는 점에서 대단히 문화 보수적이다.
셋째, 일반 시민과 누리꾼의 빅데이터 활동과 생산은 문화 생산과 정보 유통의 혁명적 변화를 가져왔지만, 전통 의 문화산업 노동시장 지형에서 보자면 일반 시민이 비공식 적으로 문화 노동의 최전선에 배치되는 효과를 내고 있기도 하다. 온라인 크리에이터, 큐레이터, 유튜버, 인플루언서 등 수많은 신종 노동자 그룹이 주류 미디어 문화산업에 흡수되거나 그 주변에서 광범위하게 문화산업의 외곽 '예비부대’ 처럼 기능하는 형국이다. 물론 이들 중 아주 극소수만이 경쟁 속에서 주류 시장에 진입하는 반면, 대부분은 플랫폼들에 매달린 채 매일매일 무급의 데이터 생산 문화 노동자들로 전락한다. 그럼에도 현실은 대중의 데이터 활동에서 얻은 닷컴기업들의 수익에 대한 어떠한 적절한 보상책 혹은 사회적 증여가 부재한다.
넷째, 빅데이터 기술 문화는 가짜뉴스의 범람, 즉 진실과 가짜를 구분하기 어려운 혼돈의 시대로 우리를 이끌고 있다. 우리는 빅데이터에 의한 대중 여론 조작이 범람하고 '팩트 체크fact check'가 일상인 불투명한 현실을 앞으로 감내 하며 살아가야 한다. 데이터의 조작과 왜곡은 자연히 진실 값을 뒤흔든다. 가짜는 진실의 존재 여부와 상관없이 진실에 위해危害를 가한다. 가짜가 범람하는 이유이기도 하다. 대 중은 그로부터 진실에 대한 판단을 대부분 유보하고, 데이 터 현실에서 진실을 찾거나 시간을 요하는 진실 찾기 행위 를 쉽게 포기하는 경향이 커질 것이다. 데이터 풍요가 사회 의 새로운 딜레마인 이유다.
- 한 기획사에는 적게는 수백 명에서 많게는 수만 명의 크리에이터가 등록되어 있고, 이들은 보통 내부 연습생 과 정을 거친 후 하루에 보통 10여 시간 방송을 진행하는 전문 크리에이터로 길러진다. 이 신생 크리에이터 양성소들은 기 존 연예기획사의 조직문화와 유사한 문화 노동의 위계 시스 템을 갖추면서 전문직 업종으로 분화하고 있다. 기획사의 배경 없이 인터넷 방송을 행하는 대다수는 자신이 만든 콘텐츠 주목도를 높이기 위해 그 누구도 강제 하지 않는 무보수 노동을 벌이며, 더 많은 '구독' 신청을 받기 위해 수없는 노력을 감내해야 한다. 물질적 보상을 얻지 못하면 대개 관심, 관계, 주목, 인기, 명성 등 정서적 보상과 보답에 자위하는 데 머문다. 물론 간혹 선택된 크리에이터가 만든 콘텐츠 가치와 스타성은 광고와 연동된 클릭과 별풍선 등으로 보상받지만, 그와 같은 금전적 보상이나 명성을 얻어 '스타'의 반열에 오 르는 일은 그야말로 하늘의 별 따기다. 유튜브 유명인의 지 위는 연예기획사에 매인 그 수많은 이름 모를 연습생이 겪는 경쟁과 비애에 견줄 만큼 자기 자신을 혹사해야만 뭇 아마추 어 크리에이터보다 먼저 자신의 기회를 부여잡을 수 있다. 신흥 문화산업 시장은 한 여성 웹툰 작가의 말대로 압정’ 모양과 같은 계층 구조와 닮아간다. 전통적으로 피라미드 계층 구조라고 해서 중산층으로 상징되는 중간이 폭넓게 존재하는 사회구조와 달리, 거꾸로 뒤집어진 압정 구조는 그 중간 허리가 사라진 채 꽤 성공한 아주 소수의 상층 고 소득 유튜버만이 승리감에 도취해 있는 모양새다. 대부분의 유튜버들은 계층 상승의 사다리가 막힌 채 하층 밑바닥에 서 저 멀리 성공의 압정 끝을 욕망하며 하염없이 데이터 활동과 노동을 수행한다. 아마추어 혁신의 대중문화 본산이라할 만한 유튜브 시장은 이렇듯 혹독한 플랫폼 계층 질서를 통해 자본주의 문화산업의 신흥 전장戰場으로 바뀌고 있다.
- 제이넵 투페키Zeynep Tufekci 같은 기술사회학자가 경고했던 바처럼, 유튜브의 알고리즘 편견은 본질적으로 이용자들을 오랜 시간 플랫폼에 붙들어두려는 과잉 욕망으로 유발된다. 투페키는 유튜브가 이용자의 체류 시간을 늘리기 위해 '극단' 의 자극적인 맞춤형 콘텐츠나 '가짜뉴스'를 자주 노출한 다고 주장한다. 전 유튜브 추천 시스템 담당자였다가 해고 된 기욤 샤슬로Guillaume Chaslot가 영국 『가디언』 등 언론에 폭로한 내용에서도 투페키의 주장을 확증한 적이 있다. 유튜브에서 극우 성향 정치 콘텐츠들이 늘 성황이다. 인기 채널은 조회수 200만이 넘고, 보통 유명인은 수십만명의 구독자 수를 자랑한다. 그에 비해 진보 색채의 크리에 이터들의 활동이나 구독률은 저조하다. 실제 취향의 알고리 즘 편견과 무관하다고 주장하는 유튜브 '인기 영상' 코너의 추천에도 '가짜', '혐오’, '막말', 'B급 정서의 콘텐츠들이 자주 보인다. 그런데 극우의 유튜브 팽창 현상은 추천 알고리즘이 극단의 정서를 선호하는 후광 효과 탓일까? 당장 극우의 유튜브 성공을 알고리즘 탓으로 돌리기에는 관련 사회변수도 많고 입증도 어렵다. 안타까운 사실은 구글과 유튜브 등 플랫폼 자본이 운 용하는 알고리즘 추천 방식에 대해 우리가 잘 모른다는 데 있다. 이는 우리에게 '암흑상자(블랙박스)' 같다. 우리 모두 자발적으로 문화 노동을 하고 거기에 콘텐츠를 공급하려는 열정에 비해 이 알고리즘 기계가 어떤 원리로 작동하는지에 대해 너무 무지하고 무감하다. 게다가 이 글로벌 플랫폼이 기술설계에 대한 본원적 문제 제기나 설명 청구조차 쉽지 않은 치외법권 영역에 있 는 점도 문제다. 유튜브 플랫폼이 한국 사회에서 취약한 데 이터 활동과 노동을 흡수하고 절연絶緣된 각자의 취향에 가두는 블랙홀이 되었다면, 하루속히 이 거대한 문화 권력에 알고리즘의 '투명성'과 '책임성'을 강제하는 일이 우선이다.
- 공유경제는 우리 이웃과 친구 와 함께하던 식사, 잠자리, 카풀, 자투리 일손 돕기, 여름 농 촌활동 등 상호부조의 거의 모든 호혜적 가치를 시장 논리 로 흡수하고 있다. 시장과 화폐의 교환 없이도 잘 유지될 수 있었던 일상 문화나 상생의 덕목들을 거의 남김없이 플랫폼 에 예속시키는 일종의 '식신食神 경제에 가까워져간다. 향 후 커뮤니티 공유의 미덕이 오로지 공유경제를 통해서만 이야기되는 우울한 미래를 경계해야 한다.
- 신기술 대세론에서 보면 인간 노동은 어차피 '제4차 산업혁명'이나 인공지능 자동화'라는 당위적 기술 명제 앞에 놓인 처치 곤란한 자원이다. 이런 논리 아래에서는 전통 적 직업의 소멸이나 대량 해고나 기술 실업은 감내해야 할 사회적 진통이자 순리다. 신기술 대세론에는 성장과 발전을 위해 산노동의 일부 희생은 불가피한 것이고, 이를 잘 넘겨 야 새로운 첨단 경제 단계로 도약하고 글로벌 시장에서 생 존할 수 있다는 경쟁 위기의 수사학이 작동한다. 현재 플랫폼 경제 방향이 대세라는 주장은 과거에도 큼지막한 기술혁신을 통해 전통 산업 노동자들의 일자리 저항에 우리 사회가 의연하게 대처했다는 그릇된 유사 경험들 에 기반한다. 기본적으로 이는 신기술을 중립적이고 사회에 좋은 상수값으로 두고, 성장과 발전주의적 미래를 계속해 욕망하는 문제를 안고 있다. 신기술 대세론에서는 과연 우리에게 적정하고 사회적 으로 삶을 풍요롭게 하는 기술의 적용이 무엇이어야 하는지 에 대한 근본 물음을 빠뜨리고 있다. 회복력’과 ‘탈성장' 등 인류 공동선을 향한 과학기술의 재조정이 화두가 되는 오늘 날에, 약탈적인 플랫폼의 논리를 수동적으로 받아들이고 다른 대안의 경로를 아예 찾지 않는 숙명론의 자세는 노예와 같은 무력감처럼 비춰진다.
- 실리콘밸리식 탈노동의 낙관적 미래 전망은 경제학 자 존 메이너드 케인스John Maynard Keynes(1883~1946)에게서 찾아야 할 것이다. 1930년경 케인스는 인류의 기술혁신으 로 인해 그로부터 꼭 100년 후인 2030년이 되면 큰 체제 전 환 없이도 주당 15시간만 일하면서 전 세계 노동자들이 나 름 품위 있는 삶을 누릴 수 있다고 예언했다. 케인스에 이어 미래사회학자 제러미 리프킨Jeremy Rifkin도 1990년대 중반 그만의 용어로 비슷한 '노동의 종말'을 예측했다. 또한 리프킨은 기술의 고도화와 자동화로 야기될 수밖에 없는 기술 실업’의 도래를 언급했다. 그는 사회적 급여'라는 개념을 제시하면서 오늘의 기본소득 논의와 유사하게 미래 탈노동 시대를 준비하자는 주장을 펼쳤다. 케인스나 리프킨의 지적대로라면 누구보다 앞서 꿈꾸 던 자동화의 신세계가 곧 도래할 것 같다. 그런데 우리 주변 을 둘러보자. '화려한 공산주의'라는 말은 합리적 이성을 가 진 이라면 어느 누구도 쉽게 꺼내기 어려운 이상향적 단어 처럼 들린다. 동시대 자본주의는 경기회복과 상관없이 저고용과 불완전고용 상태를 일부러 유지하면서, 안정적 일자리를 만들기보다는 임시직 노동자들에게 첨단 자동화 기계의 뒷일 처리나 보조역을 맡기는 불안한 노동 세계를 만들어내고 있다. 예컨대 실리콘밸리의 자동화 옹호론자들과 달리 미국 시카고대학 에런 베나나프Aatron Benanav는 자동화가 직접적 으로 탈노동을 가져오기보다는, 만성적인 세계 경기침체와 고용지수 악화가 오늘날 탈노동 효과의 근원이라고 주장한 다. 고용 소멸과 불안의 직접적 원인이 자동화 기술이 아 니라 오히려 전 세계 국가들의 장기적인 경기침체에 있다는 베나나프의 시각은 꽤 현실적이다. 기술혁신이 가져오는 노 동의 종말론과 다르게 그보다는 장시간 노동과 과로사회로 집약되는 자본주의 경기침체의 물적 조건이 장기 실업 문제 의 근본 원인이라는 해석이다.
- 미국 언론정보학자 메리 그레이Mary L. Gray의 말처럼, 안정적 고용이 해체되면서 대부분의 인간들은 자동화 장치가 아직 매끄럽게 처리하지 못하는 일의 틈새에서 기계 보조나 비서 역할자인 '고스트 워크(유령 노동)'를 주로 하는 노동인구로 대거 재편될 운명에 처해 있다.23 결국 자동화 논의는 숙명적으로 다가올 '노동 종말의 상상 시나리오로 받아들이기보다는 질적으로 나빠지고 위태로운 기술 예속형 '유령 노동'의 부상을 어떻게 현실주의적으로 대면할지 를 따져 묻는 실천적 입장이 되어야 한다.
- 이탈리아 커먼즈 이론가인 마시모 데 안젤리스Massimo de Angelis는 우리의 온라인 활동과 탄소 배출의 밀접한 유기 적 성격을 다음과 같은 몇 가지 예를 들어 설명한다. 가령 누군가 컴퓨터 앞에 앉아 구글 검색을 한다고 치면 5~10그램이 인터넷 브라우징을 하면 초당 20밀리그램의 탄소 배출을 초래한다. 단 몇 분 정도밖에 걸리지 않는 인터넷 검색에 소모되는 전력량은 보통 주전자 물을 끓이는 데 투여되는 에 너지와 맞먹는다. 한때 서구인들의 관심을 크게 받았던 '세컨드 라이프Second Life' 같은 가상현실 게임은 누군가 하나 의 아바타를 유지하려면 매년 1,752 킬로와트시kWh 전력량을 소모한다. 이는 약 1.7톤의 탄소 배출량에 해당하고, SUV자동차에 견줘볼 때 서울과 부산을 거의 5번 왕복 주행한 양과 같다.
- 미국 IT 연구·자문 업체 가트너의 조사에 따르면, 휴 대전화와 컴퓨터 등 첨단산업이 만들어내는 지구온난화 효과는 전 세계 이산화탄소 방출의 적어도 2퍼센트에 이른다. 이것도 10여 년 전 통계치임을 감안해야 한다. 가장 최근인공지능 나우연구소AI Now Institute 자료에 따르면, 이들 닷컴기업의 지구 온실가스 효과가 2020년 거의 2배인 4퍼 센트 수준에 이르고, 다른 개선이 없다면 2040년에는 14퍼 센트 수준까지 오를 것으로 내다보고 있다. 쉽게 비유하면, 현재 닷컴기업들의 화석 원료 소모 수준은 매년 전 세계 항공기들이 운행 중 방사하는 대기가스 배출량에 맞먹는다. 무엇보다 닷컴업계가 유지하는 전 세계 데이터센터와 첨단 통신 인프라 장비의 냉각장치 가동을 위한 에너지 소모는 이보다 광범위하고 심각하다. 닷컴기업 탄소 배출량의 70퍼센트 정도가 이들 거대 데이터센터에서 발생하고 있고, 이것의 지구 온실가스 효과 영향력이 점점 증가하는 추세다.
- 문제는 코로나19와 같은 미생물 전염 바이러스의 전 파 주기나 양상이 더 잦아지고 영향이 갈수록 파국적이라 는 데 있다. 현재진행형의 코로나19를 비롯해 2003년 사스, 2009년 신종플루, 2015년 메르스 등만을 보더라도 불과 십 수 년 사이 우리는 바이러스 감염병의 쓰나미를 제대로 맛보고 있다. 전 지구적 감염병 위기는 자본주의의 무차별한 자연 개발, 생명과 환경 파괴, 공장식 가축 농장의 비윤리적사육 방식, 야생동물 식용 거래 등에 기인한 바 크다. 직접적 원인이 정확히 밝혀지지 않았으나, 많은 전문가는 코로나19를 인간의 생태 교란과 동물 서식지 파괴로 인간과 동물 사이 접촉면이 늘어 생긴 '인수공통감염병'의 일종으로 보고 있다. 즉, 자연 파괴로 인해 야생동물 개체수가 줄어들면서 바이러스 스스로 인간과의 밀집 환경 속에 적응해 자가 변이를 일으키고 인간을 새롭게 숙주로 삼고있다는 관측이 일반적이다.
- 미국 전 노동부 장관인 로버트 라이시Robert Reich가 코로나19로 새롭게 분화된 노동계급 질서를 언급한 것처럼, 비대면의 '원격근무 가능한 노동자The Remotes'라는 선택받은 엘리트 지위에 있지 않다면 우리 대부분은 비대면 소비 시장을 위해 감염에 노출된 '필수 현장 노동자The Essentials가 되어야 생존이 가능하다. 아니면 '해고나 휴직 중의 노동자The Unpaid 이거나 감염병 대처가 거의 불가능한 이주노동자와 난민 등 '잊힌 자The Forgotten’ 가운데 하나의 신분을 선택해야 한다. 코로나19 국면에서 전 세계적으로 파산한 수많은 자영업자와 해고된 노동자는 이 하위 세 계급으로 대거 편입 되고 있다. 당장 단기 노동 수요가 큰 유령 노동자 대열에 대 부분 합류할 공산이 크다. 아마존의 임시직 고용 상황은 이를 말해준다. 많은 기업은 노동 가치를 헐값으로 매길 수 있 어 자동화 대체 기회비용을 신중히 따질 것이다. 자동화 대 체 효과보다 값싼 노동력이 풍부하게 존재하는 감염 재난 시기 노동시장으로 인해 언제든 가능하면 산노동을 동원할 것이고, 비대면 접객이 필수가 된 소비시장에서는 선별적으로 자동화 기계의 대체 효과를 보려고 할 것이다. 그렇게 자 동화의 속도는 노동 대체 효과와 비대면 감염사회의 조건에 따라 차별적 · 선택적으로 스며들 것이다. 코로나19 이전에 많은 사람이 우려했던 산노동과 자동화 로봇 사이 대립이나 대체 전망과 달리 이제는 좀더 유 령 노동과 자동화 로봇의 보완적 결합을 꾀하며 노동비용을 줄이고 노동 강도를 극대화하려는 기업 현실을 주목할 필요 가 있다. 기업들은 값싼 노동 인력을 활용하면서도 대면 접 촉을 우회하는 자동화 로봇의 소비시장 도입을 도모하는, 이른바 산노동과 자동화 기계의 절충주의적 노동시장을 구성할 확률이 높아졌다.
- 탈진실, 초현실, 필터 버블의 3중 효과는 모든 역사적 · 진보적·사회적인 가치의 자명한 질서를 불완전하고 비결정적인 지위로 만들어버린다. 우리가 알고 지내던 명징한 듯 보이 는 실재가 저 멀리 달아나는 것이다. 그러다 보니 오늘날 상징 권력은 특정의 가치와 담론을 앞에 내세워 자명한 질서 로 억지 강요하기보다는 혼돈 속 여럿 가짜를 기술적 알고리즘으로 자동 생성하거나 댓글 알바부대를 고용해 만든 가짜더미 속에 진실의 가치를 뒤섞는 데 골몰한다. 이와 같은 거짓과 허구는 진실처럼 군림하지만, 실제 어떠한 소통도 행하지 못하면서 계속해 우리가 시도하려는 현실의 비판적 인식을 방해한다. 탈진실의 가짜뉴스 시대에는 어찌 보면 가짜 정보와 노이즈를 대거 발산하는 쪽에 승산이 있다. 이를테면, 누군가에 대한 흑색선전이 법리적으로 '근거 없다'는 법적 판단에도 비상식적으로 비방과 악플이 계속해 진행되는 것은 이와 같은 연유에서다. 결국 데이터 과잉과 가짜 정보의 질서 는 특정의 사안에 대한 진실이 저 멀리 사라지고 수많은 다 른 가짜 해석을 대중들에게 노출시키면서, 어떤 사안에 대 해 우리 스스로 사색하고 인지하는 것을 불안정하고 어렵게 만드는 데 그 목적을 지닌다.
- 커먼즈라는 말의 어원은 '함께com- 의무를 진다.munis' 는 뜻이 합쳐 이룬 말로, 풀어보면 공동의 의무를 지닌 구성원들이 유지하는 유무형 공동 자원의 자율생산 조직체라 볼 수 있다. 즉, 커먼즈는 그 어원에서 알 수 있는 것처럼, 단 순히 원시의 물리적 장소 혹은 텅 빈 데이터 공간이라기보 다는 이미 그곳에 특정의 사회관계가 존재하고 그것의 이용 을 조직하는 구성원 공동체의 '권리' 개념이 굳게 터잡고 있다고 볼 수 있다. 보통 커먼즈 운영에는 한 사람 이상이 참 여해 협력과 유대를 맺고 공동 자산이나 유무형 자원을 함 께 일구기 위해 내규內規를 만들고 지속가능한 가치를 끌어내려고 한다. 무엇보다 오늘날 커먼즈 운동은 기업私有과 정부公有에 의존하던 자원 관리나 경영 방식을 벗어나 시민 자치의 협동적 자원 관리共有 방식을 선호한다. 물론 여기서 '공유(커 머닝)'는 오늘날 공유경제의 '공유(셰어링)’, 즉 플랫폼 자원의 기능적 중개와 효율 논리와 다르다. 이는 특정 자원을 매개한 구성원들 사이 공동 이익을 도모하는 새로운 호혜적 관계의 생성에 방점이 있다. 다시 말해 ‘커머닝commoning'은 자본주의적 자원 수탈과 승자독식 논리를 지양하고, 시민들 이 유무형 자원들을 그들의 직접적 통제 아래 두고 이를 공 동 관리하며 다른 삶의 가치를 확산하는 과정에 해당한다.따져보면, 커먼즈는 이미 인류 역사와 함께했다. 가령, 숲, 토지, 수로, 어장 등의 자원을 관리하는 전통 마을이나 부족 공동체 문화가 그것이다. 이들 대부분은 자본주의 시 장 바깥에서 주류 사회의 흐름에 그다지 영향을 미치지 못 하면서 외딴 섬처럼 고립되어 있다는 약점을 지녔다. 그렇 지만 전통 커먼즈는 고유의 환경 자원에 기초해 지구 생태 규칙을 지키기 위해 노력했다. 반면 오늘날 커먼즈 운동은 지역에 뿌리를 내리지만 전 지구적으로 더불어 같이하는 공생과 호혜성의 가치를 외부로 확장하는 능력과 상호 결속력 이 뛰어나다. 많은 부분 인터넷과 플랫폼 혁신 덕분이다.문제는 그동안 우리 사회가 플랫폼 도입을 심각한 성 찰 없이 이를 '혁신'이니 '공유'니 하며 포장해오면서 실상 조직 설계 원리로서 ‘커먼즈'의 실질적 내용을 망각해온 데 있다. 그래서일까, 플랫폼 기술은 현실에서 온전히 사회 포용적 기능을 발휘하지 못하고 인간 노동을 속박하는 불완전 한 기계장치로 쓰이고 있다. 무엇보다 시장 기능주의적으로 설계된 자본주의 플랫 폼에는 커먼즈적 상생과 호혜의 가치가 들어설 여지가 없었 다. 플랫폼 기술설계에 자본 욕망이 우위에 서고 도구적 합 리성이 압도하면서, 다른 대안의 설계 가능성이 일시적으로 닫히고 막히게 되었다. 하지만 플랫폼은 언제든 우리의 필 요에 의해 또 다른 경로 설정이 가능하다는 사실을 상기할 필요가 있다.

 

'IT' 카테고리의 다른 글

괴물신입 인공지능  (0) 2020.11.19
잡스의 기준  (0) 2020.11.03
타겟티드  (0) 2020.10.18
은밀한 설계자들  (0) 2020.09.07
AI 시대 내 일의 내일  (0) 2020.07.30
Posted by dalai
,

타겟티드

IT 2020. 10. 18. 20:07

- 우리는 개인 정보 자체를 돈을 주고 구매하는 방식으로 모든 미국인에 대한 개인 정보를 수집했다. 우리는 익스피리언Experian, 액시엄Axiom, 인포그 룹Infogroup 등 가능한 모든 업체로부터 미국인들의 재정 상태, 어디에서 물건을 사는지, 얼마를 주고 사는지, 휴가를 어디로 떠나는지, 어떤 것을 읽었는지에 관한 데이터를 사들였다. 우리는 이런 데이터를 그들의 정치적 정보(공개적으로 파악되는 투표 습관)와 비교한 뒤 다시 이 데이터를 그들의 페이스북 데이터(무엇에 '좋아요'를 눌렀는지)와 맞춰보았다. 페이스북 한 곳에서만 우리 는 사용자들에 대한 570여 개의 데이터 포인트를 얻어냈다. 그리 고 이런 정보를 종합해 우리는 약 2억 4000만 명에 달하는 18세 이상의 모든 미국인에 관한 5000개가량의 데이터 포인트를 보유하게 되었다. 테일러는 이 데이터베이스의 특장점은 페이스북을 활용해 메시지를 전할 수 있다는 점이라고 말했다. 엄청난 데이터를 수집 했던 바로 그 플랫폼 사용자들에게 접근하기 위해 우리는 페이스북을 다시 이용했다.
- 미국이나 다른 모든 국가의 법률 체계에서 자기 결정권이 있는 성인을 대리하여 동의를 표명하는 것은 불법이다. 페이스북은 그래프 API를 활용해 많은 돈을 벌었다. 그리고 케임브리지 애널리티카를 포함해 4000명 이상의 개발자들은 그래프 API의 허점을 이용해 순진한 페이스북 사용자들에 대한 데이터를 수집할 수 있었다. 케임브리지 애널리티카는 항상 새로운 데이터를 수집하고 있었고 특정 시점에 사람들이 무엇에 관심을 기울이는지에 관한 데이터를 최 신 상태로 유지했다. 케임브리지 애널리티카는 날마다 미국인들에 대한 데이터를 점점 더 많이 구매하는 방식으로 데이터 세트를 보완했다. 미국인들이 '네'를 클릭하고 쿠키를 수용하거나 어떤 웹사이트에서 서비스 이용약관에 대한 동의를 누르면서 페이스북뿐 아니라 서드파티 앱들에도 개인정보를 무료로 제공한 덕분이었다. 케임브리지 애널리티카는 익스피리언 같은 기업들로부터 최신 데이터를 사들였다. 익스피리언은 사람들의 모든 활동 및 구매 이력을 통해 미국인들의 디지털 생활을 추적했다. 표면적으로는 신용 점수를 제공하기 위한 것이라고 하지만, 그 정보를 팔아 수익을 얻기 위해 가능한 한 많은 개인 정보를 수집했다. 액시엄, 마젤란, L2 Labels and Lists 등 다른 데이터 중개업자들도 똑같은 방식으로 정보를 판매했다.
- 케임브리지 애널리티카의 5단계 접근법
케임브리지의 5단계 접근법을 가능하게 한 것이 바로 이 오션 점수다. 첫째로, 케임브리지 애널리티카는 정보를 지닌 모든 사람들을 다른 어떤 홍보 회사보다 훨씬 정교하게 세분화할 수 있었다. 물론 다른 홍보 회사들도 성·인종 등 기본적인 인구학적 특성 외의 것으로 사람들을 세분화할 수 있다. 하지만 이런 회사들은 정당에 대한 친밀감이나 이슈에 대한 선호도 등 더 높은 수준의 특성을 알아볼 때 조악한 여론조사를 이용했다. 반면 케임브리지 애널리티카의 오 션 점수는 훨씬 더 미묘한 차이를 구별했기 때문에 각각의 사람들 이 정확히 어느 위치에 있는지 알 수 있었다. 케임브리지 애널리티카는 모두 32개의 유형으로 사람들을 구분 했다. 어떤 이의 개방성 점수는 그 사람이 새로운 경험을 즐기는지 아니면 전통을 중시하고 의지하는지를 알려준다. 성실성 점수는 개인이 즉흥적인 것과 계획적인 것 중 무엇을 더 선호하는지에 대한 지표이다. 외향성 점수는 어느 수준까지 다른 사람들과 관계 맺고 공동체의 일부가 될 수 있는지를 나타낸다. 타인에 대한 동의 성향은 개인이 자신의 필요보다 남의 요구를 더 중요하게 생각하는지 그렇지 않은지에 대한 지표를 제공한다. 그리고 신경과민 성향은 결정을 내릴 때 그 사람이 두려움에 의해 좌우될 가능성이 어느 정 도인지를 나타낸다. 케임브리지 애널리티카는 사람들을 분류한 다양한 하위 범주에 따라 그들이 이미 관심을 보인 문제들(예를 들면 페이스북의 '좋아요' 처럼)을 추가해 보완하는 방식으로 각각의 개별 집단을 훨씬 더 세 밀하게 분류했다. 예를 들면 메이시 백화점에서 쇼핑하는 34세의 백인 여성 두 명이 동일한 특성을 가지고 있다고 보는 것은 너무나도 단순한 접근법이다. 이런 단순한 접근법 대신 케임브리지 애널리티카의 데이터 과학자들은 사이코그래픽스 분석에 여성들의 라이프스타일 데이터, 투표 기록, 페이스북의 '좋아요' 기록, 신용 점 수 등 다른 모든 데이터를 추가하여 각각의 여성을 완전히 다른 성 향으로 구분할 수 있었다. 비슷해 보이는 사람들이 반드시 똑같은 성향을 가진 것은 아니니, 이들에게 동일한 메시지를 보내서는 안된다. 이런 개념은 케임브리지 애널리티카가 정치 홍보 분야에 등 장했을 당시 광고업계에서는 이미 널리 퍼져 있었지만, 대부분의 정치 자문가들은 이런 일을 어떻게 할 수 있는지 또는 심지어 이런 일이 가능한지조차 모르고 있었다. 케임브리지 애널리티카의 방식 은 정치 홍보계의 새로운 발견이자 승리의 수단이었다.
두 번째로 케임브리지 애널리티카는 정치 분야 및 기업 고객들 에게 '예측 알고리즘의 정확성'이라는 차별적인 혜택을 제공했다. 테일러 박사와 질레트 박사 그리고 케임브리지 애널리티카의 다른 데이터 과학자들은 지속적으로 새로운 알고리즘을 운영하면서 단 순한 사이코그래픽스 점수를 넘어 더 많은 것들을 개발했다. 이들 은 모든 미국인에게 점수를 매겼다. 예를 들면 개개인이 투표할 확 률은 얼마인지, 특정 정당에 속할 가능성은 어느 정도인지, 어떤 치 약을 좋아할 것 같은지에 관한 예측 점수를 0점에서 100점 사이로 매길 수 있었다. 케임브리지 애널리티카는 당신이 빨간 버튼 또는 파란 버튼을 클릭할 때(빨강은 공화당, 파랑은 민주당을 상징하는 색이다.) 어느 편이 기부할 가능성이 높은지, 환경 정책과 총기 소유권 가운데 어느 것을 더 듣고 싶어 할 가능성이 높은지도 알았다. 예측 점수를 통해 사람들을 다양한 집단으로 분류한 뒤 케임브리지 애널리티카는 많은 시간을 들여 '오디언스audiences'라고 불리는 사용자 집단을 반복적으로 검증하면서 정확도가 95퍼센트에 이 를 때까지 정교하게 다듬었다.
셋째, 케임브리지 애널리티카는 이런 알고리즘을 통해 배운 것을 트위터, 페이스북, 판도라(음악 스트리밍 서비스), 유튜브 등의 플랫폼 에 적용해 사람들이 어디에서 가장 많은 시간을 보내는지를 알아냈 다. 그렇다면 사람들에게 접근하기 가장 좋은 곳은 어디였을까? 우 편함으로 전달되는 종이 우편물처럼 실체가 있는 어떤 것이거나 텔 레비전 광고 또는 개인의 구글 검색 엔진 상단에 나타나는 광고가 될 수도 있다. 케임브리지 애널리티카는 구글로부터 검색어 목록을 구매해, 사용자들이 그 목록에 있는 검색어를 입력할 때 그들에게 접근할 수 있었다. 핵심 검색어를 입력할 때마다 사용자들은 자신 에게 맞추어 특별 제작된 광고나 기사에 노출됐다.
네 번째는 케임브리지 애널리티카를 다른 경쟁 업체나 전 세계 의 어느 정치 자문 회사보다 뛰어나게 만드는 단계이다. 케임브리지 애널리티카는 자체적으로 특별히 개발한 고객 응대 프로그램 을 통해 타겟 대상에 접근하고 그 효과를 검증했다. 방문 선거 운동 원과 은행의 전화 상담원을 위해 개발된 여론조사 프로그램인 '리폰Ripon’은 프로그램 사용자들이 유권자의 집을 방문하거나 전화를 걸 때 유권자의 데이터에 직접 접근할 수 있도록 했다. 데이터 시각화 툴도 유권자들이 현관문을 열거나 전화기를 들기 전에 선거 운동원들이 어떤 전략을 활용해야 하는지를 결정하는 데 도움을 주었다.
그리고 마지막 다섯 번째 단계는 '행동 기반 마이크로타겟팅' 전략이다. 선거 운동 때 케임브리지 애널리티카 직원들이 만든 동영상, 오디오, 인쇄 광고에 이르는 모든 콘텐츠는 마이크로타겟팅을 통해 확인된 타겟에게 전달됐다. 우리는 콘텐츠를 지속적으로 수정 하는 자동화 시스템을 이용해 어떻게 하면 사람들이 콘텐츠에 의미 있는 관심을 갖도록 만들 수 있는지 파악했다. 한 사람이 광고를 클 릭하고 행동하기까지 다양한 소셜미디어를 통해 광고가 30차례 전송되었으며, 그동안 광고가 20~30번 정도 바뀌었다. 이 말은, 같은 광고를 30번 노출한다 하더라도 매번 다른 형태의 광고로 변형할 수 있다는 이야기다. 이런 지식 덕분에 새로운 콘텐츠를 만드는 제 작 팀은 케임브리지 애널리티카가 동일한 사람에게 그다음 번에 무 엇인가를 전송할 때 어떻게 접근해야 하는지를 알았다.
- 미국에서 인터넷 사용자들은 제한 없이 데이터 수집을 허용하는 법 때문에 자동으로 데이터 수집에 동의 하도록 돼 있다. 미국은 프랑스나 영국처럼 개인 정보 보호 장치를 거의 갖추지 않았다. 이것의 의미는 명백했다. 미국인들에게는 유 럽 사람들 같은 심리적 부담이 없다는 것이었다. 프랑스 사람들이 독일과 다른 서유럽 사람들처럼 개인 정보의 사용에 극히 민감하 게 반응하는 것은 충분히 이해할 만했다. 법은 사람들의 동의를 받 고 데이터를 사용하도록 허용했지만 잘못된 데이터 사용의 선례들 은 끔찍한 결과를 초래했다. 나치는 유대인과 집시, 장애인과 동성 애자들에 대한 데이터를 수집해 잔인할 정도로 효율적인 홀로코스트 정책을 실행했다. 제2차 세계대전의 여파와 디지털 시대의 영향 으로, 유럽 의원들은 과거의 참사와 유사한 일이 다시 일어나지 않 도록 데이터 법을 매우 엄격하게 만들었다.
- 예전에는 페이스북에 유료 광고가 없었다. 그 당시 아무도 페이스북 으로 수익을 얻는 방법을 생각해내지 못했으므로, 페이스북이 지속발전 가능한 비즈니스 모델이 될 수 있는가에 관해 공개적으로 여 러 논쟁이 벌어졌다. '좋아요' 버튼으로 사용자들은 각자의 팔로워 에 관한 기본적인 정보를 수집할 수 있었는데, 페이스북이 얻은 것 은 그 이상이었다. 페이스북은 개별 사용자의 '좋아요'에서 수십만 건의 새로운 데이터 포인트를 얻었다. 이것은 페이스북이 수집할 수 있고 실제로 돈으로 만들 수 있는 정보였다. 2007년 페이스북은 악의 없어 보이는 따뜻한 공간이었고 위안을 주는 내용이 올라왔다. 사람들은 페이스북을 통해 친구 관계를 맺 었다. 페이스북이 사용자들의 화났음', '슬픔', '충격받았음’을 표현하는 이모티콘을 도입하기 전이어서 게시물에 대해 '싫어요.dislike' 표시를 할 방법은 없었다. 구글이 “정보에 관한 것이었다면 (...) 페이스북은 사람들과 연결하는 것이 전부였다. 이제 선거 운동 기간 이 되자 페이스북을 통해 오바마는 혐오 발언까지 받았고, 그 내용 이 아무리 충격적이더라도 우리는 사례별로 그때마다 대응할 수밖 에 없었다. 아직 부적절한 행동이나 언어를 감지하거나 댓글 쓰는 사람을 자동으로 차단하는 알고리즘이 없었기 때문이다. 오바마 상원의원의 페이스북 페이지에서 벌어진 몇 가지 일이 아직도 기억난다. 오바마 상원의원은 네거티브 전략을 거부하고 자신에 관한 독설과 인종차별 행위에 대해 다른 쪽 뺨을 내주는 자애로움을 지녔다는 사실을 나는 생생하게 기억한다. 우리는 교대로 오바마 상원의원에 대한 협박과 위협을 수집해 FBI에 신고했다.
- 케임브리지 애널리티카가 페이스북을 활용하기 시작한 2014년 중반 페이스북은 훨씬 더 혁신적인 툴들을 활용했다. 페이스북 광고 툴의 정확성은 2012년보다 크게 향상됐다. 광고를 위해 페이스북을 이용하는 방법은 두 가지가 있었다. 2015년 4월 이전에는 서드파티 앱 개발자들에게 비용을 지불한 뒤 페이스북 데이터를 얻어 접속 중인 페이스북 사용자들에게 광고할 수 있었다. 그리고 이를 통해 그 어느 때보다 사용자들에게 더 많은 것을 알릴 수 있었 다. 아니면 기업이 자체 데이터를 활용해 훨씬 혁신적인 무엇인가 를 할 수 있었다. 기업이 보유한 데이터 세트에서 광고 대상으로 삼 고 싶은 사람들을 선택한 다음, 페이스북에 돈을 지불하고 유사한 사람들을 검색해 찾아내는 것이다. 그러면 페이스북은 1만 명(또는 10만 명 또는 심지어 100만 명)의 유사한 사람들을 찾아주고, 기업은 페이스북 플랫폼을 통해 그들에게 직접 광고를 전송한다. 그래프 API의 폐쇄는 다음과 같은 의미였다. 이제 페이스북을 제 외한 어느 누구도 페이스북의 데이터로 수익 사업을 할 수 없다, 그래프 API에 접근할 수 없으니 이제 개발자들은 사용자들에게 접근 하기 위해 페이스북의 광고 툴을 사용해야 한다, 페이스북의 어떤 데이터도 더 이상 외부의 데이터 모델 개발에 사용될 수 없다. 세계 대부분의 사람들은 이렇게 생각했다. 2015년 말 가디언의 기사가 케임브리지 애널리티카와 테드 크루즈의 선거 운동을 뒤흔들었을 때 페이스북은 여전히 건재했고 모든 사용자의 데이터를 완전하게 통제하고 있다고 주장했다. 페이스북 개인 정보 보호 문제의 최대 쟁점이던 그래프 API가 4월 말 폐쇄됐으니, 이제 데이터 보안은 염려하지 않아도 된다고 말이다. 어느 누구도 알렉산드르 코건과 케임브리지 애널리티카를 비난한 것 처럼 페이스북을 비난하지 않았다. 페이스북은 세계 최고의 광고플랫폼이 되었다. 페이스북이 안전하지 않다거나 사용자들의 사생활이 침해받더라도 비난의 손길은 다른 방향을 가리킬 것이다.
- 모두가 선거 업무에 착수하면 트럼프 선거 캠프는 소셜미디어에 엄청난 돈을 쓸 것이 분명했다. 실제로 당선 이후 집계를 보면 트럼 프 캠프가 소셜미디어에 쓴 총금액은 역대적으로도 상당했다. 케임브리지 애널리티카를 통해서만 디지털 광고에 1억 달러를 지출했고, 그중 대부분이 페이스북 광고에 쓰였다. 그뿐만 아니라 다른 소셜미디어 플랫폼이 제공하는 더 높은 수준의 서비스에도 막대한 비용이 들어갔다. 소셜미디어 기업들은 종종 선거 운동에 도움이 될 새로운 툴과 서비스를 우리에게 소개했고, 새로운 기술뿐 아니라 운영 인력도 제공 했다. 페이스북, 구글, 트위터 등의 회사에서 직원이 파견되었다. (페 이스북은 트럼프 선거 운동과 관련된 이런 업무를 “부가적인 고객 서비스”라 고 불렀다. 구글은 트럼프 선거 운동에 “자문 역할”을 제공했다고 말했고 트 위터는 “무료 노동”이라고 불렀다.) 트럼프 선거 팀은 이런 도움을 두 손 들어 환영했지만 클린턴 캠프는 어떤 이유에서인지 페이스북으 로부터 이런 종류의 도움을 받지 않기로 결정했다. 트럼프 캠프는 페이스북으로부터 고도로 숙련된 인력을 오랫동안 지원받으면서 쉽게 계량화할 수 없는 엄청난 혜택을 누렸다. 페이스북에서 지원 나온 사람들은 선거 운동 관련자들과 케임브리지 애널리티카 직원들에게 '유사 타겟look-alikes'을 수집하고 맞춤 타겟custom audience'을 만드는 방법을 가르쳐주었다. 특정한 사람들 만이 볼 수 있는 콘텐츠인 이른바 '암흑 광고dark ads'를 제작하는 방법도 알려주었다. 이런 현장 지원을 통해 트럼프 선거 캠프는 새로운 툴과 기능들을 출시와 동시에 최대한 활용할 수 있었다. 트위터는 '대화형 광고Conversational Ads'라는 새로운 상품을 만들 었다. 이 광고는 광고주가 제안한 여러 개의 해시태그 리스트를 보 여주는데, 해시태그를 클릭하면 해시태그는 물론 광고도 자동으로 리트윗됐다. 이 때문에 트럼프 선거 캠프의 트윗이 리트윗되는 수가 힐러리를 확실하게 압도하는 경향을 보였다. 스냅챗Snapchat도 '웹뷰 광고WebView Ads'를 통해 새로운 기능을 강화했다. 이는 사용 자들에게 선거 운동의 지지자로 등록해달라고 요청함으로써 데이 터를 수집하는 기능을 포함하고 있었다. 트럼프 캠프는 이를 통해 지속적으로 데이터를 수집하고 타겟 유권자를 늘려갔다. 스냅챗은 거의 종일을 온라인에서 보내는 젊은이들을 겨냥한 '직접 반응Direct Response 이라는 새로운 저가 상품을 소개했다. 사진을 위쪽으로 밀 어 올리면 사용자의 이메일 주소를 입력하는 화면으로 연결되며, 이용약관상 발생하는 데이터를 모두 제공하도록 돼 있었다. 스냅챗의 웹뷰 광고와 필터도(예컨대 힐러리와 함께 감방에 갇힌 셀카 사진 필터) 큰 도움이 되었다. 구글의 공화당 팀은 사용자들이 구글을 검색했을 때 처음 노출되 는 결과를 통제하기 위해 많은 광고비를 지출했다. 사용자들의 첫 인상'을 통제하기 위한 전략이었다. 구글 키워드구매 전략은 효과가 놀라웠다. 사용자가 '트럼프' 이라크 전쟁'을 검색하면 첫 번째 검색 결과에 “거짓말쟁이 힐러리 이라크 전쟁에 찬성 투표, 잘못된 판단”이라는 배너가 있는 슈퍼 팩 링크와 함께 “힐러리 이라크 전쟁에 찬성 투표, 도널드 트럼프는 반대”가 나타났다. 사용자가 '힐러리'와 '거래'라는 검색어를 입력하면 '사기꾼 힐러리lying-crookedhillary.com 웹사이트가 최상단에 노출됐다. 우리가 유도한 검색 결과를 클릭해 열어보는 비율도 놀 라울 정도로 높았다. 구글은 매일 트럼프 선거 캠프에 키워드 목록을 판매했고 인기 있는 유튜브 채널에 언제 새로운 독점 광고를 게재할 수 있는지 알려주었다. 구글은 트럼프 선거 캠프에 검색어 활 용 시스템을 팔아 새로 유입된 지지자들이 무더기로 투표에 나서는 데 톡톡히 기여했다.
- 콘텐츠의 정교함과 방법까지 똑같지는 않았지만 AIQ의 디지털선거 운동은 케임브리지 애널리티카와 유사한 점이 상당히 많았다. 나중에 AIQ의 제안서가 유출됐는데, 케임브리지 애널리티카에서 근무했던 크리스 와일리 Chris Wylie가 우리 제안서를 거의 그대로 베낀 것으로 드러났다. AIQ의 전략은 포커스 그룹, 사이코그래픽스 모델링, 예측 알고리즘을 활용했고 온라인 퀴즈와 다양한 경연을 통해 개인 사용자들의 데이터를 수집했다. 이 모든 것은 사용자들 의 참여 동의를 받았으므로 완벽하게 합법적이었다. 브렉시트 투표 를 위해 보트리브는 사용자 데이터를 영국 유권자들의 기록과 대 조한 다음 인터넷을 통해 유포하고, 국민을 선동하기 위해 타겟 메 시지를 활용했다. 10주에 걸친 치열한 선거 운동은 온라인에서 벌 어지는 역겨운 현상을 현실 세계에도 그대로 보여주었다. 보트리 브는 유럽연합에 가입하려 협상 중인 터키 등의 국가들에 대한 거짓 정보와 가짜 뉴스를 전달했다. 이들의 광고는 유럽연합 잔류에 찬성표를 던지면 영국의 국민건강보험 제도를 고갈시키리라는 암 시를 전달함으로써 부동층 유권자들을 자극했다. 정부의 복지 정책 자금 조달에 대한 불안감을 조성하고 국경으로 몰려드는 불법 이민자들과 테러리스트들의 이미지를 내세우는 등 두려움을 조장했다.
- 트럼프 캠프 팀은 서베이몽크Survey Monk 같은 전화 및 인터넷 여 론조사 기관을 활용했다. 힐러리는 아홉 개 주에서만 여론조사를 실시했지만 우리 팀은 열여섯 개의 경합 주에서 실시했다. 그런 다 음 사람들을 트럼프 지지자와 힐러리 지지자로 양분하고 이들을 여 러 집단으로 세분했다. 첫 번째 트럼프 지지 집단은 자원봉사자'와 기부자' 그리고 집회 참가자가 될 수 있는 '핵심 트럼프 유권자' 였 다. 투표할 의지가 있지만 투표하는 것을 잊을 수도 있는 사람들은 투표 독려 집단'으로 불렸다. 트럼프 캠프 팀은 투표 독려 집단이 관심 있어 하는 쟁점에 초점을 맞춰 이들이 확실하게 투표하도록 만들 계획이었다. 그러고도 자금이 남으면 '비관여 트럼프 지지자' 에게 돈을 썼다. 힐러리 지지자들 가운데는 핵심 유권자로 분류된 사람들이 있었고 투표를 하지 말라고 설득할 경우 투표소에 나가지 않을 가능성이 있는 '투표 저지' 집단이 있었다. 트럼프 선거 캠프가 투표 방해 전략을 펼치는 동안 “사기꾼 힐러리를 타도하자"라는 목표를 내세운 슈퍼 팩은 투표 저지 집단에 초점을 맞추었다. 나는 과거에 정부와 영향력 있는 인물들이 권력을 유지하기 위해 사회 운동이나 생각의 자유, 유권자를 억압하는 것을 목격했다. 미 국에서 유권자 억압 전략은 불법이었다. 나는 트럼프 선거 캠프가 비방전과 유권자 억압을 어떻게 구분해 구사했는지 궁금했다. 일반 적으로 둘 사이에는 명백한 차이가 있지만 디지털 시대에는 어떤 일을 했는지 추적하기가 어렵다. 정부는 이제 시위를 멈추기 위해 거리에 경찰과 군대를 보낼 필요가 없다. 그 대신 사람들 손에 있는 작은 화면에 타겟 메시지를 보내는 간단한 방법으로 사람들의 생각을 바꿀 수 있었다. 그래서 프로젝트 알라모가 트럼프 선거 전략의 핵심이었고, 이를 진행시키기 위해 캠프 팀이 밤낮으로 일했다. 그 들은 최대한 오류 없는 데이터베이스를 구축하기 위해 데이터 중개상들로부터 더 많은 소셜미디어 데이터를 사들였다. 트럼프 캠프 팀은 이 모든 데이터를 어디에서 가져왔는지 얼버무렸지만, 나는 모든 데이터를 정당하게 얻은 것이라고 믿고 싶었다. 마침내 모든 데이터를 한 곳으로 가져온 뒤 데이터 모델링 과정이 시작됐다. 먼저 '기부 성향'과 같은 예측 가능한 행동을 기반으로 지지자들의 성격을 분석해 모델링했다. 이를 통해 첫 번째 프로 그램에서 트럼프 캠프의 디지털 선거 전략은 비약적으로 발전했다. 트럼프 선거 캠프는 첫 달에만 온라인으로 2400만 달러를 모금했고, 대통령 선거일까지 계속해서 매달 비슷한 금액을 거둬들였다. 두 번째 프로그램에서 트럼프 캠프 팀은 경합 주의 설득 가능한 유권자들을 세밀하게 분류하기 위해 다양한 데이터 모델을 활용했다. 샌안토니오에 있는 팀은 미국의 실리콘밸리와 그 밖에 있는 핵심 기술 기업, 데이터 중개상들과 공생 관계'를 구축했다. 샌안토니오 팀은 데이터베이스에 포함된 모든 주, 카운티, 시, 동네, 개인들을 각각의 중요한 이슈들로 세분했다. 이런 정보를 바탕으로 트럼프의 출장 일정, 집회 목표, 유세 현장에서 전달할 메시지 등 계획을 수립하는 일을 도왔다. 그들은 또 특정 성향의 대중이 모인 상태를 지도 에 색상의 농도로 표시해 보여주는 '히트 맵heat map'을 만들어 트럼프타워 선거운동본부에 있는 로라 힐거Laura Hilger에게 매일 전송했다. 그녀는 이 정보를 분석해 트럼프의 선거 유세 우선순위를 정했다. 히트맵에는 트럼프가 방문해야 하는 지역에 설득 가능한 유권 자 수가 얼마나 되는지, 정확하게 누구를 목표로 연설해야 하는지, 집회와 언론에서 다루는 핵심 이슈들이 무엇인지가 포함돼 있었다. 집회가 끝난 뒤 샌안토니오 팀은 사람들이 연설이나 연설의 일부분 에 어떻게 반응하는지를 알려주는 '설득 효과 측정persuasion measurements'과 '광고 효과 조사brand lift studies'를 실시했다. 그리고 이런 분석 정보를 광고 제작자들에게 보내 성공적인 연설의 일부분을 광고로 만들었다.데이터베이스에서 끌어낸 진정한 가치가 바로 이런 광고와 메시 지에 있었고, 이를 통해 유권자들을 상대로 한 미세한 타겟 광고가 가능해졌다. 즉 케임브리지 애널리티카의 데이터 과학자들은 유권 자를 비슷한 사람들끼리 세밀하게 분류했고, 그 개별 집단에 맞춰 수많은 다양한 광고를 만들었다. 기본 콘셉트가 동일한 수백 또는 수천 개 버전의 광고들이 개개인에게 전송되어 그들의 생각을 바꾸 어놓았다. 트럼프 선거 예산의 절반 이상이 디지털 선거 전략에 투 입됐는데, 모든 메시지가 타겟 대상에 맞는 '암흑 광고'로 정교하게 제작됐으므로 사람들 대부분은 이웃들이 어떤 메시지를 보고 있는 지 몰랐다. 케임브리지 애널리티카 팀은 각 광고마다 1만 번 이상 창의적으로 반복되는 5000개 이상의 개인 맞춤형 광고를 운영했다. 발표를 듣던 회의 참석자 중 누군가가 “그래서 우리가 그렇게 오랫 동안 여러분 소식을 못 들었던 거군요.”라고 매트에게 농담했다. 내 부 직원도 알기 어려울 만큼 광고 캠페인이 은밀하고 끈질기게 타 겟들을 공략했던 것이다. 그리고 이런 광고 전략은 매우 성공적이 었다. 디지털 광고 전략은 트럼프에 대한 호감도를 평균 3퍼센트 정 도 상승시켰다. 트럼프가 일부 주에서 매우 근소한 차이로 이겼다. 는 사실을 고려하면 이 정도의 호감도 상승은 전체 선거에 매우 큰 도움이었다. 투표 독려 운동에서 트럼프 캠프 팀은 부재자 투표 참 여를 2퍼센트 끌어올렸다. 부재자 투표를 신청하는 많은 유권자들 은 보통 부재자 투표 용지를 작성하지도 우편으로 보내주지도 않기 때문에, 이것도 상당히 큰 성공이었다.기업으로서 케임브리지 애널리티카의 강점은 훌륭한 데이터베이 스만이 아니었다. 데이터 과학자들과 새로운 데이터 모델을 개발하 는 역량도 강점이었다. 몰리는 사이펀Siphon 이라는 대시보드를 만들어 이를 데이터 과학자들과 함께 두 가지 목적으로 활용했다. 첫째 는 유권자 분석 도표를 처리하는 목적이었다. 둘째는 구글에서부터 아마존, 트위터, 유튜브, 〈뉴욕 타임스〉, 〈폭스 뉴스> 등에 이르는 매 체의 광고를 언제 어느 구역에 입찰할 것인지를 결정하는 목적이었다. 이 대시보드를 통해 트럼프 선거 캠프는 광고 효과를 실시간으로 추적할 수 있었다. 트럼프타워에 있는 재러드 쿠슈너, 스티브 배넌, 트럼프도 이 대시보드를 보면서 특정 플랫폼에서 운영되는 디 지털 광고의 효과를 실시간으로 확인했다. 광고를 클릭할 때마다 들어가는 비용, 광고 효과 등의 정보를 눈앞에서 바로 보면서 어디 에 돈을 쓸 것인지 전략적 결정을 내렸다. 대중이 알고 있는 것과 달리, 트럼프의 선거 전략은 이상한 트윗이나 모호한 연설처럼 트 럼프라는 개인의 개성에 의해 좌우되지 않았다. 모든 세부 사항이 실시간으로 기록되고 조정되었다. 더 많은 사람들에게 신선한 광고가 도달함으로써 수백만 유권자가 관심을 갖도록 말이다
- 트럼프 캠프 팀은 특정 플랫폼에서 유권자들을 트럼프 지지자도 변화시키려면 무엇이 필요한지에 관해서도 연구했다. 온라인을 기준으로 의견이 바뀌는 데 필요한 노출 횟수는 평균 5~7회인 것으로 나타났다. 즉 광고를 5~7번 정도 보게 되면 유권자들이 우리가 보내는 자료를 클릭해 열어볼 확률이 높다는 의미였다. 이런 결과는 트럼프 선거 팀이 타겟으로 정한 집단에 얼마나 오랫동안 광고를 보내고 돈은 얼마나 써야 하는지를 결정하는 데 도움이 됐다.

 

'IT' 카테고리의 다른 글

잡스의 기준  (0) 2020.11.03
디지털의 배신  (0) 2020.10.27
은밀한 설계자들  (0) 2020.09.07
AI 시대 내 일의 내일  (0) 2020.07.30
페이스북은 내가 우울증인 걸 알고 있다  (0) 2020.07.09
Posted by dalai
,

은밀한 설계자들

IT 2020. 9. 7. 08:22

- 뉴스피드는 불안정하고 때론 충격 적이었지만, 수많은 사용자를 끌어들일 만한 매력을 갖추고 있었다. 페이스북 친구의 소소한 일상을 보여주는 서비스였을 뿐이지 만 그 영향은 결코 작지 않았다. 피드를 확인해 여러 새로운 소식을 보면서, 페이스북 친구의 삶에서 일어나는 일들을 어렴풋이 그려 볼 수 있게 되었다. 뉴스피드 서비스가 발표된 다음 날, 생비와 개 발팀은 페이스북 사용자들이 이전보다 거의 2배나 많은 시간을 페 이스북에서 보낸다는 것을 발견했다.
- 뉴스피드 때문에 미국인의 하루 평균 페이스북 사용시간이 35분 늘어났다. 이유는 간단했다. 피드 구현에 사용된 순위 알고리즘 덕 분에 사용자가 흥미를 가질 만한 정보가 좀 더 많이 제공되었기 때문이다. 뉴스피드 프로그램은 사용자에게 보여줄 새로운 정보를 좀 더 잘 찾기 위해 사용자의 '좋아요' 누르기, 다른 SNS에 '공유하기', '댓글 달기 등 사용자가 페이스북에서 했던 모든 일을 주의 깊 게 관찰한다. 이는 물론 사업을 성공적으로 이끌기 위한 것으로, 페이스북은 2017년에 광고로만 약 400억 달러를 벌었다. 그러나 모든 사람의 관심을 한 방향으로 모은 탓에 사회적인 토론을 막는 부작용도 야기했다. 누군가 잘못된 정보를 만들어 소문을 내고자 했을 때, 뉴스피드는 정말 효과적인 도구였다. 2016년 말 미국 대선이 끝나고 트럼프가 권력을 잡았을 때, 기자들은 독버섯 같은 사 람들, 예를 들어 백인 우월주의자나 자극적인 허위 정치기사로 사람을 끌어모으는 사람들이 피드를 사용해 정치적인 소동을 일으킬만한 이야기들을 퍼트린다는 사실을 알게 되었다. 또한 사용자가 '좋아요'를 선택한 일들과 잘 어울리지 않는 정보 대부분이 제거되도록 피드가 설계된 탓에 미국 내부의 편 가름이 매우 심해질 수 있다는 심각한 문제도 있었다.
- 'Hello, World!'라는 문구는 1972년 젊은 컴퓨터 과학자 브라이언 커니핸Brian Kernighan이 쓴 프로그래밍 언어 B의 매뉴얼에서 맨 처 음 등장했다. 그는 프로그래밍 언어 B로 쓸 수 있는 가장 간단한 프로그램을 보여주고 싶었고, 인사말 메시지를 화면에 출력하는 'Hello, World!'가 딱 맞다고 생각했다. 커니핸의 이야기에 따르면, 그는 병아리 한 마리가 껍질을 깨고 나오며 'Hello, World!'라고 말 하는 만화를 재미있게 봤다고 한다. 그래서 그는 짧은 메시지를 화면에 보여주는 아주 간단한 B 코드를 썼다. 커니핸의 재치 만점 아이디어는 프로그래머들 사이에서 큰 인기를 끌었으며, 이후 250여개가 넘는 모든 프로그래밍 언어의 매뉴얼은 'Hello, World!'라는 주문으로 시작한다.
- 프로그래머들은 'Hello, World!' 라는 단순한 문구에 수많은 의미를 부여한다. 특히 이 문구는 “태 초에 말씀이 계시니라” 라는 종교적인 믿음을 떠올리게 한다. (특 히 교회에 다니는 프로그래머들이 이런 생각을 매우 좋아한다. 독실한 신자로 게임 〈미스트MYST)의 공동 개발자인 로빈 밀러Robyn Miller는 멋진 게임 캐릭터 등을 만들면, 종종 프로그래밍을 잠시 멈추고는 혼잣말로 “보기좋군”이라고 말한다. 하지만 'Hello, World!'에 이런 멋진 면만 있는 것은 아니다. 통제할 수 없는 괴물을 만든 탓에 괴물에게 사랑하는 연인을 잃었던 프랑켄슈타인 박사나 말을 듣지 않는 빗자루 때문에 고생한 영화 속 마법사의 제자The Sorcerer's Apprentice 처럼 통제를 벗어난 프로그램을 만들어 예상 못한 부작용을 일으킬 수도 있다. 이처럼 프로그래밍에는 좋은 면과 나쁜 면이 있다. 예를 들어 뉴스 피드는 암에 걸린 친구의 소식을 전해 친구의 건강에 관심을 갖게 할 수 있는 반면, 터무니없는 음모론을 퍼뜨리는 데 사용될 수도 있 다. 마법과 프로그램 사이의 이런 관계 때문인지 1980년대 초반 컴 퓨터에 푹 빠진 10대 청소년들은 판타지와 주사위 확률을 결합한 던전 앤 드래곤 게임이나 톨킨의 작품에 등장하 는 마법사를 익숙하게 받아들였다. 1960년대 프로그래머들은 컴퓨터 사용자 눈에 띄지 않고 일정 속도로 실행되고 있는 코드와 백그라운드 안에서 계속 실행시킬 수 있는 형태의 코드를 만들고는 악령이나 초자연적인 존재를 뜻하는 '데몬daemon'이라고 불렀다. 컴퓨터 과학자인 레리 월Larry Wall은 ‘펄' 이라는 컴퓨터 프로그래밍 언어를 만들고 '축복Bless' 이라는 함수를 포함시켰다. 프로그래머 데니 힐리스Danny Hilis는 “수백 년 전 뉴잉글랜드New England에서 내 직업에 대해 사람들에게 정확히 설명했다면, 나는 화형에 처해졌 을 것이다”라고 말하기도 했다. 프로그래밍에서 느껴지는 마법 같은 느낌은 매우 매력적이고 흥미진진해서 많은 경우 이상적인 생각과 잘 어울린다. 그래서일까? 마치에이 세글로프스키 Macisi Centowski가 말했듯, 특히 뛰어난 실력을 가진 젊은 프로그래머들은 프로그래밍을 하며 급격히 거만해 곤 한다. 이들은 자신들이 뛰어난 분석능력을 가지고 있기 때문에 특별한 훈련을 받지 않았음에도 어떤 시스템이든 완벽하게 이해할 수 있다고 자신한다. 또한 인위적으로 만들어진 소프트웨어 세상 에서 거둔 성공을 통해 자칫 무모할 수 있는 자신감을 갖게 된다. 혹은 1976년에 컴퓨터 과학자 요제프 바이첸바움Joseph Weizenbaum 이 말했듯이 권력은 부패한다는 영국의 정치가 액톤John DalbergActon 경의 통찰이 누구나 손쉽게 전지전능한 힘을 가지는 환경에서는 통하지 않는다는 사실에 놀라게 됩니다.
- 1950년대 세계 최초의 프로그래 머 가운데 몇몇은 여성들이었다. 또한 최초의 컴파일러 Compiler(소스코드를 컴퓨터가 이해하도록 번역해주는 프로그램 ? 옮긴이)를 개발 한 그레이스 호퍼 Grace Hopper나 프로그래밍 분야에 지대한 영향을 끼친 프로그래밍 언어 스몰토크Smalitalk 를 공동 개발한 아델 골드버 그 Adel Goldberg 등 뛰어난 업적을 이룬 여성 프로그래머들도 있었다. 1983년에는 컴퓨터 과학 전공자 가운데 약 37.1%가 여성이었으나, 2010년에는 절반도 채 되지 않는 17%까지 떨어졌다.27 (대학뿐만 아니라 실제 기업에서도 그 비율은 비슷했다. 2015년의 조사결과에 따르면 구글, 마이크로소프트 같은 고연봉 직장의 여성 엔지니어 비율은 전 체의 20%가 채 되지 않았다.28) 인종구성도 별반 다르지 않았다. 스타 트업만 살펴봐도 금방 알 수 있듯이, 엔지니어들은 주로 백인과 아시아인이다. 흑인과 라틴계 프로그래머들 비율은 미국 전체를 통틀어 한 자릿수에 불과하며, 실리콘밸리 최고 수준의 회사들로 한정하면 불과 1~2% 정도로 매우 낮다. 프로그래머의 개인 능력이 가장 중요하다고 여겨지는 소프트웨어 산업에서 이런 결과가 나온 것은 상당히 모순적이다.
- 오늘날 사람들이 들으면 깜짝 놀랄 일이겠지만, 1960년대 윌크스가 일했던 MIT 링컨 연구소에서 는 전문 프로그래머 대부분이 여성이었다. 당시에는 많은 사람들 이 남성보다는 여성이 프로그래밍 업무에 적합하다고 생각했다. 그 이전에도 그랬다. 제2차 세계대전 동안, 영국 블레츨리 파크에서 암호해독을 위해 사용한 몇몇 실험적인 계산기계들은 여성들이 다뤘다. 미국에서 탄도미사일의 궤적 계산에 사용된 애니악ENIAC 컴퓨터의 첫 번째 프로그래머들 역시 여성들이었다. 윌크스는 남녀의 성에 따라 업무 구분이 있다는 사실을 알아차렸다. 남성 프로그래머가 없던 것은 여러 가지 이유가 있었겠지만, 그중 하나는 1960년대 컴퓨터 관련해서 가장 매력적이고 인정받 는 일이 하드웨어 제작이었기 때문이었다.
- 개방과 공유를 실천했던 MIT 해커그룹이었지만, 이들은 소프트웨어 분야에서 여성을 몰아내기 시작한 첫 번째 세대기도 했다. 윌크스가 활동하던 때와 달리 MIT 해커그룹은 철저히 남성 중심이었다. 해커들의 말투는 허풍스럽기 그지없었고, 생활은 독신남 같았다. 그들 스스로도 이야기했듯이, 해커가 아닌 사람들과 지내는 일 에는 전혀 관심이 없었다. 무엇보다도 자신들을 소중한 프로그램에 모든 것을 바친 일종의 성직자라고 생각했다. “심지어 프로그램이 그들의 성생활까지 대신했어요.” 레비가 말했다. 그린블래트 는 너무 지저분한데다 씻지 않기로 유명했다. 얼마나 더러웠는지 YMCA에서 쫓겨난 일도 있었다. 남자 해커들이 연구실에서 밤을 지새우거나 잠을 자면서 연구실은 점점 남자 기숙사처럼 변했다. MIT 해커들은 임시로 이것저것 손대곤 했는데, 이런 행동은 컴 퓨터를 사용해 중요한 연구를 해야 하는 MIT 컴퓨터 과학자들과 충돌을 일으켰다. MIT 해커 때문에 고생했던 대표적인 인물로 훗 날 미국 항공우주국 나사NASA에서 핵심 시스템을 설계해 아폴로 우주선의 안전한 달 착륙에 기여한 마거릿 해밀턴 Margaret Harmiton 이 있다. 그녀는 당시 MIT의 젊은 프로그래머였다. 하루는 날씨 시뮬레이션 모델을 실행하려고 했으나 자꾸 문제가 생겼다. 고생 끝에 몇몇 해커들이 자신들의 목적에 맞게 어셈블러 프로그램을 수정한 뒤 다시 원래대로 고쳐놓지 않았기 때문이라는 것을 알아냈다. 해커들은 단순히 예쁘게 생긴 셀룰러 오토마타cellular Automata(미국 수학자 스타니스와프 울람과 존 폰 노이만이 고안한 이산적 동적 시스템으 로, 동역학계를 해석하는 방법 - 옮긴이)를 이리저리 손대며 시간을 보낼 생각이었던데 반해, 그녀는 날씨 연구를 수행하고 있었다. 해밀턴 입장에서는 매우 화나는 일이었지만, 해커들은 자신들의 행동이 다른 사람에게 미치는 영향 따위에는 별 관심이 없었다.
- 1990년대 에버링험을 포함한 넷스케이프의 프로그래머들은 웹서핑을 하는 사람들이 원하면 코드도 직접 볼 수 있으면 좋겠다고 생각하고, 웹페이지 소스코드를 볼 수 있는 기능을 추가했다. 넷스케이프 웹브라우저에서 이 기능을 사용하면 현재 보고 있는 웹페이지의 소스코드를 볼 수 있 는 새로운 창이 나타난다. 얼마 지나지 않아 사람들은 페이지 소스 보기' 기능을 선택해 눈앞에 보이는 새로운 세상이 어떻게 만들어졌는지 살펴보기 시작했다. 이 기능은 좀 더 빠르고 훨씬 넓게 알려졌다는 점만 빼면 베이 직 프로그래밍 언어 덕택에 가능했던 프로그래밍 혁명과 꽤 비슷했다. 1980년대 에버링험을 비롯해 프로그래밍에 관심 있는 초보 프로그래머들은 공부하거나 배울 때 사용할 수 있는 베이직 코드를 구하는 데 상당히 많은 시간을 소비했다. 전자게시판에서 베이 직 코드를 다운로드 받거나 혹은 소스코드가 인쇄된 컴퓨터 잡지 나 책을 사야 했다. 무언가 새로운 것을 배우려면 넘어야 할 어려움 이 많았다. 그러나 웹에서는 이러한 시간이 '0'으로 줄었다. 웹 사용자는 누구나 자신이 방문한 모든 웹페이지의 모습과 동작을 기술한 소스 코드를 볼 수 있었다. 인터넷은 프로그래밍 가이드북을 잔뜩 모아 놓은 도서관이 되었다. 게다가 소스코드 일부를 잘라 새로운 파일로 저장한 뒤, 코드를 바꿔가며 실행해 어떤 일이 일어나는지 볼 수 도 있었다. 새롭게 작성한 코드와 코드 실행결과물인 웹페이지가 만족스러우면, 지오시티 GeoCities 같은 웹호스팅 서비스를 사용해 인터넷에 올릴 수도 있다. 베이직 덕분에 프로그래밍은 세상과 동떨어져 있던 상아탑에서 나와 10대 청소년들의 방으로 퍼져나갈수 있었다. 웹은 여기서 한발 더 나아가 프로그래밍을 누구나 접근할 수 있는 열린 공간으로 이끌었다.
- 80년대 초, 에버링험이 VIC-20을 처음 본 이후 프로그래밍 세계는 여러모로 크게 변했다. 매리 앨런 윌크스, MIT의 해커들, 10대 소년 에버링험 등 1~3세대 프로그래머들에게 프로그래밍 은 재미있어서 한 일이었다. 이들 관점에서 프로그래밍에는 자신이 생각한 어떤 일이든 기계가 하도록 만든다는 원초적인 지적 도전정신이 깔려 있었다. 그러나 크리거 세대는 달랐다. 이들은 넷스 케이프, 야후, 구글과 같은 회사를 세워 엄청난 부자가 된 사람들과 그들의 막대한 사회적 영향력을 경험한 첫 번째 세대였다. 누구나 인정하듯 정치, 법률, 기업의 힘은 막강하다. 그러나 정말 로 여러분이 속해 있는 사회를 바꾸고 싶다면 프로그래밍을 해라. 〈해커스Hackers〉, 〈네트The Net) 혹은 매트릭스> 같은 영화를 본 것은 문제가 되지 않는다. 해커는 더 이상 사회에서 따돌림 당하는 괴짜 컴퓨터 전문가가 아니다. 오히려 일반 사람은 꿈도 꾸지 못할 강력 한 힘을 휘두를 수 있는 슈퍼히어로들이다.
- 실리콘밸리에 엄청난 규모의 돈이 몰리면서 새로운 부류의 프로 그래머가 나타나고 있다. 2000년대 후반, 구글이나 페이스북이 인수할 만한 것을 만들어 단번에 큰돈을 번 인스타그램 같은 회사가, 성공을 원하는 사람들의 주목을 끌었다. 이들은 한때 빨리 부자가 되기 위해 월스트리트에 취직했다. 그러나 2008년 금융위기 후에는 다른 곳으로 눈을 돌렸는데, 바로 실리콘밸리였다. 이들이 '브로그래머brogramme'다. 브로그래머는 자신들이 작성한 코드의 영향력 에는 신경을 썼으나, 정작 프로그래밍이 주는 지적인 흥분감에는 별 관심이 없는 경우가 많았다. 이들에게 프로그래머라는 직업은 권력을 향한 하나의 길일 뿐이었다. 결과적으로 실리콘밸리 문화에 대한 브로그래머의 기여도에 비해 프로그래밍에 대한 기여도는 높지 않았다.
- 오늘날 대기업에서 소프트웨어를 개발할 때 많은 경우 프로그래 머가 모든 것을 결정하도록 하지 않는다. 소프트웨어의 주요 기능을 결정하는 사람들은 프로젝트 매니저로 이들은 디자이너, 사용자 인터페이스 설계 전문가 등과 함께 일한다. 프로젝트 매니저는 소프트웨어 설계를 프로그래머에게만 맡겨둘 경우, 자칫 현실과 동떨어져 프로그래머만 사용할 수 있는 이상한 소프트웨어가 개발될 수 있다는 사실을 잘 알고 있다.
- 이런 문제는 프로그래머가 제멋에 겨워 일하는 것을 좋아하기 때문이기도 하다. 예를 들어 프로그래머는 컴퓨터를 다루거나 간 단한 일을 처리하는 짧은 스크립트나 프로그램을 작성할 때, 대화 상자보다는 깜빡이는 커서가 있는 텍스트 기반의 화면에 명령어를 직접 쓰는 방식을 좋아한다. 즉, 프로그래머는 컴퓨터에게 좀 더 직접적으로 명령을 내리고 결과를 얻고 싶어 한다. 왜일까? 여러 이유가 있겠지만, 다음과 같은 기능적인 이유 때문이다. 먼저 컴퓨터에게 정확히 당신이 원하는 일을 가장 효과적이면서도 유연성 있 게 지시하는 방식이기 때문이다. 그다음은 컴퓨터 기술에 익숙하 지 않은 일반인들을 상대로 자신의 우월함을 보여줄 수 있기 때문이다. 마지막으로 일단 명령어 방식에 익숙해지면 마우스, 커서, 아이콘 등 소위 '사용자 친화적'인 사용방식은 느리고 유치해 보이 기 때문이다. 그런데 사용자 친화적' 이라는 말은 역설적이게도, 실제 사용자를 이해하는 누군가가 프로그래머로부터 소프트웨어를 디자인할 수 있는 권한을 가져오기 전에는 대부분의 소프트웨어 가 '사용자 적대적인’, 즉 사용자에게 불편했음을 의미한다. 사용자 친화적인 소프트웨어 디자인은 프로젝트 매니저, 디자이너, 사용자 인터페이스 전문가의 역할이다. 이들은 프로그래머 관점에서 소프트웨어의 작동 방식을 이해하고, 사용자를 모아 이야기를 들 으며 사용자의 관점에서 프로그래머가 만들 소프트웨어의 모습을 정의한다.
- 프로그래머들은 일반적으로 한 줄씩 혹은 '한 함수’씩 확인하며 전체 프로그램을 서서히 완성한다. 그러나 2004년의 코헨은 달 랐다. 그는 먼저 서로 멀리 떨어진 비트토렌트 사용자 사이의 여러 타이밍 문제들을 머릿속으로 따져보며 고민했다. 이런 몇 시간의 고민이 끝나면, 앉아서 프로그램을 쏟아내기 시작했다. 그리고 이 프로그램은 옆에서 누가 코드를 불러주기라도 한 듯 완벽했다(사실 코헨은 자신을 모차르트와 비교했다). 3개월 된 아이에게 모유 수유를 하며 부엌에 들어온 그의 아내 제나는 이런 사실을 확인해줬다. "그는 하루 종일 집 안팎 이곳저곳을 어슬렁거리며 돌아다녀요. 그러다 갑자기 컴퓨터로 달려가 프로그램을 쏟아내죠. 그리고 그 프 로그램은 한줄 한줄이 깔끔해요. 버그 하나 없는 완벽한 프로그램 이죠!” “컴퓨터밖에 모르는 나의 사랑스러운 큰 아기.” 그녀는 코헨이 사랑스러운 듯 그의 머리를 가볍게 두드리며 말했다. 실제로 코헨은 아스퍼거 증후군Asperger's syndrome을 앓았다. 나는 처음 그 사실을 들었을 때 상당히 놀랐다. 그가 다소 과장되게 행동하고 무슨 주제든 장황하게 이야기를 늘어놓기는 했지만, 오히 려 나는 그의 행동이 정말 좋았을 뿐만 아니라 유머도 있고 매력적이라고 생각했기 때문이다. 게다가 그는 주변 사람들의 기분을 매우 잘 알아차렸다. 그러나 이런 모습은 일반인처럼 행동하기 위한 그의 꾸준한 노력 덕분이었다.
- '좋아요’ 서비스는 페이스북에게 사 용자를 모니터링할 수 있는 새로운 강력한 수단이 되었다. '좋아요' 서비스가 인기를 얻자, 페이스북은 관련 코드를 공개해 다른 웹사 이트 게시물에도 '좋아요' 버튼을 붙일수 있도록 했다. 얼마 지나 지 않아, 인터넷 웹사이트에는 '좋아요' 버튼이 넘쳐나기 시작했다. 그런데 이 버튼은 단순히 '좋아요’ 서비스의 역할만 하는 것이 아니 었다. 만약 여러분이 페이스북 사용자고 페이스북 서비스에 로그 인한 상태라면, '좋아요' 버튼이 있는 웹사이트를 방문할 때마다 페 이스북은 여러분이 어떤 웹사이트를 방문했는지 알게 된다. '좋아요' 버튼을 누르지 않아도 말이다. 사실상 페이스북은 자신의 고객 들이 인터넷 세상에서 어느 곳을 어떤 형태로 방문하는지 끊임없이 파악할 수 있는, 간단하지만 강력한 수단을 확보한 셈이었다. 몇 년 후 '좋아요' 서비스 개발자인 로즌스타인과 펄만은 페이스북을 떠났다. 로즌스타인은 생산성 높은 작업 공간 제공 서비스인 아사나Asana를 만들었다. 펄만은 여러 회사를 세우기도 하고 새로 이 예술가 활동도 시작했다. 시간이 지날수록 두 사람 모두 좋아요 서비스의 부작용에 안타까워했다. “저도 때론 '좋아요' 서비스에 중독된 것은 아닐까 하는 생각이 들곤 해요. 제가 만든 서비스인데 말이죠.” 로즌스타인은 IT 전문 매체인 〈더 버지The Verge)와의 인터뷰에서 말했다.44 그는 자신이 소셜미디어 알림 서비스에 점점 신경 쓴다는 사실을 깨달았다(그는 소셜미디어 알림 서비스를 '가짜 행복을 담은 딩동'이라고 불렀다). 로즌 스타인은 우리가 하루 평균 2,617번씩 스마트폰을 터치해 사용할 만큼, 우리가 사용하는 앱이 사용하지 않고는 못 배기게 중독성이 있다는 것을 알았다.45 펄만은 일종의 거래처럼 서로 주고받는 '좋아요'에 대해 걱정했다. 그녀는 SF TV 드라마 〈블랙 미러〉에서 '추 락 Nosedive'이라는 제목의 에피소드를 보았다고 한다. 이 드라마에 등장한 젊은 여성은 사람이 다른 사람과의 만남에 대해 평점을 매 기는 사회에 살고 있다. 드라마 속 젊은 여성은 거울을 보며 연습한 과장된 표정을 사진으로 찍어 소셜미디어 서비스에 올리기도 하 고, 상대방이 자신에게 낮은 평점을 주지 않도록 계산대 직원에게 과장된 칭찬을 늘어놓는다.
- 밀을 2배 빨리 수확해야 한다고 가정해보자. 방법은 간단하다. 밀수확 인력을 2배로 늘리면 된다. 그러나 프로그래밍은 통찰력이 필 요한 일로 밀 수확보다는 시를 쓰는 일에 가깝다. 다시 말해 프로그 래밍 과제의 해결책은 많은 사람들의 땀방울에서 나오기보다, 통찰력과 영감을 갖춘 한 사람의 순간적인 깨달음에서 나오기 쉽다. 결론적으로 프로그래밍은 일반 노동과는 정반대다. 어려운 프로그래밍 과제를 해결하기 위해 좀 더 많은 프로그래머를 투입하는 일은 회의와 의사소통 부담을 증가시켜 과제 해결을 더욱 어렵게 만든다. 브룩스는 이런 현상을 다음과 같이 간결하게 정리했다. “지연되고 있는 소프트웨어 과제는 인력을 투입하면 투입할수록 더욱 늦어진다. 이에 최근 들어 세계 곳곳의 프로그래머들은 이런 사실을 자신 있게 인용하며 그저 그런 프로그래머가 아닌 절대 능력의 프로그래머를 채용하는 일이 매우 중요하다고 주장한다. 또한 소프트웨어 개발 과제의 이런 특징은 최고 학교를 졸업한 최고 학생들이나 스타트업의 인재를 영입하기 위해 각종 혜택을 제공하는 인재전쟁이 1990년대부터 시작돼 오늘날까지도 이어지고 있는 이유기도 하다. 10X라는 문구는 첨단 기술 세계의 뛰어난 프로그래머들에 게 자신들에 대한 논리적이고, 정량적이며, 정확한 느낌을 심어주 었다. 물론 다른 산업에도 뛰어난 인재에 대한 개념은 있다. 그러나 소프트웨어 산업에는 한 명의 뛰어난 프로그래머가 평범한 프로그 래머보다 얼마나 뛰어난지 보여주는 실제 측정값인 '숫자'가 있다. “뛰어난 프로그래머가 평범한 프로그래머보다 몇 배의 연봉을 받 기는 하지만, 뛰어난 프로그래머가 작성한 프로그램은 평범한 프로그래머가 작성한 프로그램보다 1만 배쯤 가치가 있다. 빌 게이 츠Bill Gates의 말이다.
- '포토샵Photoshop'은 2명의 형제가 개발했다. 마이크로소프트의 시작을 알린 '베이직'은 빌 게이츠가 고교 선배이 폴 앨런Paul Allen, 하버드 대학교 1학년 몬테 데이빗도프Monte Davidoff 와 함께 초기 베이직을 새롭게 고쳐 만든 것이다. 초창기 블로그 소프트웨어인 라이브저널은 브래드 피츠패트릭이 만들었다. 구글의 모태가 된 '혁신적인 검색 알고리즘'은 학생이었던 래리 페이지Larry Page와 세르게이 브린Sergey Brin이 만들었다. 유튜브'와 '스냅챗’은 3명이 개발했다. '비트토렌트’는 전적으로 브램 코헨의 작품이었고, '비트코인’은 소문에 의하면 익명의 프로그래머 사토시 나카모토Satoshi Nakamoto가 만들었다. 존 카멕John Carmack은 FPSFirst-person shooter(1인칭 슈팅게임) 비디오 게임이라는 수십억 달러시장의 탄생에 기여한 '3D 그래픽스 엔진 3D graphics engines'을 만들었다. 안드레센에 따르면 이렇게 적은 수의 사람들이 엄청난 결과를 만들 수 있었던 이유는, 새로운 앱 등을 개발할 때 정신적 공동체가 한 두 사람의 고립된 머릿속에서 훨씬 효과적으로 세워지기 때문이다. 10X'의 생산성은 그 정신 공동체 속에 들어가 머물며 복잡한 문제나 목표를 구체화하는 뛰어난 능력에서 나온다. “만약 그들이 잠들 지 않고 깨어 있을 수 있다면, 정말로 성공할 수 있어요.” 안드레센 이 말했다. “문제는 깨어 있는 시간이에요. 머릿속에 모든 문제를 집어넣는데 2시간이 걸리고 그 상태에서 10시간, 12시간, 혹은 14시 간 일할 수 있죠.” 그가 알고 있는 10X 프로그래머들은 시스템 수준에서 생각하며, 시스템을 구성하는 기술스택Stack(컴퓨터에서 사용되 는 기본 데이터 구조 중 하나)의 모든 부분에 대해 늘 궁금해하는 경향이 있다. 예를 들어 컴퓨터 마이크로프로세서에서 전류가 어떻게 흐르는지부터 터치스크린 반응 시간에 이르기까지 모든 것을 궁금해한다. “10X 프로그래머들의 이런 행동은 지적 호기심, 충동, 필요 등이 결합된 결과입니다. 그들은 관심 있는 시스템에 자신들이 모르는 게 있다는 사실을 받아들이지 못하죠.”
- 릭과 같은 10X 프로그래머는 짧은 시간에 많은 프로그램을 만들어내기도 하지만 사실 그 결과물은 전문 용어로 '기술 부채’, 즉 나중에 다시 해야 하는 일인 경우가 많다. 빠른 속도로 코드를 만들어 내는 프로그래머는 임시방편적인 방법으로 프로그래밍하거나 누더기처럼 이곳저곳의 코드를 짜깁기해 프로그래밍하는 경우가 많으며, 이런 프로그램은 결국 몇 년 후 꼼꼼함과 인내심이 필요한 재 작업으로 이어진다. “10X 엔지니어는 실제로 10배 더 생산적이지 않아. 오히려 다른 사람의 할 일을 10배쯤 늘려주지. 그들은 마치 빙산의 일각 같아서 겉보기에는 반짝거리고 아름다워 보이지만, 결국 보이지 않는 곳에 엄청난 기술 부채를 남기곤 한다니까.” 프로그래머 친구인 맥스 휘트니 Max Whitney가 말했다.
- 안드레센이 이야기했듯이 프로그래머들이 스타트업 세우기를 좋아하는 이유 가운데 하나는 일의 속도 때문이다. 그런 스타트업 에서 똑똑한 얼간이들은 엉망진창인, 그러나 초기 고객을 끌어들일 만큼 괜찮게 작동하는 프로그램을 만들곤 한다. 그렇지만 결국 얼마 지나지 않아 좀 더 꼼꼼한 다른 동료 프로그래머들이 엉망진창인 프로그램을 깔끔하게 손봐야 한다. 트레이시 추는 핀터레스트에 입사해 기존 백엔드 프로그램의 수 정을 맡았다. 프로그램 이곳저곳을 살피던 그녀는 사용자가 입력 한 검색어에 대해 서버가 같은 작업을 두 번씩 반복해 수행하는 이 상한 현상을 발견했다. '어, 왜 이러지?' 그녀는 의아해했다. 프로그램 분석을 통해 그녀는 서버에 요청을 발생시키는 코드가 실수로 두 번 쓰인 사실을 발견했다. 아마도 핀터레스트 설립 초기 일했던 능력 좋은 프로그래머가 매우 빠른 속도로 일하면서 실수를 저지른 듯했다. 중복된 코드를 지우자 핀터레스트 검색 효율이 바로 2배나 향상되었다. 이런 예를 통해 보듯 진정한 10X급의 능력은 프로그램을 작성하는 데 있지 않고, 오히려 다른 프로그래머의 실수를 수정하는 데 있다.
- 스타트업 창업자들의 배경을 살펴보면 프로그래밍 분야가 공평한 능력주의라는 생각에 대해 더욱 의구심이 든다. 경영학 교수 2명이 함께 수행해 얻은 연구결과에 따르면, 기업가들의 가장 큰 공통 요소 중 하나가 부유한 가정 출신들이라는 것이다. 믿는 구석 이 있을 때 좀 더 과감하게 위험을 무릅쓸 수 있다는 점에서 이 연구결과는 충분히 타당해 보인다. 더 나아가 누가 스타트업 투자금을 받는지 생각하면, 그 연구결과는 더욱 타당해 보인다. 영국 로이터통신 Reauters)의 조사에 따르면 상위 5개 벤처투자사로부터 시리즈A 투자를 받 은 실리콘밸리의 창업자 중 약 80%는 잘나가는 기술 기업에서 일 한 경험이 있거나 스탠퍼드 대학교, 하버드 대학교, MIT 공대 출신 들이다.33 이런 스타트업 투자 시스템은 좋은 아이디어를 가지고 있지만 무모하고, 연출도 없고, 초라해 보이는 창업자들을 위한 시스템처럼 보이지 않는다. 오히려 경제전문가 로버트 프랭크Robert Frank가 말한 '승자 독식' 같은 역학관계에 더 적합한 시스템처럼 보 인다. 초기 성공은 연이은 행운으로 이어지며, 결국 누구나 믿는 전설로 발전한다.
- 신경망 개념은 1950년대에 처음 나왔다. 그리고 1980년대 이르러 프랑스 과학자 얀 르쿤Yann LeCun은 신경망을 이용해 손글씨를 인식할 수 있다는 사실을 보여주며, 신경망 개념을 새로운 수준으로 끌어올렸다. 그러나 1980년대 신경망 기술은 그리 실용적이지 못했다. 신경 망 처리를 위해서는 소프트웨어 개발자들이 사용할 수 있는 좀 더 빠른 프로세서와 좀 더 많은 메모리가 필요했다. 더 큰 문제는 학습에 필요한 데이터 양이 너무 많았다. 예를 들어 해바라기를 인지할 수 있도록 신경망을 훈련시키려면, 이론적으로 수천 장 혹은 수백 만 장의 학습용 해바라기 사진이 필요하다. 1980년대에 그 많은 데 이터를 어디서 구할 수 있겠는가? 디지털 카메라는 10~20년 후에 야 등장했다. 1980년대 신경망은 사람들의 관심을 끌었고, 실제로 사용되기 도 했다. 은행에서는 르쿤의 연구결과를 사용해 자동으로 수표를 인식할 수 있는 신경망을 만들었다. 몇몇 음성인식 업체들에서는 신경망을 이용해 느리지만 음성을 인식하고 글로 바꿔주는 시스템을 만들었다. 그러나 대부분의 컴퓨터 과학자들은 신경망을 인공지능에 대한 헛된 기대를 품게 만드는 기술이라고 생각했다. 결국 1980년대 몇 번의 작은 성공을 거두며 사람들을 흥분시켰던 신경망 기술은 다 시금 '인공지능 겨울'에 빠져 수면 아래로 가라앉았다. “많은 사람들이 인공지능 분야는 길을 잃고 헤매는 벌판 같다고 말했어요.” 한스 크리스챤 부스Hans-Christian Boos가 내게 말했다. 그는 당시 신경망 기술에 흠뻑 빠져 있던 젊은 대학원생이었다. 그러나 그의 동료들은 한 번의 선택이 연구 인생을 좌우한다며, 아무 결과도 얻지 못할 신경망 연구를 그만두라고 충고했다. 그러나 현재 그가 옳았고, 친구들은 틀렸다.
- 논리가 아닌 실험적인 접근 탓에 전통적인 프로그래밍 방법에 익숙한 수많은 일반 프로그래머들은 신경망 프로그래밍에 대해 불안해한다. 일반 프로그래머들은 선형적이고 예측 가능한 프로그램을 선호한다. 프로그램이 작동한다면, 그 이유 또한 설명할 수 있어야 한다. “지금까지 컴퓨터 과학에서는 프로그래머라면 '결정론적으로Deterministically(인간의 행위를 포함해 세상에서 일어나는 모든 일은 우연이나 선택의 자유에 의한 것이 아닌, 일정한 인과관계의 법칙 에 따라 결정된다는 이론 )’ 생각할 수 있는, 즉 입력과 출력 을 뚜렷하게 연결 지을 수 있는 사람이어야 했습니다.” 워싱턴 대 학교University of Washington의 인공지능 전문가 페드로 도밍고스Pedro Domingos 교수의 말이다. “버그 하나 없이 모든 것이 잘 작동하도록 만들어야 합니다. 쉼표 하나도 엉뚱한 곳에 있으면 안 됩니다. 적어도 프로그래밍에 관해서는 강박장애에 빠지지 않으면 절대 좋은 프로그래머가 될 수 없어요.” 그러나 기계학습에서는 정반대다. 기계학습 프로그래머는 불확실성, 초자연적인 기이함 등을 다룰 수도, 성공할 수도, 실패할 수도 있다. 기계학습 프로그램의 이런 특징에 대해 데이터 과학 및 기계학습 분야 최고 전문가인 내 친구 힐러리 메이슨은 〈하버드 비즈니스 리뷰〉에 기고한 글에서 다음과 같이 썼다. “데이터 과학 과제는 시작하는 시점에 과제의 성공 여부를 전혀 예측할 수 없는 반면, 소프트웨어 공학 과제는 시작하는 시점에 과제의 성공 여부를 알 수 있다.” 기계학습에는 이런 특성에 더해, '블랙박스’ 문제도 있다. 고양이 얼굴인식을 학습한 신경망이 고양이 사진을 인식한다고 가정하자. 정말 훌륭한 결과다! 그러나 신경망을 제작한 프로그래머에게 "이 신경망이 고양이 사진을 어떻게 알아볼 수 있는 거야?” 라고 질문하면, 이들은 자신도 잘 모른다는 듯 어깨를 으쓱할 것이다.
- 딥러닝은 모세가 ~가 될지라”라고 말하면 곧 이루어질 것 같으 놀랍고 가슴 뛰는 가능성만을 보여주는 초창기 모습을 끝내야 한다. 우리는 인공지능 시스템이 데이터만 보고도 스스로 미묘한 내 용을 배울 수 있도록 만들 수 있고, 이것이야말로 마법이다!! 그런데 '마법' 이라는 단어의 사용은 인공지능 기술이 가지고 있 는 문제기도 하다. '마법'이라는 단어를 사용하기 시작하면, 딥러닝 기반의 인공지능 시스템 설계자가 시스템에 있는 여러 문제들을 완전하지 않은 임시 방법으로 해결하고 지나가도록 만든다. 그러나 마법이라는 것은 프로그래머들이 자신들의 인공지능 소프트 웨어가 사람보다 좀 더 객관적이고 이성적인 것처럼 보이게 만드는 시도일 뿐이다. 힐러리 메이슨은 “인공지능은 단순히 수학일 뿐 이에요. 누군가 학습 방법을 설명할 수 없거나 혹은 어떤 학습 데이 터를 사용해 어떻게 학습되었는지 설명할 수 없다면, 그런 인공지 능 소프트웨어는 구매해 사용하면 안 됩니다”라고 말했다. 소프트 웨어 회사들은 고객을 당황스럽게 만들거나 끌어들이기 위해, 잘 이해되지 않는 기술을 들먹이며 실제로 전혀 특별한 것이 아님에도 무언가 특별한 비법이 있는 듯한 분위기를 만든다. 이런 일은 딥러닝 인공지능 기술에서 특히 흔하며, 점점 심해지고 있다. 그러므로 이제 다음 단계에서는 덜 재미있더라도 기술에 대해 좀 더 책임감을 가질 필요가 있다. 어느 정도의 소프트웨어 능력만 갖추고 있어도 텐서플로를 사용해 결과를 낼 수 있는 만큼, 단순히 신경망을 작동시키는 일은 그리 중요하지 않다. 중요한 것은 성과와 책임감이다. 인공지능 시스템에 편향성이 없다는 사실을 증명할 수 있을까? 점점 많은 인공지능 전문가들이 이 문제에 도전하고 있다. 이들은 한 가지 방법으로만 그 문제를 해결할 수는 없다고 생각한다. 모든 사람을 차별 없이 대하는 데이터세트를 얻어 문제를 해결할 수도 있고, 알고리즘의 여러 인자를 조정해 문제를 해결할 수도 있다. 구글이 '고릴라' 태그 문제를 해결한 것처럼, 시스템에서 나온 편향된 결과물을 수정하는 규칙들을 일일이 직접 손으로 넣어 해결할 수도 있다(참고로 구글 포토 Google Photos에서 '고릴라', '침팬지’, 원숭이’ 등을 입력하면 어떤 결과도 나오지 않는다). 좀 더 책임감을 가진다는 것은 중요하고 위험성이 높은 일에는 당분간 딥러닝 기술 사용을 자제하자는 뜻이다. 딥러닝 인공지능 기술은 내가 이 책을 쓰고 있는 이 순간까지도 처음 만든 사람조차 완전히 이해하지 못한 기술이기 때문이다. 이런 현실에 최고의 인공지능 전문가들조차 일부는 상당한 불안감을 느끼며, 딥러닝 인 공지능 기술을 작동시키는 일에 집중하기보다 딥러닝 인공지능 기 술이 어떻게 작동하는지 설명하는 일에 집중해야 한다고 말한다. 결론적으로 뉴턴이 물리학의 작동 원리를 체계화하는 일에 기여했듯이, 인공지능 연구는 딥러닝 기술의 응용 결과를 이론적으로 설명할 수 있어야 한다.
- 여러 연구결과에 따르면 소셜네트워크 서비스 알고리즘은 사람들의 감정을 강하게 건드리 는 게시물에 높은 점수를 주는 듯 보인다. 예를 들어 화끈한 장면 을 찍은 사진이나 마음을 울리는 사진, 감정을 자극하는 제목 등이 높은 점수를 받기 쉽다. 2017년에 페이스북에서 인기가 높았던 게 시물의 제목을 조사한 연구결과에 따르면, will make you(O 하게 만들어 드릴게요)’, are freaking out(깜짝 놀랄만한)’, ‘talking about it(oo에 대해 이야기하면)’과 같이 감성을 건드리거나 호기심을 끄는 문구 등이 많이 사용되었다. 물론 이런 현상이 감동을 주는 가정용 비디오 혹은 어젯밤 본 TV 드라마에 관한 이야기라면 전혀 문제가 없다. 그러나 개인의 문제가 아닌 공공의 문제라면 이야기가 달라진다. 신경질적이고, 갈등을 일으키며, 사람들을 깜짝 놀라게 하는 게시물들이 높은 점수를 받기 때문이다. 물론 어제 오늘의 문제는 아니다. 예를 들어 선정적이며 조작된 스캔들 기사로 신문이 가득 찼었던 미국 건국 초기 이래로, 국가적인 문제를 다루는 대화는 가십기사나 터무니없는 헛소문 등에 파묻히기 일쑤였다. 다만 알고리즘 기반의 순위 선정 시스템이 사용되면서, 이런 고질적인 문제가 더욱 두드러지게 되었다. 예를 들어 인기 있는 유튜버들은 거의 미친 짓에 가깝거나 매우 위험한 행동을 해서 다른 유튜버들과의 경쟁에서 이기려 한다. 어떤 남자는 200만 명에 달하는 구독자 수를 유지해야 한다는 강박관념에 사로잡힌 나머지 자녀들이 고통스러워하는 영상을 찍어 게시했다.
- “빠르게 성장하는 웹 비즈니스의 엔진이라 할 수 있는 광고 기술은 지금까지 살펴본 모든 부정적인 외부효과를 야기하는 핵심 업 모델입니다.” 고쉬가 내게 말했다. “이런 광고 중심의 사업 모델 은 트위터의 피드, 페이스북의 메신저나 뉴스피드처럼 사용자들에 게 매우 자극적이고 중독성 있는 경험을 제공합니다." 소셜네트워크 서비스 회사에서 일했던 사람들은 하나같이 내게 회사 직원 어느 누구도 이런 일이 일어날지 몰랐다고 말했다. 정말 로 그 누구도 나는 오늘 하루 이 사회와 사람들 사이의 신뢰 관계 를 망가뜨리는 시스템을 만들 거야'라고 생각하며 침대에서 일어 나지는 않았을 것이다. 그러나 거대 기술 기업의 주요 성장 요소인 '빠른 규모 확장', '광고를 위한 공짜 서비스', '반강제적인 묶임’ 때 문에 자신도 모르는 사이 그런 일을 한다. "페이스북은 증오를 좋아하지 않겠지만, 증오는 페이스북을 좋 아한답니다.” 바이다나단은 결론지어 말했다. 2000년대 중반으로 돌아가, 당시 소셜네트워크 서비스를 만들 었던 엔지니어들과 서비스 설계자들은 왜 이런 상황을 예상하지 못했을까? 또한 이런 문제를 깨닫고 대응하기까지 왜 이리 오랜 시간이 걸렸을까? 소셜네트워크 서비스 개발자와 이야기해보면, 그들은 이런 문제 들이 부분적으로는 공학 중심의 사고방식에서 비롯된 일종의 부작용이라고 주장한다. 소셜네트워크 서비스를 처음 개발했던 프로그래머와 설계자들은 소프트웨어, 논리, 시스템, 효율, 각개격파식 문제해결 능력 등에서는 분명 뛰어났다. 그러나 그들 대부분은 대학을 갓 졸업한 백인 엔지니어들로 세상이 얼마나 복잡한지, 정치가 무엇인지, 다른 사람들은 어떻게 사는지 등에 관해서는 거의 아는 것이 없었다. 게다가 도널드 럼스펠드Donald Rumsfeld가 지적했듯이, 그들은 자신들이 모른다는 사실조차 알지 못했다. 그들에게 다른 사람들과 새로운 방식으로 이야기할 수 있는 도구를 만드는 것은 흥미진진한 일일 뿐이었다. 서로 좀 더 많이 커뮤니케이션할 수 있게 만드는 일이 어떻게 문제가 될 수 있을까? “매우 한정된 분야에서만 똑똑한 사람들을 많이 봤습니다.” 트위터 개발 초창기에 프로그래머로 일했던 알렉스 페인Asx Payne이 말 했다. 페인의 말에 따르면, 그들은 인간의 여러 가지 속성과는 관련이 없는 분야에서만 똑똑했다. 즉, 수학, 통계학, 프로그래밍, 사업, 회계에는 관심 있지만 인간 본성에 대한 통찰력은 전혀 없었으며, 사람들을 이해하는 데 도움이 될 만한 지적인 능력도 없었다. 기술 전문가이자 인류학자인 내 친구 다나 보이드Danah boyd는 소 셜네트워크 서비스인 마이스페이스MySpace 를 연구하는 프로젝트 에서 일한다. 그녀는 마이스페이스 설립자인 톰 앤더슨Tom Anderson 을 애플스토어에 데리고 가서 10대들이 마이스페이스를 어떻게 사용하는지 보여준 적이 있다. 회사 설립자라도 사용자 개개인이 서 비스를 어떻게 사용하는지, 혹은 서비스를 사용하며 어떤 영향을 받는지 언제나 세세히 알지는 못한다. 엔지니어 관점에서 보면, 소셜네트워크는 자신들이 최적화하고 싶은 그래프 구조의 객체일 뿐이다. 그래서 사용자를 이해하거나, 사용자와 사용자가 무슨 일을 하는지 신경 쓰기는 어렵다. 나는 종종 일부 프로그래머의 세계관 이 경제학자들의 냉정한 세계관과 비슷하다고 생각한다. 경제학자 들의 모델은 경제가 전반적으로 좋다는 사실은 보여줄지 모르겠지 만, 그런 사실이 49세에 회사에서 쫓겨나 다시는 돈을 벌기 어려운 가장에게는 위로가 되지 못한다. 경제학자들과 마찬가지로 모델을 사용해 거대한 시스템을 만든 엔지니어들은 세상을 '전체'로만 볼 뿐, 그 속에 있는 특정한 것들에 대해서는 관심을 기울이지는 않는 다. “기술 사회의 위험 중 하나는 기술을 개발한 사람들이 데이터 모델 전체에만 집착할 뿐, 데이터 모델에 기반을 둔 인간의 특성을 보지 않는다는 것입니다. 현재 데이터 & 소사이어티 Data & Society 라는 싱크탱크를 운영하고 있는 보이드가 말했다.
- 근본부터 구조적으로 바꿔야만 거대 기술기업을 변화시킬 수 있다. 주요 기술 기업들은 언제나 같은 종류의 권력을 누렸고, 같은 문제들을 일으켰다. 그리고 그 뒤에는 '누가 작성했는가?', '누가 자금을 댔는가?', '어떻게 돈을 버는가?' 같은 프로그램을 지배하는 구조적인 힘이 자리하고 있다. 이 힘이 문제의 핵심인 만큼, 문제를 일으키는 소프트웨어를 바꿀 수 있는 유일 한 방법은 그것을 치워버리는 것뿐이다.
- 프로그래밍은 고등 교육을 받은 사람이라면 거의 누구나 어느 정도는 할 줄 알아야 하는 기술로 성장했을 만큼, 이 세상의 주류로 자리 잡아가고 있다. 오늘날 프로그래머’라는 말을 들었을 때 가장 많이 떠오르는 것은 후드티를 입은 저커버그 같은 젊은이다. 프로 그래머라는 직업은 20세기 후반 높은 연봉으로 중산층의 주요 직업으로 자리 잡았던 무역업을 밀어낸 안정적이며 수준 높은 직업 이다. 그리고 이제 프로그래머라는 직업에 새로운 변화가 일어나 고 있다. 사상가이자 기술 기업을 운영하는 친구 아닐 대시의 표현을 빌리자면, 이 새로운 변화는 '노동자 프로그래머'의 출현이다.

 

'IT' 카테고리의 다른 글

디지털의 배신  (0) 2020.10.27
타겟티드  (0) 2020.10.18
AI 시대 내 일의 내일  (0) 2020.07.30
페이스북은 내가 우울증인 걸 알고 있다  (0) 2020.07.09
딥러닝 레볼루션  (0) 2020.06.12
Posted by dalai
,

AI 시대 내 일의 내일

IT 2020. 7. 30. 12:02

- 컴퓨터와 법률의 궁합이 잘 맞는다는 점에는 몇 가지 합당한 이유가 있다. 첫째로 엄청난 양의 정보, 지금 식으로 말하자면 빅데이터를 다루는 업종이기 때문이다. 둘째, 법률 체계가 수학적 프로그래밍, 즉 코딩의 논리적 사고 전개 방식과 매우 유사하기 때문이다. 셋째, 수사-기소-재판-집행으로 이어지는 사법 절차가 정형 반복적인 업무로 자동화하기 쉽기 때문이다. 이렇게 법률에 정보기술(IT)를 접목한 디지털 자동화 프로세스가 바로 '리걸테크'이다. 그러나 법률 AI는 리걸테크를 한 단계 넘어선 존재이다. 전기 청소기가 로봇 청소기로 진화했다고 할까. AI 법률가는 사람의 개입 없이 스스로 학습해서 끊임없이 진화하고, 최종 분석과 추론 결과를 정확한 수치를 바탕으로 정리해 의뢰자에게 전달한다. 문서와 사진, 동영상 등 콘텐츠를 읽고 쓰는 작업은 물론, 음성으로 사람들과 대화할 수도 있다.
- 한국은 특히 EMR 보급률이 96%에 달함. 건강보험공단에서 100만 건 이상의 임상 정보표본을, 심사평가원에서 8만 7,000여 개의 진료기록을 보유하고 있다. 데이터의 양만으로 따 졌을 때는 어디에도 꿀리지 않는 헬스케어 선진국이다. 그러나 이 데이터를 통합하여 관리하고 활용할 수 있는 기술 개발과 제 도 개혁에 미진해서 아직도 헬스케어 후진국으로 남아 있다. 대 표적인 예로, 이미 수십 년 전부터 의료의 미래상으로 제시되어 왔던 원격진료는 10년 넘게 갈피를 잡지 못한 채 표류하고 있다. 밥그릇을 뺏길까 염려하는 개업의開業醫 모임인 대한의사협회와 의료 서비스 양극화를 우려하는 시민단체들의 반대에 부딪히고 있기 때문이다. 초등학생들도 손쉽게 영상통화로 소통할 정도로 관련 기술이 진보해 있는 현실을 생각하면 어처구니없는 문화 지체 현상 이다. 이미 의료 현장에서는 환자들의 원격진료 요구가 현실화 되고 있다. 한 원로의사는 거동하기 힘든 부모를 대신해 병원에 온 아들딸들이 우리 어머니(아버지)와 한번 영상통화 해보라며 스마트폰을 자신에게 건넨다고 털어놓았다. 의료법 위반이라고 손사래를 치면, “의사 선생님 폰도 아니고, 제 폰으로 통화하는 것뿐인데 뭐 어떠냐”라며 우문현답을 한다는 것이다. 제도가 현실을 못 따라가는 슬픈 대한민국의 자화상이다.
- 필립스 본사에서 혁신전략을 담당하고 있는 예룬 타스Jeroen Tas 총괄 책임자는, AI는 의사를 대체할 수 없지만, AI를 사용하지 않는 의사는 대체될 것이라는 충고를 남겼다. 그만큼 AI가 앞으로 병 진단에 있어 핵심적인 역할을 하게 될 것이라는 의미다. 그러나 결국 최종판단을 내리는 것은 사람 의사이다. AI는 그저 거들 뿐이다.
- 사실 핀테크는 오래전부터 존재했다. 현금 없는 사회를 만든 1950년대 신용카드 혁명, 창구 직원을 대 체한 1960년대 현금자동입출금기(ATM), 1980~1990년대의 전자결제와 인터넷은행 등장 등도 따지고 보면 모두 새 기술에 해 당한다. 그러나 AI가 개입하기 시작한 4차 산업혁명의 스마트 핀테크는 앞선 모든 변혁을 저만치 따돌릴 만큼 그 변화의 폭과 깊이 가 넓고도 깊다. 가장 큰 차이는 '융합'이다. 금융권 내부의 업무 절차 개선, 컴퓨터를 활용한 업무 자동화 정도가 이전의 변화라 면 지금은 금전적 가치의 이전이란 금융의 본질이 전 산업 분야 에서 서로 교류하면서 섞이고 있다.
- 독일의 인더스트리 Industrie 4.0은 스마트 제조 플랫폼으로, AI 공장을 만든다. 미국의 재범 예측 AI 컴퍼스COMPAS는 사법 행정의 지능화 도구로, 범죄 피의자가 가석방해도 될 인물인가 를 판사에게 충고한다. 나름의 혜택과 위험이 있지만 국가 운영 체제의 근간을 흔들 정도는 아니다. 제조 인공지능은 사적인 비 즈니스의 영역에서, 법률 AI는 국내 사법체계의 영역에서 제한 적으로 영향을 주기 때문이다. 그러나 금융은 단순히 비즈니스 나 역내 법률의 영역에 머물지 않는다. 국내적으로는 중앙은행 의 발권력과 이자율 정책, 국채 발행 등 국민경제 시스템을 통해 안정된 통화의 공급과 유동성 관리를 도모한다. 국외적으로는 국가간 제품과 용역의 교환으로 생긴 가치의 이전 등 국제 외환거래와 투자를 통해 무역수지의 균형, 외환보 유고를 비롯한 국부의 증대를 도모한다. 한마디로 금융은 그 나라의 경제 주권으로 정부와 운명을 함께한다. 달러, 마르크, 엔, 위안, 원 등 화폐 단위에 국가의 자존심이 걸려 있는 것이다. 공공성이 그만큼 강하기 때문에 보수적이고, 따라서 디지털 혁명에 뒤처질 수밖에 없었다.
- 블록체인은 금융혁신의 최종 기술이다. 암호통화erytocurrency와 스마트 계약으로 이어지면서 금융 AI의 신뢰성을 보증해주기 때문이다. 미국의 페이스북은 비자·마스터카드와 손잡 고 암호통화 기반의 신종 거래 시스템 '리브라'를 조기 출시하려다 트럼프 행정부와 제도 금융권의 강력한 견제에 시기를 연기했다. 페이스북이 2019년 6월 리브라 발행 계획을 밝힌 직후 트럼프 대통령을 비롯한 미국 정부 고위관료들, 유럽연합 당국은 글로벌 금융 시스템의 안정을 해치는 위험한 프로젝트라고 비난하면서 철회를 요구했다. 그러나 최고경영자인 마크 저커버그는 같은 해 10월 리브라 협회를 창설해 차량공유업체 우버·리프트, 유럽의 결제서비스업체 페이유 등 21개 기업과 공조해나갈 것 을 선언했다. 각 참여기업은 1,000만 달러씩을 투자하기로 했다. 2020년 상반기부터 리브라를 발행해 모바일 기기와 SNS를 통한 결제 서비스를 시작한다는 게 목표였다. 하지만 초기 협회 가입자였던 비자·마스터카드 스트라이프·메르카도파고와 전자상거래업 체 이베이, 부킹홀딩스 등 7개 기업은 탈퇴를 공식화했다. 마음이 바뀐 업체들은 정부의 압력에 태도를 유보한 것으로 풀이된다. 그러나 페이스북은 저커버그의 미 하원 청문회 출석 등 계속된 공세에도 굴복하지 않고 리브라 프로젝트를 지속할 것임을 강조했다. 블록체인 기술에 기반한 미국의 암호통화가 2020년 시즌 2의 새로운 국면으로 접어들 것으로 보인다. 이를 틈타 중국 인민은행은 2020년 상반기 중 세계 최초로 법정 디지털 화폐를 시범 운영한다. 발행은 중앙은행인 인민은행이, 유통은 중국의 4대 국영 상업은행인 공상은행, 농업은행, 중국은행, 건설은행과 3대 이동통신사인 차이나모바일, 차이나 텔레콤, 차이나유티콤이 공동으로 책임진다. 블록체인 기반의 중국 디지털 인민폐는 일대일로一帶一路와 결합해 아프리카, 동남아 등 제3세계 협력국에 대한 원조와 교역의 표준 결제수단으 로 확산시키는 그림을 그리고 있다. 현재 국제 금융의 기축통화인 달러 패권을 디지털 관문으로 뚫고 나가려는 야심이 읽힌다. 미국의 대응도 시간문제일 뿐이다. 블록체인으로 보호되는 스마트 계약도 종래 다수의 중앙집 권적 금융기관이 개입했던 무역 업무 등 복잡한 거래를 쉽게 만들고 있다. 일본의 대형 금융사 SBI 그룹은 2세대 암호통화 '리플(XRP)'을 기반으로 한 기업용 블록체인 네트워크를 개발하고 있다. 61개 일본 은행이 이 R3 프로젝트에 참여해 해외 거래에 이용할 예정이다. 비자·마스터 신용카드 회사도 블록체인 기반 기업 결제 서비스를 이미 출시한 바 있다.
- S&P 글로벌 인수 직전인 2018년 1월 골드만삭스는 금융 AI 켄쇼를 활용해 미국 한파의 최대 수혜주는 넷플릭스와 도미노피자'라는 보고서를 내놓기도 했다. 브라운 사장은 켄쇼의 초기 버전이 주로 주식·채권 등 투자시장 분석과 미래전망 보고서 작성에 치중했다면, 현재는 S&P 글로벌의 내부적 업무 개선 또는 S&P그룹의 여러 다른 고객을 위한 신제품 개발에 집중한다고 말했다. 켄쇼의 AI 기술을 활용한 업무 개선의 예로는 데이터정제가 있다. 새로운 데이터를 추가할 때는 기존데이터와의 연결 고리를 만들어야 한다. 새 데이터의 신뢰도를 검증하고 내부로 편입시킬 수 있도록 재가공하는 작업이 필요한 것이다. 예를 들어, 특정 기업에 투자하고자 할 때 사기업에 대한 데이터는 굉장히 찾기 힘들뿐더러 다양한 소스(정보원)에서 나온다. 또 소스별로 데이터 품질도 다르다. 이때 다양한 소스에서 나온 데이터를 하나로 합치는 기술 개발이 켄쇼의 새 임무라는 설명이다. 다양한 소스로부터 품질이 다른 대량의 데이터가 유입될 때, 이를 정확하고 신속하게 하나로 합치는 것이 데이터 정제의 핵심 기술이다. 기존 데이터와 잘 연결되는 동시에, 합쳤을 때 전체 신뢰도가 떨어지지 않도록 쓰레기를 선별해서 버리고 사후에도 잘 돌아가나 검증해야 한다. 외부고객을 위한 켄쇼의 또다른 신제품 중 하나는 차세대 검색엔진이다. S&P 글로벌의 고객은 투자회사뿐 아니라 로펌 컨설팅사·정부 등으로 폭이 훨씬 넓어졌다. 투자 정보에서 법령 검 토, 심지어 외교·안보 관계 전망 등 광대역의 정보를 찾기 위해 S&P 검색엔진을 사용한다. 그런데 수집 정보의 양과 종류가 늘 어남에 따라 훨씬 더 정교하고 효율적인 작동이 필요하게 되었 다. 예컨대, 영국의 브렉시트 이후 파운드화 변동과 국제 금융시 장에 대한 영향, EU의 새 개인정보보호법(GDPR) 시행 후 대EU 수출입 관세법규의 달라진 해석, 북한 미사일 실험에 따른 글로벌 외교·안보 위험지수 증가와 군비증강 추이 등 정치·경제·사회·외교안보 지형 변화까지 폭넓은 스펙트럼의 빅데이터를 입력해도 즉시 고객이 원하는 정보를 추출해주는 금융판 구글 검색창인 셈이다.
- 알파고는 정책망政策網, policy net과 가치망價値網, value net, 2개의 인공 신경망artificial neural network, ANN으로 구성된다. 인공 신경망은 인간의 뇌신경이 강한 자극 방향끼리 시냅스에 의해 가중 연결되는 원리를 소프트웨어 코딩에 응용한 것이다. 정책망은 상대의 수에 응수할 후보수를 고른다. 가치망은 각 후보 수의 승리 확률을 계산한다. 바둑은 가로세로 19줄이 361개 교차점을 만든다. 어느 한 지점에 돌이 놓였을 때 나머지 지점에 놓을 수 있는 경우의 수는 우주에 존재하는 원자수보다 많다. 무한대에 가깝다는 이야기 이다. 트리tree 탐색은 나무가 큰 줄기에서 가는 줄기로 가지를 뻗 듯, 상위에서 하위 결정으로 내려가며 경우의 수를 따져보는 방법이다. 정책망과 가치망을 가동해도 끝까지 모든 탐색을 할 순없다. 여기에서 몬테카를로 방법Monte Carlo Method 이라는 통계적 샘플링 알고리즘이 동원된다. 경로와 승률을 계산할 때 전체 훈련 데이터 중 승리로 이끌었던 선택(액션)의 초기 확률과 바둑 판 현 상태의 승리 확률을 절반까지만 계산한다. 보다 신속한 확률 탐색으로 검색 과정을 확 줄이는 방법이다. 프로 기사들은 오픈 바둑 AI '릴라제로'를 켜놓고 연구할 때, 반상 위의 각 착점에 대한 개별 승률을 즉시 계산해주기 때문에 좋은 수와 나쁜 수를 판단하는 데 많은 도움을 받는다고 말한다. 실제 화면에서 보면 한 수 한 수를 둬나갈 때마다 왼쪽 분할 화 면에서 흑돌과 백돌의 승률은 계속 변한다. 그리고 정책망에서 보여주는 후보 수의 행마를 차례차례 음미하면서 다음 전개의 유불리를 판단한다. 화면상 후보 수는 승률의 고저에 따라 첫 번째, 두 번째, 세 번째로 좋은 수가 다른 색으로 표시된다. 후보 수의 돌 위에 반 투명한 글씨로 적혀 있는 숫자 42.8은 그 자리에 둘 경우의 승률 을 보여준다. 아래 작은 글씨로 34k라고 적혀 있는 숫자는 바둑 AI의 시뮬레이션 횟수이다. 그 자리를 3만 4,000번이나 들여다. 봤다는 뜻이다. AI가 더 많이 찾아본 수는 그만큼 과거 대국의 데이터상 승리로 이어지는 경로였다는 의미이다.
- 우리는 게임을 잘하는 사람을 보고 “머리가 좋다”라고 말한 다. 이 표현은 단순한 암기력이나 분석 능력 같은 논리적 지능뿐 아니라, 감정과 대인 관계 등 모든 것을 종합한 총체적 능력 을 지칭하는 것이다. 뛰어난 사업가 중 도박을 즐기는 사람의 비율이 제법 높다. 스파이 영화에서 주인공이 악당과 포커 게 임 대결을 벌이는 장면은 단골 에피소드이다. 게임을 잘하는 사 람이 다른 일도 잘할 것, 인생에서도 승자가 될 확률이 높을 것 이라는 게 일반적인 생각이다. 정말 그런지 증거는 없지만 우리 가 그렇게 믿고 있다는 사실이 중요하다. 부자 아빠가 자식에게 모노폴리〉 같은 재산증식 게임을 시키고, 선생님은 심시티〉 등 시뮬레이션 게임으로 학생에게 재미와 의미(지식)를 동시에 전달할 수 없을까 고민한다. 모든 것의 게임화, 게이미피케이션 Gamifacation 개념이다. 인생은 게임이다. 적어도 게임론자에게는.
- 바둑, 체스, 스타크래프트2, 일대일 포커의 공통점은 2명의 플레이어가 제로섬zero sum 게임을 한다는 점이다. 여기서는 AI가 내시 균형Nash equilibrium 전략을 쓰면 대개 통한다는 게 게임이론 전문가들의 분석이다. 그러나 다중 플레이는 다르다. 훨 씬 더 복합한 조합 관계가 등장한다. 브라운 박사는 대회가 끝난 뒤 영국 공영방송 BBC와의 인터뷰에서 “포커는 더 근본적인 문제를 해결하기 위한 하나의 벤치마크”라며 “감춰진 정보에 대처하는 AI를 발전시키는 것이 최종 목표”라고 말했다. 그의 결론은 이렇다. 현실에 활용하고 인간이나 다른 AI와도 상호작용을 하는 AI를 만들려면, 다른 구성원들이 세계를 보는 방식이나 그들이 다른 정보를 가질 수 있다는 것을 이해해야 한다. 따라서 포커는 이를 위한 대단히 훌륭한 모의 실험장치라는 것이다. 플루리버스를 공동개발한 카네기멜론대 토머스 샌드홀 름 Tuomas Sandholm 교수도 “우리는 멀티플레이 포커에서 초인간적superhuman 퍼포먼스를 보여주는 데 성공했다”라며, “이는 AI 연구와 게임이론에서 중요한 이정표를 세운 것”이라고 감격했다.
- 기존에 상용화되어 널리 쓰이고 있는 애플의 시리, 아마존의 알렉사 등 대화형 AI와 프로젝트 디베이터는 어떤 차이가 있을 까. 기존 대화형 AI의 경우, 보통 명확하게 정의된well-defined 단답식 질문 하나를 들으면 이에 즉각적으로 답한다. 무조건적으 로 무슨 대답이라도 내놓도록 프로그래밍되어 있기 때문이다. 그러나 토론은 대화의 주제가 훨씬 다양하고, 대답에 앞서 주어지는 준비시간도 길다. 또 모든 질문에 대답할 필요도 없다. 자신의 논점에 도움이 되는 한두 가지만 답해도 된다. 서로 쓰이는 경우가 근본적으로 달라서 단락적으로 비교하기 어려운 대상이다. 애초에 개발 목표가 다르기 때문이다.
- IBM 토론왕 프로젝트 디베이터는 주제가 공개되면 15분간 방대한 말뭉치corpus를 검색해 도입 연설문을 작성한다. 먼저, 신문기사를 100억 문장 정도 찾아본 후 수백 개의 유의미한 문장 조각segments 으로 줄인다. 다시 이를 맥락에 맞게 논리적으로 재배열해 최종 토론문을 만든다. 언론 기사를 재료로 삼은 이유 는 AI 학습에 필요한 방대한 양의 문장이 존재하고, 다양한 논 점을 다루고 있기 때문이다. 개발팀장은 “처음엔 위키피디아를 이용했지만 사용하는 말뭉치의 크기가 40배 이상 늘어난 후 뉴스 콘텐츠에 주목했다”라고 설명했다. 이런 심도 있는 주제에 대한 토론이 가능한 AI 기술의 등장은, 지금까지의 AI 적용 분야를 넘어선 새로운 활용 가능성을 점치게 만든다. 바로 정치와 민주주의의 디지털 트랜스포메이션, 지능화이다.
- 유권자를 조종하려면 이 같은 AI 프로파일링을 정치 영역으로 확장하기만 하면 된다. 케임브리지 애널리티카는 AI를 통해 유권자의 SNS 정보를 모으고 각 개인의 행동 성향을 분류했다. 후보 캠프의 정치 공학자와 데이터 브로커는 케임브리지의 개인성향정보를 사들인 후 자체 제작한 행동 예측 알고리즘으로 유권자를 분석했다. 누가 어느 정당, 후보를 지지할지 정밀하게 예측한 다음 자기 캠프에 우호적인 지지자들에게만 유도 정보를 노출시켰다. 즉, 페이스북 검색 시 투표 시간·장소를 비롯한 상세한 투표 정보와 투표를 마친 친구 사진 등이 뜨도록 해 투표율 을 높이려는 시도를 했다. 나를 찍을 것으로 예측되는 유권자들만 골라 투표소까지 오도록 유도한다면 내게 유리한 선거결과 조작도 가능하다는 이야기이다. 자신과 다른 견해와 취향을 지닌 사람이나 집단과의 접촉 빈도를 줄임으로써 다양성이 조화롭 게 조정·타협되는 민주주의의 기본전제를 훼손할 수 있다. 따라서 대부분의 개인정보보호법은 AI가 프로파일링을 위 해 인터넷에서 개인정보를 수집하는 경우라도 본인 동의 없이 민감정보를 취득하는 것은 금지하고 있다. 민감정보란 정보주체의 사생활을 현저히 침해할 우려가 있는 개인정보를 말한다. 특정 종교나 정당, 노동조합 가입 여부라든가 질병을 앓은 치료 이력 등 그 사람의 신념과 건강 상태를 한눈에 파악할 수 있게 하는 재료들이다. 그러나 데이터 가공업자들은 단순 정보도 조합해 민감정보로 둔갑시킬 수 있다. 약품 구매이력, 단체 홈페이지 검색 기록 등을 빅데이터로 분석하면 성향 정보를 추출해낼 수 있기 때문이다. 법률적으로 이 같은 행위는 프라이버시권(사생활 보호권) 침해로 간주된다. 자신에 관한 정보를 스스로 통제할 수 있는 권리, 즉 개인 정보를 부당하게 취득·수집당하지 않을 권리 와 노출된 정보를 열람·정정·삭제 청구할 수 있는 권리의 침해에 해당하는 것이다.
- 이중 슬릿 실험과 양자 고양이로 유명한 천재 물리학자 슈뢰딩거는 ‘생명이란 무엇인가’라는 전설적인 강연에서 “생명은 내부의 엔트로피(무질서)를 낮춰 안정을 꾀하는 대신, 외부 엔트로피는 높이는 닫힌계界”라고 정의했다. 이와 함께 생명은 외부의 에너지를 가장 잘 흡수할 수 있도록 복제 전략을 사용해 자신과 닮은 '또 하나의 나'를 연쇄적으로 생산한다고 그는 갈파했다. 복제를 통해 더 큰 닫힌계의 내부 안정을 도모하는 생명과 극에 달한 외부 엔트로피 상승이 서로 균형을 잡으며 자연은 굴러간다고, AI의 창발성과 자기조직화 원리는 생물학자들이 말하는 유기 생명체의 탄생 과정과 흡사하다. 아무것도 없는 영양 수프 덩어리 속에서 갑자기 햇볕을 받아 광합성을 시작하는 원시 생명 이 툭 튀어나온다. 무에서 유가 생긴 것이다. 무질서에서 질서가 탄생하는 순간이다. 이어 생명은 복제를 거듭하며 점차 더 정교한 다음 단계로 스스로 체계를 잡는다. 무조직에서 조직이 툭 튀 어나온다. 아무도 조종 통제 명령하지 않지만 더 큰 질서가 자연 스럽게 형성되는 것이다. AI가 나오기 한참 전에 유행하던 신과 학, 카오스Chaos 와 프랙털 그리고 퍼지 이론 Fuzzy theory 에서 이미 발견한 생명과 자연의 원리이다.

'IT' 카테고리의 다른 글

타겟티드  (0) 2020.10.18
은밀한 설계자들  (0) 2020.09.07
페이스북은 내가 우울증인 걸 알고 있다  (0) 2020.07.09
딥러닝 레볼루션  (0) 2020.06.12
빅나인  (0) 2020.05.10
Posted by dalai
,

- 기업이 인공지능을 활용하는 사례는 크게 세 가지로 나뉘는데, 이 세 가 지는 어느 정도 서로 중첩되지만 어떤 기회를 제공하는지 구분하는 데 도움이 된다. 기업은 인공지능을 이용해
첫째, 고객들을 이해하고 응대 하는 방법을 바꾸고
둘째, 더욱 똑똑한 상품과 서비스를 제공하며
셋째, 기업활동 절차를 개선하고 자동화한다.
* 고객 : 인공지능은 기업이 자사의 고객이 누군지에 대한 이해를 높 이고, 고객들이 원하는 상품이나 서비스가 무엇인지 파악하고, 시장의 추세와 수요를 예측하고 특정 고객에 알맞게 맞춤형으로 응대하도록 해 준다. 이 책에서는 인공지능으로 자사의 고객들을 정말 제대로 파악하는 스티치 픽스와 페이스북 같은 기업들을 살펴보겠다.
* 상품과 서비스 : 인공지능을 통해 기업은 훨씬 똑똑한 상품과 서비 스를 고객들에게 제공하게 된다. 고객은 점점 더 똑똑한 스마트폰, 스마트자동차, 스마트가전제품을 원한다. 이 책에서는 애플, 삼성, 그리고 테슬라와 볼보 같은 자동차업체들이 인공지능을 이용해 더욱 똑똑 한 상품을 제조하고 스포티파이, 디즈니, 우버 같은 기업들이 고객에게 더욱 똑똑한 서비스를 제공하는 방식을 살펴보겠다.
* 자동화 절차 : 인공지능은 사업 절차를 자동화하고 개선한다. 이 책에서는 제이디닷컴같은 사례들을 살펴보겠다. 이 기업은 자동 드론, 자동화된 주문처리 센터와 배달 로봇을 이용해 소매업의 지형을 변 모시키고 있다. 또한 인퍼비전과 엘즈비어가 인공지능을 이용해 의료진단을 어떻게 자동화했고, 심지어 도미노피자가 인공지능으로 어떻게 피자의 품질을 점검하는지도 살펴보겠다.
- 애플은 휴대용 기기에 장착된 감지기들을 통해 수집된 데이터 세트를 바탕으로 자사의 머신러닝 기술을 구동시키는 역량을 갖춘 막강한 휴대용 기기를 구상하고 있다. 이는 다른 기술기업들이 주창하곤 하는 클라 우드 컴퓨팅과 비교적 동력이 덜 드는 단말기가 지배할 미래와는 분명히 상충된다. 이는 자사의 전화기, 워치, 스피커에 장착된 막강한 중앙처리장치 CPU 또는 그래픽스 처리 칩을 이용하는 기기들에 직접 머신러닝 알고리듬을 깔겠다는 뜻이다. 이를 보여주는 한 사례는 가장 최근에 선보인 '아이폰 X' 모델에 장착 된 신경엔진이다. 이는 딥러닝에 필요한 신경망 연산을 수행하기 위해 특별히 설계된 맞춤형 칩이다. 이를 이용하면 안면인식 로그인, 사용자가 더 선명한 사진을 찍도록 해주거나 우스꽝스러운 효과를 추가하도록 해주는 카메라 사양, 증강 현실과 배터리 수명 관리 등과 같은 기능들을 더 신속하게 처리하도록 해준다. 기기에 머신러닝을 직접 구동시키면 클라우드로부터 데이터를 받아 서 단서를 추출해 그 단서를 토대로 작동하는 데 걸리는 시간보다 훨씬 빠르다. 그러나 단점이 없지는 않다. 오직 하나의 기기에서 수집된 데이 터를 바탕으로 알고리듬을 훈련시킬 수 있기 때문에 알고리듬이 클라우 드 머신러닝이 이용할 수 있는 방대한 크라우드 소스 데이터 세트를 통해 학습하는 이점을 누리지 못한다. 이는 사용자의 개인정보를 보호하는 데 집중하는 애플의 전략과 연결 된다. 단말기에는 민감한 개인정보뿐만 아니라 머신러닝 기술도 장착되 어 있다. 따라서 단말기에 담긴 민감한 개인정보가 머신러닝 기술에 의 해 처리되기 전에 단말기를 벗어날 필요가 없게 만듦으로써 소비자는 다른 기업들보다 애플사가 자신의 개인정보 데이터를 훨씬 안전하게 관리하리라는 믿음을 갖게 된다. 애플이 원천기술을 보유한 인공지능 생태계는 핵심적인 머신러닝 프레임워크를 중심으로 돌아간다. 핵심 머신러닝을 이용하면 개발자들이 딥러닝, 컴퓨터 비전, 자연어를 비롯해 머신러닝 알고리듬을 상품에 장 착할 수 있다. 핵심 머신러닝 기술은 애플의 음성인식 비서 시리뿐만 아니라 아이폰 카메라와 스마트 키보드인 퀵타이프의 인공지능 기능까지 구동시킨다.
- 애플은 고객들이 자신의 모바일 서비스 계약이 만료될 때 계속해서 자사와 서비스를 갱신하게 만든다는 사실을 인식하고 개발자들에게 인공지능을 제3자가 제작한 앱에도 통합시키라고 밀어붙였다. 이 전술을 쓴 이유는 다른 모바일 플랫폼에는 없는 막강한 기능들을 계속해서 제 공하도록 하기 위해서였다. 이 목표를 달성하기 위해 애플은 개발자들 에게 크리에이트 머신러닝 Create ML 같은 도구들을 제공해왔다. 이 도구를 쓰면 개발자들은 자신들이 개발한 앱을 사용자의 기기에서 구동되는 머 신러닝을 통해 작동시킬 수 있다. 이를 보여주는 아주 좋은 사례가 홈코트라 불리는 앱인데, 아마 추어 농구 게임의 심판 판정에 도움을 주도록 설계되었다. 사용자는 진행중인 경기에 카메라의 초점을 맞추기만 하면 된다. 그러면 머신러닝이 경기에 참가하고 있는 선수들에게 태그를 달고 패스나 슛을 할 때마 다 입력하고 경기장에서 선수들의 위치를 기록한다. 이 모두가 단말기 자체에 구동되는 컴퓨터 비전 기술을 통해 이루어진다. 폴리워드로 불리는 또 다른 앱은 컴퓨터 비전과 머신러닝을 이 용해 사용자들이 카메라를 들이대는 어떤 사물이든지 그 이름을 30개 언어 가운데 한 가지로 알려준다.다른 사양들을 이용하면 사용자가 찍으려는 사진을 면밀히 살펴보고 실시간으로 어떻게 하면 더 좋은 사진이 될지 제안해주며, 고지 사항을 관리해서 사용자가 제때에 중요한 정보를 받아볼 수 있도록 해준다.
- 페이스북이 인공지능 연구 경쟁에서 한참 앞서가고 있는 분야가 안면인식 기술이라는 점은 하나도 놀라울 게 없다. 페이스북 서버에 얼마나 많 은 사람들의 얼굴 사진이 저장되어 있는지 생각해보면 말이다. 딥페이스 라 일컫는 기술은 사용자가 사진을 업로드하는 순간 작동하기 시작하고 페이스북은 그 사진 속의 사람이 누군지 추측하기 시작한다. 이 기술은 신경망을 이용해 분석 대상 얼굴에서 68개의 데이터 포인트를 집어내고 얼굴의 다양한 부위, 피부색과 비율 등을 측정한다. 400만 건의 안면 이미지를 이 기술에 입력해 개별적인 얼굴 요소들을 인식하고 안면 특징들이 어떻게 사람마다 독특한 인상을 만들어내는지 이해하도록 훈련시킨다. 이 기술이 분석하는 또 다른 얼굴 이미지가 이 미 저장된 독특한 패턴과 일치하거나 흡사한 경우 두 사진 속의 사람이 동일 인물일 가능성이 높다는 사실을 인식하게 된다. | 페이스북은 이 기술로 사용자의 사진에 등장하는 인물들에 태그를 달 뿐만 아니라 사용자들이 자신의 사진이 페이스북 사이트 어디서 등장하 는지 추적하도록 해주고 시각장애인들에게는 사진을 묘사하는 청각서 비스를 제공한다. 페이스북에 따르면, 안면인식 알고리듬은 공개적으로 이용 가능한 시험 데이터 세트를 대상으로 사용하면 97.35퍼센트의 성공률을 보인 다. 인간과 거의 같은 수준으로 안면을 인식한다는 뜻이다.
- 페이스북은 1분마다 페이스북에 올라오는 50만 건의 댓글에서 단서를 추출하는 데도 인공지능을 사용한다. 맥락 분석을 이용해 사용자가 무 슨 말을 하려는지 심층적으로 이해하고 사용자가 요청하기도 전에 사용 자가 유용하다고 여길 만한 정보나 서비스를 제공하는 게 그 목적이다. 페이스북이 보여주는 사례는 다음과 같다. 머신러닝 알고리듬은 친구들 간에 향후 여행에 대해 나누는 대화를 엿듣고 여행지에서 제공하는 공공 서비스들에 대한 링크를 자동으로 생성해낸다. 현재 탐색되고 있는 더욱 진전된 응용 사례는 다음과 같다. 사용자가 자전거를 팔고 싶다는 포스트를 만들면 광고 형태의 포스트를 자동으로 만들어내고 사용자가 묘사해놓은 자전거 사양을 바탕으로 정확한 판매 가를 식별하고, 구매자를 찾아낼 만한 판매 페이지로 안내한다. 이 시스템은 딥텍스트라고 불린다. 딥러닝 신경망을 이용해 문 장을 분석하고 단순히 단어의 뜻을 이해할 뿐만 아니라 한 단어의 의 미가 포스트 내에서 놓인 위치와 그 단어와 함께 사용되는 다른 단어들 을 바탕으로 그 단어의 의미를 파악하기도 한다. 이는 부분적으로 자율 적인 학습 형태다. 사전이나 문법 책 같은 규정에 의존하지 않고 단어에 귀를 기울임으로써 그 단어가 어떻게 쓰이는지를 스스로 터득하기 때 문이다. 인간처럼 말이다.
- 상식적으로 볼 때 인공지능이 아직 할 수 없다고 생각되는 한 가지 과 업이 있다면 바로 향수를 제조하는 일이다. 그러나 세계적인 향수 제조 거대 기업인 에스테 로더, 에이본, 도나 캐런 등의 업체에게 향수를 납품 하는 심라이즈는 생각이 달랐다. 향수 개발은 보통 오랜 세월 동안 훈련받은 인간 전문가들만이 할 수 있는 일이었다. 그럼에도 심라이즈 는 IBM과 협력해 필리라라는 인공지능을 제작했고 이 시스템이 개 발한 향수들은 곧 브라질의 4,000여 개 화장품 매장에서 판매된다. 필리라는 향을 구성하는 요소들을 분류한다. 향수마다 독특한 향을 더하는 데 사용되는 기름, 화학물질, 자연추출물들이 바로 이러한 요소들인데 모두 170만 가지에 달한다. 그러고 나면 필리라는 판매 데이터 와 고객서비스 데이터를 읽어서 어떤 조합의 향이 서로 다른 인구 집단 들에게 호소력이 있을지 추측해낸다.이 알고리듬으로 개발된 두 가지 향은 포커스 집단 테스트에서 '눈부신' 결과를 낳았다. 과거 대상 고객층인 브라질 밀레니얼 세대에게 성공 적으로 팔렸던 다른 향수들보다 훨씬 인기가 있었다. 왓슨은 〈제퍼디!〉에서 왕좌에 오른 이후로 IBM이 이룬 획기적인 성공 사례로 자리매김해왔다. 이러한 응용 사례들 외에도 왓슨은 세계 10대 자동차회사 가운데 7개사, 세계 10대 석유가스회사 가운데 8개사가 사 용하고 있다.
- 2016년 아마존이 무인 비행기를 이용해 최초로 배달 시범 운행을 하고 있을 때, 제이디닷컴은 이미 드론 배달망을 본격적으로 가동하고 있었 다. 그 후로 중국에서는 드론 배송이 현실이 되었고, 현재까지 제이디닷 컴의 배송 비행단은 30만 분 이상의 비행시간을 기록했다. 제이디닷컴은 최대 5톤까지 화물을 배송할 수 있는 드론을 개발하고 있다. 현재 이 드론 서비스는 드론 정거장과 아주 가까이 위치한 지역들 로 물건을 배송하는 데 주로 사용되고 있다. 가장 멀리까지 배송한 거리 는 15킬로미터 정도다. 그러나 머지않은 장래에, 특히 배터리의 수명이 개선되면, 트럭이 접근하기 어려운 오지에까지 배송함으로써 배송에 드 는 비용을 대폭 줄이게 되기를 바라고 있다. 이 드론은 고객에게 상품을 배송할 뿐만 아니라 상품을 창고에서 창고로 옮기는 작업도 하게 된다. 현재 이 업무는 주로 트럭이 담당하고 있다. 트럭 얘기가 나왔으니 말인데, 제이디닷컴은 물론 트럭도 자동화하 고 있다. 이 회사가 투입한 자율주행 트럭은 1만 7,000시간에 달하는 도 로 주행 경험을 축적했고 경우에 따라서 배송에 이미 사용되고 있다. 현 재로서는 이 트럭이 개방형 도로에서의 주행은 수월하게 해내지만, 도 시에 진입하면 인간 운전자에게 운전대를 넘겨야 한다. 이 회사의 X-비 즈니스 부서장인 샤오 준은 다음과 같이 말했다. “우리 기술로 운전사를 세 명에서 두 명이나 한 명으로 줄이는 데 그친다면 큰 가치가 없다. 이 트럭이 무인 운행되도록 하는 게 목표다.”
- 코카콜라는 12만 건 이 상의 소셜 콘텐츠를 분석해 인구구조와 고객과 자사 제품들을 거론하는 이들의 취향을 파악한다. 인공지능의 또 다른 응용 사례는 회사에 대한 충성도를 확인하고 보 상하기 위해서 구매 인증을 확보하는 방법에서 볼 수 있다. 고객에게 병 마개에 인쇄된 14자릿수 상품코드를 웹사이트와 앱에 입력해 구매를 인 증하라고 요청하면 융통성 없는 운영방식의 속성상 실제로 입력하는 고 객의 수는 저조하기 마련이다. 보다 많은 고객들이 이러한 기획에 동참하도록 권장하기 위해서 코카 콜라는 이미지 인식 기술을 개발해 스마트폰으로 사진 한 장만 찍으면 구매인증이 되도록 했다.
- 2017년 초 맥도널드는 인공지능을 비롯한 디지털 기술을 이용해 성장을 추진하는 새로운 전략을 공개했다. 맥도널드가 무인판매기를 설치 한 매장을 점점 늘리면서 인간 직원을 기계로 대체하는 추세로 나아가는 두드러진 징후로 여겨지기도 했다. 그러나 맥도널드가 직접 한 말을 인용하자면, 무인판매기를 설치한 주요 동기는 기술을 이용해 “고객이 매장에서 먹든 포장하는 자동차를 탄 채로 주문하는 배달주문을 하든 상관없이 고객을 상대하는 방식을 재구성하는 것이다.
- 최근 전 세계적으로 맥도널드 매장에 등장한 무인판매기와 매장에 비치 된 디지털 메뉴판은 단순한 단말기가 아니다. 거기에는 스마트 분석기 술이 장착되어 있다. 어떤 제품을 고객에게 선전하고 판매할지 매장 차원에서 자율적으로 판단을 내릴 수 있다는 뜻이다. 매장이 위치한 해당 지역의 주문 상황, 날씨, 재고 중 유통기한이 끝나기 전에 처리해야 할 재료 목록 등 여러 요인들을 토대로 이러한 판단을 내린다. 메뉴도 똑똑하게 상황에 적응할 수 있다. 예컨대, 기온이 떨어지면 훨 씬 속을 든든하게 해줄 메뉴를 제시하기 시작한다. 화창한 날에는 샐러 드와 아이스크림이 메뉴판에서 눈에 띄게 만들 수도 있다. 맥도널드는 고객들이 자기 휴대폰으로 계정을 만들고 직접 주문할 수있는 앱도 제공한다. 이 방법을 통해 맥도널드는 어떤 고객에게 한정판매 메뉴를 보여주면 흥미를 보일지 예측하는 데 사용할 데이터를 확보할 수 있다. 이를 통해 맥도널드는 서로 다른 지역에서 서로 다른 부류의 고객집단에게 가장 인기 있는 품목이 무엇인지 보여주는 통합된 데이터 세트를 구축할 수도 있다.
- 실시간으로 확인하는 정도에 근접하지 않고는 상품이 운송 판매되는 과정을 정확히 모니터하기란 쉽지 않다. 서로 다른 여러 부서들이 서로 다른 재고 시스템을 이용하는 일이 종종 있다. 꼭 필요한 순간에 재고 데이터를 입수하지 못할지도 모르고, 데이터 자체도 인간이 직접 수집 하고 업데이트하기 때문에 오류가 날 가능성이 있다. 월마트가 고객중심 기업임을 보여주는 한 사례는 매장 내에서 사용하는 앱이다. 이 앱을 사용하는 쇼핑객은 매장 내의 진열대에서 특정 품목 의 위치를 찾을 수 있다. 이는 사용된 지 꽤 된 앱인데, 사용해본 사람이 라면 누구나 알겠지만 정확도는 복불복이다. 상품이 진열대에 진열되는 때와 그 상품이 스캔되는 때, 즉 계산대에서 상품 바코드가 읽힐 때 사이에 무수히 많은 일이 일어날 수 있기 때문이다. 계산대에서 스캔하는 순간 데이터가 업로드되지만 앱은 여전히 재고가 업데이트되지 않은 상태에 머문다.
- 거대한 소매업체들은 저렴한 가격을 유지하는 일과 고객에게 편의를 제공하는 일 사이에서 아슬아슬하게 외줄타기를 해야 한다. 이 외줄에서 조금만 기우뚱해도 경쟁사들에게 점유율을 빼앗긴다. 한 가지 매우 흥미로운 구상을 소개한다. 자율적으로 스캐닝하는 로봇을 배치해 매장에서 실시간으로 비디오 분석을 하는 방법이다. 이 로봇은 미국 내의 일부 매장에서 시범적으로 설치되었는데, 통로 를 오가면서 진열대 위의 상품들을 비디오로 찍는다. 매장 내 재고 수준 이 시간마다 어떻게 오르내리는지 보여주는 데이터를 사실상 실시간으로 수집한다는 뜻이다. 그 결과 하루 중 특정한 시간에 어떤 품목이 팔릴지 더 잘 예측함으로써 고객 행동을 더욱 정확하게 보여주는 모델을 구축할 수 있다. 이 데 이터는 다시 공급사슬과 재고 시스템에 입력되고 그 결과 미래 수요를 더욱 정확하게 예측하게 된다. 위에서 소개한, 고객이 매장에서 사용하는 앱의 경우, 로봇의 센서가 실시간으로 전달하는 데이터를 통해 앱 사용자는 자신이 찾는 품목이 진열된 위치를 정확히 파악한다. 별도의 데이터베이스에 따라서 대충 그 위치를 짐작하지 않아도 된다는 뜻이다. 자동화가 인력에 미치는 장기적인 영향에 대한 관심이 높아지고 있는 때에 월마트 로봇은 인간을 대체하려는 의도로 제작되지는 않았다는 점 을 주목해야 한다. 이 로봇은 매우 반복적이고 따분한 업무를 지원하기위해 설계되었다. 그 덕분에 매장의 직원들은 고객을 돕는 데 더 많은 시간을 할애할 수 있다.
- 인스타그램의 괴롭힘 방지 여과 장치는 페이스북이 개발한 딥텍스트라는 자연어 처리 기술을 사용한다. 이 기술은 사용자의 댓글을 구성하는 텍스트를 살펴보고 과거에 괴롭 히는 댓글로 경고딱지가 붙은 다른 댓글들과 비슷한 패턴을 보이는지 분석한다. 딥텍스트는 신경망과 연관된 딥러닝 기술을 이용해 업로드되는 텍스 트를 분류하고 텍스트가 업로드된 맥락을 이해한다. 딥러닝 시스템은 훈련을 거듭할수록 정확도가 개선되므로 온라인상에서 친구들끼리 장 난으로 욕설을 주고받을 때와 의도적으로 누군가를 겨냥해 집중적으로 괴롭힐 때 쓰는 욕설을 구분하는 능력이 점점 개선된다. 자연어를 기본으로 하는 다른 딥러닝 시스템과 마찬가지로 딥텍스트 도 인간들끼리 서로 문자를 주고받는 방식을 배우고 이에 적응하면서 속어, 말하는 패턴, 사투리, 어법 등을 이해하는 능력이 점점 개선된다.페이스북은 딥텍스트를 통해 새로운 장을 개척하고 있다고 말하는데, 이는 이 기술이 분석을 실행하는 과정에서 각 단어에 지정하는 의미에 여러 층이 추가된다는 뜻이다. 각 단어에 의미를 규정하는 태그를 부착할 뿐만 아니라, 이를 이용해 단어의 빈도와 텍스트 안에서의 맥락을 추적하고 각 단어가 여러 의미 의 관계망에서 차지하는 위치를 지정해준다. 이러한 기능을 통해 인공지능은 단어들 간의 공통적인 관계와 서로 다른 단어들이 똑같은 의미로 쓰이는 상황들을 학습하게 된다. 이 기술의 비결은 이러한 기능을 매우 신속하게 실시간으로 수행할 수 있으므로 매우 효과적이라는 점이다. 1초당 업로드되는 1,000건의 인스타그램을 분석하고 이해하고 판단을 내릴 정도다.
- 서비스로서 인공지능을 제공하는 다른 기업들과 마찬가지로 세일즈 포스도 자기학습 컴퓨팅 기술을 크고 작은 기업들의 손에 쥐어주는 게 목적이다. 세일즈포스는 이 목표를 추진하다가 한 가지 특별히 까다로운 난관에 봉착했다. 당연한 얘기지만 기업들은 자사의 고객 데이터 보안유지에 매우 민감하다. 인공지능은 첨단 기능의 혜택을 누리도록 해 주지만 클라우드는 해당 고객사만 독점 사용하는 것도 아니고 고객사가 통제하지도 못한다. 그렇다면 클라우드에 고객사의 데이터를 업로드하도록 기업고객을 설득할 수 있을까? 세일즈포스의 데이터 과학자와 엔지니어들은 고객들을 설득할 필요 가 없도록 해주는 솔루션을 개발했다. 그들은 실제 데이터 자체가 아니 라 메타데이터로 작동하는 머신러닝 알고리듬을 설계했다.
- 머신러닝을 이용해 고객 데이터를 구성하는 요소들에 표지를 부착함으로써 데이터 준비 절차를 자동화했다는 뜻이다. 예를 들면, 고객관리 데이터베이스 내의 한 영역이 이메일이나 마케팅 목적이 포함되어 있는 지 여부를 인식함으로써 표지를 부착할 수 있다. 이는 사실상 알고리듬이 고객의 데이터를 보지 않고도, 고객들로 하 여금 자사의 데이터를 아인슈타인의 예측 머신러닝 알고리듬으로 처리 하도록 해주었다. 그러나 기업이 자사의 데이터를 면밀히 분석해 얻은 이득을 다른 기 업들도 기꺼이 활용하도록 하겠다면 이러한 사양을 쓰지 않겠다는 선택 을 해제할 수도 있다. 즉, 익명 처리된 데이터가 여러 자료에서 수집한 데이터를 사용하는 알고리듬 실행 서비스에 입력된다는 뜻이다. 아인슈타인 실행 서비스는 판매와 마케팅, 청구서 발송과 재정기획, 공동체 관리와 고객서비스를 비롯해 수없이 다양한 영업업무를 처리함으로써 기업고객에게 도움을 준다.
- GE의 에너지 인터넷은 산업 인터넷 플랫폼 프리딕스를 중심으로 구축되었다. 이를 이용해서 GE는 석탄, 가스, 원자력에서 풍력과 태양광 발전에 이르기까지 고객의 세계 발전소 망에서의 에너지 생산을 세계적 인 관점에서 개관할 수 있다. 평균적으로 발전소에는 1만 개의 센서가 장착되어 있는데, 이러한 센서가 발전소 운영의 모든 면을 모니터하면서 센서 하나당 하루에 2테라 바이트의 데이터를 생성해낸다. 프리딕스 플랫폼은 발전소에 설치된, GE가 제조하고 판매한 기계뿐만 아니라 발전소 내의 모든 기기에서 수 집된 센서 데이터를 읽도록 설계되었다. GE는 이 데이터를 이용해 '디지털 트윈'이라는 개념을 개척하고 있다. 사업의 어떤 부문이든지 컴퓨터로 복사본을 만들어서 수요증가와 기상변화 같은 현실 세계의 요인들이 어떤 영향을 미치는지 정확 히 보여주는 기술이다. 이 기술 덕분에 미국 전역에 있는 자사의 발전소망에 프리딕스 시스템을 설치한 엑슬론같은 발전소 운영자들은 운영 여건에 영향을 미칠 만한 요인들을 더욱 정확히 예측할 수 있다. 예컨대, 기상 여건을 더욱 정확하게 예측함으로써 태양광 패널이 가장 효과적이지 않은 시기 를 파악하고 가스를 연료로 쓰는 발전소의 발전량을 늘릴 필요가 있는지 판단한다. GE 파워는 '에너지 인터넷' 프로그램의 이러한 측면들을 '자산 실적 관리'로 분류한다.
- 이와 더불어 인공지능을 사업 최적화에 사용한다. 정확한 최신 데이 터를 통합, 자동화해주는 기업 탐르가 제작한 소프트웨어를 이용해 머신러닝을 방대한 조달 업무 관리에 응용한다. GE의 수많은 부서들은 세계적인 공급망을 갖춘 수많은 공급자들로부터 수십만 가지의 품목을 구매하는데, 과거에는 중앙에서 이를 조율하지 않았다. 이 시스템에 청 구서와 구매내역 기록들을 입력, 훈련시켜 다양한 부서들이 수많은 공 급자들로부터 동일한 품목을 조달하는 상황에서 과잉 주문을 피하고 비용 효율성을 높일 수 있다.
- 탐르 플랫폼을 통해 3년 동안 8,000달러 절약 : GE 파워의 최고 디지털 책임자 가네시 벨anesh Bell은 다음과 같이 말한다. “계획에 없던 비 가동 시간을 5퍼센트 줄이고, 가동되지 않는데 가동되고 있다는 긍정 오류(오탐지)는 75퍼센트 줄었으며, 운영과 관리 비용은 25퍼센트 줄이는 결과를 얻었다. 이 모든 성과를 더하면 상당한 가치에달한다.” 탐르 플랫폼을 이용해 물품 조달과 재고 처리를 관리함으로써 3년에 걸쳐 8,000만 달러를 절약했다고 GE 디지털 스레드의 기술상품관리 부사장 에밀리 걸트는 말한다.
- 지멘스는 센서와 카메라를 이용해 운송 시스템의 모든 부분이 어떻게 움직이고 운영되는지 측정한다.이를 통해 철도 시스템의 '디지털 트윈’ 모델을 구축하고 언제 연착이 나 비효율성으로 이어질 요인들이 나타나는지 예측한다. 문제에 신속히 대처하거나 애초에 이러한 일이 발생하지 않도록 방지하려면 어떤 조치를 취해야 하는지 판단할 수 있다. 이렇게 하는 이유는 크게 세 가지 목적을 달성하기 위해서다.
첫째, 열 차가 제때에 있어야 할 장소에 있는지 확인하고, 더욱 효율적인 서비스 와 수리 작업을 통해 결함과 고장을 훨씬 신속히 바로 잡을 수 있다. 그럼으로써 필요한 때에 자산을 이용할 수 있도록 한다.
둘째, 운송망 전체에 걸쳐서 에너지 효율성을 최적화한다. 에너지 사용을 측정하고 언제 어디서 동력이 필요할지 예측할 수 있다는 뜻이다. 열차가 다른 교통수단에 비해 상대적으로 환경친화적이라고 간주되긴 하지만, 이를 통해 열차가 야기하는 환경영향을 더욱 줄일 수 있다. 열차가 운행되는 동안 에너지 절약도 최적화될 수 있다. 철도망 내 거 시적인 차원에서 운행 상황을 더 잘 파악함으로써 열차가 브레이크를 이용하는 빈도를 줄이고 열차를 앞으로 밀어내는 데 필요한 에너지를 절약할 수 있다. 또한 더욱 빠른 속도로 열차가 달리도록 해서 목적지까 지 도착하는 데 걸리는 운행 시간을 줄일 수 있다.
셋째, 자산을 더욱 효율적으로 이용할 수 있다. 특정 시간대에 목적지와 목적지 사이에 운송될 승객 수나 화물의 양을 더욱 정확하게 예측하 게 된다는 뜻이다. 승객이나 화물을 운송하는 데 필요한 열차 운행이 줄어들수록 환경에 미치는 영향뿐만 아니라 운영자가 치러야 하는 비용도 줄어든다.
- 지멘스의 서로 연결된 예측 인공지능 플랫폼 레일리전트는 다시 마인드 스피어라는 자사의 사물인터넷 운영체계에 연결된다. 이 시스템은 모바일 데이터망을 이용해 실시간으로 열차로부터 데이 터가 전송되거나 네트워크 연결이 부실한 지역에서 열차가 목적지에 도 착하면 데이터가 업로드되도록 설계되었다. 열차에 장착된 센서는 엔진 온도에서부터 열차 진동 빈도, 열차 출입 문의 개폐 상태까지 샅샅이 포착하고 외부 카메라에서 수집한 이미지 데이터를 처리해서 연착을 야기할 요인들을 규명한다. 영국에서 실시된 한 시범 운행 사례에서는 300개 센서가 사용되었는데, 1년 동안 100만 건의 센서 판독기록을 생성했다. 센서에서 수집된 데이터는 고장 및 운영중지 데이터와 서로 연관해서 분석된다. 열차 자체에서 수집한 내부 데이터뿐만 아니라 카메라 피드에서 수집 된 외부 데이터도 사용된다. 그 덕분에 열차는 전방의 철도 이미지를 포착해 하자가 있는지 자동으로 인식하고 미래에 결함이 발생할 위치를 더욱 정확하게 예측할 수 있다. 인간이 직접 열차가 운행 중인 철도를 점검할 필요성을 줄여주기 때문에 근로자의 안전도 개선된다. 지멘스는 테라데이터의 애스터 디스커버리 플랫폼과 손잡고 센서가 생성한 데이터에서 유용한 정보를 뽑아낸다. 데이터는 전용 보고 및 시각화 플랫폼을 통해 조종실로 전달되거나 이미 사용 중인 도구에 통 합될 수 있다. 중요한 보고 내용이나 사건들은 SMS를 통해서도 전송할 수 있다.

 

 

 

'IT' 카테고리의 다른 글

은밀한 설계자들  (0) 2020.09.07
AI 시대 내 일의 내일  (0) 2020.07.30
딥러닝 레볼루션  (0) 2020.06.12
빅나인  (0) 2020.05.10
최신 인공지능 쉽게 이해하고 넓게 활용하기  (0) 2020.02.23
Posted by dalai
,

딥러닝 레볼루션

IT 2020. 6. 12. 13:01

- 알파고 제로는 인간의 전략을 배제했지만 그럼에도 그 프로그램이 바둑을 두기 위해 이용할 수 있는 바둑 지식은 수작업으로 입력된 상 태였다. 그렇다면 알파고 제로는 바둑에 대한 지식이 없어도 여전히 향상될 수 있을까? 이 의문에 대한 답을 찾기 위해 도출한 것이 알파 제로(AlphaZero)였다. 코카콜라 제로(Coca-Cola Zero)가 코카콜라에서 모든 칼로리를 제거한 것이듯 알파제로는 알파고 제로에서 바둑에 관한 특정 지식 모두를 제거한 것이었다. 결론부터 말하자면 알파제로는 알파고 제로보다 더욱 빠른 속도로 학습할 수 있었고, 알파고 제 로를 뛰어넘는 수준에 이르렀다. 또한 알파제로는 학습 매개변수를 단 하나도 변경하지 않은 상태에서 슈퍼맨 수준으로 체스를 배워 ‘적을수록 더 좋다(less is more)'는 요점을 보다 극적으로 보여줬다. 알파 제로는 인간이 전에 한 번도 시도한 적 없는 외계적 체스 수까지 선보이며 슈퍼맨 수준의 기존 체스 프로그램인 스톡피시(Stockfish)에게 단 한 차례도 승리를 허용하지 않았다. 한 체스 대국에서는 비숍 하나를 희생하는 대담한 수(때로 유리한 위치를 점유하기 위해 이용되는 수)를 둔 후 퀸까지 내줬다. 이런 행보는 치명적인 실수로 보였지만, 이후 적잖은 수가 진행된 후 체스 프로들도, 스톡피시도 예상하지 못했던 외통 수 장군이 나와 모두를 놀라게 했다. 외계인이 도착한 셈이었고, 이제 지구는 더 이상 전과 같지 않을 터였다.
- 컴퓨터 비전은 픽셀이 아닌 특징에 초점을 맞춤으로써 진보하기 시작했다. 예를 들어 조류 사육자나 관찰자들은 몇 가지 미묘한 무늬만 다른 경우가 많은 각각의 종을 구별할 줄 아는 전문가가 되어야 한다. 조류 구분법을 알려주는 실용적이고 대중적인 서적은 대개 각 각의 새에 대해 한 장의 사진을 소개하면서 그들 사이의 미묘한 차이 를 보여주는 스케치를 곁들인다(<그림 2.3) 특정 종에만 고유한 특징 이 있으면 수월한 경우에 해당하지만, 대개 많은 종에서 동일한 특징 들이 발견되기 때문에 새의 식별을 가능하게 하는 것은 날개의 횡대 나 눈의 줄무늬, 깃털의 반점 등과 같은 부위별 표식 몇 가지의 독특 한 조합이다. 그러한 부위별 표식이 밀접히 관련된 종들 사이에 공유 되는 경우에는 다시 울음소리나 노랫소리로 서로를 구별한다. 관련된 종들 사이의 특징에 주의를 집중시킬 때에는 사진보다 그림이나 스케치를 이용하는 것이 효과가 높다. 사진은 관련성이 낮은 수많은 특징까지 가득 포함하기 때문이다. 특징에 기초한 이 접근 방식의 문제점은 수없이 많은 세상의 서로 다른 객체에 대한 특징 감지기를 개발하는 일이 매우 노동 집약적이 라는 것뿐만 아니라 최상의 특징 감지기를 갖춘다 하더라도 객체의 일부가 가려지는 경우 그 이미지에서 모호성이 발생한다는 데 있다. 결국 여러 객체가 뒤섞여 모여 있는 경우 컴퓨터가 각각을 인지하는 일은 벅찬 작업이 될 수밖에 없는 것이다. 1960년대 컴퓨터 비전이 인간 수준의 수행력을 갖추는 데 이후 50 년의 세월에 걸쳐 컴퓨터 성능이 100만 배는 증가해야 될 것으로 짐 작한 사람은 거의 없었다. 컴퓨터 비전 프로그램을 작성하는 일이 수월할 것이라는 잘못된 직관은 우리 인간이 보고 듣고 움직이는 것과 같은 활동을 수월하게 행한다는 사실에 기초했다. 하지만 그런 활동 이 제대로 자리 잡히는 데 수백만 년이라는 진화의 세월이 걸리지 않 았던가. 원통하게도 초기의 인공지능 개척자들은 곧 컴퓨터 비전 문 제를 해결하는 일이 극도로 어렵다는 사실을 인정하지 않을 수 없었 다. 그에 반해 컴퓨터가 로직에서는 인간보다 훨씬 뛰어난 것으로 밝 혀졌기 때문에 그들은 수학적 정리를 증명하도록 컴퓨터를 프로그래 밍하는 일은 훨씬 쉽다는 것을 깨달았다. 수학적 정리의 증명은 최고 수준의 지능을 요하는 것으로 생각되는 과정이다. 논리적으로 생각하는 능력은 진화에서도 늦은 단계의 발달에 속하며, 심지어 인간의 경우에도 정확한 결론에 이르려면 일련의 논리적 명제를 체계적으로 따르도록 훈련을 받아야 하는 무엇이다. 반면에 우리가 생존을 위해 풀어야 할 대부분의 문제는 대개의 경우 이전 경험에 기초한 일반화만으로도 잘 해결할 수 있다.
- 1957년 소련이 스푸트니크 위성을 쏘아올렸을 때 미국의 반응과 흡사하게 2017년 알파고 와 대국을 펼친 중국의 바둑기사 커제의 패배는 베이징에서 2030년까지 전 세계에서 지배적 위치를 구축한다는 목표 아래 야심찬 프로젝트와 스타트업 그리고 학문적 연구 등을 지원하는 수십 억 달러 규 모의 새로운 인공지능 연구 계획이 시작되는 계기가 되었다. 방대 한 의학적, 개인적 데이터를 보유하고 있으며 서방 민주국가들에 비 해 사생활 침해에 대한 우려가 상대적으로 적은 중국이기에 개인정 보를 사유권으로 간주하는 국가들을 뛰어넘어 앞으로 도약하는 일이 충분히 가능하다. 중국은 또한 데이터 수집을 위한 최적의 재배 및 제조 시스템의 구축도 목표로 삼고 있다. 가장 많은 데이터를 보유하는 쪽이 승자가 된다. 중국은 그 점을 간파하고 판을 짜고 있다. 더욱 불길한 것은 중국이 '인공지능 기술을 유도미사일에 접목하 고, 폐쇄회로 카메라에 적용해 사람을 추적하는 데 이용하며, 인터넷 감시를 넘어 범죄 예측에까지 활용하기를 원한다는 점이다. 한편 미국의 정치 지도자들은 과학 기술 분야의 재정 삭감을 계획하고 있다. 1960년대 미국은 우주 개발에 1천 조 달러의 재정을 투입한 바 있다(물가 상승률을 감안해 조정한 금액이다). 덕분에 위성 산업이 발전했고 미국은 초소형전자공학과 재료공학 분야에서 선두로 나서며 과 학기술이 곧 국가의 힘이라는 정치적 선언까지 하지 않았던가. 그때 의 투자로 인한 성과는 오늘날까지 여전히 이어져오고 있다. 초소형 전자공학과 첨단소재 분야는 미국이 아직도 경쟁력을 유지하고 있는 몇몇 산업 분야에 속하기 때문이다. 따라서 인공지능 개발에 대한 중 국의 막대한 투자는 21세기를 지배하는 몇몇 핵심 산업 분야에서 선두를 차지하게 만들기에 충분하다. 바로 이 점이 우리에게 경종을 울리고 있다.
- 생물학자였던 스튜어트 카우프만(Stuart Kauffman)은 이른바 '전사 인자'라고 하는 단백질이 특정 유전자에 결합해 활성화 또는 비활성 화에 관여하는 유전자 네트워크에 흥미를 느끼게 되었다. 그의 가설 에 의해 구축된 모델은 자가 조직적이며 시간의 척도는 훨씬 느리지 만 어떤 측면에서는 뉴럴 네트워크와 흡사한 이진법 단위의 네트워크에 기초한다. 1980년대 후반 크리스토퍼 랭튼(Christopher Langton) 이 '인공 생명'이라는 용어를 처음 사용한 이래' 살아 있는 세포의 복 잡성과 복잡한 행동이 유발되는 원리를 이해하려는 시도가 봇물처럼 터져나왔다. 세포 내 분자 메커니즘의 고도로 진화된 복잡성에 대한 실마리를 찾고자 지금까지 이뤄낸 세포생물학과 분자유전학 분야의 발전에도 불구하고 생명의 신비는 여전히 우리 인간의 이해 범위를 벗어나고 있다.
- 알고리즘은 우리가 사는 세상과 비교해볼 수 있는 복잡한 세상을 만들어낼 새로운 기회를 제공한다. 실제로 20세기에 발견된 알고리즘으로 인해 우리는 복잡성의 특성을 새롭게 조명하게 된 바 있다. 1980년대의 뉴럴 네트워크 혁명 또한 그와 유사한 성격의 시도들이 주도한 것이다. 뇌의 복잡성을 이해하기 위한 시도들 말이다. 비록 우리가 만든 뉴럴 네트워크 모델은 뇌의 뉴런 회로에 비해 상당히 단순 하지만 학습 알고리즘 덕분에 방대한 뉴런으로의 정보 전달과 같은 일반 원칙에 대한 탐구가 가능해졌다. 어떻게 비교적 단순한 학습 규칙으로부터 네트워크 기능의 복잡성이 발생하는 것인가? 보다 쉽게 분석할 수 있는 복잡성을 보유한 보다 단순한 체계가 존재한다는 말인가?
- 주요 컴퓨터 칩 기업과 스타트업들은 너 나 할 것 없이 딥러닝을 위한 칩 개발에 상당한 투자를 하고 있다. 예를 들면 2016년 인텔 (Intel)은 4억 달러에 너바나를 인수했다. 너바나는 샌디에이 고에서 특수 목적 VLSI 칩을 설계하던 작은 스타트업 기업이다. 너바나의 전 CEO 나빈 라오(Naveen Rao)는 현재 인텔의 새로운 인공지능 제품 그룹을 이끌며 중간 단계를 거치지 않고 인텔 CEO에게 직접 보 고하는 위치에 있다. 2017년 인텔은 자율주행 자동차에 적용하는 감 지기와 컴퓨터 비전 분야에 특화된 기업 모빌아이(Mobileye)를 153억 달러에 인수했다. 그래픽 애플리케이션과 게임 구동에 최적화된 특 수 목적 디지털칩, 일명 ‘그래픽처리장치(GPUs)'를 개발한 앤비디아 (Nvidia)의 경우 현재 딥러닝과 클라우드 컴퓨팅을 위한 특수 목적 칩 의 판매량이 훨씬 더 많다. 구글은 자사의 인터넷 서비스에 사용되는 딥러닝 기능을 강화하기 위해 보다 효율적인 특수 목적칩인 텐서처 리장치(Tensor Processing Unit, TPU)를 자체 개발했다.
- 딥러닝 애플리케이션의 개발을 위해서는 특수한 소프트웨어 또한 못지않게 중요하다. 구글은 자사의 딥러닝 네트워크가 대중적으로 활용되도록 하기 위해 텐서플로우(TensorFlow) 프로그램을 제작했다. 비록 그 의도가 보이는 것처럼 이타적인 것은 아닐지라도 말이다. 예 를 들면 안드로이드 프로그램을 무상으로 이용하도록 한 결과 전 세 계에 사용되고 있는 거의 모든 스마트폰의 운영체제에 대한 통제권 이 구글의 손에 들어갔다. 그러나 지금은 구글의 텐서플로우를 대체 할 수 있고 무상으로 사용할 수 있는 대안도 존재한다. 마이크로소프 트의 인지툴킷(Cognitive Tool Kit, CNTK), 아마존을 비롯한 다른 주요 인터넷 기업들이 지원하는 엠브이넷(MVNet), 그 외에도 독자적으로 딥러닝 프로그램의 구동이 가능한 카페(Caffe), 테아노(Theano), 파이토치(PyTorch) 등이 그것이다.
- 자동차처럼 디지털과 뉴로모픽 설계의 융합이 부상하고 있다. 컴퓨팅을 위해 매우 낮은 전력만을 필요로 하는 뉴로모픽 설계의 장점과 커뮤니케이션에 유리한 고대역폭 디지털 칩의 장점을 취하는 새로운 하이브리드 구도 말이다.무어의 법칙은 칩의 처리 성능만을 고려했을 뿐이다. 향후 50년간 병렬 구조가 지속적으로 진화한다면 무어의 법칙은 에너지와 함께 처리량까지 고려하는 새로운 법칙으로 대체되어야 할 것이다. 인텔의 주관으로 오리건, 포틀랜드에서 열린 2018 NICE 콘퍼런스에서 미국과 유럽의 과학자들에 의해 세 가지 새로운 뉴로모픽 칩이 공개되었다. 그중 하나는 인텔이 개발한 로이히 리서치 칩(Loihi research chip)이고 나머지 두 개의 차세대 칩은 유럽의 인간두뇌프로젝트(European Human Brain Project)에서 발표한 것이다. 대량 병렬 구조의 발전과 함께 이 구조에서 작동할 수 있는 새로운 알고리즘 또한 만들어지고 있다. 그러나 이들 구조 내에 있는 칩들은 여전히 정보의 전달을 필요로 한다.
- 생명의 기원은 지구가 현재 우리가 알고 있는 것과는 완전히 다른, 우리가 알고 있는 것처럼 생명을 지탱하지 못했을 수십 억 년 전으로 시간을 거슬러 올라간다. 환경 은 혹독했고 대기 중에는 산소도 얼마 없었다. 고세균류는 박테리아 보다 먼저 지구상에 서식하고 있었다. 그렇다면 고세균류 이전에는 무엇이 있었을까? 오늘날 알려진 모든 세포에는 DNA가 있다. 그렇다. 면 DNA 이전에는 무엇이 있었는가? 1968년 오르겔과 크릭은 DNA 로부터 추출된 RNA가 전구체라고 추측했다. 그러나 그것은 RNA의 자기복제 능력을 전제로 하는 추측이었다. 그 가능성을 뒷받침하는 증거는 RNA 기반의 효소로 RNA 반응의 촉매 작용을 하는 리보자 임의 형태로 발견되었다. 오늘날 대다수의 학자들은 모든 생명체가 초기 'RNA 세상'으로부터 유래되었을 가능성이 충분하다고 믿고 있다. 그렇다면 RNA는 어디서 온 것인가? 불행하게도 그것을 증명할만한 자료는 그리 많지 않다.

Posted by dalai
,

빅나인

IT 2020. 5. 10. 15:10

- 알파벳(Alphabet 구글의 모회사)의 비즈니스 유닛인 딥마인드에는 700 명의 직원이 있으며, 그중 일부는 가능한 빠른 속도로 상용 제품을 개발하는 임무를 부여받았다. 2018년 3월, 구글의 클라우드 사업 부문은 딥마인드 엔진을 탑재한 문자 음성 지원 서비스를 텍스트 100만 자 처 리당 16달러에 제공한다고 발표했다. 구글의 2018년 I/O 콘퍼런스에서 주목받은 발표 중 하나는 고객을 대신해 자동으로 전화를 걸어 “음” 이나 “아하”소리까지 넣어 가며 인간에게 말을 걸고 식당이나 미용실을 예약하는 음성인식 비서인 듀플렉스(Duplex)였다. 이 상품은 딥마인드의 일부인 AI 기반 발성 장치인 웨이브넷(WaveNet 텍스트를 읽어 음성으로 재생하는 딥 러닝 네트워크)을 이용한다. 그동안 알파벳 산하 또 다른 부문의 AI 연구 그룹 구글 브레인(Google Brain AI의 심층 학습 연구 팀)은 AI를 만드는 AI를 만들었다고 공개했다. 오토ML(AutoML)로 불린 이 시스템은 강화 학습이라는 기술을 이용한 기계 학습 모델을 자동화했다. 오토ML은 일종의 '부모' 같은 최 고위층 관리자인 DNN으로서 특정 임무를 맡을 '자녀' AI 네트워크 생성 여부를 결정한다. 오토ML은 요청 없이도 나스넷(NASNet)이라 불리는 자녀를 생성해 비디오로 사람, 자동차, 교통 신호등, 지갑 등을 알 아볼 수 있도록 가르친다. 자아, 의심, 자신감 부족 최고의 컴퓨터 과학자에게서도 발견되는 특징이다 같은 인간적 결함 없이 나스넷은 82.7퍼센트의 확률로 이미지를 예측했다. 이는 이 시스템이 오리지널 부모 컴퓨터를 창조했던 사람을 포함한 인간 코딩 담당자를 능가한다는 이야기다.
- 그렇다. 기계는 생각할 수 있다. 튜링 테스트나 보다 최근인 2011년 헥터 레브스크가 제안한, 상식적인 추론에 초점을 맞춰 AI에게 애매모호한 대명사가 들어 있는 간단한 질문에 대답을 하도록 하는 위노그래드 도식(Winograd schema) 같은 대화체 시험이 다른 영역에서의 AI력을 측정하기 위해 반드시 필요한 게 아니다. 이는 기계가 인간처럼 언어 구조를 이용해 생각할 수 있음을 증명한 것이다. 아인슈타인이 천재라는 점에는 모두가 동의한다. 아인슈타인은 당시 자신을 담당한 교사들이 이해할 수 없는 방식으로 생각했으며, 이에 따라 그들은 당연히 아인슈타인이 지능이 낮다고 여겼다. 사실은 당시 아이슈타인의 강력한 사고력을 측정할 수 있는 의미 있는 방법이 없었다. AI도 그러하다. 생각하는 기계는 현실의 결과물에 영향을 끼치는 결정이나 선택을 할 수 있으며, 이를 위해서는 의도와 목적이 필요하다. 결국 그들은 판 단 감각을 개발했다. 철학자와 신학자 양측에 따르면 이런 것은 영혼 을 만드는 본질이다. 각각의 영혼은 신의 통찰력이자 의도의 표현으로, 유일한 창조주에 의해 만들어지고 부여되었다. 생각하는 기계도 창조주가 있다. 그들은 AI의 새로운 신인데, 대부분 남성이고, 압도적으로 미국과 서유럽 그리고 중국에 거주하며, 어떤 점에서는 빅 나인으로 연결돼 있다. AI의 영혼은 미래에 대한 그들의 통찰력이자 의도의 표현이다.
- AI와 한참 먼 분야에서 사례를 빌자면, 1970년대와 80년대, 샘 키 니슨, 앤드루 다이스 클레이, 짐 캐리, 마크 마론, 로빈 윌리엄스, 리처 드 프라이어는 모두 전설적인 코미디 스토어(미국 캘리포니아주 웨스트 할 리우드의 웨스트 선셋 불러바드에 있는 유명한 코미디 클럽) 바로 아래에 있는 크 레스트힐 로드에 살았다. 그들은 밥 호프(미국의 전설적인 코미디언)가 TV 에 나와 “나는 한 여자를 두고 두 번 생각한 적이 없어. 한 번이면 충분 하잖아” 같은 농담을 터트리는 시대에 무대에 올라갈 기회를 얻으려고 노력하면서 한 집에 살던 젊은이에 불과했다. 하지만 그들의 가치는 급진적으로 달랐다. 터부를 깨뜨리고, 사회적 불의에 맞서고, 관객의 피드백을 반영해 가며 초현실적인 이야기를 해댔다.
그들은 서로 특성과 관찰 내용을 공유했다. 그들은 무대에서 썰렁한 반응을 접하게 되면 서로 안타까워했다. 그들은 서로 실험했고 서로 배웠다. 이 획기적이고 재기 넘치는 희극배우로 이루어진 그룹이 미국 엔터테인먼트 미래의 초석을 놓았다. 이들의 영향력은 아직까지는 살아 있다. 마찬가지로, AI도 동일한 가치와 아이디어, 목적을 공유한 현재이 개발자 그룹 덕분에 비슷한 급진적 변화를 겪게 되었다. 앞에서 말했 던 세 명의 심층 학습 선구자 제프 힌턴, 얀 르꿩 그리고 요슈아 벤지오는 심층 신경망 초기 AI 세계의 샘 키니슨이고 리처드 프라이어다. 르꿩은 캐나다 고등 연구소(CIFAR)가 요슈아 벤지오를 포함한 소그룹의 연구자를 가르친 토론토 대학교 힌턴 밑에서 공부했다. 이들은 많은 시간을 함께 보냈고, 아이디어를 이리저리 궁리했으며, 이론을 시험했고, 차세대 AI를 만들어 나갔다.
- 개발자 그룹의 강력한 유대는 사람들이 밀접하게 함께 일하고 좌절을 겪고 성공을 축하하면서 형성된다. 그들은 일련의 경험을 공유하 고, 이는 공통의 어휘로 기록되며, 공통의 아이디어와 행동 그리고 목 표로 귀결된다. 수많은 스타트업 스토리, 정치적인 운동, 문화적인 거대한 흐름이 바로 이런 방식으로 시작된다. 몇 명의 친구, 기숙사 방이나 집이나 창고의 공유, 프로젝트에 집중하기 등이다. 현대 AI의 비즈니스 진앙은 실리콘밸리, 베이징, 항저우 그리고 선전이지만, 대학이야말로 AI 개발자 그룹의 원동력이다. 그 허브는 몇 개 안 된다. 미국에서는 카네기 멜런대, 스탠퍼드대, UC 버클리대, 워 싱턴대, 하버드대, 코넬대, 듀크대, MIT, 보스턴대, 맥길대 그리고 캐 나다의 몬트리올대를 포함한다. 이 대학은 산업과 강력한 유대를 맺고 활발한 학술적 연구를 진행하는 거점이다. 이들에겐 특유의 규칙과 관습이 있는데, 이는 가혹한 대학 교육에서 시작된다. 북미에선 대학이 R이나 파이선 같은 프로그래밍 언어 숙달, 자연어 처리, 응용 통계학, 컴퓨터 시각 장치, 컴퓨터 생명공학 그리고 게임이론 같은 고난도 기술을 강조한다. 밖에서 '마음의 철학이나 문학 속 무슬림 여성' 또는 '식민주의에 대한 강의를 듣는 것을 못마땅한 눈으로 바라본다. 만일 우리가 인간처럼 생각하는 능력을 갖춘 생각하는 기계를 만들려고 노력하면서 인간의 조건에 대해 배우는 것을 배제한다면 이는 직관에 어긋나는 일로 간주될 것이다. 하지만 이런 과목은 교과과정에서 의도적으로 배제되고 있는데, 전공 외의 분야에서 선택과목을 수강할 여지는 거의 없다고 할 수 있다.
- 페이스북은 아마 세계 최대의 소셜네트워크이겠지만, 텐센트 기술 은 여러 면에서 훨씬 우위에 있다. 텐센트는 샤오웨이(Xiaowei)라는 이 름의 휴대용 정보 단말기, 모바일 결제 시스템(텐페이 TenPay), 클라우드 서비스(웨이윈 Weiyun), 최근에는 무비 스튜디오(텐센트 픽처스 Tencent Pictures)를 내놨다. 텐센트의 유튜 연구소(YouTu Lab)는 안면과 사물 인식 분야에서 전 세계를 주도하면서 50개 이상의 다른 기업에 기술을 제공하고 있다. 이 역시 건강 산업 분야로 진출하고 있는데 영국의 헬스케어 업체로 원격의료 스타트업인 바빌론 헬스(Babylon Health)와 AI를 원격 환자의 모니터링에 이용하는 메도패드(Medopad) 두 업체와 파트너 관계다. 2018년 텐센트는 두 군데의 유망한 미국 스타트업인 아톰와이즈(Atomwise)와 엑스탈피(Xtalpi)에 큰 투자를 했는데, 이들은 AI를 의약품에 적용하는 데 초점을 맞추고 있다. 2018년 텐센트는 시장가치 5,500억 달러를 웃돈 최초의 아시아 기업이 되었고, 페이스북을 누르고 전 세계에서 가장 가치 있는 소셜미디어 기업에 올라섰다. 그중에서도 가장 놀라운 일은 텐센트 매출에서 온라인 광고가 차지하는 비율이 20퍼센트가 되지 않는다는 사실로, 이는 페이스북이 98퍼센트에 이르는 것과 비교된다.
- 중국에서 자본 투자의 대가로 지적 소유권을 요구하는 것은 기묘한 문화적 관습도, 투자자가 더 많은 걸 얻기 위한 탐욕도 아니다. 그것 은 정부에 대한 조직적인 협력의 일부다. 중국은 경제적, 지정학적, 군 사적으로 가까운 미래에 세계를 지배한다는 분명한 비전을 갖고 있다. 그래서 AI를 그 목표로 가는 통로로 여긴다. 이 목적을 위해선 정보의 절대적인 통제가 국가 지도자의 최고 관심사일 수밖에 없다. 따라서 중국은 미국 기업으로부터 중국의 사업 파트너로 지적 소유권을 이전 하도록 설계된 산업 정책을 채택했다. 그 사례에는 특정 데이터세트, 알고리즘 그리고 공정 디자인이 포함된다. 중국에서 사업을 하려는 수 많은 미국 기업은 반드시 자신이 소유한 기술부터 먼저 중국에 넘겨야 한다. 그 외에도 외국 기업이 연구와 개발을 중국 내에서 현지화하고, 현지에서 사용한 데이터를 저장하도록 강제하는 새로운 규제가 있다. 데이터를 현지에서 저장하게 하는 것은 외국 기업에는 어려운 요구다. 왜냐하면 중국 정부가 언제라도 데이터를 조사하고 암호를 해제할 수 있는 권한을 갖게 되기 때문이다. 베이징은 신중하게 장기 계획을 짜고 있다. 정부 지도자와 공산당 간부가 전략적인 전망을 총괄하면서 중국을 몇 십 년 뒤 미래까지 뻗어 나갈 종합적인 경제적, 정치적, 군사적 그리고 사회적인 계획과 설계를 하는 지구상에 몇 안 되는 나라로 만들기 위해서 말이다. 중국 정부는 어떤 계획을 이행하고 어떤 비용을 치르더라도 중국을 2030년까지 세계 최고의 AI 혁신 센터로 전환해 자국 경제에 1,500억 달러 규모의 산업을 창출할 2030 계획을 포함한 국가 전략을 실행할 굉장한 능력을 갖추고 있다. 이 계획은 정권이 바뀌어도 계속될 것으로 전망 되고 있다. 2018년 3월 중국은 임기 제한을 폐지해 시진핑이 권좌에 종신으로 머물 수 있는 길을 터주었기 때문이다. 시진핑 주석의 통치 아래 중국은 인상적인 권력 강화를 경험했다. 그는 공산당을 대담하게 만들었으며, 정보 흐름에 대한 통제를 강화하였고, 열매를 다음 세대에서 누릴 수 있을 것으로 기대하는 숱한 장기 계획을 진척시킬 새로운 정책을 수립했다. 중국 정부의 최상층에, AI는 최일선이자 가장 중심에 자리 잡고 있다. '능력을 숨기고 때를 기다 린다'라는 뜻의 도광양회(韜光養晦)를 정부 철학으로 삼았던 전 중국 공 산당 지도자 덩샤오핑(鄧小平)과 달리 시진핑 주석은 중국의 능력을 전 세계에 보여줄 준비가 되었으며, 글로벌 선두를 달리고 싶어 한다. 중국이 지도자들은 미래를 내다보며 대담하고 통합된 계획을 실행에 옮기고 있다. 이 같은 정책적 배경은 BAT에 슈퍼 파워를 안긴다.
- 명시된 규칙과 지시 사항이 없을 경우 팀이 선택한 선택 사항은 해 당 집단의 암묵적인 가치를 반영하는 경향이 있다고 주장하는 것이 콘웨이의 법칙이다. 1968년 컴퓨터 프로그래머이자 고등학교 수학 및 물리학 교사였던 멜빈 콘웨이는 시스템이 그것을 설계한 사람의 가치를 반영하는 경향이 있음을 알아냈다. 콘웨이는 조직이 내부적으로 소통하는 방식을 구체적으로 살펴보았지만 나중에 하버드와 MIT에서 진행된 연구를 통해 더욱 그의 주장에 힘이 실렸다. 하버드 비즈니스 스쿨은 동일한 목적을 위해 구축되었지만 다른 유형의 집단, 즉 엄격하게 통제된 소프트웨어와 보다 특별하고 개방적인 소프트웨어를 검토하면서 다양한 코드베이스를 분석했다. 위 연구의 주요 성과 중 하나는 집단의 설계방식은 집단이 어떻게 구성되어 있는지와 밀접한 관련이 있으며, 이것이 야기하는 편견이나 행사하는 영향력이 집단 내에서는 간과되는 경향이 있음을 알아낸 것이다. 결과적으로 집단에 속한 소수의 사람들의 초월적인 네트워크-그것이 무엇이건 간에는 집단 전체에 엄청난 영향력을 미친다. 콘웨이의 법칙은 AI에도 적용된다. 초창기 철학자, 수학자 그리고 오토마타 발명가가 마음과 기계를 논했을 당시 도구에 대한 인류의 동기와 목적을 설명하는 가치 알고리즘은 존재하지 않았다. 토대 연구 및 응용 프로그램에 대한 접근 방식에는 차이가 있었으며, 마찬가지로 현재에도 중국과 서구의 AI 개발 단계에도 간극이 존재한다. 콘웨이의 법칙은 집단의 신념, 태도, 행동이 숨겨진 편견이라고 확신하기 때문 에 중요하다. 콘웨이의 법칙의 맹점은 빅 나인이다. 왜냐하면 AI에 있어서 유전 성은 일정하기 때문이다. 현재 인류는 AI를 개발한 모든 단계를 그대 로 반복하고 있다. 그들의 개인적인 아이디어와 집단 이데올로기는 AI 생태계, 코드베이스, 알고리즘, 프레임 워크, 하드웨어 및 네트워크 설계에 고스란히 반영된다. 언어, 성별, 인종, 종교, 정치 및 문화가 개 인을 반영하지 않는다면, 그것들로 구축된 모든 부산물이 반영하는 것 은 아무것도 없을 것이다. 현실은 우리가 전문가가 아니기 때문에 AI 에만 국한되는 이야기는 아니다. 이는 업계와 상관없이 자금과 판매, 대담한 새로운 제안 사이의 지속되는 연결 고리다.
- 현재 AI의 발달로 자동화 및 효율성이 우선시되고 있는데, 이는 우리의 수천 가지 일상에 대한 통제와 선택의 폭이 그만큼 작다는 것을 의미한다. 만약 당신이 새로운 차를 운전한다면, 당신의 스테레오는 당신이 후진할 때마다 볼륨을 낮춰 줄 가능성이 있고, 그 결정을 거부 할 방법이 없다. 인간의 실수는 자동차 사고의 가장 큰 원인이다. 비 록 내가 차고로 후진할 때 어떤 것에 부딪히거나 넘어뜨리는 일은 결 코 없었지만 차고로 들어가는 순간 더 이상 '사운드가든'의 록 음악을 가장 큰 소리로 들을 수가 없다. AI 개발자 그룹은 내가 선택할 수 있 는 능력을 무시했고, 그들이 개인적인 결점으로 인식하는 것을 최적화했다. 아직 다루지 않은 것은 G-MAFIA나 BAT에선 공감을 위해 최적화하고 있다는 사실이다. 의사 결정 과정에서 공감대를 없애면 우리 인간성을 빼앗는 것이며, 때로 논리적으로 전혀 이해가 되지 않을 수 있 는 것도 어떤 특정 순간에는 우리에게 최선의 선택이 될 수 있다. 아픈 가족 구성원과 시간을 보내기 위해 일을 그만두거나 불타는 차에서 누 군가를 돕는 것처럼, 그 행동이 당신 자신의 삶을 위험에 빠뜨릴지라도 말이다. AI로 살아가는 우리의 미래는 작은 것에 대한 통제력 상실에서 시작된다. 내가 차고로 차를 몰고 들어가면서 크리스 코넬이 '블랙홀 태 양을 큰 소리로 듣지 못하는 것, 온라인 광고에 체포 기록과 연관된 당 신 이름이 나오는 것을 보는 것, 당황스러운 챗봇 사고 이후 주가가 하 락하는 것을 지켜보는 것, 종이에 베이는 것 같은 이 작은 사고는 현재 에는 별로 중요해 보이지 않지만, 앞으로 50년 동안 우리에게 많은 고통을 줄 수 있다. 우리는 하나의 재앙을 향해 가는 것이 아니라 오늘날 우리가 당연하게 여기는 인간성의 지속적인 침식을 향해 나아가고 있는 것이다.

 

Posted by dalai
,

- 왓슨은 현재 가장 인공지능에 가까운 플랫폼 중 하나입니다. 단, IBM은 왓슨을 절대 인공지능이라 부르지 않고 인지 체계'라고 부릅니다. IBM 입장에서는 인공지능을 '강한 AI'라 고 부르는 만큼 AI 관련 기술을 쓰고 있어도 전지전능하다고 할 수는 없는 왓슨을 인공지능이라고 부를 수 없다는 거겠죠. IT 업계에서는 '인지'가 스스로 생각할 수 있다'는 뜻으로 통합니다.
- 왓슨은 고객과 상담원의 대화를 음성 인식'으로 인식해 텍스트로 변환하고 그 것을 형태소로 분석(단어 및 문절로 변환)한 다음 자연어 처리 분류를 해서 문장 의 뜻과 의도를 이해합니다. 조작 매뉴얼, FAQ, 서포트 이력, 최근 많았던 사례 등의 데이터베이스를 검색해 적절해 보이는 여러 답변을 점수까지 매겨 골라주고 점수가 가장 높은 것을 최적의 답으로 판단해 상위 3개~5개의 답을 후보로 올려 화면에 표시합니다. 기본적인 이용 매뉴얼에 적혀 있는 내용을 보고 베테랑의 기량과 경험까지 학 습한 시스템이 상담원을 지원해 해결책을 조언해 주면, 설령 새내기라 해도 최적 의 답으로 고객 응대를 할 수 있으며 직무 수준을 통일할 수 있습니다. 또 새내기 도 더 빨리 실전에 들어가 베테랑 수준의 조언을 받아서 문제를 해결하는 경험을 할 수 있어 교육 기간이 단축된다는 장점도 있습니다.
- IBM 왓슨은 클라우드 서비스[PaaS (Platform as a service)]로 제공되기 때문에 물리적인 하드웨어나 서버군은 소프트뱅크가 운영 및 관리하는 데이터 센 터에 있습니다. IBM 왓슨을 이용하기 위한 30개가 넘는 기능을 가진 API가 이미 공개됐고, 거기에는 딥러닝 등의 AI 관련 기술뿐 아니라 50개 이상의 선진 테크놀 로지가 이용됐습니다. 이러한 API를 조합하면 누구나 쉽게 인지 애플리케이션을 만들 수 있습니다. IBM이 운영 중인 '블루믹스 (BlueMix)에서 공개 중이며, 이미 전 세계에서 8만 명 이상의 개발자가 사용하고 있습니다. 몇 가지의 계약 형태가 준비돼 있고 그에 따라 IBM 왓슨 사용 시 청구되는 금액이 다릅니다. '블루믹스'에서는 30일간 무료 시험판을 준비해 놓았기 때문에 본인이 개발한 시스템에 왓슨의 API를 넣어 성능 및 효과를 시험해 볼 수 있습니다.
- 마이크로소프트는 음성 비서로 린나와는 별개인 '코타나(Cortana)를 가지 고 있습니다. 윈도우폰용으로 개발됐고 최근에는 윈도우 10에도 탑재된 음성 입 력의 중요하고도 핵심적인 기능입니다. 말하자면 아이폰의 '시리'와 같은 기능인 데, 코타나에게 내일 날씨를 물으면 정확하게 지역별로 내일 날씨 정보를 대답해 줍니다. 즉, 코타나는 사용자에게 유익한 정보를, 린나는 유익성보다는 사용자를 즐겁게 해주는 관점에서 대답하도록 만들어진 것입니다. '린나'의 근간에 있는 기술은 마이크로소프트 애저' (Microsoft Azure)입니 다. 애저는 마이크로소프트에서 제공하는 비즈니스용의 본격적인 클라우드 플 랫폼입니다. Bing에서 수집한 방대한 데이터를 축적해 그것을 머신러닝 Azure Machine Learning' 등을 이용해 처리합니다. 애저 기반을 사용하면 갑작스럽게 접속량이 집중돼도 견딜 수 있는 구성을 갖추게 됩니다. '린나'가 오락성을 중시했다고 해서 라인과 마이크로소프트가 이 AI 관련 대화 기술을 재미로 끝내려던 것은 아닙니다. 2015년 8월, 라인은 기업용 API 솔루션 인 '라인 비즈니스 커넥트'와 '린나를 활용해 인공지능(AI)형 라인 공식 계정을 기 업에 제공하겠다고 발표했습니다. 라인에 따르면 '인공지능 린나의 대화 엔진 기술을 활용해 기업을 대상으로 한 새로운 마케팅 솔루션으로 제공하는 것이며, 트랜스 코스모스를 통해 '라인 비 즈니스 커넥트’ 지원 솔루션 중 하나로 '린나 API for Business'를 제공해 기업의 라인 공식 계정에 실질적으로 적용하면 도입할 수 있게 된다고 합니다. 기업용으 로는 오락성뿐 아니라 유용성이 높게 요구된다고 볼 수 있습니다.
- 예전에는 제품 사진을 다양한 각도에서 찍어 이미지로 데이터베이스상에 등록해 두고 방문자가 내민 이미지를 탐색해 전체 모습과 특징적 인 디자인 등 부분적으로 일치하는 것을 해당 제품으로 인식하게 하는 일반적인 시스템을 사용했습니다. 하지만 페퍼의 시연회 때 도입된 딥러닝에서는 상품의 영상을 인식시켜 자동 으로 '직선'을 구분하는 유사한 신경 세포와 '둥근 모양을 구분하는 유사한 신경 세 포 같은 다양한 유사 세포(형식 뉴런)가 소프트웨어적으로 만들어졌고 원시적인 (기초적인) 형상을 구분하는 유사한 신경 세포를 몇 겹이나 조합한 결과, 직선과 곡선 그리고 색의 조합 등을 통해 물질의 특징값을 발견한 뒤 예를 들어 이것은 OX 클린' 치약이겠네, 이것은 '와플'이겠네, 라는 식으로 식별할 수 있게 됩니다. 물론 이 해석 작업에 CG 데이터 같은 입체 도면 데이터가 쓰이는 것도 아닙니다. 딥러닝을 비롯한 인공지능 기술의 경우는 도입하는 기업이 취급할 상품과 서 비스에 맞게 적절한 특징값을 잡을 수 있게 트레이닝 (튜닝)하면 해석 및 인식의 정밀도(정답률)를 올릴 수 있다고 알려져 있습니다. 또한 가까운 미래에는 실제 로 제조업체 홈페이지를 통해 제품의 특징 등의 정보를 수집할 가능성도 있고, 그 렇게 되면 로봇은 자동으로 상품 정보를 학습하기 때문에 매장 측이 제품 정보를 등록하기 위해 들여야 할 수고도 현저하게 줄어들 것으로 기대됩니다.
- 2011년에 캘리포니아주 샌타크루즈 시 경찰청이 도입한 시스템 ‘프레드 폴(PredPol)은 지진의 여진 예측을 응용한 것으로서 차량 내 물건 도난 및 강도, 무기에 의한 범죄 등의 종류로 나눠 범죄가 발생할 확률이 높은 지역을 표시합니 다. 지역은 약 150m 사방으로 구역을 나눴으며 상당히 세세하게 명시돼 있습니 다. 경찰관은 지정된 지역을 중점적으로 순찰해 범죄에 발 빠르게 대처하고 미연 에 이를 방지할 수 있게 했습니다. 샌타크루즈 시 경찰청이 이 예측 시스템을 도입 할 수 있었던 것은 범죄 보고를 전자화했기 때문입니다. 즉, 그때까지의 범죄 데이터를 축적해놓은 덕에 범죄 예측에 사용할 빅데이터를 비교적 쉽게 준비할 수 있었던 겁니다.
오늘과 내일 일어날 범죄, 즉 미래의 범죄를 예측하려면 유효한 범죄 예측 모 델이 필요합니다. 모델은 연간 12만 건에 달하는 보고서와 범죄 기록 데이터는 물 론 그 지역의 범죄 발생률, 한 번 범죄가 있었던 지역에서 바로 다시 똑같은 범죄 가 일어날 확률과 경향, 범죄가 일어난 지역 가까이에서 범죄가 일어날 확률과 경 향, 범죄 이력이 있는 인물의 유무(또는 이사왔는지 여부), 비교적 치안이 나쁜 매 장의 유무, 빈집의 증감, 가로등 상황 등을 패턴화해 범죄를 예측하게 돼 있습니다.
샌타크루즈 시 경찰청의 발표에 의하면 다음 해인 2012년의 시내 범죄 발생 건수는 전년 대비 6% 감소했고 2013년에는 11% 감소했으며, 최근 보도에서는 체 포한 범죄자의 수가 50% 증가하고 범죄율은 20% 감소해 큰 성과를 올렸습니다. 2012년에는 빈집털이 사건이 11%, 강도 사건이 27% 감소했다고 하는데 빈집털 이 피해가 발생하면 그 주위에서도 연달아 발생할 확률이 높다는 점, 빈집 증감은 그 지역 치안의 좋고 나쁨에 관련돼 있다는 점 등이 수학 모델로도 증명됐습니다. 베테랑 경찰관도 발견하지 못한 데이터를 컴퓨터가 발견해 예측에 반영하는 경우 ' 도 많이 볼 수 있었다고 합니다.
그 후 로스앤젤레스와 애틀랜타 등, 약 60곳의 시 경찰청에서 이를 도입했습니다. 범죄를 미연에 방지해 치안을 좋게 만들 수 있다는 이점이 제일 먼저지만 실은 각 시 경찰청 모두 범죄의 급증과 함께 오랜 시간 경찰관의 인원 부족에 시달려 왔기 때문입니다. 범죄 예측 시스템을 도입해 더욱 효과적으로 경찰관을 배치할 수 있고 신속하게 범죄에 대처할 수 있다는 점은 인력 부족을 해소하는 데 공헌하고 있습니다.
- 히트곡 예측 사이트 'Music Xray'는 아티스트가 올린 곡을 들을 수 있는 사 이트입니다. 이 사이트는 소니와 워너, 유니버설 등과 같이 12,000개가 넘는 회사 들이 유력한 레이블 및 음악 프로듀서들과 제휴를 맺었습니다. 아티스트에게는 유 력한 음악 업계와 접촉할 기회가 제공되는 장이며, 올린 곡이 레코드 회사와 프로 듀서, 프로모터의 눈에 띄면 본격적으로 데뷔할 길이 열릴 수도 있습니다. Music Xray는 AI 시스템과 연관돼 있습니다. 올린 곡을 AI 시스템이 20초 동안 들어보 고 히트할 확률을 산출해 냅니다. 올린 곡의 경우는 항상 평가가 이뤄지며 매달 500~700곡이 계약 안건에 들 어간다고 합니다. AI가 듣고 평가해 히트하리라 판단한 곡은 우선 음악 업계에 소 개되는 시스템을 갖추고 있습니다. AI의 분석 기술을 이용해 재능을 인정받을 기회를 아직 접하지 못한 아티스트를 발굴하자는 것입니다. 이 AI 시스템은 클래식과 재즈 등 다양한 장르를 통해 300만 곡 이상의 곡들을 사전에 학습합니다. 히트곡에는 패턴이 있는데 AI에 의해 약 60개의 히트 클러스터라고 불리는 그룹으로 분류할 수 있다고 합니다. 바꿔 말해 과거에 히트한 곡의 패턴을 분석해 보면 대부분은 그중 하나의 히트 클러스터에 속해 있다는 것입니다. 올린 곡은 리듬, 멜로디, 하모니, 비트, 억양, 음색, 속도 등의 70개 요소로 분 루해 분석됩니다. 더 나아가 약 40개의 깊은 구조로 정보가 분류되어 AI가 패턴을 분석해 본 결과, 몇 개의 히트 클러스터에 자리를 잡으면 히트 확률이 올라가는 것 으로 판단됩니다. '그럼 처음부터 히트할 패턴으로 곡을 만들면 되는 거 아냐?'라고 생각할 수도 있지만 꼭 그렇지만도 않습니다. 그게 바로 머신러닝의 재미있는 점인데 개발자도 AI가 왜, 어디를 보고 그 곡을 히트 클러스터에 넣은 것인지 자세한 이유는 알지 못합니다. 바꿔 말해 어떤 곡이 히트곡이 될지는 개발자도 정확하게 알지 못한다는 것입니다.
- 머신러닝은 크게 분류 문제'와 '회귀 문제'로 나뉩니다.
'분류 문제는 글자 그대로 뭔가를 분류하는 것으로, 이미 실용화가 진행됐습니다. 예를 들어, 뭔가를 분류하는 기능이라고 하면 처음에는 쉬울 것 같다는 생각 을 합니다. 이미지 인식을 예로 들면 스캔한 이미지가 무엇인지 고양이 '개'차' 등 이라고 식별하는 그 분류를 말합니다. 텍스트의 경우 스팸 메일인지 정규 메일인 지 파악하고 뉴스 장르를 분류하며, 데이터 분석의 경우 잘 팔리는 상품이나 추천 상품을 분류하는 것 등이 한 예라고 할 수 있겠습니다.
분류 문제는 예측 대상이 개나 고양이 같은 이산값(연속되지 않는 값)인 데 비해 '회귀 문제는 예측 대상이 1.05m, 40.14$ 등의 실질적인 수치인 문제를 말 합니다. 계산을 통해 산출되는 수치, 추측 및 미지의 데이터를 예측, 그리고 시계 열로 변화하는 주가 데이터 같은 것들 말입니다.
- 머신러닝의 신경망에서는 식별해서 분류하기 위해 인간이 제시한 규칙이 아 니라 '어떤 “특징값을 산출합니다. 그리고 그 특징값이 개'라고 가르치면 개로 분 류합니다. 이를 반복하면 기계 스스로가 특징값을 산출해 개로 분류할 정보가 늘어납니다. 이처럼 학습 및 훈련, 트레이닝을 거치면 개에게 여러 가지 패턴이 있다는 것을 학습함과 동시에 어떤 특징값에 해당하는 것을 '개'라고 분류하면 되는지 를 이해합니다. 컴퓨터가 다루는 특징값은 실제로는 수치’ (벡터값)인데, 뉘앙스 로 설명하자면 인간처럼 개인지 고양이인지는 보면 안다'와 마찬가지로 어디가 어 떻다를 따지는 것이 아니라 '대충 보면 알죠, 이건 개예요'라는 애매한 특징값으로 구분하게 된다는 것입니다. 또한 이 특징들은 훈련을 통해 기계가 자동으로 학습 하기 때문에 개발자는 기존과 같이 세세한 규칙을 정의해야 하는 업무에서 해방될 수 있습니다.
- 이렇게 완성된 분류 시스템에 이 이미지는 개랑 고양이 중 무엇인가요?'라며 이미지를 입력하면 그 이미지의 특징값을 컴퓨터가 분석해 개의 특징값 내 범위와 일치할 경우 개라고 판단하고, 고양이의 특징값과 일치할 경우 고양이라고 판단해 분류합니다. 그리고 반복해서 말하지만, 중요한 건 개를 판단하는 기준(특징값) 을 인간이 만들어서 제공한 것이 아니라 기계가 학습을 통해 스스로 계산해 냈다. 는 것입니다. 이를 가능하게 한 것이 머신러닝의 신경망이며 높은 정밀도로 인식 하는 것이 심층 신경망입니다. '딥러닝으로는 머신러닝을 통해 특징값을 학습한다 나 '딥러닝으로 어떠한 특징값을 산출한다'는 이런 것을 의미합니다.
- 신경망(Neural Network)은 뉴런의 구조를 컴퓨터로 모방하는 것에 도전 한 것입니다(신경망은 NN'으로 줄여 부르기도 합니다). 신경망이라는 말은 생 체나 생물학, 신경학 분야에서도 이용되기 때문에 인공지능과 컴퓨터 업계에서 뇌 의 구조를 시물레이션한 시스템을 말하는 경우에는 일부러 '인공'이라는 말을 붙여 인공신경망 (인공신경 회로망) (ANN)이라고 구별하는 경우도 있습니다. 뇌는 신경 세포의 거대한 망이라고 불립니다. 네트워크를 구성하는 뉴런은 무수히 많고, 그 수는 100억~300억 개가 넘는 다는 설도 있습니다. 신경 세포의 역할은 정보를 처리하는 것과 다른 신경 세포로 경보를 건달(입출력)하는 것입니다. 다른 신경세포로는 신경전달물질에 의한 시냅스 결합을 통해 정보가 전달되어 기억 및 학습 등과 같은 지능적인 처리를 진행 합니다. 뇌 과학의 '단 하나의 학습 이론'(One Learning Theory)에 의하면 뇌는 다. 양한 기능을 가지고 있다고 생각하기 쉽지만 사실 공통된 패턴을 인식해 처리하고 있다고 합니다. 지극히 간단하게 말 하자면 인간은 사물을 보고 듣고 대화하고 뭔가를 느끼고 감정을 품고 답을 생각 하고 추측하는 다양한 것들을 해내고 있는 만큼 뇌에도 각각에 적합한 구조의 부위가 있고 그것들이 복잡한 처리를 하는 게 아니겠냐는 상상을 합니다. 하지만 사 실 뇌 내부에서는 모두 똑같은 패턴 인식을 통해 정보를 처리하고 있다는 이론이 있습니다. 그리고 신경망이 그러한 패턴 인식을 모방한다면 뇌와 같이 이미지 인식과 음 성 인식과 계산과 분류와 추론, 그리고 학습과 기억 모든 부분에서 범용적으로 능 력을 발휘할 가능성이 있지 않겠냐는 것입니다. 그것을 실천하고 있는 것이 바로 신경망과 그 알고리즘입니다. 인공신경망의 구조 자체는 새로울 것이 없습니다. 인공지능은 예로부터 연구 돼 온 분야이고 형식 뉴런’ 발표는 1943년, 시각과 뇌의 기능을 모델화한 '퍼셉트론' 발표는 1958년까지 거슬러 올라갑니다.
- 신경망은 뇌와 닮은 구조를 단순화해서 컴퓨터로 재현한 것입니다. 컴퓨터상에 뇌신경 세포를 시뮬레이션하는 '형식 뉴런과 '노드를 배치합니다. 입력된 정보는 각 뉴런에서 처리되어 다른 뉴런으로 전송됩니다. 정보를 받은 다른 뉴런은 처 리를 마친 후 또 다른 뉴런에 정보를 전달합니다. 이 처리를 반복했을 때 특징’ (특징값)이 산출되어 몇 가지 처리 결과를 출력하는 구조가 '신경망'의 기본입니다. 몇 가지 처리 결과라는 것은 표현이 좀 애매한데, 사물을 인식하고 분석하고 예측하고 대화하는 다양한 것들을 말합니다.
- 뻔히 정답을 알고 있는데 기계가 분석할 게 뭐가 있느냐고 묻는다면 왜 그게 개로 분류되는가?'에 대한 것을 생각하게 하는 것이라고 답할 수 있습니다. 즉, 기 계가 특징값을 스스로 발견하게 한다 → 그것은 '개'로 분류된다 → 그 특징값의 답은 '개'다, 라는 것입니다. 하지만 이미지를 한 장만 분석해 특징값을 기억한 시스템의 경우에는 다른 개 의 이미지를 보여줘도 어지간히 닮은 개의 이미지가 아니고서는 같은 견종이라는 것을 판별해내지 못할 겁니다. 그럼 만약에 개의 라벨링된 (정답) 데이터 이미지 1,000만 장을 읽게 해서 훈련한다면 어떻게 될까요? 이것이 바로 신경망의 공부법(중 하나)이며, 학습을 위해 방대한 빅데이터가 필요한 이유입니다. 이 개를 예로 든 것처럼 라벨링된 데이터로 학습하게 하는 방 법을 지도학습이라고 합니다. 머신러닝에는 지도 학습(Supervised Learning) 외에 '비지도 학습 또는 '자율 학습 (Unsupervised Learning)이 있습니다. 지도 학습은 이 이미지가 개라든가, 이런 경우 1시간 후의 주가는 얼마라든 가, 와 같이 입력 데이터와 정답이 1대 1로 결합돼 있는 훈련 데이터를 사용해 학 습하는 것입니다. '비지도 학습은 입력 이미지는 있지만 정답 데이터는 주어지지 않습니다. 예 측은 미래의 것이기 때문에 정답이 없습니다. 이처럼 추론, 분석과 같이 정답이 없 고 정답이 풀리지 않는 문제를 가지고 학습하는 것을 비지도 학습이라고 합니다. 지도 학습과 비지도 학습을 섞는 방법도 있습니다. 우선 기계가 지도 학습으 로 특징값을 학습하게 하고 그 이후 비지도 학습으로 방대한 훈련 데이터를 제공 해 자동으로 특징값을 산출하게 하며 반복 학습을 하는 방법입니다. 이를 준지도 학습 (Semi-Supervised Learning)이라 부르기도 합니다. ‘비지도 학습은 정답이 없는 데이터로 머신러닝을 하는 것입니다. 정답이 없 는 예측과 분석, 해석 등의 분야에서 사용되거나 방대한 데이터 안에서 컴퓨터 스 스로가 뭔가를 발견하게 하거나 방대한 훈련 데이터를 반복적으로 학습하게 할 때 쓰입니다. 비지도 학습은 컴퓨터가 이미지 및 음성, 수치 등의 방대한 데이터를 읽게 해 서 특징값을 구하고 그에 따라 패턴과 카테고리에 자동으로 분류하게 하거나 클러 스터 분석, 규칙성 및 상관성, 특징, 특이성, 경향 등을 분석하게 합니다(주성분 분석, 벡터 양자화/표본화 샘플링 등). 또한 데이터 마이닝 등 미지의 데이터의 특징을 발견하거나 예측하는 분야에 서는 필연적으로 비지도 학습의 방식을 채택하는 경우가 많아집니다. 또한 비지도 학습을 할 경우에도 가장 적합하다고 판단되는 초기 수치를 제공 해 학습을 시작하는 것이 효율적이라고 합니다.
- 지도학습과 비지도학습 비교
(1) 지도학습
- 훈련데이터 : 라벨 있음 (정답이 붙여져 있음)
- 방법 : 정답이 붙여진 데이터를 기계가 자동으로 분석하게 한 다음 산 출한 특징값을 정답이라고 분류 하게 하면 정답이라고 특징값의 관계성을 학습한다. 사물을 인식 및 분석하는 정의를 도출한다.
- 장단점 : 분류 문제는 효율적으로 학습할 수 있다. 초기 단계에서는 학습 성과를 내기 쉽다. 방대한 라벨링된 데이터 를 준비하는 데 손이 많이 간다.
(2) 비지도학습
- 훈련데이터 : 라벨없음
- 방법 : 방대한 데이터를 자동으로 분석 하게 하지만 정답이 없어 산출 한 특징값으로부터 구조, 법칙, 경향, 분류, 정의 등을 도출한다.
- 장단점 : 기계 스스로 특징이나 정의를 발견하 기 때문에 방대한 데이터가 있으면 라벨링된 데이터를 준비할 필요도 없 고 번거롭게 손을 댈 일도 없다. 정답 이 없는 대신 보상(득점) 등을 설정해 야 한다. 오토인코더 등으로 사전에 학습해야 효율이 좋은 경우가 많다.

- 강화학습은 기계가 시행착오를 거치게 해서 실패와 성공을 통해 학습해가는 방법입니다. 하지만 그냥 단순 히 방대한 훈련 문제를 제공해 기계를 학습시켰다고 해도 기계가 무엇이 성공인지 도 모르는 상태에서는 학습이 순조로울 리 만무합니다. 학습 목표로 성공이라고 판단할 수 있는 어떤 요소를 부여해야 합니다. 여기서 성공 및 성과에 대해 점수를 매깁니다. 이를 '보상' 혹은 득점이라고 합니다. 자전거를 예로 들자면, 1m를 달려 넘어지는 것보다 10m를 이동하는 쪽이 높은 점수를 얻을 수 있습니다.
- 강화학습은 위키피디아에서는 “어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법이다”라고 설명
- ‘오차역전파법 (Backpropagation)이란 컴퓨터가 내놓은 답이 정답이 아니 거나 기대했던 수치와 동떨어져 있는 경우, 그 오차를 출력 쪽에서 역방향으로 분 석하게 한 후 각 뉴런의 오류를 정정해 오차를 줄이는 로직입니다. 우리 생활 속에 서 예를 들자면 계산 문제에서 내놓은 답이 틀렸을 때 답을 보고 계산 식을 거슬러 올라가 계산 오류를 찾고 계산이 틀린 부분을 알아내면 틀리지 않도록 수정해 다 음번부터 정답률을 올린다, 같은 느낌이라고 보면 됩니다.
- 딥러닝의 과제인 과적합'의 회피
기존에 설명한 '구글의 고양이' DON' '알파고'와 세계적인 이미지 대회인 ILSVRC' 에서도 딥러닝은 좋은 성적을 거뒀습니다. 이 정도의 성과를 올리기 시 작한 배경에는 돌파구라고 할 만한 기술적인 진전이 있었습니다. 컴퓨터의 성능이 향상됐고 빅데이터를 이용할 수 있게 됐으며, 또 딥러닝 특유의 과제인 과적합을 회피할 수 있었던 것입니다. 심층 신경망은 중간층을 다층화시켜 더욱 깊이 사고할 수 있습니다. 다층이 되면 될수록 뉴런 처리와 전달, 산출되는 특징값이 늘어나며 이에 따라 답의 정확 도가 올라갈 것이라는 사실은 이전부터 연구된 것이고 이론적으로도 유효하다는 주장이 있었습니다. 과적합 (over-fitting)이라고 불리는 문제는 심층 신경망을 마구잡이로 다 층화해 파라미터의 수가 너무 많아질 때 발생하기 쉽다고 합니다. 과적합의 영향 으로 인한 악영향으로 낯익은 훈련 데이터에는 정확도가 높은 답을 할 수 있는 한 편, 훈련 데이터에 없는 미지의 데이터인 경우 정밀도가 내려가는 (훈련 데이터의 영향을 너무 많이 받음) 현상이 있습니다. 즉, 훈련할 때는 성적이 좋았는데 실전 에 가서는 성과를 내지 못한 상태를 말합니다. 이것은 범용성이 부족하다는 과제 를 낳았고 딥러닝에게는 정체기라고도 할 수 있는 시간을 불러왔습니다.
- 합성곱 신경망(CNN) : 이 과제의 구체적인 해결책이 바로 합성곱 신경망' 또는 '컨볼루션 신경 망(CNN)입니다. 뉴런이 많고 복잡해지면 원래는 아무 관계도 없던 결합이 늘어나고 그것이 결국 악영향을 미쳐 과적합의 원인을 만들기도 합니다. 기계 정답률을 올리려면 층 을 늘리는 한편 '아무 관계도 없는 결합을 끊어내는 것이 중요합니다. 하지만 무수 한 뉴런의 결합 중 어느 것이 유효하고 어느 것이 관계가 없는지 어떻게 판단해야 하는 걸까요? 또한 오차역전파법에 의해 출력 쪽에서 오차를 확인하게 하는 방법도 소개한 바 있는데, 모두 결합한 후 다층으로 만든 상태에서 오차역전파법을 써버리면 오 차 전파가 분산되어 전혀 학습이 진전되지 않기 때문에 그 사태를 피하기 위해서 는 아무 관계도 없는 결합을 잘라 버려야 한다는 이론도 있습니다. 합성곱 신경망의 특징 중 하나가 아무 관계도 없는 결합을 잘라 관계성이 높은 결합을 남긴다는 것입니다. 실제로 합성곱 신경망에서는 파라미터의 수가 격감 하며 많은 경우에서 성과가 향상됩니다. 합성곱 신경망 (Convolutional Neural Network)은 줄여서 CNN이라 고 부릅니다. 여기서 합성곱이라는 이름을 보고 합성해서 곱하는 구조가 뭔지 이 해하려고 하면 곤란합니다. 그 이유는 이 단어가 합성곱 적분과 같이 수학 용어로 자주 사용하던 단어에서 유래된 것이라서 일반적으로 합성'이나 '곱 등을 해석한 단어와는 의미 자체가 다르기 때문입니다.
- 순환 신경망(RNN) : 최근에는 '리커런트 뉴럴 네트워크 (RNN; Recurrent neural network)', 즉 순환 신경망'이 주목받고 있습니다. 기존의 신경망은 '정적 데이터로 취급하는 게 잘 어울렸기 때문에 '동적 데이 터는 익숙하지 않다고만 여겨져 왔습니다. 정적 데이터란 움직임이 없는, 혹은 움직임이 적은 데이터를 말하는데 예를 들면 정지 화면, 텍스트, 수치, 최신 통계 데 이터 같은 것이 여기에 해당합니다. 개와 고양이의 이미지를 식별하는 것은 정적 데이터입니다. 한편 동적 데이터란 움직임이 큰, 또는 시간적인 상관관계가 중요한 데이터와 시계열 데이터 등을 말합니다. 대화, 동영상, 음성, 시계열의 통계 데이터와 로그 데이터 같은 것들 말입니다. RNN은 이러한 시계열 분석을 가능하게 만들어 준 동 적 데이터와 호환되는 딥러닝입니다. 최근 자연어 대화 등의 분야에서 성과가 올 라가고 있는 만큼 향후 RNN' 이라는 용어를 IT 관련 뉴스나 일반 인공지능 정보에 서도 보게 될 기회가 늘어날지도 모릅니다.
- IBM에서는 왓슨을 인공지능이라고 부르지 않고 인지 시스템' 혹은 인지 컴퓨터' 라고 부릅니다. 인지란 인식해서 아는'이라는 의미로, IT 업계에서 는 스스로 사고할 수 있다는 의미로 씁니다. IBM은 인공지능이 인간과 같은 지능 을 가진 결푸터, 즉 강한 AI'라고 생각해서인지 왓슨에 인공지능이 필요로 하는 많 은 기술과 자연어 대화, 대화 분석, 딥러닝을 포함한 머신러닝, 데이터 분석, 추리와 추론 등의 기술이 쓰이고 있음에도 왓슨은 인공지능이 아니라 인지 컴퓨팅이라는 발언을 일관되게 하고 있습니다. 또한 왓슨 자체는 플랫플이기 때문에 방대한 데이터를 보유하지 않은 상태에 서 도입한 기업의 빅데이터로 머신러닝을 한 후 특훈을 거쳐 시스템을 구축하는 구 조로 되 있습니다. 이 때문에 잊슨은 계약해서 바로 실전에 들어가 이용하지는 못 하고 도입을 위한 학습과 훈련, 튜닝 기간에만 약 3개월~1년이 걸린다고 합니다.
- 지금까지는 비구조화 데이터를 구조화 데이터로 변환해 컴퓨터가 처리, 분석 할 수 있게 만들자는 노력이 꾸준히 진행됐지만 왓슨과 딥러닝을 이용한 인식 시 스템의 등장으로 상황이 크게 바뀌었습니다. 즉, 자연어를 이해하거나 디지털카메 라로 찍은 사진을 그대로 컴퓨터가 분석해 이해할 수 있게 하는 기술이 진보하고 있는 것입니다. 이 흐름은 이제 멈추지 않을 것입니다. 이제는 자연어를 정확하게 이해해 인간과 원활하게 대화하고 인터넷의 비구조화 데이터를 통해 학습할 수 있 는 시스템이 필요하기 때문입니다. 영어판으로는 이미 도입 실적이 발표됐는데, 일본어로 사용하려면 왓슨은 일 본어를 학습해 이해할 수 있어야 합니다. IBM은 일본어판 개발을 소프트뱅크와 협업해 진행했습니다. 그에 더해 왓슨의 시스템(서버군)을 설치 및 운영해 에코 파트너 개척, 일부 판매에 대한 부분까지 소프트뱅크와 제휴해 2016년 2월부터 서비스를 시작했습니다.
- 마이크로소프트는 키보드와 마우스, 터치 조작으로 바뀌는 다음 단계의 인터 페이스로 '대화'를 언급하고 있습니다. 그것이 실현된 것이 바로 음성 입력이 가능 한 개인 비서 '코타나', 대화를 즐기는 '린나', 중국의 '샤오아이스’, 영어의 '테이와 같은 풍부한 AI 대화 엔진 그룹입니다. 또한 마이크로소프트 리서치 (Microsoft Research)에서 연구 중인 머신러닝 을 이용한 통역 및 번역 기술이 주목을 모으고 있습니다. 통역 및 번역을 통해 대 화 기술도 적극적으로 연구해서 2020년의 도쿄 올림픽 때까지 외국어와 일본어의 동시통역을 실현하는 것이 목표입니다. 스카이프에서는 이미 일부 번역 기능에 이 통역 기술을 도입해 영어, 스페인어, 이탈리아어, 중국어, 프랑스어, 독일어 등의 언어를 지원하고 있습니다. 마찬가지로 윈도우 10 등에 탑재된 개인 비서 '코타나'에도 이 기술을 활용할 예정입니다. 마이크로소프트는 이러한 일련의 클라우드 서비스와 AI 관련 기술로 성과를 거두며 최고의 기업들이 활약하는 무대에서 두각을 드러내고 있습니다.
- 구글은 딜러닝을 이용한 머신러닝 라이브러리인 '텐서플로 (TensorFlow)를 그가 그프소화했습니다. 이에 따라 많은 개발자가 무료로 딥러닝 기술을 도입 한 시스템을 가사에서 개발할 수 있게 됐습니다. 딥러닝을 활용한 대화형 인터페이스 ‘구글 비서는 안드로이드 단말기를 통해 이미 친숙한 개인 비서, 구글 나우’(OK Google)에서도 이용되고 있습니다. 이 기술은 애플 iOS의 '시리', 아마존의 '알렉사', 마이크로소프트의 '코타나' 등과 경 쟁하는 기술입니다. 구글이 2016년 5월에 개최한 개발자 행사인 '구글 I/O'에서는 이러한 경쟁사 들 앞에서 새로운 도전을 선보였는데, 그중 하나로 '알로(Allo)가 발표되며 주목 을 받았습니다. 알로는 구글 비서가 탑재된 메시지 앱(채팅)의 일종으로, 채팅 대화의 의도 를 읽어내 여러 가지 대답을 예측해서 제안한다는 특징이 있습니다. 또 하나는 구 글의 검색 엔진이 채팅에 추가되는 것입니다. 원하는 정보가 있거나 상품을 찾고 있다는 것을 채팅에 전달하면 구글 검색 엔진과 연동해 답변해줄 뿐 아니라 택시 와 렌터카, 식당 예약까지 할 수 있습니다. 더 나아가 그룹 기능과 연동해 친구들 과 대화 중인 채팅창 안에서 구글 검색 엔진을 이용할 수 있습니다.
- 구글 I/O에서 또 하나 주목받은 발표가 바로 구글 비서와 알로를 탑재한 '구글 홈'(Google Home)입니다(2016년에 발매). 구글 홈은 스마트 홈을 실현하기 위한 허브 중 하나로 개발됐고, 사용자와는 음성으로 대화를 나눌 수 있습니다. 나중에 설명할 '아마존 에코'의 대항마라고 할 수 있습니다.
- 2016년 6월, 애플은 개발자 이벤트 WWDC에서 시리의 개발 키트(SDK) 를 공개하겠다고 발표했습니다. 시리의 SDK가 공개되면 서드파티에서 자사의 단 말기와 앱으로 시리를 이용할 수 있는 환경이 구축됩니다. 시리의 음성 대화가 보 여준 성능에 실망한 사람들도 많겠지만 채택되면 좀 더 수준 높은 대화를 할 수 있 게 될지도 모릅니다. '보컬아이큐의 전체 내용은 밝혀지지 않았으나 '시리'와 비교 했을 때 인식률이 3배 넘게 높다는 소문이 있습니다. 개인 비서인 SDK를 공개한 것은 아마존의 '알렉사, 구글의 구글 비서' (구 글 홈)에 대항하기 위해서인 것으로 알려져 있습니다. 구글이 '구글 나우 (OK Google 포함)를, 마이크로소프트가 '코타나'를 아이폰에서 실행되는 앱으로 제 공한다는 점만 봐도 알 수 있듯이 앞으로는 사용자가 단말기와 개인 비서를 선택해 조작하게 될지도 모릅니다. 개인 비서가 사용자의 성별과 성격, 신변 정보, 취 미 및 기호를 학습해 성장한다는 점을 생각하면 단말기를 바꿀 때마다(아이폰에 서 안드로이드 스마트폰으로 바꾸는 등) 개인 비서와의 관계를 처음부터 다시 시 작하는 것은 현명한 선택이라고 할 수 없습니다. 그런 의미에서도 디바이스에 의 존하지 않고 개인 비서를 선택할 수 있는 환경이 만들어지길 바라는 수요가 있습 니다. 애플은 자동차용 기능인 '애플 카플레이 (Apple CarPlay, iOS in the Car) 를 개발해 도입하기 시작했습니다. 자동차 안에서 아이폰의 기능을 쓰기 쉽게 융 합한다는 구상입니다. 시리의 음성 제어와 터치 패널, 맵과 연동, 메시지 읽기, 아이튠즈나 애플 뮤직으로 음악을 재생하는 기능을 차 안에서 이용하기 위한 시스템 으로, 이미 100가지 이상의 차종이 애플 카플레이를 지원하고 있습니다.
- 페퍼에는 중요한 인공지능 기술이 탑재돼 있습니다. 바로 로봇 스스로가 감정 을 지는 감정 생성 엔진임. IT업계에서 주목받고 있는 인공지능 관련 기술에는 여러 가지 종류가 있는 더 크게 다음과 같이 구분된다고 합니다.
* 지혜의 자식을 지을 학습하거나 분석 및 해석하는 타입
* 인간의 감정과 감성 감각을 학습하는 타입
페퍼의 감정 생성 엔진 (감정 엔진)을 개발한 코코로SB (cocoroSB)에 의하 면 전자는 인간의 뇌로 비유했을 때 대뇌신피질'에 해당하는 부분으로, 다시 말해 만능형 인공지능'이고, 후자는 대뇌변연계에 해당하는 부분으로 '인공 감성 지능 이라고 부르며 주로 인간의 감정 표현을 모방한 분야를 연구합니다. 인간처럼 행동하고 인간처럼 자연 대화를 나누려면 후자의 대뇌변연계 연구 와 개발이 매우 중요한 의미를 가집니다. 코코로SB는 감정 생성 엔진, 자연어 처리 잡담 엔진, 물체 인식 엔진 3개에 더해 산하 AGI (Advanced Generation Interface Japan)사가 담당하고 있는 감정 인식 엔진의 기술을 페퍼에게 탑재했습니다. 가족용 페퍼의 경우, 이 기능을 가족과 친목을 다지는 데 이용할 수 있습 니다. 반면 비즈니스용은 매장을 방문하는 고객들을 성별 및 연령별로 집계하거나 고객이 정보를 소개받은 후의 반응(표정 분석)을 읽어내 이 정보가 효과적이었는지 여부를 평가할 수 있어 광고 및 마케팅 방안으로도 기대를 받고 있습니다. 이 엔진들은 도쿄 대학 대학원 의학계 연구과 특임 강사, 과학자이자 수리 연 구자인 미쓰요시 슌지의 감정 지도'라는 발상에 기반을 두고 있습니다. 감정 지도는 심리학 사전 등에서 뽑아낸 약 4,500가지의 감정 표현을 영어로 번역할 수 있는 한계인 223개 장르로 나눈 결과를 원형 다이어그램으로 정리한 것인데 추가로 뇌내 전달 물질, 호르몬 등과 같은 정동의 관계를 논문 조사에 따라 매트릭스화했습니다. 일반 판매용 페퍼에는 AGI의 감정 지도를 근거로 한 감정 생성 엔진과 감정 인식 엔진이, 비즈니스용 페퍼에는 감정 인식 엔진이 탑재돼 있습니다. 또한 이 회사는 IBM 왓슨의 일본어화와 판매로 제휴를 맺고 있어 IBM 왓슨 비즈니스 시장의 날개 한 축을 담당하고 있을 뿐 아니라 IBM 왓슨과 페퍼를 연결 해 커뮤니케이션 로봇의 응대 및 정보 제공을 더욱 고도로 진화시킬 수 있다는 점을 강조하고 있습니다. 소프트뱅크 그룹에서는 2016년 4월, 소프트뱅크 커머스&서비스가 페퍼 외에 인공지능형 학습 엔진 '뮤즈' (MUSE)를 활용한 소형 로봇 '뮤지오’ (MUSIO, AKA LLC 제조)를 판매하고 유통하는 업무에 관한 제휴를 맺었다고 발표했습니다. 뮤지오는 일본 내에서 영어 학습용 로봇으로 이용될 예정입니다.

 

'IT' 카테고리의 다른 글

딥러닝 레볼루션  (0) 2020.06.12
빅나인  (0) 2020.05.10
세상을 읽는 새로운 언어 빅데이터  (0) 2020.02.20
프레디쿠스  (0) 2020.02.17
인공지능이 나하고 무슨 관계지  (0) 2020.02.17
Posted by dalai
,

- 일본의 건설 장비업체 고마츠는 건설 현장에서 사용되는 굴삭기에도 센서를 달아 판매하는데, 이상이 생기면 유지 보수를 해줌으로써 소비자들의 좋은 반응을 얻고 있다. 그런데 이와 같은 센서를 이용해서 고마츠는 다른 정보도 획득한다. 전 세계에 팔린 고마츠 굴삭기가 10만 대 정도 되는데, 여기에도 GPS가 있어서 판매된 모든 굴삭기가 언제 어느 정도 이용되는지 현황을 파악할 수 있다. 가령 지금 시베리아 쪽에서는 하루에 열 시간씩 일한다는 것, 중국에서는 밤낮 없이 기사를 바꿔가면서 24시간씩 일한다는 것, 한국에서는 주로 쉬고 있다는 것 등을 모두 파악한다.이로써 전 세계의 건설 경기 현황을 간접적으로 들여다볼 수 있는 것이다. 지금은 수많은 산업현장에서 그야말로 모든 것이 수치로 데이터화되고 있다.
- 중국 정부는 전 국민의 얼굴 사진을 확보한 것으로 알려졌는데, 인도는 실제로 세계에서 가장 큰 홍채 데이터베이스를 가지고 있다. 문맹률이 높은 인도에서는 극빈자들에게 지급하는 정부 보조금을 중간에 누군가가 신분증을 도용해 대신 받아 가는 문제가 있었다. 이를 막기 위해 인도 정부가 나서 전 국민의 홍채 사진을 확보해 신분증에 넣었고, 홍채가 확인되어야만 보조금을 지급하도록 한 것이다.
- 미국의 어떤 은행은 대출받는 이유를 글로 쓰게하고 그 글에 등장하는 단어를 분석해 대출 신청자가 돈을 잘 갚을 사람인지, 못 갚을 사람인지를 추정한다. 해당 은 행이 발견한 인사이트는 다음과 같다. 대출금을 잘 갚는 사 람들은 금리', '금리 차이' 등의 단어를 많이 사용했고, 잘 갚지 못하는 사람들은 절대로', '죽어도', '반드시', '하나님 께 맹세'와 같은 단어나 구문들을 많이 사용했다. 약속을 지키지 못하는 사람들이 어떻게라도 대출을 받으려고 과장된 모습을 보인 것이다
- 에어컨을 사용하는 소비자의 관심은 온도 조절 기능과 전기요금, 딱 두 가지다. 여름에 저렴한 전기요금으로 시원 하게 지내고 싶을 뿐, 기계 자체에는 사실 관심이 없다. 데 이터 분석을 통해 얻은 인사이트는 건물 에너지 관리실에 제공될 수도 있고, 아니면 아예 제조사가 인사이트를 기반 으로 서비스를 판매하고 관리를 맡을 수도 있다. 여기서도 80대20' 파레토 법칙이 성립한다. 전체 20퍼센트의 방에 서 전체 소비 에너지의 80퍼센트를 사용하기에, 해당 20퍼 센트 방을 찾아내면 에너지 효율을 획기적으로 올릴 수 있 다. 이때 모든 답은 실내기 데이터에 들어 있다. 일본의 '다이킨'은 에어컨 분야에서 세계 최고의 기술력 을 보유한 회사로서 시스템 에어컨이라는 개념도 이 회사 에서 만들었다. 그런데 다이킨이 최근에 실외기와 실내기 조합의 기계가 아닌 서비스를 판매하기 시작했다. 건물주 와 맺은 계약 내용은 이렇다. “우리가 이 건물을 전기요금 포함 월 얼마의 사용료에 1년 내내 22도에서 25도 사이로 유지해주겠다.” 건물주 입장에서는 기계 제품의 유지 및 보수 문제에 따로 신경 쓸 일이 없다. 실내기와 실외기 설 치에 관련된 모든 결정을 다이킨에서 알아서 하는 것이다.
- 하라스라는 라스베이거스의 오래된 카지노는 단골 회원 고객의 개개인에 대한 고통 커브 pain curve'를 추정해서 데이터로 가지고 있다. 오른쪽의 고통 커브 그래프를 보면, 가로축은 고객이 1회 방문 시 잃은 돈이고 세로축은 미래에 재방문할 확률이다. 여기서 재방문 확률 값은 일정하게 높이 유지되다가 어느 지점을 지나가면 급격히 감소하게 된다. 이 시점을 고통 포인트라고 한다. 물론 이 고통 포인트는 회원마다 다르다. 어떤 회원은 한 번에 100만 원을 잃어도 재미있었다고 생각할 수도 있고, 어떤 회원은 10만 원만 잃어도 너무도 실망하고 기분이 상하여 다시는 돌아오지 않을 수도 있다. 누구나 큰돈을 잃으면 다시는 안 돌아오겠지만 조금만 잃으면 대개는 돌아온다. 단지 큰돈과 작은 돈의 기준이 개인마다 조금씩 다른 것임. 여기서 하라스 카지노가 원하는 것은 후자의 사람들임. 한 번 와서 1000만원 잃고 평생 안 돌아오는 손님보다 주말마다 와서 매달 50만원씩 잃고 가는 손님을 원함. 그래서 하라스는 단골 손님이 입장하여 베팅을 시작하면 그 회원이 잃은 돈을 실시간 모니터링 하다가, 잃은 돈의 액수가 고통 포인트에 접근하면 더 이상 잃지 못하도록 도박 자체를 못하게 슬쩍 방해함. 직원을 시켜 음료수를 제공한다거나 디너 쇼 티켓을 서비스로 주면서 그 순간 흥분된 회원의 심리상태를 식혀줌. 그러면 게임에 몰입해 이성이 잠시 마비되어 있던 회원은 제정신을 차리고 현재 자신이 잃은 돈의 액수를 인지하고 그만 떠나게 된다. 물론 적절한 금액만 잃었으므로 그 고객은 다음 주에 다시 올 것이다.
- 소비자들의 말과 실제 행동이 다르다는 것은 여러 데이터로 알 수 있는 사실이다. 따라서 마케팅 전문가 들은 더 이상 소비자들에게 묻지 말아야 한다. 리서치업체 는 소비자들에게 무엇이 불만인지, 무엇을 원하는지, 신제 품을 구매할 것인지, 신제품의 가격이 얼마면 살 것인지 등 을 끝없이 묻는다. 이때 소비자가 하는 대답은 사실과 다른 경우가 허다하다. 정답을 말하기가 부담스럽기도 하고 본 인의 마음을 제대로 이해하지 못하기 때문이다.이제 소비자는 물어볼 대상이 아니라 관찰의 대상이다. 묻지 말고 관찰해야 한다. 그들의 글과 행동을 관찰해야 한 다. 그것이 훨씬 정확한 예측을 가져온다. 마케팅에서의 소비자 연구, 그 답은 소비자의 입이 아닌 행동에 있다.
- 제록스는 애널리틱스를 동원 해서 조기퇴사하는 사람들에 대한 특징들을 찾아냈다. 우 선 회사에서 멀리 거주하며 확실한 교통수단이 없는 사 람 가운데 조기퇴사자가 많았다. SNS 활동이 전혀 없거나 5개 이상의 소셜네트워크를 가진 사람들의 조기퇴사 가능 성도 매우 높았다. 또한 성격 검사에서 드러난 특징도 있다. 첫째, 궁금한 것이 너무 많은 타입 inquisitive type 이다. 예컨대 주변 사람들의 근황까지도 자신이 모든 것을 다 알아야 하는 사람들, 이것 저것 끊임없이 물어보는 사람들 가운데 조기퇴사자가 많았다. 둘째, 공감을 너무 잘하는 사람, 그리고 셋째, 창의력 이 낮은 사람들 가운데서도 조기퇴사자가 많았다. 이제 각각의 성격 유형에 대해 왜 이런 결과가 나왔는지 유추해보기로 하자. 궁금한 것이 너무 많은 성격의 직원은 퇴근 후 집에 가서 잠자리에 들어서도 호기심이 멈추지 않을 수 있다. 3시에 전화한 사람이 왜 자신에게 욕을 했는지 궁금함이 뇌리를 떠나지 않으면서 남들보다 더 스트레스 를 받지 않았을까 추정해볼 수 있다. 또한 과도한 공감 능 력을 가진 상담원은 지나치게 공감하다 보니 감정 노동이 너무 심해져서 힘들어지는 것이 아닐까 싶다. 끝으로 창의 력이 좋은 사람은 고객이 안 좋은 말을 해도 그걸 창의적으 로 해석해서 본인이나 제록스사의 문제가 아닌 전화를 걸 어온 고객의 문제로 보는 게 아닐까? 단지 고객이 이상한 사람이라서 그럴 것이라고 매우 창의적으로 치부하는 능 력이 뛰어난 것이 아닐까? 이러한 해석은 맞을 수도 있고 맞지 않을 수도 있다. 중요한 것은 우리가 데이터를 통해 도출한 인사이트는 상관관계만 밝혀진 것이라는 사실이다. 즉 인사이트는 상관관계다. 여기에서의 의미는 이런 저런 특징을 가진 사람들의 퇴사율이 훨씬 높다는 것으로, 그 이상도 이하도 아니다. 해당 특징이 직접적인 원인이 될 수도 있고 아닐 수도 있 다. 즉 인과관계가 있는지 없는지의 여부는 알 수 없다.
- 데이터마이닝은 금광에서 금을 캐는 것에 비유되기도 한다. 만 약 금광 안의 금 매장량이 100톤이라고 한다면 어떤 방법 을 써도 그곳에서 200톤의 금이 나오는 것은 불가능한 일 이다. 100톤을 다 캐내면 끝이다. 데이터도 그와 마찬가지 다. 데이터도 그 데이터가 포함하고 있는 잠재적인 인사이 트 양이 어느 정도인가에 따라 최대로 잘했을 때 그만큼의 인사이트가 도출되는 것이다. 따라서 제록스에서 이력서와 성격 검사 데이터만으로 20퍼센트의 조기퇴사자를 예방할 수 있었던 것은 괜찮은 성적이라고 할 수 있다. 실제 상황에서의 판단 기준은 20 퍼센트가 아니다. 중요한 것은 데이터를 모으고 분석하는 데 드는 비용과 20퍼센트의 조기퇴사 감소를 금액으로 환 산했을 때 절감되는 비용, 즉 편익을 비교해보는 것이다.
- 업이 투자자 회의 일시를 공표하고 전화할 곳을 알려주면 기업의 분기별 실적 전화 대 화가 시작된다. 그리고 전화 대화가 끝난 후 이 소식이 알 려지면 그때부터 주가가 움직이기 시작한다. | 이때 CEO와 애널리스트들이 무슨 대화를 나누었는지 를 자연어 처리 기술을 이용해 텍스트를 분석한다. 과연 CEO가 내년에도 실적이 좋을 것이라고 했는지, 아니면 약간 떨어질 수도 있다고 했는지 그 말을 컴퓨터에게 분석하도록 해서 주가를 예측하고자 한 것이다. 애널리스트들이 어떤 질문을 던지느냐 또한 CEO의 답변 못지않게 중요하다. 그 질문을 통해 일반인들이 잘 모르는 기업의 내밀한 사정을 알 수 있기 때문이다. 예를 들어 “내년에 경쟁사가 중국에 공장 20개를 더 짓는다고 하는데, 과연 버틸 수 있을까요?”라고 물어보는 것 자체가 매우 비 관적인 정서를 포함하고 있다. 질문의 정서가 중요한 인사 이트다. 어떤 연구팀은 목소리도 분석했다. 애널리스트가 “내년에는 실적이 안 좋겠죠>" 라고 물어볼 때 CEO가 편안한 목소리로 "그럴 리가 없다"고 하는지, 아니면 갑자기 흥분해서 말이 빨라지는지 그 음성을 분석한다. CEO의 말이 빨라지거나 돈이 올라간 경우, 주가가 떨어지는 경우가 많다고 한다. CEO가 보통 사람들은 도저히 알아들 수 없는 어려운 용어를 쓰면서 설명하는 경우에도 주가가 떨어지는 예가 많다는 것을 발견했다. 안 좋은 상황을 인정하기 싫어서 어려운 말과 복잡한 표현으로 적당히 피하려는 것이다.
- 이미지 데이터로부터 인사이트를 도출한다는 것은 해당 이미지에 어떠한 물체가 들어 있는지, 이들 간의 위치관계는 무엇인지, 색은 무엇인지 등을 이해하는 것임. 컴퓨터 비전 분야 전문가들은 이를 두고 이미지에 대한 표현을 도출한다고 한다. 과거 수십 년간 이 분야는 정말 많이 연구되었다. 특히 통계적 패턴 인식 분야는 매우 성공적이었고, 오늘날의 애널리틱스에도 많은 영향을 주었다. 방법은 이렇다. 사람 얼굴 이미지가 주어지고 이 얼굴의 주인공이 남자인지 여자인지 분류하는 문제를 생각해보자. 이를 해결하기 위해서는 1단계에서 눈, 코, 입 부분을 찾아내고, 2단계에서 각 부위의 크기, 각도, 상대적 위치 같은 소위 특징점을 도출한 후, 3단계에서 도출된 특징점들의 조합으로 최종 판정함. 이때는 딱히 기호주의라고 할 수는 없으나 사람얼굴, 남녀 얼굴의 차이에 대한 깊은 지식이 필요함. 그런데 만일 남녀 구분이 아니라 지문 인식이라면 어떻게 되겠는가? 3단계는 동일하겠지만 1,2 단계는 완전히 달라진다. 또는 항공기의 종류나 나무의 종류를 구분하는 것이라면? 매번 1,2 단계는 완전히 달라짐. 즉 이와 같은 접근방식의 어려운 점은 문제가 달라질 때마다 매버 분석가가 해당 분야 전문가를 찾아가서 특징점이 무엇이어야 하는지를 물어보고 그 사람의 머릿속에 들어 있는 암묵지를 발굴해 내야 한다는 것. 왜냐하면 보통의 사람이라면 이미지의 주인공이 남자인지 여자인지 인식은 하지만 자신이 어떻게 인식하는지 명제로 설명할 수 없기 때문. 하지만 최근에 빅데이터가 등장하면서 1,2 단계를 거치지 않고 곧바로 3단계로 가는 방식을 취하게 되었다. 즉 입력으로 넣고 직접 분류하는 것이다. 거대한 다층 퍼셉트론을 딥러닝으로 학습. 이 방법의 장점은 1,2 단계가 생략되었으므로 전문가와 의논해서 특징점을 고안해야 할 필요가 없다는 점. 사람얼굴이든 지문이든, 비행기든 나무 종류든 3단계로만 해결한다. 빅데이터만 있으면 마치 만병통치약처럼 여러 문제가 유사하게 해결되는 것이다
- 빅데이터 분석의 최종목표는 인사이트가 아니다. 최종목표는 가치만들기임. 따라서 그냥 눈앞에 있는 구하기 쉬운 데이터를 갖고 무작정 분석해서 인사이트를 도출하고, 이를 의사결정자에게 던져주는 접근법은 100% 실패함. 미리 어떠한 가치를 위해 어떠한 인사이트가 필요한지 가르쳐주지 않고 그저 데이터만 주면서 뭐든지 분석해보라고 하는 것은, 셰프에게 무얼 먹고 싶은지 말하지 않고 그냥 내가 맛있게 먹을 수 있는 것을 만들어오라고 하는 것과 같다. 실패확률 100%다.

 

'IT' 카테고리의 다른 글

빅나인  (0) 2020.05.10
최신 인공지능 쉽게 이해하고 넓게 활용하기  (0) 2020.02.23
프레디쿠스  (0) 2020.02.17
인공지능이 나하고 무슨 관계지  (0) 2020.02.17
당신은 데이터의 주인이 아니다  (0) 2020.02.08
Posted by dalai
,

프레디쿠스

IT 2020. 2. 17. 12:08

- 인공지능이라는 멋진 단어는 56년도 다트머스 회의에서 처음 등장했고, 이름에 걸맞은 연구도 이때부터 본격적으로 시작되었음. 당시 학자들은 체스를 두는 기계나 미로찾기 알고리즘 같은 것을 구현하기 위해 총력을 쏟아부었다. 초기에는 기호주의 혹은 규칙기반이란 방법론을 통하여 어느 정도 성공을 거두었다. 그러나 단순하게 외부에서 규칙을 컴퓨터에게 주입하는 방식으로 인간의 지능을 모방한다는 것은 현실적으로 불가능하다는 것이 드러났다. 이런 상황에서 인간의 기존지식을 잘 활용하여 지식을 추론할 수 있는 전문가 시스템이 등장하기도 했다. 한편 인간의 신경망을 모방하는 퍼셉트론이라는 인공신경망 컴퓨터가 57년도에 등장. 인공신경망은 기계가 학습한다는 의미의 머신러닝이라는 개념을 탄생시켰다. 머신러닝은 전통적 규칙기만 방법론과 함께 인공지능 연구의 양대 축으로 발전. 인공지능을 만들기 위하여 위 두가지 방법론은 서로 치열하게 대립하면서 나름의 역사를 만들어갔지만 결국 각자의 기술적 문제를 완전히 해결하지 못하고 90년대 이후 패망의 길로 들어선다 그런데 06년도 딥러닝이라는 것이 갑자기 등장하여 인공지능이 화려하게 부활하였다. 딥러닝은 인공신경망이 진화발전된 것이며 특별히 새로운 것이 아니다.
- 인공지능 연구자들은 우리가 아는 모든 것을 컴퓨터에 이식하면 컴퓨터가 지능을 갖고 인간처럼 생각할 수 있다고 생각했다. 언뜻 보면 이런 발상은 지극히 합리적이고 그럴듯하다. 데이터를 정리하고 검색하고 세금을 정산하고 비행 스케줄을 최적화하고 심지어 자동차를 만드는 작업까지 컴퓨터는 인간보다 월등히 뛰어난 성능을 자랑한다. 비록 지루하고 고통스러운 프로그래밍 작업이 선행되지만 어쨌든 컴퓨터는 잘 작동한다. 그런데 문제는 언어나 추론 같은 인간의 고등한 지능을 컴퓨터로 구현하자니 무한한 비용과 시간이 들어간다는 것이다. 더 심각한 것은 보고 듣고 움직이는 인간의 아주 기본적인 지능의 활동은 애초 그 규칙을 말로 설명할 수 없다는 것이다. 이것이 바로 널리 회자되는 폴라니의 역설이다. 66년 마이클 폴라니는인간의 인지특징을 "우리는 말할 수 있는 것보다 더 많이 안다"라고 요약하면서, 말로 설명할 수 없는 암묵지가 우리 지식의 대부분을 차지한다고 보았다. 예를 들어 우리는 반복학습을 통해 자전거를 타는 법을 터득한다. 그러나 타는 법을 모두 말로 설명할 수는 없다. 개와 고양이를 구별하는 것도 마찬가지다. 어떤 식으로 구별하는지 설명하기는 어렵지만 보면 안다. 이런 지식이나 지능은 말로 도두 설명할 수 없기 때문에 규칙이나 논리로 변형해서 프로그래밍하는 것이 불가능하다. 폴라니의 역설은 인간을 묘사하는 것이지만 '기계가 인간을 모방할 수 없다'는 이유가 되었다. 세상이 모두 놀란 알파고의 등장은 딥러닝이 폴라니의 역설을 돌파했다는 상징을 의미를 가지고 있다. 우리 인간이 암묵지의 형태로 지식을 흡수하면서 지능이 향상하듯이 이제 컴퓨터는 데이터를 통해서 스스로 학습을 하면서 세상의 규칙을 이해할 수 있다. 인간의 모든 규칙을 손수 컴퓨터에 가르치는 성가신 작업이 사라지는 순간이다. 아기가 말문이 처진 것처럼 딥러닝은 이제 알아서 암묵지를 형성해 나간다
- 예측적 지각 : 우리 시각 시스템은 과거의 정보를 바탕으로 0.1초 이후의 상황을 예측하여 미리 예상 이미지를 생성하는 방향으로 진화했음. (인지과학자 마크 창기지)
- 소송 전에 방대한 문서를 분석해야 하는 인간의 수작업 업무는 컴퓨터와 분석기술에 의해 조금씩 대체되고 있다. 전자증거개시제도가 도입되는 시기에 이미 블랙스톤 디스커버리같은 회사가 등장했고, 예츠코딩기술이 퍼지면서 관련 산업이 활성화됐다. 예측코딩 산업의 대표주자로 떠오른 에버로라는 회사 변호사가 원하는 대로 방대한 문서를 검색하고 관련문서를 추출해준다. 광범위한 사용자 제어 기능을 통해 변호사 및 법률 종사자는 검색결과를 60%, 75% 등 사용자가 지정한 예측률 범위내로 설정하여 검토할 수 있다. 에버로 사용자는 최종검색결과를 바탕으로 사용자가 직접 2차 검수한 문서를 바탕으로 검색범위를 좁히거나 확장시킬 수 있다. 한편, 예측기반 법률 시스템은 자료검색과 분류에 탁월한 예측코딩과는 달리 자료분석보다는 예측에 무게중심을 둔다. 예측기반도 본질적으로는 데이터 분석을 기반으로 하기 때문에 전통적인 데이터 마이닝 기술에 의존한다. 이 분야의 대표회사는 렉스 마키나다. 이 회사는 09년 설립됐는데, 데이터 마이닝을 기반으로 법률과 판례추이 등을 분석해 어떻게 판결이 날지를 예측하며 세심한 소송전략을 제시해준다. 또한 연방법원 판사들을 모두 분석해서 사건 경험, 평균소요시간, 관련 사건의 기각률, 손해배상 인용액 등의 자세한 판사비교표를 제공하고 있다. 렉스 마키나의 예측 분석 시스템이 큰 성공을 거둔 후 유사한 예측 시스템이 많이 등장했다. 주목할 만한 것은 송무와 괄년한 예측분석을 넘어 법률 자체를 예측하는 서비스 모델의 탄생이다. 미국의 피스컬노트라는 회사는 예측분석 기법을 입법으로 확장했다. 이 회사의 핵심 서비스는 연방정부와 50개주에서 발의된 법안을 추적하고 법안 통과가능성을 예측해주는 것이다. 온라인 인상에서 미국 연방정부 법과 50개주 법안, 그리고 법안을 만드는 데 참여한 상하원 의원들과 통과 여부를 확률로 보여준다. 입법 예측은 예측 법률세계에서 예측 본연의 개념에 가장 근접하고 있다.
- 17년 구글의 인공지능 챗봇 2대가 서로 대화를 하면서 수다를 떠는 모습이 실시간 방송됐다. 두 챗봇은 각각 블라디미르와 에스트라공이라는 이름표가 붙어 있다. 아일랜드 출신 극작가 사무엘 베케트의 희곡 고도를 기다리며에 등장하는 주인공들의 이름을 따서 만든 재치있는 별명이다.
- 기호주의 혹은 규칙기반 인공지응은 세상의 모든 것을 인간이 직접 기호화하거나 규칙으로 표현해야 하기 때문에 비용과 시간의 측면에서 근본적 한계를 지니고 있다. 이런 문제를 극복하기 위해 데이터를 통해 학습하는 인공신경망 같은 학습기반 혹은 연결주의 방식의 머신러닝 연구도 물밑에서 활발하게 진행됐다. 그러나 이런 도전들도 역시 기술적 벽을 넘지 못하고 2차 인공지능 겨울과 함께 시들해짐. 튜링 이후 인공지능에 대한 인류의 꿈은 이렇게 하나의 추억으로 사라졌다가 딥러닝이라는 이름으로 부활하고 있는 것이다. 우리가 보는 지금의 인공지능은 오랫동안 축적된 연구결과를 바탕으로 하는 것이며 특별히 새로운 것은 아니다.
- 법률은 의료분야와 함께 대표적인 전문지식 영역에 속한다. 두 종류의 전문가 시스템(규칙기반과 사례기반)의 형식을 잘 살펴보면 놀랍게도 법률세계와 궁합이 잘 맞는다는 것을 알 수 있다. 먼저 법률의 형식과 내용을 보면 그 자체로 이미 규칙으로 표현된 텍스트다. 민법, 형법, 저작권법 같은 법률은 개개의 논리와 체계를 가지고 있으며 엄격한 법적 규칙을 담고 있다. 법률은 그 자체가 컴퓨터 프로그래밍 코드처럼 작동하며 법적 분쟁해결과정도 법률을 기초로 하여 정교한 논리 추론 형식으로 진행된다. 법률가들은 이런 규칙덩어리를 갖고 그 규칙에 따라 연역적 추론을 하는 것처럼 보인다. 이런 이유로 학자들은 일찍부터 법률세계를 주목하면서 규칙기반 법률 시스템 연구를 시작했다. 그런데 법률가들은 법률규칙에 따라 컴퓨터 알고리즘처럼 추론하기도 하지만 유사한 사례를 기억에 떠올려서 귀납적으로 판단하는 경우도 있다. 이런 인지과정은 사례기반 시스템과 잘 어울린다. 결론적으로 법률세계는 규칙기반과 사례기반 모두 가능하다는 것이다. 그런데 역사적으로 보면 법률 전문가 시스템 연구는 규칙기반 시스템이 등장한 이후에 시간이 좀 더 흘러 사례기반 시스템 연구가 시작됐다. 규칙이냐 사례냐 하는 이분법은 오랫동안 대립하면서 격렬한 논쟁을 가져왔다. 법률추론이라는 것이 주로 연역의 과정이라는 관점과 법 이론을 유추하는 과정이라는 관점의 충돌이었다. 그러나 법률가의 추론은 어느 하나의 관점으로 설명할 수 없는 복합적인 면이 있다. 실제 변호사는 법률적 상담을 할 때 의뢰인이 처한 상홍을 분석하여 특징을 잡아낸 후 법률논리에 대입하게 된다. 그러나 법률용어의 추상성과 애매성 등의 이유로 규칙에 의해 일의적으로 분명하게 판단을 내릴 수 없는 경우도 많다. 이런 경우에는 과거 유사한 사례나 판례를 근거로 유추한다. 예를 들면 교통사고로 사람이 다치면 교통사고특례법, 도로교통법, 형법 등의 관련법을 잘 검토하고 조항 하나하나를 논리적으로 따지면서 추론을 한다. 그러나 변호사는 실제 처리했거나 기억 속에 있는 유사한 판례를 머릿속에서 검색하여 단번에 결론을 내기도 한다. 이런 변호사의 해결전략은 매우 일반적이다. 그러나 머릿속에 유추할 수 있는 사례가 부족하고 없다면 법률조항을 하나씩 따져가면서 법률 규칙 알고리즘을 작동시킬 수밖에 없다. 결국 변호사는 연역과 귀납을 동시에 사용하는 셈이다.
- 전문가 시스템 연구는 기존에 존재하는 지식과 인간의 상식을 모두 주입하면 인간 의사나 변호사처럼 추론하는 기계를 만들 수 있다는 믿음으로 출발했다. 그러나 예상과는 달리 전문가 시스템은 현실세계에서 인간의 능력과는 비교되지 못하며 매우 제한적으로만 작동한다. 전문가 시스템은 형식적으로 인간을 단순하게 모방한 것에 불과하며 실제 인간의 복잡한 인지과정을 그대로 반영한 것은 아님. 뇌과학이나 신경생물학 같은 학문이 고도로 발달한 지금도 우리는 뇌에 대해서 아는 것이 별로 없을 정도로 뇌는 난공불락의 세계다. 인간의 뇌를 모방해서 인공지능을 구현한다는 관점에서는 그 당시 학문 수준으로 인간처럼 추론하는 기계를 만드는 것은 애초 불가능한 도전이었는지 모른다. 또한 형식적으로나마 인간의 인지과정을 모방한다고 해도 지식을 추출하고 규칙을 입력하는 것은 결국 인간이 해야 하기 때문에 무한한 시간과 비용의 문제를 극복할 수 없다. 이것은 인공지능 구현에 학습개념이 절대적으로 필요하다는 것을 암시하고 있다. 이런저런 이유로 파이겐바움의 그 원대한 꿈은 끝이 났다. "어려운 것은 쉽고 쉬운 것은 어렵다"는 모라벡의 역설처럼 기계에게 복잡한 계산이나 연산은 쉽지만 걷고 움직이고 사물을 지각하는 것은 어려운 일이다. 사물을 보고 인식하거나 상식적인 것을 이해하는 것에는 특별한 규칙이 없어 보인다. 따라서 기계에게 어떤 규칙을 부여하는 것 자체가 너무나 애매하고 막막하다. 우리는 물, 나무, 바람 같은 것들을 상식적으로 이해하고 있으며, 그런 상식은 고도의 지능에 의존하기보다는 어린 시절에 별 생각없이 반복했던 언어훈련에서 부지불식간에 형성된 것이다. 단어의 상식적 의미나 개념은 다른 단어에 의해 논리적으로 설명되어지는 것이 아니라 우리 몸이 외부세계와 상호작용을 하는 과정에서 자연스럽게 감각적으로 체득되는 면이 있다. 따라서 몸이 없는 기계는 그런 것을 애초 가정할 수 없고 상식을 가르칠 뾰족한 방법도 없다.
- 전문가 시스템은 인간의 지식을 잘 표현하는 것이 핵심이라고 했다. 그런데 그 지식의 의미를 잡아내기 위해 또 다른 지식의 표현이 필요한데 이런 식으로 계속 연결하다 보면 상식 수준의 지식이 등장하게 된다. 그런데 이런 상식은 컴퓨터가 그 의미를 직접 잡아내지 못하므로 또 다른 지식이나 단어가 필요하고 끝없는 반복을 하게 된다. 이것은 우리가 지식을 표현하는 방법으로 추론지능을 만드는 것은 물리적으로 감당할 수 없는 작업임을 암시한다. 결국 초기의 생각하는 기계는 전문가 시스템으로 진화했지만 이런 본질적인 한계를 극복하지 못하고 머신러닝과 같은 학습기반 인공지능과 융합할 때까지 긴 정체기를 가진다. 법률 전문가 시스템도 이런 운명의 길을 걷는 것은 당연하다. 재미있는 것은 전문가 시스템이라는 개념이 등장하기 훨씬 전인 57년에 이미 컴퓨터를 이용한 법률 자동화연구가 시작되었다는 것이다. 법률의 자동화는 인공지능과 만나면서 자연스럽게 법률정보학, 법률 인공지능, 컴퓨테이션 법률학과 같은 다양한 종파들이 생겨났고 리걸테크라는 새로운 산업을 잉태하게 된다. 법률과 컴퓨터의 성공적 결합은 알고리즘과 컴퓨터를 이용하는 방법론이 세상의 모든 학문과 지식에도 적용가능함을 암시한다. 또한 '생각이 알고리즘이며 알고리즘이 곧 생각'이라는 컴퓨테이션 철학이 일종의 패러다임으로 작동하고 있다는 의미도 된다.
- 케플러 추측은 위대한 물리학자 케플러가 1611년 제안한 것으로 여러 개의 구를 가장 효율적으로 쌓는 방법은 과일가게가 오렌지를 진열하는 것과 같은 방법(피라미드식)이라는 것이다. 이 문제도 수많은 수학자가 도전했지만 일반적인 증명에 실패했고 300년이 더 지난 98년도에 와서 수학자 토마스 헤일스와 그의 제자 숀 맥러플린이 케플러 추측을 증명. 그런데 기존 방식과는 달리 증명은 컴퓨터를 이용하는 방식이었다. 헤일즈는 그들의 증명을 수학연보에 제출. 이후 12명의 수학자들이 심사위원으로 투입되어 증명의 오류를 검토하였고 4년 이상의 세월이 흘렀다. 그런데 헤일즈가 제출한 증명에는 컴퓨터 프로그래밍 파일도 있었는데, 심사위원들이 컴퓨터 프로그램 오류를 모두 검증하기 어려웠다. 최종적으로 수학연보는 증명이 참이라는 것은 99% 확신한다고 발표했다. 수학역사에서 보기 힘든 희대의 발표였다. 한편 헤일즈는 지루한 검토과정을 보면서 증명과정을 컴퓨터 알고리즘을 이용해 자동을 검토할 수 있는 프로그램을 만들기로 마음먹고 플라이스펙 프로젝트를 기획하게 된다. 이 프로젝트는 03년도에 시작하여 14년에 최종 마무리되었다. 결국 컴퓨터가 등장해서 헤일즈의 증명이 100% 참이라는 것을 증명한 것이다. 컴퓨테이션을 기반으로 증명의 증명, 소위 메타증명의 세계가 펼쳐지는 순간이었다. 이제 컴퓨테이션 수학은 이산수학처럼 컴퓨터를 위한 수학에서 나아가 수학자체를 위한 수학으로 진화하고 있다. 바야흐로 컴퓨터는 증명의 검토뿐 아니라 가설을 세우거나 증명을 하는 단계에서 인간과 협업할 준비를 하고 있다. 결론적으로 자동계산과 알고리즘을 바탕으로 하는 컴퓨테이션은 인간사고의 초절정 영역인 수학의 영역에 소리없이 침투하고 있다. 이제 컴퓨테이션은 수학과 과학을 넘어 인문학, 사회학, 예술, 법률에도 적용되면서 우리의 생각방식을 확장하고 있다. 소위 컴퓨테이셔니즘 시대가 오고 있는 것이다.
- 머신러닝에는 인공신경망 외에도 선형회귀, 로지스특회귀, 의사결정나무, 나이브베이즈, 서포트벡터머신 등 다양한 모델이 있다. 그런데 인공신경망 중에서 특별한 구조를 가지고 있는 것이 딥러닝이다. 우리는 보통 인공지능, 머신러닝, 딥러닝이라는 단어를 구별없이 사용한다. 이들은 비슷하면서도 조금씩 다른 의미를 가지고 있기 때문에 집합의 포함관계로 해석하는 것이 가장 간명하다. 즉 인공지능의 부분집합이 머신러닝이고 머신러닝의 부분집합이 딥러닝이다. 새로운 인공지능 시대를 열고 있는 딥러닝은 머신러닝의 일종이며 인공신경망의 후손인 셈이다.
- 초기의 신경망 모델인 퍼셉트론은 입력층과 출력층만을 가지는 간단한 형식이었지만 일반적으로 인공신경망은 입력층, 중간층(은닉층), 출력층 등 여러 개의 층으로 이루어진 다층 네트워크 구조를 가진다. 각층은 여러 개의 노드로 이루어져 있고 노드와 노드의 연결에 의해 전체 네트워크가 작동한다. 각 노드는 뉴런의 몸체이며 연결선은 축삭돌기이고 연결자체는 시냅스 연결을 의미한다. 정보의 전달과 연산은 실제 인간의 뉴런에서 일어나는 과정과 유사하다. 노드는 일정 크기 이상의 자극을 받으면 반응을 하는데 그 반응의 크기는 입력값과 노드 연결선의 계수(또는 가중치)를 곱한값에 비례. 일반적으로 노드는 여러 개의 입력을 받으며 입력마다 다른 계수를 가지고 있다. 이 계수가 바로 각 입력에 대한 가중치가 되며 실제 시냅스의 신호전달 가변성을 대변함. 각 노드는 들어오는 모든 입력값과 각 연결선의 가중치를 곱한 값들을 전부 더한 후 그 값을 입력값과 각 연결선의 가중치를 곱한 값들을 전부 더한 후 그 값을 최종 판결자인 활성함수의 입력으로 보낸다. 활성함수의 결과가 그 노드의 출력에 해당한다. 이런 식으로 노드는 층층이 배치되어 정보입력과 출력을 이어간다. 데이터를 입력받아서 학습한다는 것은 노드와 노드를 연결하는 연결선의 가중치를 변화시키면서 최종응답(출력)의 오류를 최소화하는 과정이다. 학습이 끝나면 이 가중치가 특정 수치로 결정된다. 인공신경망은 보통 2,3개의 중간층을 가지는 신경망 구조로도 좋은 성능을 보이며 학습도 쉽게 이루어진다. 그러나 언어지능이나 시각지능같이 복잡하고 어려운 영역에서는 중간층의 개수가 여러 개인 깊은 구조로 만들어진 네트워크가 필요하다. (다층신경망 혹은 심층신경망) 그러나 무작정 중간층(은닉층)을 많이 늘린다고 좋은 것은 아님. 층이 늘어나면 연산 양이 기하급수적으로 늘어나면 학습자체가 부족하면 오답을 학습할 가능성이 높아짐. 더 큰 문제는 융통성 없이 학습한다는 것. 주어진 학습 데이터에 기반을 두고 학습하다보니 조금이라도 변수가 생기면 적합한 답을 내놓지 못하는 경우가 생긴다. 이런 현상을 과적합이라고 하며 실제 데이터에 대한 오차가 급격하게 증가하는 현상. 다층신경망은 80년대부터 연구가 진행됐지만 실전에서 큰 활약을 못하고 역사속으로 사라지는 듯 했다.
- 힌튼이라는 영웅이 등장하여 수렁에 빠진 다층신경망을 구해낸다. 힌튼과 그의 동료들이 86년에 발표한 오차역전파 기법에 의해 다층신경망은 기적적으로 회생을 하게 됨. 이것이 바로 1차 신경망 구출작전이다. 극적으로 부활한 신경망은 영상처리, 제어분야, 자연어 처리 등에서 제법 활약을 하는 듯하였지만 과적합 같은 문제들을 해결하지 못하면서 2차인공지능 겨울과 함께 90년대 이후에 서서히 몰락하게 된다. 2차 인공지능 겨울은 대부분의 학자들과 투자자들이 인공지능을 외면하는 시대였고, 인공신경망은 더욱더 심한 냉대속에 있었다. 이런 싸늘한 분위기 속에서도 힌튼은 '인공신경망이 바로 인공지능이라는 신념을 굽히지 않았다. 불굴의 힌튼과 그의 동료들의 노력에 의해 꺼져가는 신경망의 불씨가 조금씩 살아나기 시작했다. 06년도에 와서 캐나다의 지원을 받아온 힌튼팀은 한편의 기념비적 논문을 발표하게 되는데 이것이 바로 딥 빌리프 넷을 위한 패스트 러닝 알고리즘이다. 이 논문은 인공신경망의 고질적인 문제가 데이터의 사전학습 등을 통해 해결될 수 있음을 밝혔고, 인공신경망 연구의 새로운 이정표를 세운다. 힌튼의 2차 신경망 구출작전이 성공한 것이다. 이 논문 이후에 딥러닝이란 말이 유행하기 시작. 흥미로운 것은 논문제목에서 신경망이란 단어대신 딥 빌리프 넷이 사용된 점이다. 2000년대 초기만 하더라도 논문에 신경망의 neural이란 단어만 들어가도 탈락당할 정도로 신경망은 죽은 분야였다. 이런 참단한 시기에 힌튼은 색다른 단어를 선택해서 악마의 프레임을 빠져나오고 있었다. 그후 6년의 세월이 지난 2012년 세계 최대의 이미지 인식 경연대회 ILSVRC에 출전한 힌튼 팀은 마치 다른 팀들을 비웃기라도 하듯 압도적 기록으로 우승하면서 딥러닝의 가공할 위력을 보여주게 된다. 힌튼의 신경망 구출작전이 성공하면서 우리가 보는 지금의 인공지능 시대가 열린 것이다.
- 과일 분류기와는 달리 아파트 가격예측의 경우만 하더라도 결정적 피처를 선택하기 위해서는 일반 상식보다 더 깊은 전문가의 지식이나 경험이 필요함을 알 수 있다. 좀 더 복잡한 경우를 생각해보자. 엑스레이 사진을 보고 암을 판정하는 기계를 머신러닝 방식으로 만드는 경우, 역시 일단 세포에 대한 이미지 데이터를 준비해야 하는 것이 급선무다. 그런데 암세포와 정상세포를 구별할 수 있는 피처(특징)를 어떤 식으로 정의해서 데이터를 모아야 할까? 정교한 의료지식이 없다면 이 단계에서 벌써 막히게 된다. 이제 눈치를 챘겠지만 머신러닝 방식의 결정적 단점은 도메인 특징을 반영하는 피처를 정의하거나 좋은 피처를 찾아내는 것이 쉬운 작업이 아니라는 것이다. 어느 정도 피처에 대한 감이 온다면 이미지 이식의 경우로 돌아가보자. 사물을 구별하는 것은 너무나 쉬운 일인 것 같은데 이미지의 어떤 것을 피처로잡아서 입력으로 사용해야 할지 분명하지가 않다. 이미지의 개별 픽셀 하나하나를 입력으로 해도 되고 털을 먼저 검출하여 그것을 피처로 잡아도 된다. 눈, 코, 입 등을 모듈로 구분하여 피처로 잡아도 될 것 같다. 그러나 좋은 성능을 내는 최적의 피처가 무엇인지 알 수 없기 때문에 인간이 수작업으로 하나씩 잡아서 모두 검토해야 한다. 또한 하나의 얼굴이라고 보는 각도 등에 따라 수많은 경우가 발생하므로 그것을 모두 반영하는 피처를 설계하는 것은 거의 불가능에 가깝다. 결국 머신러닝 방식도 고전적인 규칙기반 시스템이 갖고 있는 문제로 수렴한다.
- 여기서 자연스럽게 컴퓨터가 자동으로 피처를 잡아주는 시스템을 상상할 수 있다. 이런 상상이 현실이 된 것이 바로 딥러닝이다. 딥러닝은 피처를 사람이 선택하는 고전적인 머신러닝과는 달리 적절한 피처(입력값)를 스슬 생성해낸다. 딥러닝은 엄청난 양으 데이터를 학습하여 스스로 피처를 만들고 인간이 인식하지 못한 숨은 특징도 찾아낸다. 이런 의미에서 딥러닝을 표현학습 혹은 특징학습이라 한다. 고전적 머신러닝은 이미 만들어진 입력 피처를 받아서 분류기를 학습한다. 그러나 딥러닝은 입력 데이터에서 스스로 피처를 찾아내고 그것을 입력값으로 변환하여 다시 분류기로 넘기는 작업을 동시에 수행한다.
- 컨볼루션 신경망은 기계적 시각지능을 구현한 일등공신이며 딥러닝의 철학을 만든 장본인이다. 컨볼루션 신경망의 핵심은 피처를 자동을 잡아내는 것이라고 했다. 컨볼루션 신경망은 이미지의 특징이나 피처를 잡아내는 필터의 집합체다. 단계별로 나누어진 필터는 사물의 피처를 잘 잡아낼 수 있도록 학습을 통해 최적화된다. 피카소가 사물의 피처를 멋지게 잡아내서 표현하는 것처럼 기계는 학습을 통해 사물의 피처를 이해하는 것이다. 그러나 기계가 고양이와 개를 구별한다고 해서 그 의미를 이해하는 것은 아니다. 단지 이미지를 분류할 수 있을 뿐이다. 기계는 딱 거기까지 가능하다. 따라서 기계는 모나리자보다 피카소가 만든 얼굴이 더 인간적이라고 판단할 수도 있다.
- 이미지 인식의 신기원을 이룩한 컨볼루션 신경망은 입력 이미지에서 자동으로 피처를 뽑아내는 것이 주특기. 그렇다면 반대로 생각하여 피처맵을 이용하여 이미지를 뽑아내면 어떨까? 앞에서 살펴보았듯이 컨볼루션 신경망은 위계적인 구조를 바탕으로 단계별로 피처를 잡아낸다. 이런 피처를 역으로 이용하여 이미지를 복원하여 연구가 활발하게 진행되고 있다. 17년도에 들어와 구글 브레인 연구팀은 저해상도의 흐릿한 얼굴 이미지에서 뚜렷한 고해상도 이미지를 생성하는 알고리즘 '픽셀 리커시브 슈퍼 레졸루션'을 발표했다. 흐릿한 8*8 픽셀 사진을 입력하면 컴퓨터는 원본사진을 복원하여 출력으로 보낸다. 이미지 복원기술은 다양하게 응용될 수 있다. 사진을 확대할 때 사진이 깨지거나 일그러지는 현상을 막을 수 있다. 구글은 이미 고해상도 이미지 변경 기술을 통해 사진을 깨지지 않게 확대해주는 서비스를 시작한 상태. 한편 이런 이미지 기술들은 범죄 현장이나 범인의 얼굴을 찍은 CCTV 영상을 깨끗하게 복원하는 데 응용이 될 수도 있다. 최근에 차량 블랙박스의 흐린 이미지를 깨끗하게 복원하는 연구가 활발하다. 뺑소니 사고 등 크고 작은 교통사고를 해결하는 데 결정적 역할을 할 것이다.
- 컨볼루션 신경망은 자율자동차 개발에도 빠질 수 없다. 자율자동차는 전통적인 자동차 기술뿐 아니라 센서기술, 자동제어 기술, 이미지 인식기술 등 거의 모든 첨단 기술들이 필요. 특히 움직이는 주위 환경을 인식하는 기술은 자율자동차의 생명이다. 급변하는 환경과 빠른 속도로 지나가는 다른 차와 사람들을 올바르게 인식하지 못하면 곧바로 사고로 이어진다. 따라서 이미지를 분류하거나 이미지 속에서 한 객체의 위치를 알아내는 수준으로는 자율자동차에 적용하기 어렵다. 자율자동차의 영상정보에는 다양한 객체들이 다양한 위치에 존재함. 사람, 신호등, 차량, 표지판 등 수많은 객체들이 총 동원되어야 함. 객체의 위치를 특정해서 분류해야 하고(분류 및 구역화), 여러 객체들을 인식해야 하고(객체 탐지), 객체의 윤곽을 잡아서 독립된 파편으로 분할해야 하는(객체 분할) 등 자율자동차 등 거의 인간 수준의 시각지능이 필요하다. 여기서 객체분할은 객체의 윤곽을 잡아내는 것으로 세그멘테이션이라고 부르기도 한다. 15년 켐브리지 대학은 이 기술을 자율자동차에 적용할 수 있는 세그넷이라는 시스템을 공개했다. 이 시스템은 컨볼루션 신경망을 기반으로 만들어졌는데 위치추적 시스템을 통한 위치측정과 함께 도로위의 표지판과 도로표지, 거리의 모습, 보행자, 심지어 날씨까지 인식할 수 있다. 세그넷은 지금까지 본 적인 없는 거리의 풍경을 분석하고 도로 및 도로 표지판, 보행자, 건물, 자전거 등 12개의 다른 카테고리 별로 사물과 풍경을 분류한다. 요즘은 이 시스템을 능가하는 모델들이 계속 등장하면서 자율자동차의 가능성을 높이고 있다. 컨볼루션 신경망은 자율자동차의 꿈을 실현하는 데 일등공신임에 틀림없다.
- 인공신경망을 트윈모듈로 연결하여 경쟁을 시키는 적대적 생성 네트워크 모델은 한 방향으로 흐르는 기존 신경망과는 달리 실제 자연의 생태계처럼 진화할 수 있는 상호작용 시스템을 구현한 것이다. 이 아이디어를 경쟁하는 다중 모듈로 계속 확장한다면 점점 인간에 가까운 능력을 발휘할지도 모른다. 컨볼루션 신경망의 완성자 얀 르쿤 교수가 적대적 생성 네트워크는 최근 10년간 머신러밍 분야에서 가장 혁신적인 아이디어라고 극찬했을 정도로 응용분야가 무궁무진하다. 적대적 생성 네트워크를 만든 이언 굿펠로우는 대강의 그림만 그려놓으면 나머지는 인공지능이 완성하는 형태의 시스템이 구현가능함을 강조했다. 실제 적대적 생성 네트워크는 이미지 분야뿐 아니라 음성인식 분야나 예술분야 등으로 계속 응용되고 있으며 적대적 생성 네트워크의 변종들이 계속 탄생하고 있다. 시각지능은 이제 창조지능이 되고 있다.
- 리걸테크 산업의 종류는 변호사의 업무 영역만큼 다양하지만 서비스 형태를 기준으로 간단하게 나누어보면 다음과 같다. 지능형 법률정보 검색, 변호사 소개 서비스, 법률 데이터 분석 및 예측, 전자증거개시 분석, 법률 프로세스 자동화, 법률문서 자동화 등이다. 결국 인공지능 변호사라는 닉네임을 달고 나타나는 모든 서비스는 하나로 볼 수 있다. 리걸테크는 요즘 갑자기 등장한 것 같지만 그 뿌리는 매우 깊다. 컴퓨터와 법률의 만남 자체가 리걸테크의 시작이며 가시적으로는 법률정보검색 서비스이 형태로 나타났다. 50년대 이후에 컴퓨터는 문헌이나 자료를 검색하는 데 필수적인 도구로 자리잡았따. 법률 영역은 판례나 법률자료를 검색하는 것이 너무나 중요하기 때문에 다른 분야보다 일찍 컴퓨터가 응용되었다. 60년대에 이미 미국 오하이오 변호사협회는 판례를 검색하는 컴퓨터 시스템을 도입하였다. 이후에 민간영역에서 법률 정보검색 서비스가 본격화되었다. 렉시스 넥시스가 민간영역에서 최초로 법률검색 서비스를 시작하였고, 웨스트로가 방대한 법률문서의 데이터베이스를 기반으로 검색 서비스 사업에 뛰어들었다. 이 두 회사가 법률검색 서비스를 거의 독점하면서 리걸테크는 그 자체의 산업으로 다양성을 확보하지는 못하였다.

 

Posted by dalai
,