AI 시대 내 일의 내일

IT 2020. 7. 30. 12:02

- 컴퓨터와 법률의 궁합이 잘 맞는다는 점에는 몇 가지 합당한 이유가 있다. 첫째로 엄청난 양의 정보, 지금 식으로 말하자면 빅데이터를 다루는 업종이기 때문이다. 둘째, 법률 체계가 수학적 프로그래밍, 즉 코딩의 논리적 사고 전개 방식과 매우 유사하기 때문이다. 셋째, 수사-기소-재판-집행으로 이어지는 사법 절차가 정형 반복적인 업무로 자동화하기 쉽기 때문이다. 이렇게 법률에 정보기술(IT)를 접목한 디지털 자동화 프로세스가 바로 '리걸테크'이다. 그러나 법률 AI는 리걸테크를 한 단계 넘어선 존재이다. 전기 청소기가 로봇 청소기로 진화했다고 할까. AI 법률가는 사람의 개입 없이 스스로 학습해서 끊임없이 진화하고, 최종 분석과 추론 결과를 정확한 수치를 바탕으로 정리해 의뢰자에게 전달한다. 문서와 사진, 동영상 등 콘텐츠를 읽고 쓰는 작업은 물론, 음성으로 사람들과 대화할 수도 있다.
- 한국은 특히 EMR 보급률이 96%에 달함. 건강보험공단에서 100만 건 이상의 임상 정보표본을, 심사평가원에서 8만 7,000여 개의 진료기록을 보유하고 있다. 데이터의 양만으로 따 졌을 때는 어디에도 꿀리지 않는 헬스케어 선진국이다. 그러나 이 데이터를 통합하여 관리하고 활용할 수 있는 기술 개발과 제 도 개혁에 미진해서 아직도 헬스케어 후진국으로 남아 있다. 대 표적인 예로, 이미 수십 년 전부터 의료의 미래상으로 제시되어 왔던 원격진료는 10년 넘게 갈피를 잡지 못한 채 표류하고 있다. 밥그릇을 뺏길까 염려하는 개업의開業醫 모임인 대한의사협회와 의료 서비스 양극화를 우려하는 시민단체들의 반대에 부딪히고 있기 때문이다. 초등학생들도 손쉽게 영상통화로 소통할 정도로 관련 기술이 진보해 있는 현실을 생각하면 어처구니없는 문화 지체 현상 이다. 이미 의료 현장에서는 환자들의 원격진료 요구가 현실화 되고 있다. 한 원로의사는 거동하기 힘든 부모를 대신해 병원에 온 아들딸들이 우리 어머니(아버지)와 한번 영상통화 해보라며 스마트폰을 자신에게 건넨다고 털어놓았다. 의료법 위반이라고 손사래를 치면, “의사 선생님 폰도 아니고, 제 폰으로 통화하는 것뿐인데 뭐 어떠냐”라며 우문현답을 한다는 것이다. 제도가 현실을 못 따라가는 슬픈 대한민국의 자화상이다.
- 필립스 본사에서 혁신전략을 담당하고 있는 예룬 타스Jeroen Tas 총괄 책임자는, AI는 의사를 대체할 수 없지만, AI를 사용하지 않는 의사는 대체될 것이라는 충고를 남겼다. 그만큼 AI가 앞으로 병 진단에 있어 핵심적인 역할을 하게 될 것이라는 의미다. 그러나 결국 최종판단을 내리는 것은 사람 의사이다. AI는 그저 거들 뿐이다.
- 사실 핀테크는 오래전부터 존재했다. 현금 없는 사회를 만든 1950년대 신용카드 혁명, 창구 직원을 대 체한 1960년대 현금자동입출금기(ATM), 1980~1990년대의 전자결제와 인터넷은행 등장 등도 따지고 보면 모두 새 기술에 해 당한다. 그러나 AI가 개입하기 시작한 4차 산업혁명의 스마트 핀테크는 앞선 모든 변혁을 저만치 따돌릴 만큼 그 변화의 폭과 깊이 가 넓고도 깊다. 가장 큰 차이는 '융합'이다. 금융권 내부의 업무 절차 개선, 컴퓨터를 활용한 업무 자동화 정도가 이전의 변화라 면 지금은 금전적 가치의 이전이란 금융의 본질이 전 산업 분야 에서 서로 교류하면서 섞이고 있다.
- 독일의 인더스트리 Industrie 4.0은 스마트 제조 플랫폼으로, AI 공장을 만든다. 미국의 재범 예측 AI 컴퍼스COMPAS는 사법 행정의 지능화 도구로, 범죄 피의자가 가석방해도 될 인물인가 를 판사에게 충고한다. 나름의 혜택과 위험이 있지만 국가 운영 체제의 근간을 흔들 정도는 아니다. 제조 인공지능은 사적인 비 즈니스의 영역에서, 법률 AI는 국내 사법체계의 영역에서 제한 적으로 영향을 주기 때문이다. 그러나 금융은 단순히 비즈니스 나 역내 법률의 영역에 머물지 않는다. 국내적으로는 중앙은행 의 발권력과 이자율 정책, 국채 발행 등 국민경제 시스템을 통해 안정된 통화의 공급과 유동성 관리를 도모한다. 국외적으로는 국가간 제품과 용역의 교환으로 생긴 가치의 이전 등 국제 외환거래와 투자를 통해 무역수지의 균형, 외환보 유고를 비롯한 국부의 증대를 도모한다. 한마디로 금융은 그 나라의 경제 주권으로 정부와 운명을 함께한다. 달러, 마르크, 엔, 위안, 원 등 화폐 단위에 국가의 자존심이 걸려 있는 것이다. 공공성이 그만큼 강하기 때문에 보수적이고, 따라서 디지털 혁명에 뒤처질 수밖에 없었다.
- 블록체인은 금융혁신의 최종 기술이다. 암호통화erytocurrency와 스마트 계약으로 이어지면서 금융 AI의 신뢰성을 보증해주기 때문이다. 미국의 페이스북은 비자·마스터카드와 손잡 고 암호통화 기반의 신종 거래 시스템 '리브라'를 조기 출시하려다 트럼프 행정부와 제도 금융권의 강력한 견제에 시기를 연기했다. 페이스북이 2019년 6월 리브라 발행 계획을 밝힌 직후 트럼프 대통령을 비롯한 미국 정부 고위관료들, 유럽연합 당국은 글로벌 금융 시스템의 안정을 해치는 위험한 프로젝트라고 비난하면서 철회를 요구했다. 그러나 최고경영자인 마크 저커버그는 같은 해 10월 리브라 협회를 창설해 차량공유업체 우버·리프트, 유럽의 결제서비스업체 페이유 등 21개 기업과 공조해나갈 것 을 선언했다. 각 참여기업은 1,000만 달러씩을 투자하기로 했다. 2020년 상반기부터 리브라를 발행해 모바일 기기와 SNS를 통한 결제 서비스를 시작한다는 게 목표였다. 하지만 초기 협회 가입자였던 비자·마스터카드 스트라이프·메르카도파고와 전자상거래업 체 이베이, 부킹홀딩스 등 7개 기업은 탈퇴를 공식화했다. 마음이 바뀐 업체들은 정부의 압력에 태도를 유보한 것으로 풀이된다. 그러나 페이스북은 저커버그의 미 하원 청문회 출석 등 계속된 공세에도 굴복하지 않고 리브라 프로젝트를 지속할 것임을 강조했다. 블록체인 기술에 기반한 미국의 암호통화가 2020년 시즌 2의 새로운 국면으로 접어들 것으로 보인다. 이를 틈타 중국 인민은행은 2020년 상반기 중 세계 최초로 법정 디지털 화폐를 시범 운영한다. 발행은 중앙은행인 인민은행이, 유통은 중국의 4대 국영 상업은행인 공상은행, 농업은행, 중국은행, 건설은행과 3대 이동통신사인 차이나모바일, 차이나 텔레콤, 차이나유티콤이 공동으로 책임진다. 블록체인 기반의 중국 디지털 인민폐는 일대일로一帶一路와 결합해 아프리카, 동남아 등 제3세계 협력국에 대한 원조와 교역의 표준 결제수단으 로 확산시키는 그림을 그리고 있다. 현재 국제 금융의 기축통화인 달러 패권을 디지털 관문으로 뚫고 나가려는 야심이 읽힌다. 미국의 대응도 시간문제일 뿐이다. 블록체인으로 보호되는 스마트 계약도 종래 다수의 중앙집 권적 금융기관이 개입했던 무역 업무 등 복잡한 거래를 쉽게 만들고 있다. 일본의 대형 금융사 SBI 그룹은 2세대 암호통화 '리플(XRP)'을 기반으로 한 기업용 블록체인 네트워크를 개발하고 있다. 61개 일본 은행이 이 R3 프로젝트에 참여해 해외 거래에 이용할 예정이다. 비자·마스터 신용카드 회사도 블록체인 기반 기업 결제 서비스를 이미 출시한 바 있다.
- S&P 글로벌 인수 직전인 2018년 1월 골드만삭스는 금융 AI 켄쇼를 활용해 미국 한파의 최대 수혜주는 넷플릭스와 도미노피자'라는 보고서를 내놓기도 했다. 브라운 사장은 켄쇼의 초기 버전이 주로 주식·채권 등 투자시장 분석과 미래전망 보고서 작성에 치중했다면, 현재는 S&P 글로벌의 내부적 업무 개선 또는 S&P그룹의 여러 다른 고객을 위한 신제품 개발에 집중한다고 말했다. 켄쇼의 AI 기술을 활용한 업무 개선의 예로는 데이터정제가 있다. 새로운 데이터를 추가할 때는 기존데이터와의 연결 고리를 만들어야 한다. 새 데이터의 신뢰도를 검증하고 내부로 편입시킬 수 있도록 재가공하는 작업이 필요한 것이다. 예를 들어, 특정 기업에 투자하고자 할 때 사기업에 대한 데이터는 굉장히 찾기 힘들뿐더러 다양한 소스(정보원)에서 나온다. 또 소스별로 데이터 품질도 다르다. 이때 다양한 소스에서 나온 데이터를 하나로 합치는 기술 개발이 켄쇼의 새 임무라는 설명이다. 다양한 소스로부터 품질이 다른 대량의 데이터가 유입될 때, 이를 정확하고 신속하게 하나로 합치는 것이 데이터 정제의 핵심 기술이다. 기존 데이터와 잘 연결되는 동시에, 합쳤을 때 전체 신뢰도가 떨어지지 않도록 쓰레기를 선별해서 버리고 사후에도 잘 돌아가나 검증해야 한다. 외부고객을 위한 켄쇼의 또다른 신제품 중 하나는 차세대 검색엔진이다. S&P 글로벌의 고객은 투자회사뿐 아니라 로펌 컨설팅사·정부 등으로 폭이 훨씬 넓어졌다. 투자 정보에서 법령 검 토, 심지어 외교·안보 관계 전망 등 광대역의 정보를 찾기 위해 S&P 검색엔진을 사용한다. 그런데 수집 정보의 양과 종류가 늘 어남에 따라 훨씬 더 정교하고 효율적인 작동이 필요하게 되었 다. 예컨대, 영국의 브렉시트 이후 파운드화 변동과 국제 금융시 장에 대한 영향, EU의 새 개인정보보호법(GDPR) 시행 후 대EU 수출입 관세법규의 달라진 해석, 북한 미사일 실험에 따른 글로벌 외교·안보 위험지수 증가와 군비증강 추이 등 정치·경제·사회·외교안보 지형 변화까지 폭넓은 스펙트럼의 빅데이터를 입력해도 즉시 고객이 원하는 정보를 추출해주는 금융판 구글 검색창인 셈이다.
- 알파고는 정책망政策網, policy net과 가치망價値網, value net, 2개의 인공 신경망artificial neural network, ANN으로 구성된다. 인공 신경망은 인간의 뇌신경이 강한 자극 방향끼리 시냅스에 의해 가중 연결되는 원리를 소프트웨어 코딩에 응용한 것이다. 정책망은 상대의 수에 응수할 후보수를 고른다. 가치망은 각 후보 수의 승리 확률을 계산한다. 바둑은 가로세로 19줄이 361개 교차점을 만든다. 어느 한 지점에 돌이 놓였을 때 나머지 지점에 놓을 수 있는 경우의 수는 우주에 존재하는 원자수보다 많다. 무한대에 가깝다는 이야기 이다. 트리tree 탐색은 나무가 큰 줄기에서 가는 줄기로 가지를 뻗 듯, 상위에서 하위 결정으로 내려가며 경우의 수를 따져보는 방법이다. 정책망과 가치망을 가동해도 끝까지 모든 탐색을 할 순없다. 여기에서 몬테카를로 방법Monte Carlo Method 이라는 통계적 샘플링 알고리즘이 동원된다. 경로와 승률을 계산할 때 전체 훈련 데이터 중 승리로 이끌었던 선택(액션)의 초기 확률과 바둑 판 현 상태의 승리 확률을 절반까지만 계산한다. 보다 신속한 확률 탐색으로 검색 과정을 확 줄이는 방법이다. 프로 기사들은 오픈 바둑 AI '릴라제로'를 켜놓고 연구할 때, 반상 위의 각 착점에 대한 개별 승률을 즉시 계산해주기 때문에 좋은 수와 나쁜 수를 판단하는 데 많은 도움을 받는다고 말한다. 실제 화면에서 보면 한 수 한 수를 둬나갈 때마다 왼쪽 분할 화 면에서 흑돌과 백돌의 승률은 계속 변한다. 그리고 정책망에서 보여주는 후보 수의 행마를 차례차례 음미하면서 다음 전개의 유불리를 판단한다. 화면상 후보 수는 승률의 고저에 따라 첫 번째, 두 번째, 세 번째로 좋은 수가 다른 색으로 표시된다. 후보 수의 돌 위에 반 투명한 글씨로 적혀 있는 숫자 42.8은 그 자리에 둘 경우의 승률 을 보여준다. 아래 작은 글씨로 34k라고 적혀 있는 숫자는 바둑 AI의 시뮬레이션 횟수이다. 그 자리를 3만 4,000번이나 들여다. 봤다는 뜻이다. AI가 더 많이 찾아본 수는 그만큼 과거 대국의 데이터상 승리로 이어지는 경로였다는 의미이다.
- 우리는 게임을 잘하는 사람을 보고 “머리가 좋다”라고 말한 다. 이 표현은 단순한 암기력이나 분석 능력 같은 논리적 지능뿐 아니라, 감정과 대인 관계 등 모든 것을 종합한 총체적 능력 을 지칭하는 것이다. 뛰어난 사업가 중 도박을 즐기는 사람의 비율이 제법 높다. 스파이 영화에서 주인공이 악당과 포커 게 임 대결을 벌이는 장면은 단골 에피소드이다. 게임을 잘하는 사 람이 다른 일도 잘할 것, 인생에서도 승자가 될 확률이 높을 것 이라는 게 일반적인 생각이다. 정말 그런지 증거는 없지만 우리 가 그렇게 믿고 있다는 사실이 중요하다. 부자 아빠가 자식에게 모노폴리〉 같은 재산증식 게임을 시키고, 선생님은 심시티〉 등 시뮬레이션 게임으로 학생에게 재미와 의미(지식)를 동시에 전달할 수 없을까 고민한다. 모든 것의 게임화, 게이미피케이션 Gamifacation 개념이다. 인생은 게임이다. 적어도 게임론자에게는.
- 바둑, 체스, 스타크래프트2, 일대일 포커의 공통점은 2명의 플레이어가 제로섬zero sum 게임을 한다는 점이다. 여기서는 AI가 내시 균형Nash equilibrium 전략을 쓰면 대개 통한다는 게 게임이론 전문가들의 분석이다. 그러나 다중 플레이는 다르다. 훨 씬 더 복합한 조합 관계가 등장한다. 브라운 박사는 대회가 끝난 뒤 영국 공영방송 BBC와의 인터뷰에서 “포커는 더 근본적인 문제를 해결하기 위한 하나의 벤치마크”라며 “감춰진 정보에 대처하는 AI를 발전시키는 것이 최종 목표”라고 말했다. 그의 결론은 이렇다. 현실에 활용하고 인간이나 다른 AI와도 상호작용을 하는 AI를 만들려면, 다른 구성원들이 세계를 보는 방식이나 그들이 다른 정보를 가질 수 있다는 것을 이해해야 한다. 따라서 포커는 이를 위한 대단히 훌륭한 모의 실험장치라는 것이다. 플루리버스를 공동개발한 카네기멜론대 토머스 샌드홀 름 Tuomas Sandholm 교수도 “우리는 멀티플레이 포커에서 초인간적superhuman 퍼포먼스를 보여주는 데 성공했다”라며, “이는 AI 연구와 게임이론에서 중요한 이정표를 세운 것”이라고 감격했다.
- 기존에 상용화되어 널리 쓰이고 있는 애플의 시리, 아마존의 알렉사 등 대화형 AI와 프로젝트 디베이터는 어떤 차이가 있을 까. 기존 대화형 AI의 경우, 보통 명확하게 정의된well-defined 단답식 질문 하나를 들으면 이에 즉각적으로 답한다. 무조건적으 로 무슨 대답이라도 내놓도록 프로그래밍되어 있기 때문이다. 그러나 토론은 대화의 주제가 훨씬 다양하고, 대답에 앞서 주어지는 준비시간도 길다. 또 모든 질문에 대답할 필요도 없다. 자신의 논점에 도움이 되는 한두 가지만 답해도 된다. 서로 쓰이는 경우가 근본적으로 달라서 단락적으로 비교하기 어려운 대상이다. 애초에 개발 목표가 다르기 때문이다.
- IBM 토론왕 프로젝트 디베이터는 주제가 공개되면 15분간 방대한 말뭉치corpus를 검색해 도입 연설문을 작성한다. 먼저, 신문기사를 100억 문장 정도 찾아본 후 수백 개의 유의미한 문장 조각segments 으로 줄인다. 다시 이를 맥락에 맞게 논리적으로 재배열해 최종 토론문을 만든다. 언론 기사를 재료로 삼은 이유 는 AI 학습에 필요한 방대한 양의 문장이 존재하고, 다양한 논 점을 다루고 있기 때문이다. 개발팀장은 “처음엔 위키피디아를 이용했지만 사용하는 말뭉치의 크기가 40배 이상 늘어난 후 뉴스 콘텐츠에 주목했다”라고 설명했다. 이런 심도 있는 주제에 대한 토론이 가능한 AI 기술의 등장은, 지금까지의 AI 적용 분야를 넘어선 새로운 활용 가능성을 점치게 만든다. 바로 정치와 민주주의의 디지털 트랜스포메이션, 지능화이다.
- 유권자를 조종하려면 이 같은 AI 프로파일링을 정치 영역으로 확장하기만 하면 된다. 케임브리지 애널리티카는 AI를 통해 유권자의 SNS 정보를 모으고 각 개인의 행동 성향을 분류했다. 후보 캠프의 정치 공학자와 데이터 브로커는 케임브리지의 개인성향정보를 사들인 후 자체 제작한 행동 예측 알고리즘으로 유권자를 분석했다. 누가 어느 정당, 후보를 지지할지 정밀하게 예측한 다음 자기 캠프에 우호적인 지지자들에게만 유도 정보를 노출시켰다. 즉, 페이스북 검색 시 투표 시간·장소를 비롯한 상세한 투표 정보와 투표를 마친 친구 사진 등이 뜨도록 해 투표율 을 높이려는 시도를 했다. 나를 찍을 것으로 예측되는 유권자들만 골라 투표소까지 오도록 유도한다면 내게 유리한 선거결과 조작도 가능하다는 이야기이다. 자신과 다른 견해와 취향을 지닌 사람이나 집단과의 접촉 빈도를 줄임으로써 다양성이 조화롭 게 조정·타협되는 민주주의의 기본전제를 훼손할 수 있다. 따라서 대부분의 개인정보보호법은 AI가 프로파일링을 위 해 인터넷에서 개인정보를 수집하는 경우라도 본인 동의 없이 민감정보를 취득하는 것은 금지하고 있다. 민감정보란 정보주체의 사생활을 현저히 침해할 우려가 있는 개인정보를 말한다. 특정 종교나 정당, 노동조합 가입 여부라든가 질병을 앓은 치료 이력 등 그 사람의 신념과 건강 상태를 한눈에 파악할 수 있게 하는 재료들이다. 그러나 데이터 가공업자들은 단순 정보도 조합해 민감정보로 둔갑시킬 수 있다. 약품 구매이력, 단체 홈페이지 검색 기록 등을 빅데이터로 분석하면 성향 정보를 추출해낼 수 있기 때문이다. 법률적으로 이 같은 행위는 프라이버시권(사생활 보호권) 침해로 간주된다. 자신에 관한 정보를 스스로 통제할 수 있는 권리, 즉 개인 정보를 부당하게 취득·수집당하지 않을 권리 와 노출된 정보를 열람·정정·삭제 청구할 수 있는 권리의 침해에 해당하는 것이다.
- 이중 슬릿 실험과 양자 고양이로 유명한 천재 물리학자 슈뢰딩거는 ‘생명이란 무엇인가’라는 전설적인 강연에서 “생명은 내부의 엔트로피(무질서)를 낮춰 안정을 꾀하는 대신, 외부 엔트로피는 높이는 닫힌계界”라고 정의했다. 이와 함께 생명은 외부의 에너지를 가장 잘 흡수할 수 있도록 복제 전략을 사용해 자신과 닮은 '또 하나의 나'를 연쇄적으로 생산한다고 그는 갈파했다. 복제를 통해 더 큰 닫힌계의 내부 안정을 도모하는 생명과 극에 달한 외부 엔트로피 상승이 서로 균형을 잡으며 자연은 굴러간다고, AI의 창발성과 자기조직화 원리는 생물학자들이 말하는 유기 생명체의 탄생 과정과 흡사하다. 아무것도 없는 영양 수프 덩어리 속에서 갑자기 햇볕을 받아 광합성을 시작하는 원시 생명 이 툭 튀어나온다. 무에서 유가 생긴 것이다. 무질서에서 질서가 탄생하는 순간이다. 이어 생명은 복제를 거듭하며 점차 더 정교한 다음 단계로 스스로 체계를 잡는다. 무조직에서 조직이 툭 튀 어나온다. 아무도 조종 통제 명령하지 않지만 더 큰 질서가 자연 스럽게 형성되는 것이다. AI가 나오기 한참 전에 유행하던 신과 학, 카오스Chaos 와 프랙털 그리고 퍼지 이론 Fuzzy theory 에서 이미 발견한 생명과 자연의 원리이다.

'IT' 카테고리의 다른 글

타겟티드 (0)	2020.10.18
은밀한 설계자들 (0)	2020.09.07
페이스북은 내가 우울증인 걸 알고 있다 (0)	2020.07.09
딥러닝 레볼루션 (0)	2020.06.12
빅나인 (0)	2020.05.10