- 왓슨은 현재 가장 인공지능에 가까운 플랫폼 중 하나입니다. 단, IBM은 왓슨을 절대 인공지능이라 부르지 않고 인지 체계'라고 부릅니다. IBM 입장에서는 인공지능을 '강한 AI'라 고 부르는 만큼 AI 관련 기술을 쓰고 있어도 전지전능하다고 할 수는 없는 왓슨을 인공지능이라고 부를 수 없다는 거겠죠. IT 업계에서는 '인지'가 스스로 생각할 수 있다'는 뜻으로 통합니다.
- 왓슨은 고객과 상담원의 대화를 음성 인식'으로 인식해 텍스트로 변환하고 그 것을 형태소로 분석(단어 및 문절로 변환)한 다음 자연어 처리 분류를 해서 문장 의 뜻과 의도를 이해합니다. 조작 매뉴얼, FAQ, 서포트 이력, 최근 많았던 사례 등의 데이터베이스를 검색해 적절해 보이는 여러 답변을 점수까지 매겨 골라주고 점수가 가장 높은 것을 최적의 답으로 판단해 상위 3개~5개의 답을 후보로 올려 화면에 표시합니다. 기본적인 이용 매뉴얼에 적혀 있는 내용을 보고 베테랑의 기량과 경험까지 학 습한 시스템이 상담원을 지원해 해결책을 조언해 주면, 설령 새내기라 해도 최적 의 답으로 고객 응대를 할 수 있으며 직무 수준을 통일할 수 있습니다. 또 새내기 도 더 빨리 실전에 들어가 베테랑 수준의 조언을 받아서 문제를 해결하는 경험을 할 수 있어 교육 기간이 단축된다는 장점도 있습니다.
- IBM 왓슨은 클라우드 서비스[PaaS (Platform as a service)]로 제공되기 때문에 물리적인 하드웨어나 서버군은 소프트뱅크가 운영 및 관리하는 데이터 센 터에 있습니다. IBM 왓슨을 이용하기 위한 30개가 넘는 기능을 가진 API가 이미 공개됐고, 거기에는 딥러닝 등의 AI 관련 기술뿐 아니라 50개 이상의 선진 테크놀 로지가 이용됐습니다. 이러한 API를 조합하면 누구나 쉽게 인지 애플리케이션을 만들 수 있습니다. IBM이 운영 중인 '블루믹스 (BlueMix)에서 공개 중이며, 이미 전 세계에서 8만 명 이상의 개발자가 사용하고 있습니다. 몇 가지의 계약 형태가 준비돼 있고 그에 따라 IBM 왓슨 사용 시 청구되는 금액이 다릅니다. '블루믹스'에서는 30일간 무료 시험판을 준비해 놓았기 때문에 본인이 개발한 시스템에 왓슨의 API를 넣어 성능 및 효과를 시험해 볼 수 있습니다.
- 마이크로소프트는 음성 비서로 린나와는 별개인 '코타나(Cortana)를 가지 고 있습니다. 윈도우폰용으로 개발됐고 최근에는 윈도우 10에도 탑재된 음성 입 력의 중요하고도 핵심적인 기능입니다. 말하자면 아이폰의 '시리'와 같은 기능인 데, 코타나에게 내일 날씨를 물으면 정확하게 지역별로 내일 날씨 정보를 대답해 줍니다. 즉, 코타나는 사용자에게 유익한 정보를, 린나는 유익성보다는 사용자를 즐겁게 해주는 관점에서 대답하도록 만들어진 것입니다. '린나'의 근간에 있는 기술은 마이크로소프트 애저' (Microsoft Azure)입니 다. 애저는 마이크로소프트에서 제공하는 비즈니스용의 본격적인 클라우드 플 랫폼입니다. Bing에서 수집한 방대한 데이터를 축적해 그것을 머신러닝 Azure Machine Learning' 등을 이용해 처리합니다. 애저 기반을 사용하면 갑작스럽게 접속량이 집중돼도 견딜 수 있는 구성을 갖추게 됩니다. '린나'가 오락성을 중시했다고 해서 라인과 마이크로소프트가 이 AI 관련 대화 기술을 재미로 끝내려던 것은 아닙니다. 2015년 8월, 라인은 기업용 API 솔루션 인 '라인 비즈니스 커넥트'와 '린나를 활용해 인공지능(AI)형 라인 공식 계정을 기 업에 제공하겠다고 발표했습니다. 라인에 따르면 '인공지능 린나의 대화 엔진 기술을 활용해 기업을 대상으로 한 새로운 마케팅 솔루션으로 제공하는 것이며, 트랜스 코스모스를 통해 '라인 비 즈니스 커넥트’ 지원 솔루션 중 하나로 '린나 API for Business'를 제공해 기업의 라인 공식 계정에 실질적으로 적용하면 도입할 수 있게 된다고 합니다. 기업용으 로는 오락성뿐 아니라 유용성이 높게 요구된다고 볼 수 있습니다.
- 예전에는 제품 사진을 다양한 각도에서 찍어 이미지로 데이터베이스상에 등록해 두고 방문자가 내민 이미지를 탐색해 전체 모습과 특징적 인 디자인 등 부분적으로 일치하는 것을 해당 제품으로 인식하게 하는 일반적인 시스템을 사용했습니다. 하지만 페퍼의 시연회 때 도입된 딥러닝에서는 상품의 영상을 인식시켜 자동 으로 '직선'을 구분하는 유사한 신경 세포와 '둥근 모양을 구분하는 유사한 신경 세 포 같은 다양한 유사 세포(형식 뉴런)가 소프트웨어적으로 만들어졌고 원시적인 (기초적인) 형상을 구분하는 유사한 신경 세포를 몇 겹이나 조합한 결과, 직선과 곡선 그리고 색의 조합 등을 통해 물질의 특징값을 발견한 뒤 예를 들어 이것은 OX 클린' 치약이겠네, 이것은 '와플'이겠네, 라는 식으로 식별할 수 있게 됩니다. 물론 이 해석 작업에 CG 데이터 같은 입체 도면 데이터가 쓰이는 것도 아닙니다. 딥러닝을 비롯한 인공지능 기술의 경우는 도입하는 기업이 취급할 상품과 서 비스에 맞게 적절한 특징값을 잡을 수 있게 트레이닝 (튜닝)하면 해석 및 인식의 정밀도(정답률)를 올릴 수 있다고 알려져 있습니다. 또한 가까운 미래에는 실제 로 제조업체 홈페이지를 통해 제품의 특징 등의 정보를 수집할 가능성도 있고, 그 렇게 되면 로봇은 자동으로 상품 정보를 학습하기 때문에 매장 측이 제품 정보를 등록하기 위해 들여야 할 수고도 현저하게 줄어들 것으로 기대됩니다.
- 2011년에 캘리포니아주 샌타크루즈 시 경찰청이 도입한 시스템 ‘프레드 폴(PredPol)은 지진의 여진 예측을 응용한 것으로서 차량 내 물건 도난 및 강도, 무기에 의한 범죄 등의 종류로 나눠 범죄가 발생할 확률이 높은 지역을 표시합니 다. 지역은 약 150m 사방으로 구역을 나눴으며 상당히 세세하게 명시돼 있습니 다. 경찰관은 지정된 지역을 중점적으로 순찰해 범죄에 발 빠르게 대처하고 미연 에 이를 방지할 수 있게 했습니다. 샌타크루즈 시 경찰청이 이 예측 시스템을 도입 할 수 있었던 것은 범죄 보고를 전자화했기 때문입니다. 즉, 그때까지의 범죄 데이터를 축적해놓은 덕에 범죄 예측에 사용할 빅데이터를 비교적 쉽게 준비할 수 있었던 겁니다.
오늘과 내일 일어날 범죄, 즉 미래의 범죄를 예측하려면 유효한 범죄 예측 모 델이 필요합니다. 모델은 연간 12만 건에 달하는 보고서와 범죄 기록 데이터는 물 론 그 지역의 범죄 발생률, 한 번 범죄가 있었던 지역에서 바로 다시 똑같은 범죄 가 일어날 확률과 경향, 범죄가 일어난 지역 가까이에서 범죄가 일어날 확률과 경 향, 범죄 이력이 있는 인물의 유무(또는 이사왔는지 여부), 비교적 치안이 나쁜 매 장의 유무, 빈집의 증감, 가로등 상황 등을 패턴화해 범죄를 예측하게 돼 있습니다.
샌타크루즈 시 경찰청의 발표에 의하면 다음 해인 2012년의 시내 범죄 발생 건수는 전년 대비 6% 감소했고 2013년에는 11% 감소했으며, 최근 보도에서는 체 포한 범죄자의 수가 50% 증가하고 범죄율은 20% 감소해 큰 성과를 올렸습니다. 2012년에는 빈집털이 사건이 11%, 강도 사건이 27% 감소했다고 하는데 빈집털 이 피해가 발생하면 그 주위에서도 연달아 발생할 확률이 높다는 점, 빈집 증감은 그 지역 치안의 좋고 나쁨에 관련돼 있다는 점 등이 수학 모델로도 증명됐습니다. 베테랑 경찰관도 발견하지 못한 데이터를 컴퓨터가 발견해 예측에 반영하는 경우 ' 도 많이 볼 수 있었다고 합니다.
그 후 로스앤젤레스와 애틀랜타 등, 약 60곳의 시 경찰청에서 이를 도입했습니다. 범죄를 미연에 방지해 치안을 좋게 만들 수 있다는 이점이 제일 먼저지만 실은 각 시 경찰청 모두 범죄의 급증과 함께 오랜 시간 경찰관의 인원 부족에 시달려 왔기 때문입니다. 범죄 예측 시스템을 도입해 더욱 효과적으로 경찰관을 배치할 수 있고 신속하게 범죄에 대처할 수 있다는 점은 인력 부족을 해소하는 데 공헌하고 있습니다.
- 히트곡 예측 사이트 'Music Xray'는 아티스트가 올린 곡을 들을 수 있는 사 이트입니다. 이 사이트는 소니와 워너, 유니버설 등과 같이 12,000개가 넘는 회사 들이 유력한 레이블 및 음악 프로듀서들과 제휴를 맺었습니다. 아티스트에게는 유 력한 음악 업계와 접촉할 기회가 제공되는 장이며, 올린 곡이 레코드 회사와 프로 듀서, 프로모터의 눈에 띄면 본격적으로 데뷔할 길이 열릴 수도 있습니다. Music Xray는 AI 시스템과 연관돼 있습니다. 올린 곡을 AI 시스템이 20초 동안 들어보 고 히트할 확률을 산출해 냅니다. 올린 곡의 경우는 항상 평가가 이뤄지며 매달 500~700곡이 계약 안건에 들 어간다고 합니다. AI가 듣고 평가해 히트하리라 판단한 곡은 우선 음악 업계에 소 개되는 시스템을 갖추고 있습니다. AI의 분석 기술을 이용해 재능을 인정받을 기회를 아직 접하지 못한 아티스트를 발굴하자는 것입니다. 이 AI 시스템은 클래식과 재즈 등 다양한 장르를 통해 300만 곡 이상의 곡들을 사전에 학습합니다. 히트곡에는 패턴이 있는데 AI에 의해 약 60개의 히트 클러스터라고 불리는 그룹으로 분류할 수 있다고 합니다. 바꿔 말해 과거에 히트한 곡의 패턴을 분석해 보면 대부분은 그중 하나의 히트 클러스터에 속해 있다는 것입니다. 올린 곡은 리듬, 멜로디, 하모니, 비트, 억양, 음색, 속도 등의 70개 요소로 분 루해 분석됩니다. 더 나아가 약 40개의 깊은 구조로 정보가 분류되어 AI가 패턴을 분석해 본 결과, 몇 개의 히트 클러스터에 자리를 잡으면 히트 확률이 올라가는 것 으로 판단됩니다. '그럼 처음부터 히트할 패턴으로 곡을 만들면 되는 거 아냐?'라고 생각할 수도 있지만 꼭 그렇지만도 않습니다. 그게 바로 머신러닝의 재미있는 점인데 개발자도 AI가 왜, 어디를 보고 그 곡을 히트 클러스터에 넣은 것인지 자세한 이유는 알지 못합니다. 바꿔 말해 어떤 곡이 히트곡이 될지는 개발자도 정확하게 알지 못한다는 것입니다.
- 머신러닝은 크게 분류 문제'와 '회귀 문제'로 나뉩니다.
'분류 문제는 글자 그대로 뭔가를 분류하는 것으로, 이미 실용화가 진행됐습니다. 예를 들어, 뭔가를 분류하는 기능이라고 하면 처음에는 쉬울 것 같다는 생각 을 합니다. 이미지 인식을 예로 들면 스캔한 이미지가 무엇인지 고양이 '개'차' 등 이라고 식별하는 그 분류를 말합니다. 텍스트의 경우 스팸 메일인지 정규 메일인 지 파악하고 뉴스 장르를 분류하며, 데이터 분석의 경우 잘 팔리는 상품이나 추천 상품을 분류하는 것 등이 한 예라고 할 수 있겠습니다.
분류 문제는 예측 대상이 개나 고양이 같은 이산값(연속되지 않는 값)인 데 비해 '회귀 문제는 예측 대상이 1.05m, 40.14$ 등의 실질적인 수치인 문제를 말 합니다. 계산을 통해 산출되는 수치, 추측 및 미지의 데이터를 예측, 그리고 시계 열로 변화하는 주가 데이터 같은 것들 말입니다.
- 머신러닝의 신경망에서는 식별해서 분류하기 위해 인간이 제시한 규칙이 아 니라 '어떤 “특징값을 산출합니다. 그리고 그 특징값이 개'라고 가르치면 개로 분 류합니다. 이를 반복하면 기계 스스로가 특징값을 산출해 개로 분류할 정보가 늘어납니다. 이처럼 학습 및 훈련, 트레이닝을 거치면 개에게 여러 가지 패턴이 있다는 것을 학습함과 동시에 어떤 특징값에 해당하는 것을 '개'라고 분류하면 되는지 를 이해합니다. 컴퓨터가 다루는 특징값은 실제로는 수치’ (벡터값)인데, 뉘앙스 로 설명하자면 인간처럼 개인지 고양이인지는 보면 안다'와 마찬가지로 어디가 어 떻다를 따지는 것이 아니라 '대충 보면 알죠, 이건 개예요'라는 애매한 특징값으로 구분하게 된다는 것입니다. 또한 이 특징들은 훈련을 통해 기계가 자동으로 학습 하기 때문에 개발자는 기존과 같이 세세한 규칙을 정의해야 하는 업무에서 해방될 수 있습니다.
- 이렇게 완성된 분류 시스템에 이 이미지는 개랑 고양이 중 무엇인가요?'라며 이미지를 입력하면 그 이미지의 특징값을 컴퓨터가 분석해 개의 특징값 내 범위와 일치할 경우 개라고 판단하고, 고양이의 특징값과 일치할 경우 고양이라고 판단해 분류합니다. 그리고 반복해서 말하지만, 중요한 건 개를 판단하는 기준(특징값) 을 인간이 만들어서 제공한 것이 아니라 기계가 학습을 통해 스스로 계산해 냈다. 는 것입니다. 이를 가능하게 한 것이 머신러닝의 신경망이며 높은 정밀도로 인식 하는 것이 심층 신경망입니다. '딥러닝으로는 머신러닝을 통해 특징값을 학습한다 나 '딥러닝으로 어떠한 특징값을 산출한다'는 이런 것을 의미합니다.
- 신경망(Neural Network)은 뉴런의 구조를 컴퓨터로 모방하는 것에 도전 한 것입니다(신경망은 NN'으로 줄여 부르기도 합니다). 신경망이라는 말은 생 체나 생물학, 신경학 분야에서도 이용되기 때문에 인공지능과 컴퓨터 업계에서 뇌 의 구조를 시물레이션한 시스템을 말하는 경우에는 일부러 '인공'이라는 말을 붙여 인공신경망 (인공신경 회로망) (ANN)이라고 구별하는 경우도 있습니다. 뇌는 신경 세포의 거대한 망이라고 불립니다. 네트워크를 구성하는 뉴런은 무수히 많고, 그 수는 100억~300억 개가 넘는 다는 설도 있습니다. 신경 세포의 역할은 정보를 처리하는 것과 다른 신경 세포로 경보를 건달(입출력)하는 것입니다. 다른 신경세포로는 신경전달물질에 의한 시냅스 결합을 통해 정보가 전달되어 기억 및 학습 등과 같은 지능적인 처리를 진행 합니다. 뇌 과학의 '단 하나의 학습 이론'(One Learning Theory)에 의하면 뇌는 다. 양한 기능을 가지고 있다고 생각하기 쉽지만 사실 공통된 패턴을 인식해 처리하고 있다고 합니다. 지극히 간단하게 말 하자면 인간은 사물을 보고 듣고 대화하고 뭔가를 느끼고 감정을 품고 답을 생각 하고 추측하는 다양한 것들을 해내고 있는 만큼 뇌에도 각각에 적합한 구조의 부위가 있고 그것들이 복잡한 처리를 하는 게 아니겠냐는 상상을 합니다. 하지만 사 실 뇌 내부에서는 모두 똑같은 패턴 인식을 통해 정보를 처리하고 있다는 이론이 있습니다. 그리고 신경망이 그러한 패턴 인식을 모방한다면 뇌와 같이 이미지 인식과 음 성 인식과 계산과 분류와 추론, 그리고 학습과 기억 모든 부분에서 범용적으로 능 력을 발휘할 가능성이 있지 않겠냐는 것입니다. 그것을 실천하고 있는 것이 바로 신경망과 그 알고리즘입니다. 인공신경망의 구조 자체는 새로울 것이 없습니다. 인공지능은 예로부터 연구 돼 온 분야이고 형식 뉴런’ 발표는 1943년, 시각과 뇌의 기능을 모델화한 '퍼셉트론' 발표는 1958년까지 거슬러 올라갑니다.
- 신경망은 뇌와 닮은 구조를 단순화해서 컴퓨터로 재현한 것입니다. 컴퓨터상에 뇌신경 세포를 시뮬레이션하는 '형식 뉴런과 '노드를 배치합니다. 입력된 정보는 각 뉴런에서 처리되어 다른 뉴런으로 전송됩니다. 정보를 받은 다른 뉴런은 처 리를 마친 후 또 다른 뉴런에 정보를 전달합니다. 이 처리를 반복했을 때 특징’ (특징값)이 산출되어 몇 가지 처리 결과를 출력하는 구조가 '신경망'의 기본입니다. 몇 가지 처리 결과라는 것은 표현이 좀 애매한데, 사물을 인식하고 분석하고 예측하고 대화하는 다양한 것들을 말합니다.
- 뻔히 정답을 알고 있는데 기계가 분석할 게 뭐가 있느냐고 묻는다면 왜 그게 개로 분류되는가?'에 대한 것을 생각하게 하는 것이라고 답할 수 있습니다. 즉, 기 계가 특징값을 스스로 발견하게 한다 → 그것은 '개'로 분류된다 → 그 특징값의 답은 '개'다, 라는 것입니다. 하지만 이미지를 한 장만 분석해 특징값을 기억한 시스템의 경우에는 다른 개 의 이미지를 보여줘도 어지간히 닮은 개의 이미지가 아니고서는 같은 견종이라는 것을 판별해내지 못할 겁니다. 그럼 만약에 개의 라벨링된 (정답) 데이터 이미지 1,000만 장을 읽게 해서 훈련한다면 어떻게 될까요? 이것이 바로 신경망의 공부법(중 하나)이며, 학습을 위해 방대한 빅데이터가 필요한 이유입니다. 이 개를 예로 든 것처럼 라벨링된 데이터로 학습하게 하는 방 법을 지도학습이라고 합니다. 머신러닝에는 지도 학습(Supervised Learning) 외에 '비지도 학습 또는 '자율 학습 (Unsupervised Learning)이 있습니다. 지도 학습은 이 이미지가 개라든가, 이런 경우 1시간 후의 주가는 얼마라든 가, 와 같이 입력 데이터와 정답이 1대 1로 결합돼 있는 훈련 데이터를 사용해 학 습하는 것입니다. '비지도 학습은 입력 이미지는 있지만 정답 데이터는 주어지지 않습니다. 예 측은 미래의 것이기 때문에 정답이 없습니다. 이처럼 추론, 분석과 같이 정답이 없 고 정답이 풀리지 않는 문제를 가지고 학습하는 것을 비지도 학습이라고 합니다. 지도 학습과 비지도 학습을 섞는 방법도 있습니다. 우선 기계가 지도 학습으 로 특징값을 학습하게 하고 그 이후 비지도 학습으로 방대한 훈련 데이터를 제공 해 자동으로 특징값을 산출하게 하며 반복 학습을 하는 방법입니다. 이를 준지도 학습 (Semi-Supervised Learning)이라 부르기도 합니다. ‘비지도 학습은 정답이 없는 데이터로 머신러닝을 하는 것입니다. 정답이 없 는 예측과 분석, 해석 등의 분야에서 사용되거나 방대한 데이터 안에서 컴퓨터 스 스로가 뭔가를 발견하게 하거나 방대한 훈련 데이터를 반복적으로 학습하게 할 때 쓰입니다. 비지도 학습은 컴퓨터가 이미지 및 음성, 수치 등의 방대한 데이터를 읽게 해 서 특징값을 구하고 그에 따라 패턴과 카테고리에 자동으로 분류하게 하거나 클러 스터 분석, 규칙성 및 상관성, 특징, 특이성, 경향 등을 분석하게 합니다(주성분 분석, 벡터 양자화/표본화 샘플링 등). 또한 데이터 마이닝 등 미지의 데이터의 특징을 발견하거나 예측하는 분야에 서는 필연적으로 비지도 학습의 방식을 채택하는 경우가 많아집니다. 또한 비지도 학습을 할 경우에도 가장 적합하다고 판단되는 초기 수치를 제공 해 학습을 시작하는 것이 효율적이라고 합니다.
- 지도학습과 비지도학습 비교
(1) 지도학습
- 훈련데이터 : 라벨 있음 (정답이 붙여져 있음)
- 방법 : 정답이 붙여진 데이터를 기계가 자동으로 분석하게 한 다음 산 출한 특징값을 정답이라고 분류 하게 하면 정답이라고 특징값의 관계성을 학습한다. 사물을 인식 및 분석하는 정의를 도출한다.
- 장단점 : 분류 문제는 효율적으로 학습할 수 있다. 초기 단계에서는 학습 성과를 내기 쉽다. 방대한 라벨링된 데이터 를 준비하는 데 손이 많이 간다.
(2) 비지도학습
- 훈련데이터 : 라벨없음
- 방법 : 방대한 데이터를 자동으로 분석 하게 하지만 정답이 없어 산출 한 특징값으로부터 구조, 법칙, 경향, 분류, 정의 등을 도출한다.
- 장단점 : 기계 스스로 특징이나 정의를 발견하 기 때문에 방대한 데이터가 있으면 라벨링된 데이터를 준비할 필요도 없 고 번거롭게 손을 댈 일도 없다. 정답 이 없는 대신 보상(득점) 등을 설정해 야 한다. 오토인코더 등으로 사전에 학습해야 효율이 좋은 경우가 많다.

- 강화학습은 기계가 시행착오를 거치게 해서 실패와 성공을 통해 학습해가는 방법입니다. 하지만 그냥 단순 히 방대한 훈련 문제를 제공해 기계를 학습시켰다고 해도 기계가 무엇이 성공인지 도 모르는 상태에서는 학습이 순조로울 리 만무합니다. 학습 목표로 성공이라고 판단할 수 있는 어떤 요소를 부여해야 합니다. 여기서 성공 및 성과에 대해 점수를 매깁니다. 이를 '보상' 혹은 득점이라고 합니다. 자전거를 예로 들자면, 1m를 달려 넘어지는 것보다 10m를 이동하는 쪽이 높은 점수를 얻을 수 있습니다.
- 강화학습은 위키피디아에서는 “어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법이다”라고 설명
- ‘오차역전파법 (Backpropagation)이란 컴퓨터가 내놓은 답이 정답이 아니 거나 기대했던 수치와 동떨어져 있는 경우, 그 오차를 출력 쪽에서 역방향으로 분 석하게 한 후 각 뉴런의 오류를 정정해 오차를 줄이는 로직입니다. 우리 생활 속에 서 예를 들자면 계산 문제에서 내놓은 답이 틀렸을 때 답을 보고 계산 식을 거슬러 올라가 계산 오류를 찾고 계산이 틀린 부분을 알아내면 틀리지 않도록 수정해 다 음번부터 정답률을 올린다, 같은 느낌이라고 보면 됩니다.
- 딥러닝의 과제인 과적합'의 회피
기존에 설명한 '구글의 고양이' DON' '알파고'와 세계적인 이미지 대회인 ILSVRC' 에서도 딥러닝은 좋은 성적을 거뒀습니다. 이 정도의 성과를 올리기 시 작한 배경에는 돌파구라고 할 만한 기술적인 진전이 있었습니다. 컴퓨터의 성능이 향상됐고 빅데이터를 이용할 수 있게 됐으며, 또 딥러닝 특유의 과제인 과적합을 회피할 수 있었던 것입니다. 심층 신경망은 중간층을 다층화시켜 더욱 깊이 사고할 수 있습니다. 다층이 되면 될수록 뉴런 처리와 전달, 산출되는 특징값이 늘어나며 이에 따라 답의 정확 도가 올라갈 것이라는 사실은 이전부터 연구된 것이고 이론적으로도 유효하다는 주장이 있었습니다. 과적합 (over-fitting)이라고 불리는 문제는 심층 신경망을 마구잡이로 다 층화해 파라미터의 수가 너무 많아질 때 발생하기 쉽다고 합니다. 과적합의 영향 으로 인한 악영향으로 낯익은 훈련 데이터에는 정확도가 높은 답을 할 수 있는 한 편, 훈련 데이터에 없는 미지의 데이터인 경우 정밀도가 내려가는 (훈련 데이터의 영향을 너무 많이 받음) 현상이 있습니다. 즉, 훈련할 때는 성적이 좋았는데 실전 에 가서는 성과를 내지 못한 상태를 말합니다. 이것은 범용성이 부족하다는 과제 를 낳았고 딥러닝에게는 정체기라고도 할 수 있는 시간을 불러왔습니다.
- 합성곱 신경망(CNN) : 이 과제의 구체적인 해결책이 바로 합성곱 신경망' 또는 '컨볼루션 신경 망(CNN)입니다. 뉴런이 많고 복잡해지면 원래는 아무 관계도 없던 결합이 늘어나고 그것이 결국 악영향을 미쳐 과적합의 원인을 만들기도 합니다. 기계 정답률을 올리려면 층 을 늘리는 한편 '아무 관계도 없는 결합을 끊어내는 것이 중요합니다. 하지만 무수 한 뉴런의 결합 중 어느 것이 유효하고 어느 것이 관계가 없는지 어떻게 판단해야 하는 걸까요? 또한 오차역전파법에 의해 출력 쪽에서 오차를 확인하게 하는 방법도 소개한 바 있는데, 모두 결합한 후 다층으로 만든 상태에서 오차역전파법을 써버리면 오 차 전파가 분산되어 전혀 학습이 진전되지 않기 때문에 그 사태를 피하기 위해서 는 아무 관계도 없는 결합을 잘라 버려야 한다는 이론도 있습니다. 합성곱 신경망의 특징 중 하나가 아무 관계도 없는 결합을 잘라 관계성이 높은 결합을 남긴다는 것입니다. 실제로 합성곱 신경망에서는 파라미터의 수가 격감 하며 많은 경우에서 성과가 향상됩니다. 합성곱 신경망 (Convolutional Neural Network)은 줄여서 CNN이라 고 부릅니다. 여기서 합성곱이라는 이름을 보고 합성해서 곱하는 구조가 뭔지 이 해하려고 하면 곤란합니다. 그 이유는 이 단어가 합성곱 적분과 같이 수학 용어로 자주 사용하던 단어에서 유래된 것이라서 일반적으로 합성'이나 '곱 등을 해석한 단어와는 의미 자체가 다르기 때문입니다.
- 순환 신경망(RNN) : 최근에는 '리커런트 뉴럴 네트워크 (RNN; Recurrent neural network)', 즉 순환 신경망'이 주목받고 있습니다. 기존의 신경망은 '정적 데이터로 취급하는 게 잘 어울렸기 때문에 '동적 데이 터는 익숙하지 않다고만 여겨져 왔습니다. 정적 데이터란 움직임이 없는, 혹은 움직임이 적은 데이터를 말하는데 예를 들면 정지 화면, 텍스트, 수치, 최신 통계 데 이터 같은 것이 여기에 해당합니다. 개와 고양이의 이미지를 식별하는 것은 정적 데이터입니다. 한편 동적 데이터란 움직임이 큰, 또는 시간적인 상관관계가 중요한 데이터와 시계열 데이터 등을 말합니다. 대화, 동영상, 음성, 시계열의 통계 데이터와 로그 데이터 같은 것들 말입니다. RNN은 이러한 시계열 분석을 가능하게 만들어 준 동 적 데이터와 호환되는 딥러닝입니다. 최근 자연어 대화 등의 분야에서 성과가 올 라가고 있는 만큼 향후 RNN' 이라는 용어를 IT 관련 뉴스나 일반 인공지능 정보에 서도 보게 될 기회가 늘어날지도 모릅니다.
- IBM에서는 왓슨을 인공지능이라고 부르지 않고 인지 시스템' 혹은 인지 컴퓨터' 라고 부릅니다. 인지란 인식해서 아는'이라는 의미로, IT 업계에서 는 스스로 사고할 수 있다는 의미로 씁니다. IBM은 인공지능이 인간과 같은 지능 을 가진 결푸터, 즉 강한 AI'라고 생각해서인지 왓슨에 인공지능이 필요로 하는 많 은 기술과 자연어 대화, 대화 분석, 딥러닝을 포함한 머신러닝, 데이터 분석, 추리와 추론 등의 기술이 쓰이고 있음에도 왓슨은 인공지능이 아니라 인지 컴퓨팅이라는 발언을 일관되게 하고 있습니다. 또한 왓슨 자체는 플랫플이기 때문에 방대한 데이터를 보유하지 않은 상태에 서 도입한 기업의 빅데이터로 머신러닝을 한 후 특훈을 거쳐 시스템을 구축하는 구 조로 되 있습니다. 이 때문에 잊슨은 계약해서 바로 실전에 들어가 이용하지는 못 하고 도입을 위한 학습과 훈련, 튜닝 기간에만 약 3개월~1년이 걸린다고 합니다.
- 지금까지는 비구조화 데이터를 구조화 데이터로 변환해 컴퓨터가 처리, 분석 할 수 있게 만들자는 노력이 꾸준히 진행됐지만 왓슨과 딥러닝을 이용한 인식 시 스템의 등장으로 상황이 크게 바뀌었습니다. 즉, 자연어를 이해하거나 디지털카메 라로 찍은 사진을 그대로 컴퓨터가 분석해 이해할 수 있게 하는 기술이 진보하고 있는 것입니다. 이 흐름은 이제 멈추지 않을 것입니다. 이제는 자연어를 정확하게 이해해 인간과 원활하게 대화하고 인터넷의 비구조화 데이터를 통해 학습할 수 있 는 시스템이 필요하기 때문입니다. 영어판으로는 이미 도입 실적이 발표됐는데, 일본어로 사용하려면 왓슨은 일 본어를 학습해 이해할 수 있어야 합니다. IBM은 일본어판 개발을 소프트뱅크와 협업해 진행했습니다. 그에 더해 왓슨의 시스템(서버군)을 설치 및 운영해 에코 파트너 개척, 일부 판매에 대한 부분까지 소프트뱅크와 제휴해 2016년 2월부터 서비스를 시작했습니다.
- 마이크로소프트는 키보드와 마우스, 터치 조작으로 바뀌는 다음 단계의 인터 페이스로 '대화'를 언급하고 있습니다. 그것이 실현된 것이 바로 음성 입력이 가능 한 개인 비서 '코타나', 대화를 즐기는 '린나', 중국의 '샤오아이스’, 영어의 '테이와 같은 풍부한 AI 대화 엔진 그룹입니다. 또한 마이크로소프트 리서치 (Microsoft Research)에서 연구 중인 머신러닝 을 이용한 통역 및 번역 기술이 주목을 모으고 있습니다. 통역 및 번역을 통해 대 화 기술도 적극적으로 연구해서 2020년의 도쿄 올림픽 때까지 외국어와 일본어의 동시통역을 실현하는 것이 목표입니다. 스카이프에서는 이미 일부 번역 기능에 이 통역 기술을 도입해 영어, 스페인어, 이탈리아어, 중국어, 프랑스어, 독일어 등의 언어를 지원하고 있습니다. 마찬가지로 윈도우 10 등에 탑재된 개인 비서 '코타나'에도 이 기술을 활용할 예정입니다. 마이크로소프트는 이러한 일련의 클라우드 서비스와 AI 관련 기술로 성과를 거두며 최고의 기업들이 활약하는 무대에서 두각을 드러내고 있습니다.
- 구글은 딜러닝을 이용한 머신러닝 라이브러리인 '텐서플로 (TensorFlow)를 그가 그프소화했습니다. 이에 따라 많은 개발자가 무료로 딥러닝 기술을 도입 한 시스템을 가사에서 개발할 수 있게 됐습니다. 딥러닝을 활용한 대화형 인터페이스 ‘구글 비서는 안드로이드 단말기를 통해 이미 친숙한 개인 비서, 구글 나우’(OK Google)에서도 이용되고 있습니다. 이 기술은 애플 iOS의 '시리', 아마존의 '알렉사', 마이크로소프트의 '코타나' 등과 경 쟁하는 기술입니다. 구글이 2016년 5월에 개최한 개발자 행사인 '구글 I/O'에서는 이러한 경쟁사 들 앞에서 새로운 도전을 선보였는데, 그중 하나로 '알로(Allo)가 발표되며 주목 을 받았습니다. 알로는 구글 비서가 탑재된 메시지 앱(채팅)의 일종으로, 채팅 대화의 의도 를 읽어내 여러 가지 대답을 예측해서 제안한다는 특징이 있습니다. 또 하나는 구 글의 검색 엔진이 채팅에 추가되는 것입니다. 원하는 정보가 있거나 상품을 찾고 있다는 것을 채팅에 전달하면 구글 검색 엔진과 연동해 답변해줄 뿐 아니라 택시 와 렌터카, 식당 예약까지 할 수 있습니다. 더 나아가 그룹 기능과 연동해 친구들 과 대화 중인 채팅창 안에서 구글 검색 엔진을 이용할 수 있습니다.
- 구글 I/O에서 또 하나 주목받은 발표가 바로 구글 비서와 알로를 탑재한 '구글 홈'(Google Home)입니다(2016년에 발매). 구글 홈은 스마트 홈을 실현하기 위한 허브 중 하나로 개발됐고, 사용자와는 음성으로 대화를 나눌 수 있습니다. 나중에 설명할 '아마존 에코'의 대항마라고 할 수 있습니다.
- 2016년 6월, 애플은 개발자 이벤트 WWDC에서 시리의 개발 키트(SDK) 를 공개하겠다고 발표했습니다. 시리의 SDK가 공개되면 서드파티에서 자사의 단 말기와 앱으로 시리를 이용할 수 있는 환경이 구축됩니다. 시리의 음성 대화가 보 여준 성능에 실망한 사람들도 많겠지만 채택되면 좀 더 수준 높은 대화를 할 수 있 게 될지도 모릅니다. '보컬아이큐의 전체 내용은 밝혀지지 않았으나 '시리'와 비교 했을 때 인식률이 3배 넘게 높다는 소문이 있습니다. 개인 비서인 SDK를 공개한 것은 아마존의 '알렉사, 구글의 구글 비서' (구 글 홈)에 대항하기 위해서인 것으로 알려져 있습니다. 구글이 '구글 나우 (OK Google 포함)를, 마이크로소프트가 '코타나'를 아이폰에서 실행되는 앱으로 제 공한다는 점만 봐도 알 수 있듯이 앞으로는 사용자가 단말기와 개인 비서를 선택해 조작하게 될지도 모릅니다. 개인 비서가 사용자의 성별과 성격, 신변 정보, 취 미 및 기호를 학습해 성장한다는 점을 생각하면 단말기를 바꿀 때마다(아이폰에 서 안드로이드 스마트폰으로 바꾸는 등) 개인 비서와의 관계를 처음부터 다시 시 작하는 것은 현명한 선택이라고 할 수 없습니다. 그런 의미에서도 디바이스에 의 존하지 않고 개인 비서를 선택할 수 있는 환경이 만들어지길 바라는 수요가 있습 니다. 애플은 자동차용 기능인 '애플 카플레이 (Apple CarPlay, iOS in the Car) 를 개발해 도입하기 시작했습니다. 자동차 안에서 아이폰의 기능을 쓰기 쉽게 융 합한다는 구상입니다. 시리의 음성 제어와 터치 패널, 맵과 연동, 메시지 읽기, 아이튠즈나 애플 뮤직으로 음악을 재생하는 기능을 차 안에서 이용하기 위한 시스템 으로, 이미 100가지 이상의 차종이 애플 카플레이를 지원하고 있습니다.
- 페퍼에는 중요한 인공지능 기술이 탑재돼 있습니다. 바로 로봇 스스로가 감정 을 지는 감정 생성 엔진임. IT업계에서 주목받고 있는 인공지능 관련 기술에는 여러 가지 종류가 있는 더 크게 다음과 같이 구분된다고 합니다.
* 지혜의 자식을 지을 학습하거나 분석 및 해석하는 타입
* 인간의 감정과 감성 감각을 학습하는 타입
페퍼의 감정 생성 엔진 (감정 엔진)을 개발한 코코로SB (cocoroSB)에 의하 면 전자는 인간의 뇌로 비유했을 때 대뇌신피질'에 해당하는 부분으로, 다시 말해 만능형 인공지능'이고, 후자는 대뇌변연계에 해당하는 부분으로 '인공 감성 지능 이라고 부르며 주로 인간의 감정 표현을 모방한 분야를 연구합니다. 인간처럼 행동하고 인간처럼 자연 대화를 나누려면 후자의 대뇌변연계 연구 와 개발이 매우 중요한 의미를 가집니다. 코코로SB는 감정 생성 엔진, 자연어 처리 잡담 엔진, 물체 인식 엔진 3개에 더해 산하 AGI (Advanced Generation Interface Japan)사가 담당하고 있는 감정 인식 엔진의 기술을 페퍼에게 탑재했습니다. 가족용 페퍼의 경우, 이 기능을 가족과 친목을 다지는 데 이용할 수 있습 니다. 반면 비즈니스용은 매장을 방문하는 고객들을 성별 및 연령별로 집계하거나 고객이 정보를 소개받은 후의 반응(표정 분석)을 읽어내 이 정보가 효과적이었는지 여부를 평가할 수 있어 광고 및 마케팅 방안으로도 기대를 받고 있습니다. 이 엔진들은 도쿄 대학 대학원 의학계 연구과 특임 강사, 과학자이자 수리 연 구자인 미쓰요시 슌지의 감정 지도'라는 발상에 기반을 두고 있습니다. 감정 지도는 심리학 사전 등에서 뽑아낸 약 4,500가지의 감정 표현을 영어로 번역할 수 있는 한계인 223개 장르로 나눈 결과를 원형 다이어그램으로 정리한 것인데 추가로 뇌내 전달 물질, 호르몬 등과 같은 정동의 관계를 논문 조사에 따라 매트릭스화했습니다. 일반 판매용 페퍼에는 AGI의 감정 지도를 근거로 한 감정 생성 엔진과 감정 인식 엔진이, 비즈니스용 페퍼에는 감정 인식 엔진이 탑재돼 있습니다. 또한 이 회사는 IBM 왓슨의 일본어화와 판매로 제휴를 맺고 있어 IBM 왓슨 비즈니스 시장의 날개 한 축을 담당하고 있을 뿐 아니라 IBM 왓슨과 페퍼를 연결 해 커뮤니케이션 로봇의 응대 및 정보 제공을 더욱 고도로 진화시킬 수 있다는 점을 강조하고 있습니다. 소프트뱅크 그룹에서는 2016년 4월, 소프트뱅크 커머스&서비스가 페퍼 외에 인공지능형 학습 엔진 '뮤즈' (MUSE)를 활용한 소형 로봇 '뮤지오’ (MUSIO, AKA LLC 제조)를 판매하고 유통하는 업무에 관한 제휴를 맺었다고 발표했습니다. 뮤지오는 일본 내에서 영어 학습용 로봇으로 이용될 예정입니다.

 

'IT' 카테고리의 다른 글

딥러닝 레볼루션  (0) 2020.06.12
빅나인  (0) 2020.05.10
세상을 읽는 새로운 언어 빅데이터  (0) 2020.02.20
프레디쿠스  (0) 2020.02.17
인공지능이 나하고 무슨 관계지  (0) 2020.02.17
Posted by dalai
,