인공지능 파운데이션

IT 2023. 5. 13. 17:50

- 레벨 1 지능은 소프트지능(soft intelligence)으로 부르는데 지식이 소프트웨어의 프로그램 코드 속에 들어 있기 때문이다. 즉 입력된 데이터를 원하는 출력으로 만드는 모든 절차와 지식이 알고리즘 속에 있다. 데이터가 가지는 모든 속성과 특징을 이해해야만 알고리즘을 만들 수 있으며 학습이 필요하지 않다. 오늘날 대부분의 SW들이 이에 속한다. 모든 지능이 코드 속에 알고리즘으로 구현되어 지식을 이해하려면 코드 전체를 이해해야 하므로 지식의 전달이 어렵다. 또한 '알고리즘 지능'이라고 부를. 도 있다. 프로그램 속에서도 일정한 크기의 데이터 처리는 가능하지만 주기억장치의 용량에 좌우되는 한계가 있고, 데이터가 고정되어 있어서 변경하는 경우는 새롭게 컴파일과 설치를 해야 한다.
레벨 2 지능은 데이터 지능(data intelligence)이라고 하며 대량의 질문과 답변 사전을 구축해서 질문 에 답을 주거나 데이터베이스를 검색한다. 알고리즘 속에 모든 지식을 표현하는데, 표현이 불가능한 경우는 컴퓨터 메모리 외부의 저장소(파일이나 데이터베이스 등)에 저장된 데이터를 활용하여 문제 를 해결하는 방법이 있다. 주로 변화하는 데이터의 경우는 알고리즘 속에 저장이 불가능하고 실행 시 점에 외부 데이터를 가져와야 하기 때문이다. 날씨, 현재의 위치에 따른 주변 센서 데이터, 방대한 과 거의 누적 데이터들을 기반으로 통계적 분석이 요구되는 것이나 순위 데이터와 같은 사례에 해당한 다. 기업의 판매량이나 영업실적과 같은 데이터 기반 의사결정에 알고리즘과 데이터의 결합으로 문제를 해결할 수 있다.
레벨 3 지능은 실질적으로 지능(intelligence)과 AI라고 부를 수 있는 레벨로 학습된 지식을 바탕으로 문제를 해결한다. 데이터 마이닝을 기반으로 한 솔루션으로 데이터에 대한 깊은 지식이 필수적이다. 그래서 데이터에서 필요한 특징 (feature)들을 추출해서 테이블로 만들 수 있어야 마이닝 알고리즘을 적용해서 지도 학습 또는 비지도 학습을 수행하여 학습 모델을 생성한다. 지식을 추출한다는 의미에 서 프로그래밍이 반자동화되어 있다고 볼 수 있다. 대신 충분한 양의 데이터가 필요하며 데이터는 많 을수록 성능이 향상된다. 인간이 모두 가르쳐야만 하며 제한된 영역에서만 활용이 된다는 측면에서 '약지능(weak intelligence)'이라고 부른다.
레벨 4 지능은 강지능(strong intelligence)으로 부르며 딥러닝과 빅데이터를 기반으로 학습하는 모 델을 뜻한다. 딥러닝을 통해서 인간보다 우수한 능력을 보유하여 '강'이라고 한다. 알파고가 대표적인 강지능 시스템으로 3만 개의 바둑 기보를 학습했다(인간은 3만 개의 바둑 기보를 학습할 수 없다). 인간이 감당할 수 없는 빅데이터 학습을 통해 만들어진 학습모델이므로 인간의 지능을 능가한다.
레벨 4 지능의 학습 모델은 마이닝과 같이 특징 추출이 필요 없어서 데이터에 대한 깊은 이해가 없어 도 된다. 즉 사진을 가지고 누구인지 식별할 때 눈, 코, 입의 특징을 가르쳐줄 필요가 없으며 시스템이 알아서 적절한 특징을 추출해서 학습한다. 그러므로 인간은 무슨 특징을 가지고 구별했는지 알 수가 없어서 결과가 어떻게 도출되었는지 모르는 블랙박스와 같다. 최근에 설명 가능한 딥러닝에 대한 연 구가 진행 중에 있다.
또한 언어 학습도 종단간 학습(end-to-end learning)이 가능하다. 즉 번역의 경우 입력문장과 출력 문장의 집합을 가지고 학습을 시키면 된다. 그러므로 레벨 3 학습을 위해서는 빅데이터가 필수적이 며 오늘날 수억 개의 번역 문장을 확보하면 번역 학습이 가능하다.
레벨 5 지능은 초지능(super intelligence)으로 빅데이터도 필요 없이 스스로 학습을 할 수 있는 것 을 의미한다. 제로 데이터 학습이라고 해서 체스 두는 기본 원칙만 알면 스스로 수많은 체스판을 생 성하면서 학습한다. 바둑도 바둑 두는 기본 원칙만 가르쳐주면 수만 개의 바둑판을 만들어가면서 바둑에 대해서 학습한다. 알파제로가 대표적인 레벨 5 지능이다.

- AI가 아닌 사례를 들어보면 다음과 같다.
•내비게이션: 알고리즘으로 구현된 것으로, 내비게이션은 AI가 아니다. 또 교통상황에 따라서 길 찾기를 다르게 하는 기능이 있어도 AI가 아니다.
•퍼지 냉장고, 퍼지 선풍기: 예전에 퍼지(fuzzy) 기능을 넣고 인공지능 가전제품으로 홍보한 적이 있다. 퍼지로직이 구현되었다고 AI는 아니다.
•AI 로봇청소기: 로봇청소기가 AI 기능이라고 홍보는 하지만 주변 환경에 적응하고 장애물을 회피한다 고 AI라고 볼 수 없다.
•AI 세탁기: 세탁할 의류의 오염도를 감지하여서 세제의 양과 세탁 방식을 조절한다고 해서 AI는 아니다.
음성인식과 통역, 사물인식 등 학습에 의한 AI의 핵심 기능을 활용해서 제품화한 것은 AI 제품으로 간주한다. AI 스피커, 자율주행 자동차 등이 이에 속한다. 그러나 같은 기능이라도 알고리즘에 의해서 만들어진 음성인식이나 자연어 번역의 경우는 AI라고 볼 수 없다.

- 지식에서 노하우(know how)는 실제로 어떻게 만드느냐에 해당하는 지식으로 이론에는 있지만 실 전의 경험에 의해서 숙련된 별도의 지식을 말한다. 기능(skill)은 반복에 의하여 숙달된 지식을 의미 한다. 과거에는 노하우를 중요하게 생각했지만 오늘날에는 필요로 하는 지식이 어디에 있는지, 그리 고 누구를 통해서 구할 수 있는가를 의미하는 노웨어(know where)가 중요하다. 그러나 검색 엔진은 필요한 지식을 모두 검색해준다. 인터넷에 없는 지식을 구하는 것은 어려우며 기업들은 영업 비밀의 형태로 특허로 등록하지 않고 보안을 유지하며 관리한다. 15
노와이(know why)는 노웨어(know where)도 알고 노하우도 알아서 실제로 제조하여 활용은 하지 만 실제 그 원리는 모르는 수가 있으며 지식을 완전히 이해하고 더 발전시키려면 노와이를 알아야만 한다. 근본 원리를 이해하는 것인데 노와이는 모르는 채 활용되는 지식들도 많다.
베스트 프랙티스(best practice)는 특정한 업무를 수행할 때 가장 최선의 방법을 의미한다. 최선의 문제해결 방법을 베스트 프랙티스라고 하며 누구나 자신이 맡고 있는 일에 대해서 이 방법을 알고 처 리하면 가장 경쟁력이 있다고 할 것이다.

- 온톨로지는 철학에서 존재론이란 뜻이지만, 지식 표현 분야에서는 단어와 단어 간의 모든 관계를 표 현하는 방식으로 추상화에서 살펴본 IS-A, PART-OF 관계 외의 모든 다른 관계를 표현할 수 있다. '호 랑이'와 '토끼'의 관계에는 '먹는다'는 관계가 가능하며 '사람'과 '자동차'에는 '교통수단'이란 관계가 있다. 또한 단어의 비슷한 말, 반대말, 유사어 등 모든 관계를 표현 가능하여 모든 단어 간의 관계를 DB로 만들어 놓은 워드넷(wordnet)은 단어들의 온톨로지 사전이다. 이 방식에서는 모든 지식을 개 념 1, 관계, 개념 2)의 트리플(triple) 형식으로 표현하기에 지식의 추가와 삭제 연산에 편리하고 단순 한 형식이라는 장점이 있으나 작은 지식의 양에도 방대한 트리플을 처리해야 하는 단점도 있다.
사람이 하나하나 모든 단어의 온톨로지를 만들어서 지식 처리를 하려는 노력이 오래전부터 시도되 어 왔으나 성공에 이르지 못하고 오늘날 딥러닝을 이용하여 모든 단어의 관계를 스스로 학습하여 신 경망에 저장하도록 하는 방식이 더 잘 처리한다. 그래서 지금 서비스로 제공하는 언어 번역 시스템이 모두 딥러닝을 기반으로 하고 있다.
- 딥러닝의 특징은 입력 데이터로부터 특징 추출을 할 필요가 없다는 것이다. 입력과 출력 사이의 종단 간 학습(end-to-end learning)이 가능하다는 것이 가장 큰 장점이다. 이 점은 언어 번역에서도 품사 분류와 문법의 구문 구조에 따른 파싱 트리를 만들지 않고 입력 문장과 번역 문장만 주고 학습하면 문법의 세부내용은 알 필요도 없이 종단간 번역 능력을 학습한다는 것이다.
딥러닝은 자동프로그래밍 SW를 가진 것과 같다. 프로그래머의 꿈은 프로그래밍을 컴퓨터가 자동으 로 해주는 것이다. 프로그래머는 단지 입출력 데이터만 주면 시스템이 해당하는 프로그램을 완성해 주는 것으로 딥러닝은 바로 이것을 가능하게 해주고 있다.
딥러닝의 문제는 완전한 프로그램을 얻기 위해서는 대량의 입력과 출력을 알려주어야 한다는 점이 다. 하나만 가르치면 열을 아는 딥러닝은 없다. 빅데이터와 딥러닝은 상호의존적인 관계라고 볼 수 있다. 오늘날 빅데이터 기술이 등장하면서 딥러닝도 가능해졌다. 45TB의 문장들을 학습해서 만들어진 GPT-3 언어 플랫폼은 빅데이터와 딥러닝의 완성이라고 볼 수 있다.
잘못된 데이터를 학습하면 잘못된 생각으로 이어진다. 역사 교육에 있어서 오류는 무척 많다. 중국 이나 소련, 일본 등이 대표적인 사례다. 일본의 청소년들은 아직도 한국전쟁을 항미원이라고 배우고, 대동아전쟁이 평화를 위한 것이라고 배우는 등 한일강제병합의 역사를 왜곡해서 한국이나 대만이 식민지를 통해서 발전되었다는 교육을 받는다.

- 인공 데이터를 만들어 학습하는 딥러닝: 알파 제로
딥러닝이 반드시 빅데이터를 필요로 하는 것은 아니다. 알파고는 대량의 바둑 기보를 토대로 학습했 다. 그러나 알파제로는 바둑기보를 가지고 학습하지 않고 스스로 바둑을 두면서 학습했다. 인간이 만 든 데이터를 필요로 하는 것이 아니면, 인공 데이터를 생성할 수 있는 분야의 경우는 데이터를 만들 어 학습하면 된다.
- 데이터가 필요 없는 학습: 제로샷(zero shot) 학습
빅데이터를 확보하는 일은 간단하지 않다. 또 데이터 자체가 희소한 분야가 있기도 하다. 이미 우리 는 실제 데이터가 없어도 데이터에 대한 개념적 설명을 가지고 인식할 수 있는 능력을 가지고 있다. 예를 들어 밤하늘에서 'W' 모양의 별자리를 카시오페아라고 알려주면 한 번도 본 적 없어도 찾을 수 있다. 이러한 학습을 제로샷 학습이라고 한다. 샷은 예제 데이터를 의미하여 데이터를 한 번도 주지 않고 학습하는 것으로 대신 충분한 데이터에 대한 메타데이터 설명이 주어져야 한다. 그래서 이 분야 를 전이학습의 한 사례로 구분하기도 한다.
오카피(okapi)라는 동물은 다리에 얼룩말 무늬가 그려져 있는 말과 비슷하게 생긴 동물이다. 우리는 오카피를 한 번도 본적이 없지만 설명만으로도 오카피를 보게 되면 알아볼 수 있다. 직접 본적 없지 만(동물을 보고 학습하지 않고) 설명만으로 맞출 수 있는 제로샷 학습의 또 다른 예이다.

- 데이터가 가지는 편견의 문제는 인간의 실제 생생한 모습 그 자체일 뿐이다. 여성차별, 인종차별에 따른 편견은 인간이 누적한 데이터가 그러하기 때문에 데이터를 모두 삭제하지 않는 한 해결 자체가 불가능하다. 인간의 생생한 데이터를 학습한 결과를 통해서 AI는 우리가 보고 싶지 않은 불편한 진실 을 알려주고 있다.
그러므로 편견 없는 AI를 만들기 위해서는 데이터에 대한 청소(cleansing)가 필요하다. 데이터 마사 지라고도 하며 개인정보 보호를 위해서 법원 판결문에서 개인정보에 해당하는 부분을 모두 제거하 는 익명화(anonymization) 기술과 같이 편견 부분을 모두 제거해야 한다. 이것은 사실 진실을 가리 는 작업이라고 볼 수도 있고 선의의 거짓말을 통해서 우리가 지향해야 할 방향을 제시하기 위함이라 고 볼 수 있다.25 성장기의 청소년에게는 현실의 생생한 모습 중에 목불인견의 장면을 보여주지 않는 것이 타당한 것과 같다고 여길 수 있다.26
AI의 공정성을 논하기 전에 우리는 먼저 알고리즘의 공정성을 생각해볼 수 있다. 특히 검색 알고리즘 의 경우 검색 결과를 보여주는 순서에서 인위적인 조작이 추가되는 경우가 문제가 된다. 조회수와 같 은 공정한 기준을 사용하지 않고, 광고비를 많이 낸 순서로 결과를 보여주는 것은 정보를 왜곡하는 것이다." 블로그의 기사를 광고비를 받아서 썼다고 명시하는 것은 가능하다. 문제는 광고비를 받고 서 마치 객관적인 의견인 양 기사를 쓰는 것이다.
- 분석에서 나아가 마이닝(mining)은 보다 고차원적인 정보의 분석 결과를 보여주며 우리는 이것을 지식 추출(knowledge extraction)이라고도 한다. 마이닝의 결과 지식은 다양한 방식에 따라서 여러 가지 형식으로 나타내며, 수준별로 다양하게 나타날 수 있다.
우선 설명 마이닝(descriptive mining)을 들어보면, 이는 데이터 전체에 대해 요약해서 설명하여 이 해하기 쉽게 만들어주는 마이닝이다. 책이나 논문의 요약문이 전체를 한 마디로 요약하는 것으로 문 서 마이닝에서 주요 응용의 하나다. 독서 감상문의 경우 책 전체를 얼마나 잘 이해해서 짧게 요약하 는지 능력을 파악할 수 있으며 자기소개서의 경우도 자신을 짧은 문장으로 어떻게 잘 표현하는지 알 수 있다.
설명 마이닝에는 특징 추출, 특징 요약(축소), 의사결정 트리, 연관규칙, 군집 등의 방법을 사용한다.
- 예측 마이닝(predictive mining)
데이터에 대한 전체를 이해하고 파악한다면, 미지의 데이터가 입력되었을 때 그 데이터의 특성을 통해서 분류와 미지의 값을 채워 넣을 수 있다. 
- 딥러닝은 역공학이다.
딥러닝은 알고리즘을 모르는 경우 역공학으로 파라메터를 가진 일반적인 신경망 모델을 만들고 파라 메터 값을 계산하는 과정이다. 딥러닝 알고리즘 하나로 오늘날 모든 문제를 푸는 데 필요한 알고리즘 을 학습하여 파라메터에 저장함으로써 문제를 해결한다. 문제를 푸는 알고리즘을 자동으로 만들어주 는 알고리즘이라고 볼 수도 있으며 프로그래머의 꿈인 자동 프로그래밍이 실현되었다고 볼 수 있다.
- 딥러닝은 메타알고리즘이다.
알고리즘이란 문제를 해결하는 방법을 의미한다. 알고리즘을 모르고도 문제를 해결할 수 있다. 

- 단어를 벡터로 표현하는 기법의 효용성으로 인해서 구문(phrase)을 벡터로 그리고 문장을 벡터로 표 현하는 모델도 등장하였다. 지금까지 단어들의 의미와 유사어, 반대어 등을 사전에 저장하는 방식으 로 자연어를 처리하는 방식에서 벗어나서 주어진 텍스트를 그대로 단어들의 연관 관계만을 가지고 벡터로 만드는 워드 임베딩은 단어의 의미를 처리하는 모든 문제를 해결해주었다.
즉 단어는 문장 내에서 함께 사용되는 단어에 따라서 의미가 결정된다는 사실이다. 우리가 영어학습 에서 단어의 뜻을 모를 때 문장 내에서 어떤 뜻인지 추측하는 학습을 하라는 것이 바로 이 때문이다. 오늘날 자연어 처리는 많은 문장을 단어와 단어 간의 연관성을 가지고 학습시키는 방식을 사용한다.

- 인공지능이 인간보다 예술작품에서 이길 수밖에 없는 이유는 다음과 같다.
* 인류가 만든 모든 예술작품을 다 알고 있다.
* 인간이 좋아하는 모든 음악을 다 알고 있다.
* 인간이 좋아하는 모든 문학 표현과 스토리텔링 및 문체를 모두 학습했다.
* 색상의 수에서 압도적이다. 컴퓨터가 처리하는 색상 수는 현재 1억 개를 넘었다. 아무리 뛰어난 화가라도 컴퓨터가 다루는 색상의 수를 넘지 못한다.
* 음의 활용 개수에서 압도적이다.
* 캐릭터 제작에서 가장 아름다운 (인간이 좋아하는 모든 요소를 갖춘 캐릭터를 만들 수 있다.

- 현재 GPT-3의 문제점으로 알려진 것으로는 다음과 같은 것을 들 수 있다.
* 초거대 AI 모델이므로 막대한 학습 비용이 든다. 마이크로소프트사의 10억불 투자로 독점 사용권을 부여했으며 현재 유료로 서비스 중에 있다.
* 물리적인 상식을 모른다. “치즈를 냉장고 안에 넣으면 녹을까?"의 질문에 “그렇다.”로 답한다.
* 모든 분야에서 뛰어난 것은 아니며 두 가지 이상의 복합 연산 능력은 저조하다.
* 예제를 암기한 것인지 추론해서 얻어진 것인지 불분명하다.
* 새로운 정보를 수용하기 어렵다.
* 통계적으로 다음에 많이 나오는 단어를 예측하는 방식으로 학습한 것일 뿐 결코 '이해(understand)'한 것은 아니다. 그리고 상식도 매우 부족하다.
* 가짜 뉴스나 편견 등이 완전하게 제거되지 않아서 위험한 답변을 줄 수 있다. 특히 유대인이나 여성에 대해서 반유대, 여성혐오적 표현 생성이 가능하다.
* 일관된 한 사람으로서의 페르소나(persona)를 가지지 못한다.

- "자신을 기억할 만한 사람이라고 생각하기 시작하는 순간, 당신은 당신을 만난 것조차 기억하지 못하는 사람과 마주칠 것이다." (존 어빙)




'IT' 카테고리의 다른 글

좋아요는 어떻게 지구를 파괴하는가  (7) 2023.06.02
AI 혁명의 미래  (3) 2023.05.25
프로덕트 매니저는 무슨 일을 하고 있을까  (1) 2023.04.08
AI 2041  (0) 2023.03.23
웹 3.0 사용설명서  (2) 2023.03.17
Posted by dalai
,