인공지능으로 성공하기

IT 2021. 11. 26. 18:54

- 데이터는 새로운 석유 자원data is the new oil 이라는 식으로 비유하는 경우가 있는 데, 이런 생각을 도입해 보자. 새로운 유전이 필요하다면 석유를 찾는 일과 유전이 어떻게 생겼는지를 이해하는 일에 최대한 초점을 맞춰야 한다. 나중에 생각해도 될 시추 장소를 미리 감안해 가면서 세계 최고 수준의 석유 시추 장비를 구입하는 일 부터 하지는 않을 것이다. 이런 원리를 데이터에도 동일하게 적용할 수 있다. 시추
- 모든 인공지능 프로젝트에서 기억해야 할 가장 중요한 두 가지 아이디어는 다음과 같다.
(1) 수익은 여러분이 어떤 행위를 해야만 나온다. 행위는 하지 않은 채 분석만 하면 비용만 들 뿐이다. 일부 분석이 완료될 때 수익을 얻는 게 아니라, 적절한 사업 행위를 수 행할 때 수익을 얻는다. 분석이 수익 창출의 원동력이 될 수는 있지만 회계라는 관점 에서 볼 때 분석은 비용 계정에 해당할 뿐이다. 분석이 비용이 되게 하는 일을 멈추고 좋은 사업 행위를 취하는 데 도움이 되게 할 때만 분석이 투자가 된다.
(2) 성공하려면 개별 부분이 아닌 전체 시스템에 집중하자. 여러분의 고객은 시스템의 개 별 부분을 볼 수 없다. 예를 들어, 고객은 여러분이 사용하는 머신러닝 알고리즘에 대해 신경 쓰지 않는다. 고객은 결과에만 관심을 둘 뿐이며, 그 결과는 시스템이 전 체적으로 얼마나 잘 작동하는지에 달려 있다.
- 사업상의 결정을 내리기 위해 데이터 분석법을 더 잘 이해해야 한다는 생각이 든다면, 그것은 여러분에게 분석법에 관한 지식이 부족해서 생기는 문제가 아니라 데이터 분석법을 잘 아는 전문가와 의사소통이 잘 안 되어서 생기는 문제인 것 이다.
인공지능 프로젝트를 관리하기 위해 알아야 할 지식은 인공지능 관련 개념을 사업에 연계 하는 방법이다. 즉, 다음 질문에 답할 수 있으면 그만인 것이다.
? 인공지능으로 무엇을 할 수 있으며 사업에 어떻게 이용할 수 있는가?
? 어떤 유형의 인공지능 프로젝트부터 시작해야 하나?
? 인공지능이 사업에 얼마나 도움이 되는지를 측정하려면 어떻게 해야 하는가?
? 인공지능 프로젝트를 어떻게 관리해야 하는가?
? 부족한 자원은 무엇이며 자원을 최대한 잘 배정하려면 어떻게 해야 하는가?
- 여러분이 취할 수 있는 행위를 찾으려면 반드시 적절한 규모로 이뤄진 조직 을 선택해야 한다. 그런데 스무 가지가 넘는 선택지가 나온다면 여러분이 지나치게 세분화했기 때문일 것이다.
인공지능을 의사결정 지원 시스템의 일부로 사용하는 일에 대해 논의할 때에 부딪히게 될 위험성으로는 그 일에 너무 깊이 빠져드는 경우를 들 수 있다. 고위 경영진을 위한 의사결 정 지원 시스템의 일부로 인공지능을 적용하는 경우라면 여러분은 조직에서 일하는 각 개 별 작업자가 취할 수 있는 행위를 분석해서는 안 되고 고위 경영진이 수행하는 행위를 분 석해야 한다. 인턴이 입사한 첫날에 취할 수 있는 행위를 분석하지 말자.
- 제품에 인공지능 기능이 들어 있다고 해서 제품을 특별하게 여겨 구매하는 사람은 거의 없다. 핵심 질문은 “제품이 고객에게 제공하는 가치는 무엇인가?” 이다.
“우리는 인공지능을 사용한다” 라는 말이 마케팅 · 자금 조달 기법으로 여겨지던 때도 있었 지만, 그런 시절은 끝났다. 시간이 흐르면 인공지능은 오늘날 자동차에서 엔진이 작동하 듯이 자율형 제품에서 핵심 역할을 맡게 될 것이다. 인공지능 없이는 어디로도 갈 수 없게 되는 것이다. 그러나 대부분의 자동차 구매자는 특정 엔진에 관심을 두기보다는 자동차를 타고 한곳에서 다른 곳으로 갈 수 있게 하는 이동성에 더 관심을 둔다.
- 완전 자율 시스템의 예로는 룸바 같은 진공 청소 로봇을 들 수 있다. 이 경우에는 진공 청소기로 방 전체를 청소해야 한다. 진공 청소기와 관련성이 있는 영역 행위는 “어디로 가야 하고 어떤 장소를 피해야 하는가?” 이다.
인공지능을 사용해 환경을 탐색하는 기능을 해당 장치에 장착할 수 있다. 이러한 인공 지능은 정교한 항법 시스템에서 상대적으로 간단한 연산 장치에 이르기까지 다양할 수 있다는 점에 유의하자. 로봇 청소기는 인공지능을 사용해 방에 놓인 가구들의 배치 상태 를 학습하고 해당 배치 상태가 바뀐 내용을 인식할 수 있다. 또한 배터리 용량이 클수록 방 구조를 더 정교하게 파악해 처리할 수 있으므로 시간 집약적인 시행착오 접근 방식을 사용하여 장애물을 파악한 다음에는 장애물을 쉽게 피할 수 있다.
용량이 더 큰 배터리라는 사례를 통해 우리는 인공지능 알고리즘을 선택하는 일보다. 전체 시스템을 구성하는 방법이 더 중요하다는 점을 알 수 있다. 몇 년 전까지만 해도 크 게 개선된 인공지능 탐색 기능에 많은 시간과 비용을 소비하기보다는 차라리 고용량 배터리를 추가해 작동 시간을 늘리는 편이 더 수월하고 가성비가 좋았다.
완전 자율형 제품이라고 하는 맥락에서 볼 때, 제품이 취할 수 있는 행위뿐만 아니라 일부 행위와 결과가 바람직하지도 않고 허용되지도 않는다는 점도 고려해야 한다. 여러분은 룸 바가 계단을 알아서 내려오는 기능이 있는 값비싼 로봇 청소기가 되기를 바라지는 않을 것이다.
- 인공지능 프로젝트 난이도를 추정할 때는 다음 고려 사항들에 유의하자.
? 필요한 데이터를 수집하는 데 필요한 시간을 고려하자. ? 데이터 크기에 알맞은 인프라를 갖췄는가? 빅데이터 프레임워크가 필요한가?
? 대규모 데이터셋을 사용하는 경우에 데이터를 처리하고 인공지능 알고리즘을 훈련하는 데 필요한 시간을 고려하는 일을 잊지 말자.
? 팀이 이 사용 사례를 다루는 데 필요한 모든 기량을 갖추고 있는가? 기량 간에 격차가 있다면 무엇인가? (팀 리더는 팀의 지식 격차를 알고 있어야 한다.)
? 프로젝트가 기술적으로 가능하다는 점이 확실한가? 여러분은 제안된 인공지능 기반 방법들을 팀이 구축하게 할 생각이 들 만큼 충분히 이해하고 있는가? 또는 프로젝트 가 가능하다고 여길 만큼 여러분이 인공지능 분야를 잘 알고 있는가?
- 인공지능 프로젝트를 실행할 때 피해야 할 함정 중에 흔한 게 몇 가지 있다. 중요한 함정 들 중에 일부를 예로 들면 다음과 같다.
? 감지 · 분석 · 반응 루프 중에 반응 부분을 담당하는 조직에 속한 행위자와 소통하지 않거나, 심지어 인공지능 프로젝트가 순조롭게 진행될 때까지 그들과 전혀 함께 일하지 않는 것
? 다른 프로젝트나 조직의 사용 사례(및 지표)를 가져다 쓰는 일
? 온갖 신문의 1면을 장식할 수 있을 만큼 유행하는 인공지능 프로젝트들을 진행하는 일
? 지속적으로 우위에 설 수 있게 할 만한 도구를 사서 쓸 수 있다고 믿거나, 더 나아가서 온갖 도구를 다 사서 쓸 수 있다고 믿는 일
? 분석한 내용을 아무렇게나 데이터 속으로 던져 넣으면서 성과가 나오기를 바라는 일
? 분석 결과 대신에 ‘직감’을 바탕으로 진행해야 할 프로젝트를 선정하는 일
- 기술지표에는 머신러닝 알고리즘이 이러한 지표의 값을 쉽게 최적화할 수 있는 속성이 있 다. 이러한 속성은 본질적으로 수학적이고 고도로 기술적이며 일반적으로 사업과 관련이 없다. 예를 들어, 기술지표의 일반적인 속성 중 하나는 '미분 가능' 이라는 것이며 인공지 | 능 및 머신러닝 맥락에서 사용되는 많은 최적화 알고리즘은 지표를 미분할 수 있어야 한 다는 것이다. 안타깝게도 사업지표들이 반드시 미분 가능하지는 않다. 그렇기 때문에 많 은 머신러닝 및 인공지능 알고리즘에서는 곧바로 사업지표를 사용할 수 없다.
- 머신러닝 파이프라인의 경직화
인공지능 프로젝트와 그 밖의 소프트웨어 프로젝트에 공통인 문제 외에도 자체 문제가 있다. 이러한 문제 중 하나는 머신러닝 파이프라인의 유지보수 비용이다. 인공지능 프로젝 트 비용에서 가장 큰 비율을 차지하는 일 중 하나는 머신러닝 파이프라인을 빠르게 변경 하기 어렵고 변경하는 데 큰 비용이 든다는 점이다. | 인공지능 소프트웨어를 유지보수하는 데는 큰 비용이 든다. 데이터와 사용된 알고리즘 들 사이에는 다른 어떤 종류의 소프트웨어 프로젝트보다 더 널리 퍼져 있는 고유한 엉킴이 있다
- 머신러닝 파이프라인을 구현하기 시작하는 순간 파이프라인의 경직화가 시 작된다는 특징이 있다. 경직화를 막을 수는 없다. 최선의 방법은 사업 문제를 해결 하는 머신러닝 파이프라인 공법을 연구하는 것이다. 잘못된 머신러닝 파이프라인 이 경직화되면 놀랄 만큼 큰 비용이 들기도 한다.
더 상위 수준에서 생각해 볼 때 경직화는 기술적 이유와 조직적 이유 모두에서 발생한다. 기술적인 측면에서 볼 때 머신러닝 파이프라인이란 그 안에 여러 단계가 들어 있을 수 있 는 복잡한 소프트웨어이다. 이러한 각 단계별로 데이터 공학 분야의 전문 기술이나 빅데이 터 분야로부터 클라우드 컴퓨팅 분야에 이르는 기술이 필요할 수 있다. 조직 측면에서 볼 때, 머신러닝 파이프라인은 조직이 구축하는 대부분의 다른 소프트웨어 유물보다 더 많은 팀 간 동의가 필요하며 외부 공급업자와 새로운 계약도 해야 한다.
- 일부 작업에서는 인공지능 알고리즘이 인간보다 나은 효과를 낼 수는 있지 만 이 글을 쓰는 시점에서 이러한 상황은 드물고, 종종 뉴스거리가 되는 정도이며, 게다가 성취되기까지 했다면, 그런 것들은 보통 세계 최고 수준의 인공지능 연구자 들로 구성된 팀이 산출해 낸 것이다. 인공지능 알고리즘의 결과가 사람이 달성할 수 있는 결과보다 더 나쁜 편이 훨씬 더 일반적이다
- 실용적인 사람들에게는 해법이 필요한데, 이 경우에는 여러분이 이미 문제에 익숙하다. 는 점을 인식하는 게 답이다. 이것은 내가 여러분에게 “그래서, 사는 동안 얼마까지 벌 수 있는가?”라고 묻는 일과 똑같은 문제다. 글쎄, 여러분이 적절한 사람들을 만날 수 있었다. 면 오늘날 구글보다 더 번영하는 회사를 설립했을 수도 있지만, 장래 일을 여러분은 결코 알 수 없다. 여러분은 그러한 질문에 답할 수 있게 하는 여러분의 인생에 대한 '소득 민감도’ 곡선을 모른다.
살면서 벌 수 있는 만큼 충분히 돈을 벌었는지를 여러분은 결코 알지 못한다. 여러분이 아는 것이라고는 여러분이 편안하게 살기에 충분한 돈을 벌었는지 여 부뿐이다.
인생과 마찬가지로, 어떤 한 가지 프로젝트에서 할 수 있는 질문은 “곡선의 최댓값은 얼마 인가?”가 아니다. 여러분은 사냥감이 풍부한 사냥터에 있으며 투자한 인공지능 프로젝트가 수익성이 있는지 확인하고 싶다는 점을 기억하자. 또한 투자 결정을 해야 하 는 시점에 이용할 수 있는 최상의 정보를 기반으로 결정해야 한다. 민감도 분석으로 최대값을 찾지 못했을지라도 여전히 수익성이 있는 파이프라인을 구축할 수 있다면 이를 사업적 성공이라고 한다.
- 프로젝트 관리 방식은 빠르게 실패하는 쪽으로 기울어야 한다. 너무 일찍 포기하는 바람 에 잠재적인 해결책을 놓칠 수 있는 가능성을 받아들이는 대신에 종국에 가서 작동하지 않을 일에 오랫동안 갇혀 있는 상황을 피할 수 있다는 생각으로 균형 잡힌 생각을 유지 해야 한다. 문제가 있는 프로젝트에서 너무 오래 머무르면 결국 보여 줄 게 없는 상황이 되어 버리 기 때문에 주로 인공지능에 관한 주도권을 놓치게 된다
- 불행히도 조직은 종종 연구 프로젝트의 결과를 '예/ 아니요’, ‘작동 / 작동하지 않음'과 같은 이항 범주로 분류하는 습성을 보인다. 타임박스 접근 방식을 제대로 사용하려면 연 구상의 질문을 초기에 분석할 때 있을 법한 결과가 세 가지라는 점을 이해해야 한다.
(1) 예 : 이 접근 방식을 더 추구해 볼 가치가 있다. 우리는 이 접근 방식에 많은 자원을 투입해야 한다.
(2) 아니요 : 우리는 많은 노력을 기울여 이 접근 방식이 잘못되었다는 점을 확신할 수 있으며 이 접근 방식이 들어맞지 않을 것으로 예상한다. 여기에 자원을 더 이상 투입하지 말자.
(3) 글쎄요 : 초기 조사에 착수한 후로 시간이 흘렀지만 이 접근 방식이 효과가 있는지를 알아내지 못했다. 하지만 우리가 더 열심히 노력했을 때도 효과가 없을지에 대해서는 충분히 조사하지 않았다. 나중에 자금과 시간이 더 주어지면 이 문제를 다시 검토해야 한다.
- 결과를 예/ 아니요 / 글쎄요라는 3개 상태 논리 형식으로 보고하고 추적해 보 는 게 중요하다. 그 이유는 '아니요'로 답한 질문을 다시 개시하지 않은 채 시간이 흘러 '글쎄요’로 답했던 질문을 다시 개시할 수 있기 때문이다. 이런 식으로 제대로 구별할 수 있어야 '어려운 프로젝트를 조기에 기꺼이 포기’할 수 있고, 이게 유일한 방법이다. 나중에 더 많은 자원을 사용해 개선하고자 하는 성공적인 해법이 있는 경우에 일부 가능 성을 다시 살펴볼 가치가 있다고 결정할 수 있다.
- 인공지능 기반 물리적 시스템은 간단한 환경 속에서 간단한 행위를 할 때 가 장 잘 작동한다. 시스템이 수행하는 모든 행위가 간단해서 시스템이 지루해하는 것처럼 보일 정도면 완벽하다. 여러분이 타고 있는 차가 창의적이기를 원하는가?
인공지능을 사용하는 물리적 시스템은 물리적 시스템이 우선이고 인공지능 시스템이 그 다음이다. 시스템은 사용 분야에 적합한 안전 지침과 신뢰 지침에 맞게 이러한 물리적 시 스템을 설계해야 한다. (예를 들어 자율 주행 차는 자동차 공학의 규칙과 규정에 맞춰져야 한다.) 안전 시스템 설계와 관련해 안전 공학이나 시스템 엔지니어링을 전공한 도메인 전문가는 예측 가능한 미래에 대해 최종 결정을 내린다.
- 사물 인터넷 장치에서 데이터를 수집하려면 큰 비용이 소요되므로, 여러분 은 사물 인터넷 장치 설계 범위 내에서 인공지능에 필요한 데이터를 획득할 수 있 게 계획해야 한다. 기존 사물 인터넷 장치를 설치한 후에 나중에 가서 인공지능을 거기에 추가할 생각을 한다면, 곧 후회하게 될 것이다.
사물 인터넷이라는 분야에 인공지능을 적용할 때는, 물리적 장치는 현장에 배포된 후 변 경하기 어렵거나 변경이 불가능할 수 있는 반면에 시스템의 인공지능 부분은 훨씬 쉽게 개 선할 수 있는 소프트웨어로 구성된다는 점을 이해해야 한다. 이러한 불일치를 계산에 넣 어 두려면, 시스템을 설계하는 동안에 여러분은 인공지능 시스템의 첫 번째 버전이 수행할 작업을 고려해야 할 뿐만 아니라 향후 인공지능 시스템에서 이상적으로 개발하고 싶은 기 능까지도 고려해야 한다. 시스템용 최신형 인공지능에 필요할 것으로 예상되는 모든 하드웨어 센서를 처음부터 사물 인터넷 장치에 부착해 둔 다음에 해당 장치를 현장에 배포하 겠다는 식으로 생각하자. 이렇게 하면 고객은 자신이 이미 구매해 둔 장치에 필요한 추가 기능을 소프트웨어 업데이트만으로도 사용할 수 있을 것이다.
“일단 하드웨어를 팔고 나중에 소프트웨어까지 팔아 돈을 번다”는 정책의 예는 스마트 폰의 소프트웨어를 지속적으로 개선해 나가는 제조업체에서 자동차 산업에 이르기까지 다 양하다. 일부 테슬라 모델에는 자율 주행에 필요할 것으로 예상되는 모든 하드웨어가 이 미 포함되어 있지만 자동 운전 기능 자체는 시간이 지남에 따라 계속 개선되고 있다.
- 인공지능은 올바른 판단을 할 수 없으며 오늘날 사용되는 가장 일반적인 인 공지능 기반 방법들(예 : 딥러닝)로는 인과관계를 결정할 수 없다. 인공지능 기반 방법들은 올바른 지표가 있어야 추진할 수 있는 정량적 방법이다. 모든 인공지능 알고리즘은 지정된 지표를 최대화하는 이유는 모른 채 그러한 지표를 최대화하는 방 법만 안다. 인공지능이 해당 지표를 최대화해야 하는 맥락과 목적은 인간에게서 비롯되어야 한다.
- 인공지능이 만드는 오류는 본질적으로 보험계리적이어서 인공지능은 “전체 모집단에 비추어 볼 때 내가 내린 이 결정이 합리적인가?” 라는 식으로 생각한다고 볼 수 있다. 반면에 인간은 특정한 경우들에서 각 사례에 맞춰 “이 결정이 합리적인가?”라는 식으 로 생각한다. 대부분의 사람은 이러한 구분을 이해하지 못하며 인공지능 시스템의 보 험계리적인 오류를 악의에 기인한 것이라고 생각할 수 있다.

'IT' 카테고리의 다른 글

아세안 슈퍼앱 전쟁 (0)	2021.12.18
NFT사용설명서 (0)	2021.12.05
2029 기계가 멈추는 날 (0)	2021.11.17
데이터 과학자의 일 (0)	2021.11.17
AI 최강의 수업 (0)	2021.11.09