인공지능이 인간의 지적 능력을 압도하는 이벤트가 잇따르고 있다. 지난 5월 말 중국 저장성 우전에서 열린 구글 딥마인드와 바둑 세계랭킹 1위 커제 9단과의 대결에서도 인간 진영은 자신들의 지적 능력이 기계 수준을 따라갈 수 없다는 것을 씁쓸하게 재확인했다.
올해 1월 미국 카네기멜런대 연구진이 개발한 인공지능 ‘리브라투스’와 포커 프로 4명이 20일 동안 12만번 치러진 포커게임(텍사스홀뎀 방식)에서도 인공지능은 완벽하게 승리했다. 알파고가 스타크래프트 등 전략시뮬레이션게임에서는 아직 인간 고수를 꺾지 못했다며, 기계와 대결이 이뤄지지 않은 영역을 찾아내 싸움을 붙이려는 매치메이커들의 시도가 있지만 사람과 기계의 대결이라는 종목에서 승부는 결정 난 셈이다.
이처럼 기억, 연산, 판단, 추리 능력 대부분에서 디지털 기계의 능력을 상대할 수 없는 상황에서 인간 고유 능력으로 호기심이 주목받고 있다. 아무리 강력한 컴퓨터와 똑똑한 인공지능도 사람처럼 호기심을 갖지는 못할 것이므로 창의성이 중요해질 인공지능 시대엔 호기심이 지적 능력의 핵심이 될 것이라는 얘기다. <큐리어스>의 저자 이언 레슬리는 유인원도 식욕, 성욕, 주거욕을 갖고 있지만, 호기심은 사람만 지닌 네 번째 본능이라고 강조한다. 올해 초 스위스 세계경제포럼(World Economic Forum)의 맨파워그룹(ManpowerGroup)은 기술을 계속해서 업그레이드할 수 있게 해주는 욕구인 ‘학습능력(Learnability)’이 자동화 시대의 주요한 해독제라고 예측했다. 지속적인 학습을 가능하게 하는 욕구는 ‘호기심’이다.
그런데 호기심은 학습자 스스로 지식과 지혜를 찾아가게 하는 개인과 사회 발전의 원동력이지만, 비효율성이 특징이다. 관련한 정보나 답이 있는 경우 호기심은 불필요하고 위험한 모색을 하게 만들어 시간과 자원을 낭비하게 한다. 특히 선진국 따라잡기 전략을 통해 단기간에 산업 발전을 일군 한국사회에서 호기심은 장려되지 않았다. 빠른 추격자 전략이 제공한 효율성에 대한 경로 의존성은 호기심과 양립하기 어려웠다. 호기심은 효율성 대신 쓸모없어 보이는 지적 추구, 사상과 표현의 자유, 비판적 사고를 존중하는 사회적·문화적 토양이 있는 곳에서 싹트기 마련인데 한국사회의 효율성 추구 경쟁은 호기심 배양을 훼방한다.
최근 인공지능에 호기심을 가르치려는 시도에서 괄목할 성과가 보고돼, 기대와 충격을 안기고 있다. 지난 5월23일 ‘MIT 테크놀로지 리뷰’(Curiosity May Be Vital for Truly Smart AI)에 따르면, 미국 캘리포니아 버클리대학 연구진은 최근 호기심 기반 인공지능을 개발했다. 이 호기심 인공지능은 즉각적 피드백과 보상이 없어도 의사결정을 내리고 실행할 수 있는 게 특징인데, 슈퍼마리오 게임과 1인칭 사격게임 둠을 대상으로 실험한 결과 기존 인공지능에 비해 뛰어난 성과를 냈다. 곧바로 점수를 획득할 수 있는 효율적 시도를 하는 대신 게임 초반에 자신이 처한 전체적 환경과 규칙의 특성에 대한 탐색을 시도한다는 게 특징인 인공지능이다. 즉각적인 피드백과 보상이 장기적 모색과 판단을 저해해온 인공지능 강화학습의 한계를 넘어서, 인간 지적 기능의 핵심인 호기심에 비견할 수 있는 새로운 가능성을 부여한 성과로 평가받고 있다.
[관련영상]
미국 캘리포니아 버클리대학 연구진이 공개한 호기심 기반 인공지능. 이 인공지능은 즉각적인 피드백이나 보상이 없어도 스스로 환경을 탐색한 뒤에 나중에 훨씬 효과적인 방법을 구사할 줄 아는, 호기심 기반 수행능력을 보이며 높은 효율성을 입증했다. 유튜브(https://www.youtube.com/watch?v=J3FHOyhUn3A) 캡처.
알파고가 바둑에서 선보인 뇌 신경망을 모방한 강화학습 방식의 인공지능(딥러닝)은 주어진 모든 가능성에 대해 탐색을 하는 무작위 연산이 아니다. 이전 경험에서 나온 피드백을 반영한 가중치를 적용해 가지치기를 하면서 무수한 선택 경로에서 선택지를 좁혀가며 점점 승률을 높이는 구조다(몬테카를로 트리 방식). 개를 훈련시킬 때처럼 기대하는 행동에 보상을 주고 반대의 결과가 나오면 불이익을 주는 방식이다. 이런 강화학습은 높은 보상이 주어지는 행동을 빠르게 학습하게 만드는 장점이 있지만, 즉각적 보상이 주어지지 않는 모색이나 전반적 탐색은 비효율로 판단해 중단하게 한다. 과업의 목표와 보상이 명확한 경우엔 효율적이지만, 당장의 성과가 장기적 성취에 걸림돌로 되는 경우엔 부적합한 학습방법이다. 심리학 분야에서 유명한 ‘마시멜로 실험’에서 관찰된 즉각적 보상을 유예하고 장기적 목표를 추구할 때 얻어지는 성과와 유사하다.
사람의 학습은 단기적 성과보다 장기적이고 추상적인 과업을 추구할 때 더 나은 결과로 이어지는 경향이 있다. ‘어떻게 더 많은 돈을 모을까’, ‘어떻게 더 많은 쾌락을 얻을까’처럼 단기적이고 계량적인 목표보다 ‘궁극적으로 만족도 높은 인생은 무엇일까’ ‘가장 오래 지속될 수 있는 쾌락은 무엇일까’와 같은 추상적 추구를 할 때 오히려 만족도가 높아진다는 것은 쾌락주의자들이 오래전에 깨달은 ‘쾌락의 역설(paradox of hedonism)’이다.
인공지능이 즉각적 보상이 없어도 장기적이고 전체적인 관점에서 환경을 탐구하고 나중에 활용될 기술을 배울 수 있게 되었다는 소식은, 인공지능을 더 다양한 용도로 활용할 수 있게 만드는 가능성이면서 호기심마저 기계가 따라 하는 환경에서 인간의 고유성이 무엇인지에 대한 깊은 질문을 던진다.
기계는 인간이 호기심을 활용하는 것과 다른 방식으로 효율성을 높여왔고, 이는 일종의 호기심으로 보아야 한다는 주장이 있다. 엔지니어들은 자동차 안전도를 높이기 위해서 다양한 시도를 해왔고, 호기심을 기반으로 디자인과 구조 개선, 에어백, 브레이크 미끄럼방지, 보행자 감지 등 신기술을 기술을 개발했다. 최근의 인공지능은 인간이 자동차 설계에 적용해왔던 관행과 방식에 얽매이지 않고 효율성을 기초로 전혀 새로운 디자인과 구조 설계를 구현할 수 있다. 사람과 다른 유연성을 갖춘 기계 지능이 나타나고 있는 것이다. 이는 알파고와 알파고의 대국을 보면서, 프로바둑기사들이 “인간 바둑에서는 상상할 수 없던 수이지만, 놀랍게 효과적인 포석이다”라고 열광하고 있는 것과 유사하다. 최근 구글이 데이터센터의 냉각 효율성을 높이고, 나사(NASA)의 엔지니어들이 안테나 품질을 높이는 데 인공지능을 활용했는데, 인공지능은 기존 인간의 시도와 전혀 다른 유연한 디자인으로 접근해 효율성을 높였다.
그렇다고 지금 바둑이나 체스처럼 호기심에서 인간이 기계에 밀려난 상황은 아니다. 기계는 불가능할 것으로 여겨졌던 호기심마저 기계가 흉내 낼 수 있다는 가능성을 확인한 수준이다. 지난 4월 <하버드 비즈니스 리뷰>(Can AI Ever Be as Curious as Humans?)는 기계에 불어넣으려는 ‘인공적 호기심’과 달리, 인간 호기심은 자유롭고 변덕스럽다는 점이 단점이자 장점이라고 지적했다. 기계가 호기심마저 모방하게 된 시점에서 사람은 새삼 호기심의 본질이 무엇인지를 묻고 있다는 점과 그 호기심을 제어할 수 없다는 것이 차별성이자 가능성으로 주목할 만하다.
구본권 사람과디지털연구소장 starry9@hani.co.kr◎ Weconomy 홈페이지 바로가기: http://www.hani.co.kr/arti/economy/home01.html/ ◎ Weconomy 페이스북 바로가기: https://www.facebook.com/econohani/
기사공유하기