가속 붙는 AI의 ‘인간화’…‘의식’을 창조한다
가속 붙는 AI의 ‘인간화’…‘의식’을 창조한다
  • 이종호 한국과학저술인협회장
  • 승인 2016.05.02 14:51
  • 댓글 0
이 기사를 공유합니다

인공지능 로봇이 만드는 세상 ① 알파고 재능

인공지능 알파고가 바둑의 고수 이세돌에게 완승을 거두자 세계인들이 가장 궁금하게 여긴 것은 세 가지다. 첫째는 알파고를 어떻게 만들었길래 10여 년 동안 세계 바둑계를 평정했던 이세돌에게 승리할 수 있느냐이다. 알파고와 이세돌의 대결은 인간과 인공지능의 대결, 문화와 과학의 대결 등으로 수많은 화제를 불러일으켰다. 

둘째는 인공지능 알파고가 그 정도로 똑똑하다면 앞으로 인공지능을 활용할 분야가 매우 많을 것이고 이것이 인간에게 어떤 영향을 주느냐이다. 가장 먼저 지적된 것은 현재 인간이 종사하는 일자리에 상당한 타격을 줄 수 있다는 것이다. 궁극적으로 인간의 일자리를 빼앗는 기술이라면 굳이 인공지능을 개발해야 할 필요가 있느냐고도 말해진다.
마지막은 많은 사람들이 우려를 자아내는 부분으로 인간의 속성상 인공지능이 인간에게 선한 측면으로만 개발될 수 있느냐이다. 로봇이 우리에게 친밀하게 느껴지는 것과 더불어 위해한 대상으로 변질될 수 있다고 생각하는 것이다. 인간사를 보면 어떤 경로를 통하든 일단 발명된 것이라면 이를 인간이 선용하느냐 악용하느냐는 당대의 정황에 따라 달라진다. 이와 같이 선악이 극단적으로 변질될 수 있는 발명품으로는 화약을 거론한다. 화약은 매우 오래전부터 중국에 알려졌는데 이들은 화약을 단지 폭죽으로 사용하거나 또는 연금술의 일환인 신기한 물질로 간주했다. 
반면에 화약의 특성을 파악한 유럽인들은 폭죽과 같이 재미를 돋구는 것이 인간을 살상하는데도 적합한 물질이라는 것을 발견했다. 이와 같은 발상의 전환이 추후 서양이 세계로 진출하는 근원이 되었고 결국 화약을 발견한 중국조차 서양에 무릎 꿇는 계기가 되었다. 로봇도 이와 같은 예로 설명될 수 있지만 화약과는 달리 전 인류를 위협할 수 있다는데 심각성이 있다는 것이다. 

딥러닝 기법이 가져온 획기적 진전

구글이 소유한 인공지능 기술 개발업체 딥마인드가 창조해낸 알파고 즉 인공지능 바둑 시스템은 빅데이터, 클라우드 컴퓨팅, 인공지능 등 최첨단 ICT 기술이 총동원된 시스템으로 설명된다. 구글의 설명에 의한 딥마인드는 다음 기술로 무장했다.
우선 알파고는 바둑의 확률을 수학적으로 계산하는 것이 불가능하기 때문에 무작위로  바둑알을 대입해보며 예상 확률을 알아낸 뒤 가장 가능성이 높은 수를 선택하는 컴퓨터 기법인 ‘몬테카를로 트리탐색(Monte Carlo tree search, MCTS)’을 바탕으로 했다. 몬테카를로 트리탐색은 선택지 중 가장 유리한 선택을 하도록 돕는 알고리즘이다. 예를 들어 알파고가 검은 돌로 대국을 벌인다고 가정할 때, 흰 돌이 어디에 위치하느냐에 따라 검은 돌을 둔다는 의미다. 이 같은 최적의 선택이 반복될수록 대국이 유리하게 풀림은 자명한 일이다. 

구체적으로 알파고가 바둑돌을 놓을 위치를 정하는 알고리즘은 ‘정책망(policy network)’이라는 이름이 붙여진 신경망과 ‘가치망(value network)’이라고 부르는 또 다른 신경망의 결합에 의한다. ‘정책망’은 상대방의 다음 움직임을 미리 예측해 이길 가능성이 높은 수만 고려하도록 해주고, ‘가치망’은 바둑돌의 위치 별로 승자가 누가 될지 예측한다. 말하자면, 알파고의 바둑 대국은 머신러닝으로 훈련된 정책망과 가치망의 결합이 몬테카를로 트리 리서치 알고리즘을 통해 발현되는 것이다.
이를 보다 설명하면 구글은 딥 러닝(deep learning·심층학습) 분석기법으로 ‘정책망’과 ‘가치망’을 활용했다는 뜻이다. 일반적으로 인공지능이라 말하는 분야는 사실 ‘딥러닝 기법’에 의한 강화학습을 말한다. 미국 미시간대학 조태호 박사는 인공신경망의 개념이 큰 진전 없이 이어져 오다가 딥러닝 기법으로 획기적인 진전을 이루었다고 말했다. 
일반 컴퓨터는 정해진 규칙을 따라 연산을 수행하면서 예/아니오의 결과를 내놓는다. 반면에 딥러닝은 연산 과정에 여러 층을 두어 컴퓨터 스스로 정보를 잘게 조각내어 작은 판단을 내고, 그것을 종합해 결과를 내놓는 새로운 알고리즘이다. 즉 다층구조 형태의 신경망을 기반으로 하는 머신 러닝의 한 분야로, 다량의 데이터로부터 높은 수준의 추상화 모델을 구축하고자 하는 기법이다. 데이터를 컴퓨터가 처리 가능한 형태인 벡터나 그래프 등으로 표현하고 이를 학습하는 모델을 구축하는 연구를 포함한다. 얼굴이나 표정을 인식하는 등의 특정 학습 목표에 대해, 딥 러닝은 학습을 위한 더 나은 표현 방법과 효율적인 모델 구축에 초점을 맞춘다. 

스스로 학습하는 능력 ‘무진장’

딥 러닝 기법은 1980년 후쿠시마 쿠니히토(Kunihito Fukushima)가 소개한 인공신경망인 네오코그니션(Neocognition)에 처음 등장했다. 1989년에는 얀 러쿤(Yann LeCun)과 동료들이 신경망에 오류역전파(backpropagation) 알고리즘을 적용한 연구를 수행하였는데 신경망을 훈련시키는 데 장시간이 걸려 실용화에 실패했다. 그러나 2006년 토론토대학교의 제프리 힌튼(Geoffrey Hinton)이 비감독(unsupervised) 학습을 이용한 전처리 과정을 다층 신경망에 추가하는 방법을 통해 다층망을 쌓아도 정확성을 해치지 않는 방법을 개발했고 2012년 스탠포드대학교의 앤드류 응(Andrew Ng) 교수와 제프 딘(Jeff Dean)이 이끄는 구글 브레인팀은 클라우드 환경을 기반으로 방대한 양의 유튜브 비디오를 자동으로 분석하는데 성공했다.
딥러닝의 핵심은 분류를 통한 예측이다. 수많은 데이터 속에서 패턴을 발견해 인간이 사물을 구분하듯 컴퓨터가 데이터를 나눈다. 이 같은 분별 방식은 두 가지로 나뉜다. ‘지도 학습(supervised learning)’과 ‘비지도 학습(unsupervised learning)’이다. 기존 기계학습 알고리즘은 대부분 지도 학습에 기초한다. 지도 학습 방식은 컴퓨터에 먼저 정보를 가르치는 방법이다. 예를 들어 사진을 주고 ‘이 사진은 고양이’라고 알려주는 식이다. 컴퓨터는 미리 학습된 결과를 바탕으로 고양이 사진을 구분하게 된다. 비지도 학습은 이 배움의 과정이 없다. ‘이 사진이 고양이’라는 배움의 과정 없이 ‘이 사진이 고양이군’이라고 컴퓨터가 스스로 학습하는 것이다. 
알파고의 개발자인 하사비스 박사는 알파고를 개발하면서 프로 바둑기사들의 대국 기보 3,000만 건을 입력시켰다고 말했다. 이후 알파고가 입력된 기보를 바탕으로 쉬지 않고 바둑을 두며 배우도록 했는데 알파고가 개발된 지 얼마 안 되지만 1,000년에 해당하는 시간만큼 바둑을 학습했다고 한다. 이를 통해 구글은 정책망의 예측 성공률을 44%에서 57%까지 높였다고 발표했다. 여기에서 알파고의 경우 바둑을 두는 프로그램이기는 하지만 두 신경망을 동시에 활용해 경기를 진행하면서 경험을 쌓아 스스로 학습하고 전략을 짠다는 점으로 딥마인드 개발자들도 어느 단계까지 스스로 학습하고 지속적으로 진화할 수 있는지는 의문이지만 알파고가 이세돌에게 연승한 것은 어느 정도 스스로 진화하는 학습능력을 갖추었기 때문이라고 주장했다.
딥마인드는 다양한 바둑 소프트웨어와 대국을 벌여 꾸준히 알파고의 실력을 검증했다. 현재 가장 강력하다고 알려진 상업용 바둑 소프트웨어 ‘크레이지 스톤(Crazystone)’, ‘젠(Zen)’을 포함해 오픈소스 바둑 프로그램 ‘파치(Pachi)’와 ‘푸에고(Fuego)’ 등이 알파고의 연습 대국 토너먼트 상대가 됐다. 놀라운 것은 알파고가 총 495회 바둑 소프트웨어와 대국을 벌여 딱 한 번을 패배했다고 한다. 이에 자신을 얻은 알파고가 이세돌에 도전했고 결론은 이세돌과의 대결에서 4승1패로 압승했으며 100만 달러의 상금도 획득했다.
이러한 딥러닝 기법은 현재 여러 분야에서 활용되고 있다. 
대용량 자동 음성 인식(speech recognition)은 딥 러닝 시스템에서 산업계와 학계를 모두 아우르는 가장 성공적인 케이스라고 할 수 있다. 현재 모든 주요 상업 음성인식 시스템(MS 코타나, 스카이프 번역기, 구글 나우, 애플 시리 등)이 딥 러닝 기법에 기반하고 있다. 자동 음성인식 분야의 자동 음성 번역 및 이해 분야로의 확장과 마찬가지로, 이미지 분류 분야는 딥 러닝을 핵심 기반 기술을 적용하여 자동 영상 캡션닝(captioning)이라는 분야로 확장되고 있다. 또한 심층 인공신경망 구조들을 활용하여 자동 번역(machine translation), 감정 분석(sentiment analysis), 정보 검색(information retrieval)을 비롯한 다양한 자연언어처리 등에서 활용된다. 
약물 발견과 독성학에서도 딥러닝이 사용된다. 제약 산업에서 많은 수의 약들이 시장에 출시되지 못하는데 이렇게 실패하는 이유 중 하나는 생각한 만큼의 효험을 보이지 못하거나, 예상치 못한 다른 작용을 일으키기 때문이다. 딥 러닝은 약학에 있어 가상 실험 방법(Virtual Screening Method)에 적합함을 보여주므로 현재 많은 연구자들이 여러 가지 데이터를 조합하여 약물을 발견하는 데에 딥 러닝을 활용하고 있다.

“단순한 운영체제 아닌 또 하나의 의식…”

딥러닝은 마케팅 기획, 고객 관계 관리 자동화를 위한 수단 적합성 산출 등에 직접적으로 활용된다. 즉 인공 신경망은 RFM으로 정의된 고객들에 대한 활용 가능한 마케팅 활동의 값을 예측할 때 사용되고 있다. 인간의 인식 발달 및 진화와 관련된 연구도 딥 러닝 기법이 도입되고 있는데 딥러닝 기법 활용 분야에서 가장 잘 알려진 분야가 무인주행 자동차이다. 
무인차의 컴퓨터는 앞에 횡단보도가 있는지 사람이 있는지와 같은 정해진 물음에 답할 뿐 아니라, 안전하거나 위험한 횡단보도 상황을 담은 동영상 데이터베이스를 스스로 학습해 자동차를 운행한다. 무엇이 더 중요한 정보인지 덜 중요한 정보인지 판단해 그것을 다음 연산에 반영하게 하는 방식이다. 컴퓨터가 참조할 데이터베이스가 수백 개, 수백만 개로 많아질수록 인공지능은 단련된다. 이런 행동에 의해 이전에 없던 새로운 ‘창의성’이라는 단어도 나타날 수 있다고 인공지능 연구자들은 말한다. 
그러므로 근래 로봇들이 폭발적으로 똑똑해지면서 수많은 분야에 진출하고 있다는 말은 딥러닝에 힘입은 바 크다. 영화  ‘그녀 Her’에서 주인공 테오도르가 여자의 이름을 물으면서 다음과 같은 대사가 진행된다. 

“뭐라고 부르면 되죠? 이름이 있나요?”
여자는 잠시 뜸을 들인 뒤 대답한다. 
“음… 네, 사만다예요.”
“그 이름은 어디서 얻었나요?”
“사실 방금 제가 혼자 지은 이름이에요.”

여자는 자신이 방금 지은 이름이라고 실토하는데 테오도르의 질문에 컴퓨터인 ‘오에스원(OS1)’은 100분의 2초 만에 ‘아기 이름 짓는 법’이라는 책에 나오는 18만개의 이름 중 하나를 선택해 자신의 이름으로 삼는다. 발음할 때 소리가 좋다는 그럴듯한 이유까지 덧붙여서 말이다. 영화는 이 운영체제를 이렇게 소개한다.

‘단순한 운영체제가 아닙니다. 또 하나의 의식입니다.’

알파고의 딥마인드는 다른 프로그래머들에게 자극을 주어 보다 업그레이드한 개념을 도출시켰다. 프랑스 피에르-마리 퀴리대학과 미국 와이오밍 주립대 공동연구팀은 고장이 나도 자신의 힘으로 대처법을 찾는 인공지능 로봇을 개발했다. 이 로봇은 예기치 못한 상황에 부닥치면 직관적으로 판단해 새로운 환경에 적응한다. 연구팀에서 일부러 다리 한 개를 작동시키지 않자, 나머지 5개의 다리에 적합한 걸음걸이를 찾아 걷는 것이다. 
이를 위해 연구팀은 6개의 다리를 가진 거미 로봇에 진화 알고리즘을 적용시켰다. 거미 로봇의 걸음 방법만 13,000개. 로봇의 다리 한 개나 두 개를 아예 없애거나 일부 다리 길이를 짧게 만들어도 이 로봇은 2분 만에 새로운 걸음법을 찾아낸다. 고장 난 다리를 제외한 나머지 4개의 다리로 뛰는 것도 모자라 점프까지 한다. 이 기술은 길이 62cm의 로봇팔에도 적용되었다. 로봇에게 공을 집어 빈 통에 넣는 임무를 준 뒤, 총 8개의 관절 가운데 일부를 일부러 작동시키지 않았다. 이 로봇은 바로 공을 넣지 못했지만 곧 고장 난 관절을 제외한 나머지 관절 각도를 바꿔 공을 넣는데 성공했다. 이 거미 로봇은 ‘맵엘리트(MAP-Elites)’라는 새로운 유형의 진화 알고리즘이 적용되었다. 쉽게 말해 ‘적자생존’ 경쟁에서 살아남는 방법들이 포함된 것이다. 구글의 딥마인드 기술이 ‘스스로 배우는 시스템’에 대한 것이라면 이보다 한 단계 업그레이드 알고리즘이다. 
이런 놀라운 능력에 모든 사람들이 환호하는 것은 아니다. 스티븐 호킹은 자기 개량 인공지능이 계속 발전한다면 인공지능에 의한 테이크오버(A.I의 지구 장악)도 도래할 수 있다고 경고했다. “컴퓨터 지능이 발전하여 세계를 접수할 위험성이 현실적으로 존재한다. 우리는 인공적인 뇌가 인간의 지능과 대결하지 않고 협동할 수 있게 뇌와 컴퓨터를 직접 연결하는 기술을 최대한 신속하게 개발해야 한다.”
반면에 장 가브리엘 가나시아는 호킹의 주장에 동의하지 않으며 상식과 같은 것들을 로봇이 복제할 수는 없다고 말했다. 알파고가 현실적으로 제기한 이들 문제는 다음호에서 다시 설명한다. 


인사이트코리아, INSIGHTKOREA

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.