챗GPT, 활용법이 중요하다

“쓰레기가 들어가면 쓰레기가 나온다”

디지털 세상은 정말 숨가쁘게 돌아간다. 너무 급속하게 변해 그 속도를 따라가기에도 벅차다. 빅데이터, 메타버스를 익히기도 전에 ‘챗GPT’라는 괴물이 나타나 요즘 어디를 가도 핫이슈다. 챗GPT(Generative Pretrained Transformer)가 무엇이길래 무료 공개 두 달만에 전세계 월간사용자수(MAU, Monthly Active Users) 1억명을 돌파했다. 틱톡이 2년, 페이스북이 3년
이상 걸린 1억 사용자 기록을 엄청나게 추월한 것이다.

MS의 빌 게이츠는 인공지능(AI) 발전이 지금 디지털 세상에서 가장 중요한 혁신이라면서 챗GPT와 같은 생성형 AI가 우리의 세상을 바꿀 것이라고 강조했다. 특히 챗GPT의 등장은 과거 인터넷의 발명만큼 중대한 사건이 될 수 있다고도 한다. 이에 따라 MS는 챗GPT 개발사인오픈AI사와 파트너 관계를 맺고 2019, 2021년에 이어 세 번째로 수년간 총 100억 달러(12조3000억원) 규모의 파트너십을 체결했다.

이런 지속적이고 과감한 투자의 배경에는 AI 연구 진전, AI의 새로운 플랫폼으로 만들겠다는 야망이라는 명분도 있지만 구글 검색엔진에 대항해 쇠락해 가는 MS의 검색 엔진 ‘Bing(빙)’을 부활시키기 위한 최후의 비책이라고 전문가들은 추측한다. 현재 검색엔진의 1인자 구글은 MS의 이런 속셈을 알아채고 새로운 대화형 AI 서비스 ‘바드’를 경쟁 출시하기도 했다. 바야흐로 인공지능 검색 서비스 시장 경쟁이 후끈 달아오르고 있다. 한편 구글의 바드는 챗GPT에 대항해 너무 급하게 출시했는지 파리에서 열린 시연회에서 질문에 오답을 내놓아 주가가 이틀간 10% 이상, 시가총액 150조원이 증발하는 홍역을 치르기도 했다.

“Garbage in, garbage out(GIGO)”

글쓴이는 2021년 2월호 <인사이트코리아>에 “‘이루다’는 왜 본래의 뜻 이루지 못하고 사라졌나”라는 글에서 AI 분야에서 스타트업 기업인 스캐터랩이 세계 최고 수준의 언어능력을 보유한 인공지능 챗봇(chatter robot, 문자 또는 음성으로 대화하는 기능이 있는 컴퓨터 프로그램, 인공지능) ‘이루다’를 출시해 많은 관심을 받았다고 했다.

이루다는 페이스북 메신저를 통해 일상적인 대화를 나눌 수 있는 대화형 AI로 단순히 명령을 수행하는 AI들과는 다르게 사람과 같은 어투로 생동감 있는 대화, 그리고 귀여운 캐릭터로 2020년 6월부터 약 1500명의 베타 테스터와의 시험 대화과정을 거친 후 6개월 만에 정식으로 출시한 서비스였다. 따라서 출시 2주 만에 75만명의 이용자들이 이루다와 대화를 나눴는데 이 과정에서 일부 혐오와 차별에 대한 대화 사례와 개인정보 활용에 대한 문제를 일으켜 중단한 바 있다. 우리나라에서도 인공지능 챗봇 서비스를 출시한 선례가 있다.

OpenAI사는 더 복잡하고 정교한 질문에 대화식으로 답하는 ChatGPT라는 AI를 선보였다. 이는 혁명적인 기술인데 앞서 이루다가 실패한 요소들을 넘어선 질문을 할 때 무엇을 의미하는지 학습하도록 훈련돼 있으며 현재 인간이 컴퓨터와 상호 작용하는 방법을 변형하면서 정보 검색 방법을 바꿀 수 능력도 갖추고 있다.

ChatGPT는 OpenAI가 개발한 GPT-3.5 기반의 대형 언어모델(LLM·large language model) 챗봇이다. 대형 언어모델은 일련의 단어에서 다음 단어를 예측하는 작업을 수행하며 인간 피드백형 강화학습(RLHF·Reinforcement Learning w/Human Feedback)을 사용해 사용자의 지시를 따르고 만족스러운 반응을 생성하는 능력을 만들기 위해 인간 피드백을 사용하는 추가 훈련이다.

즉 ChatGPT 작동 원리의 핵심은 ‘LLM’과 ‘RLHF’라고 할 수 있는데 LLM(대형 언어모델)은 문장에서 다음에 오는 단어를 정확하게 예측하기 위해 방대한 양의 데이터로 훈련되는데 데이터의 양을 늘리면 언어 모델의 수행 능력이 증가한다. 스탠포드 대학 연구에 따르면 GPT-3는 1750억개의 매개 변수를 가지고 있으며 570기가바이트의 텍스트에 대해 교육을 받았다고 한다.

이전 버전인 GPT-2의 15억개 매개변수에 비하면 무려 100배 이상 발전한 광대한 데이터 수치이니 정확한 예측이 가능할 수
밖에 없다.(참고로 구글의 ‘바드’는 람다 LaMDA라는 초거대 인공지능을 토대로 하고 있는데 1370억개에 달하는 매개 변수, 30억개 문서, 11억개 대화를 학습했다고 함)이런 기능을 통해 단락뿐만 아니라 여러 페이지의 콘텐츠 작성도 가능한 것이다. 하지만 이렇게 방대한 LLM도 사용자가 원하는 것을 항상 정확히 이해하지 못하는 한계를 여전히 가지고 있다. 이 한계점을 극복하는 것이 RLHF 훈련이다. 이 훈련을 통해 ChatGPT는 사용자의 지시를 따르고 만족스러운 반응을 생성하는 능력을 만
들어 가고 있는 것이다.

또 하나 이해해야 할 개념이 생성형 인공지능이다. 생성형 인공지능은 사용자의 특정 요구에 따라 결과를 생성해 내는 인공지능을 말하는데 막대한 데이터를 학습해 원본과는 유사하지만 나름대로 독창적인 문장이나 그림을 그릴 수 있다. 이런 생성형 인공지능을 만들려면 그 뒤에 엄청나게 큰 초거대 인공지능이 필요한데 앞에서 언급한 1750억개 매개 변수로 학습한 GPT-3.5를 기반으로 하고 챗GPT는 막대한 토큰(말뭉치)을 학습한 결과다.

이 글을 쓰면서 글쓴이는 챗GPT에게 다음과 같은 질문들을 해 봤다.

# 글쓴이 : 한국의 월간지 <인사이트 코리아> 알아?

# 챗GPT : 네, <인사이트코리아>는 한국에서 출판되는 경제 및 비즈니스 분야의 월간지 중 하나입니다. <인사이트
코리아>는 기업 경영, 금융, 투자, 스타트업, 혁신 등 다양한 분야에 대한 기사를 다룹니다. 또한 경제 전망 및 비즈니스 동향 등에 대한 정보를 제공합니다. 인사이트 코리아는 온라인 및 종이 매체를 통해 구독자들에게 제공되며, 한국의 비즈니스 전문가 및 기업인들에게 매우 인기가 있는 잡지 중 하나입니다.

# 글쓴이 : <인사이트코리아>의 강점은 무엇?

# 챗GPT : <인사이트코리아>의 강점은 다음과 같습니다.

1. 전문적인 분석과 깊이 있는 보도 : <인사이트코리아>는 경제 및 비즈니스 분야에서 폭넓은 경험을 가진 전문기자들이 다양한 주제에 대해 깊이 있는 보도를 제공합니다. 이를 통해 독자들은 최신 동향을 놓치지 않고, 새로운 비즈니스 아이디어를 얻을 수 있습니다.

2. 적극적인 뉴스 취재 : 는 최신 뉴스 챗GPT와 같은 모델은 특정 주제나 문제에 대해 충분한 정보를 제공할 수 있지만 창의적인 해결책을 제안하는 능력은 인간의 창의성에 비해 제한적일 수 있다. 또한 챗GPT가 이해할 수 없는 질문이나 불명확한 질문을 받았을 때는 대답이 불충분하거나 부적절할 수도 있다. 78 Insight Korea ˚ MARCH 2023 를 신속하게 보도하고, 적극적인 뉴스 취재를 통해 독자 들에게 신뢰성 있는 정보를 제공합니다

3. 깊이 있는 분석과 예측 : <인사이트코리아>는 최신 비즈니스 동향을 분석하고, 이를 바탕으로 미래를 예측하는 기사를 다룹니다. 이를 통해 독자들은 미래 비즈니스 동향을 빠르게 파악하고, 이를 바탕으로 비즈니스 전략을 세울 수 있습니다.

4. 다양한 콘텐츠 : <인사이트코리아>는 기사뿐 아니라 인터뷰, 칼럼, 리뷰, 차트 등 다양한 콘텐츠를 제공합니다. 이를 통해 독자들은 다양한 정보를 한곳에서 쉽게 얻을 수 있습니다.

5. 높은 품질의 디자인과 레이아웃 : <인사이트코리아>는 높은 품질의 디자인과 레이아웃을 제공해, 독자들이 쉽게 읽고 이해할 수 있는 매거진을 제공합니다.

# 글쓴이 : <인사이트코리아> 독자 수는?

# 챗GPT: 저는 정확한 <인사이트코리아>의 독자 수를 파악하는 정보를 가지고 있지는 않습니다. 하지만 <인사이트 코리아>는 한국에서 권위 있는 경제 및 비즈니스 매체 중 하나로 인정받고 있으며, 매월 수만 명 이상의 독자들에게 인기를 끌고 있습니다. <인사이트코리아>는 종이 매체뿐 아니라 온라인 매체를 통해서도 독자들에게 서비스를 제공하고 있으며, 온라인 매체를 통해 전 세계 어디서든 접근이 가능합니다. 또한 <인사이트코리아>는 소셜 미디어를 통해 다양한 콘텐츠를 제공하고 있어 많은 사람들이 쉽게 접근할 수 있는 매체 중 하나입니다.

첫 번째와 두 번째 질문에 챗GPT는 놀라운 수준의 응답을 했으나 세 번째 질문에 대해서는 앞의 두 응답에 비해 떨어지는 답변을 했다. 인공지능의 수준이 아직은 인간에 미치지 못함을 보여주는 사례다. 챗GPT와 같은 모델은 특정 주제나 문제에 대해 충분한 정보를 제공할 수 있지만 창의적인 해결책을 제안하는 능력은 인간의 창의성에 비해 제한적일 수 있다. 또한 챗GPT가 이해할 수 없는 질문이나 불명확한 질문을 받았을 때는 대답이 불충분하거나 부적절할 수도 있다.

더 나아가 응답을 무조건 수용한다면 자칫 지식의 왜곡으로도 이어질 수 있어 유의해야 한다. 챗GPT가 대규모의 데이터 학습을 지속적으로 해 스스로 창의적인 생성을 한다고 해도 데이터의 부정확성, 오류 데이터 등을 포함하고 있을 경우 세번째 응답처럼 다소 오버하는 대답을 생성하기도 한다. 데이터가 충분하지 않을 경우 응답 성능이 떨어질 수 있어 챗GPT가 놀라운 수준이지만 무조건적인 신뢰는 금물이다.

디지털 격차보다 더 엄청난 ‘인공지능 격차’

그럼에도 불구하고 지금까지의 단순한 검색 결과를 보여 주던 검색엔진과는 차원이 다른 결과를 보여준다. 예를 들어 논문을 쓰기 위한 자료 제공, 각종 제안서나 기획서 작성을 위한 빠른 문헌, 문서 검토가 필요한 경우, 또 자료 분석 등의 시간 압박을 받는 데이터 검토, 그림에서 보듯이 프로그램(코딩) 데이터까지도 생성해 낸다. 또한 학자들에게는 새로운 심층 연구를, 저자나 기자들에게는 책이나 기사에 더 집중할 수 있는 기회를 주기도 한다.

따라서 챗GPT가 조만간 일반화, 보편화되면 인간들의 일자리가 위태로워질 것이라는 우려를 벌써부터 하고 있다. 직업 자체가 없어지는 것은 아니겠지만 수십 명이 하 던 일을 단 몇 명으로 가능한 시기가 예상외로 빨리 올 수도 있다.

<인사이트코리아>와 같은 미디어도 예외가 아닌 직종이다. 수억의 문장을 학습한 인공지능이 얼마든지 인간의 창의성을 일정 부분 대신할 수 있다. 이미 인공지능 기자가 등장했고 인공지능 소설가는 일본에서 공모전 수상이라는 기록도 있다. 챗GPT가 보고서, 기획서를 사람보다 더 빨리 잘 쓴다는 사실은 이미 공공연하다. 이 밖에도 방대한 양의 법률 데이터를 분석해 친절하게 안내해 주는 법률 서비스, 데이터를 수집하고 데이터 내의 트렌드를 파악하는 시장 조사 분석가나 마케터, 기업 회계 데이터 분석을 하는 회계사 등의 영역에 챗GPT는 깊숙히 들어와 있다. 심지어는 디자인 영역도 예외가 아니어서 인공지능이 대신하고 있다.

이처럼 챗GPT가 매우 뛰어나지만 당장 인간의 능력을 대체하지는 못할 것이다. 그렇다고 먼 미래도 아니다. 하지만 챗GPT를 잘 활용할 줄 아는 사람과 그렇지 않은 사람의 차이는 디지털 격차(digital divide)보다 더 어마어마한 인공지능 격차(AI divide)로 나타날 것이다. 우리나라는 이미 인공지능 분야에서 기술을 인정받고 또한 성과도 거두고 있다. 자율주행차 분야는 세계적 준으로 인정받고 있으며 의학분야에서도 마찬가지다. 이제 사용자 수준에서도 세계적 수준이 돼야 한다.

미래학자인 김홍열 박사는 ‘미디어스’의 기고에서 “몇 달 지나지 않았지만 챗GPT는 이미 여러 분야에서 활용가능해 보인다.(중략) 누구라도 그 결과물을 활용할 수 있다. 이제 중요한 것은 질문하는 방식이다. 챗GPT는 질문하는 사람에 따라 다른 답을 내놓지 않는다. 같은 질문이라면 그 결과도 같다. 중요한 것은 다른 질문을 얻어낼 수 있는 창의성이다. ‘창의적 질문’이중요하다. 이제 우리는 지식의 창조적 활용이 일상화되는 시대, 지식혁명의 시대 초입에 들어섰다”고 했다.

컴퓨터 분야에서 고전처럼 회자되는 말이 있다. “Garbag in, garbage out(GIGO)”. “쓰레기가 들어가면 쓰레기가 나온다”는 뜻이다. 인공지능도 마찬가지다. 목적하는 산출물을 정확하게 사용자가 알고 질문을 해야 훌륭한 응답을 얻을 수가 있다. 인공지능이 만능은 아니다. 인공지능은 프로세스에 의해 응답을 하기 때문에 결함이 있는, 심지어는 터무니없는 질문 데이터가 입력돼도 처리해 준다. 서두에 언급했던 ‘이루다’가 그러했듯 생각하지도 않은 오류의 쓰레기 데이터를 쏟아낼 수가 있다.

인사이트코리아, INSIGHTKOREA

이원섭 IMS Korea 대표 컨설턴트 다른기사 보기