일러스트=이미지투데이.
일러스트=이미지투데이.

인공지능(AI) 기술이 적용된 로봇이 인간의 역할을 빠르게 대체하고 있다. 우리 생활 곳곳에서 제조, 안내, 서빙 등 사람의 역할을 하는 AI로봇을 이제는 심심치 않게 볼 수 있다. 물론 실체는 없지만 홈쇼핑, 금융사 각종 콜센터 등 온라인 대고객 응대채널에서도 인공지능 로봇이 활약하고 있다. 기업들이 일상의 모든 업무를 대화하듯이 처리하는 업무용 AI 서비스를 내놓고 있는 것. 오픈AI에서 개발한 인공지능 언어모델 챗GPT 또한 많이들 경험해 봤을 것이다. AI가 사람이 묻는 질문을 이해하고 대화를 이어나가는 게 놀라울 수준이다.

이처럼 우리는 자연스럽게 AI 삶 속으로 녹아 들어와 있다. 점차 AI기술 고도화로 더욱 섬세한 서비스와 함께 활용 분야도 넓어질 것이다. 물론 사람이 하는 위험한 일을 대체하고, 편리함을 배가할 수 있다는 점 이면에 사람의 일자리가 잠식되고, 스스로 학습하는 AI가 언젠가는 인간의 통제력을 벗어날 수 있다는 우려가 있기도 하다. 대한데일리는 요즘 핫 키워드인 AI기술을 기반으로 챗봇모델 등 이와 관련한 서비스를 개발, 제공하는 ‘디피랩’과 함께 AI에 대해 알아보는 시간을 마련했다. <편집자 주>

챗봇의 가장 기초를 다룬 지난 글에 이어 이번에는 AI챗봇이 어떻게 변화해 왔는지에 대한 흐름과 현 시점에서 챗봇의 한계는 무엇인지에 대해 다루겠습니다.

챗봇이란 인간과 기계사이의 자연스러운 의사소통 즉, 자연어 의사소통을 가능하게 해주는 컴퓨터 프로그램을 뜻합니다.

챗봇의 역사

챗봇의 역사는 1950년부터 시작합니다. 잉글랜드 출신의 컴퓨터 과학의 선구적 인물인 앨런 튜링(Alan Turing)의 “기계가 생각할 수 있는가?(Can machines think?)” 라는 질문에서 시작되었습니다. “문자로 대화를 했을 때, 기계인지 사람인지 구분할 수 없다면 기계가 지능적이다”고 주장한 데에 많은 이들이 스마트 챗봇의 기원이라고 부릅니다.

이때 인공지능의 판별 기준이 기계와 인간 사이의 ‘대화’라는 점을 주목할 필요가 있습니다. 대화란, 사회성을 기반으로 공감과 모방, 반복이 하나의 연상고리처럼 얽혀 있기 때문입니다.

이후 1966년, 미국MIT AI연구소에서 심리치료를 목적으로 ‘일라이자(ELIZA)’를 개발했습니다. ‘ELIZA’는 최초의 지능형 대화엔진으로써 초기 자연어처리 컴퓨터 프로그램입니다. 사용자가 입력한 문장을 분석해 챗봇 대답에서의 키워드를 추출하여 단순 패턴 매칭 기법을 사용해 대화를 구성하는 방식으로 개발되었습니다.

당시 ‘ELIZA’는 의사역할, 사용자는 환자역할이 되어 의사인 ‘ELIZA’에게 찾아와 간단한 질문을 하면 답을 하는 대화인 ‘DOCTOR’로, 실제 일라이자와 대화했던 사람들은 컴퓨터가 아니라 의사와 이야기를 하는 것처럼 많은 이들이 빠져들었고, 엄청난 파장효과를 불러일으키게 됩니다.

챗봇의 발전은 꾸준히 이루어지고 2010년, 애플(Apple)사의 ‘시리(Siri)’가 등장하게 됩니다. ‘Siri’는 음성으로 대화를 주고받으나 대화방식(음성, 문자)에만 차이가 있고 전체적인 대화흐름은 챗봇과 동일한 방식입니다.

지금 아주 친숙한 ‘Siri’는 음성과 챗봇이 결합된 형태로, 사용자가 말을 하면 애플의 서버로 전송한 뒤 텍스트로 변환시킵니다. 이후 인공지능이 사용자가 발화한 텍스트를 분석하여 답변을 하거나 앱을 실행시켜주는 등의 처리를 합니다.

2017년 여러 자연어처리 모델에서 개선이 이루어지면서 자연어이해(NLU; Natural Language Understanding) 뿐만 아니라 자연어생성(NLG; Natural Language Generation)까지 발전해왔습니다.

특히 인간의 집중을 모방해 만들어진 신경망 구조인 어텐션(Attention)신경망에 대한 연구가 이루어진 이래, Attention신경망을 활용한 대규모 언어모델의 발전이 빠르게 이루어지고 있습니다.

텍스트 생성의 대표적인 트랜스포머(Transformer)모델과 Transformer 모델의 한계를 개선한 Transformer XL모델 등이 등장했습니다. 그렇게 지난 2022년 11월, 오픈AI의 챗GPT가 등장하기까지 약 70여 년간 이루어져 온 챗봇의 발전을 되돌아보면 지금의 자연어생성까지 그리 놀랍지만은 않은 것 같기도 합니다.

챗봇의 단계

챗봇의 발전단계는 크게 3단계로 나눌 수 있습니다.

1단계 챗봇은 1개의 채널, 1개의 언어, 간단한 대화 수행 등 주로 메뉴방식으로 처리하는 챗봇으로, 룰베이스 챗봇을 말합니다.(rule-base chatbot: 단순히 정해진 규칙에 따라 응답하는 챗봇)

2단계 챗봇은 멀티채널, 감성파악, 자연어처리 기술을 이용해 훈련된 챗봇으로, 사용자의 예상발화를 학습 데이터로 구축해 매순간 머신러닝을 활용하여 학습하는 챗봇을 의미합니다.

3단계 챗봇은 다자간 채팅, 과거담화의 기억, 자체적인 학습 능력, 주도적인 챗봇 대화, 외부정보망과의 연결을 하는 챗봇을 의미합니다. 즉 지난 대화를 어느 정도 기억하고, 문맥을 이어갈 수 있으며 스스로 학습할 수 있는 챗봇, 바로 GPT3.5 이상의 모델이 이 단계에 해당합니다.

수십년 전부터 지금까지, 인공지능에 대해 끊임없는 연구가 이루어지고 있습니다. 실제로 인공지능과 관련된 많은 이론들을 보면 오래전부터 거론되어 오고 있었습니다.

그간 이론들을 증명할 수 없었던 이유는 방대한 양의 데이터셋을 학습할 수 있는 하드웨어의 성능도 큰 영향이 있었습니다. 이렇게 인공지능이 폭발적으로 발전할 수 있었던 건 방대한 양의 학습셋을 빠르게 돌려볼 수 있는 그래픽 카드 등 하드웨어의 발전이 뒷받침되어 비로소 가능한 일이었습니다.

현 챗봇의 한계

그렇다면 현재 시점에서 가장 대표적인 챗봇이라 할 수 있는 GPT4가 지닌 한계는 무엇일까요?

사용해 보신 분들은 아시겠지만, 거짓정보를 사실처럼 답하는 할루시네이션(Hallucination)현상과 사람처럼 유머러스하고 위트 있는 답을 하기 어렵다는 것이 GPT4모델의 한계입니다.

조금 더 시야를 넓혀 현 초거대 생성형AI의 과제로는 보다 적은 데이터를 활용할 수 있는 데이터의 경량화와 최신화, 그리고 초거대 생성형AI의 윤리적 문제에 대한 해결이 남아있습니다.

앞으로 인공지능의 3대 분야인 이미지를 포함한 영상, 음성, 텍스트의 비약적인 발전이 어떻게 버무려져 더 발전할 수 있을지에 대한 기대, 혹은 걱정이 됩니다.

저작권자 © 대한데일리 무단전재 및 재배포 금지