인공지능 기반 챗봇 심심이, 대화 매커니즘과 최종 로드맵 공개

인공지능(AI) 챗봇 기업 ‘심심이(대표 최정회)’가 자체 개발한 동명의 솔루션 심심이의 대화 매커니즘 및 최종 개발 목표를 공개해 주목받고 있다.

심심이는 사용자가 하는 말에 따라 답변을 제시하는 인공지능 챗봇으로, 전 세계 200여개 국가에서 총 81개 언어로 글로벌 서비스되고 있다.

심심이의 인기는 ‘Talkset’이라고 불리는 대화 시나리오 덕분이다. 각각의 대화 시나리오는 사용자들이 가르친 질문 문장(Qtext)과 답변 문장(Atext)의 쌍으로 이뤄지는 것이 특징이다. 즉, 사용자가 질문 문장을 말할 경우 답변 문장으로 답을 하라는 자동 명령이 적용되어 있는 셈이다. 심심이 플랫폼에는 이러한 대화 시나리오가 한국어 기준 900만 개, 전 세계 언어 포함 기준 1억 4천만 개가 자리하고 있다. 국내에서 가장 많은 사용자 발화 패턴을 보유하고 있다고 알려진 카카오뱅크 챗봇 12만 9천개의 70배에 이른다. 이처럼 수없이 많은 대화 세트들이 심심이의 생동감 있는 대화를 이끈다.

챗봇 뒤에는 AICR이라고 불리는 심심이 대화 처리 엔진이 존재하고 있다. 대화 처리 엔진은 수많은 대화 세트들이 쌓여 있는 일종의 저장소로 적절한 응답을 찾는 작업을 수행하는 것이 특징이다. 심심이에게 사용자가 말을 걸면 사용자 문장이 AICR로 전달된다. AICR은 대화 시나리오 저장소에서 전달 받은 사용자 문장과 유사도 등의 관련성이 높은 질문 문장을 찾아 후보군을 만든다. 이어 가장 적절한 하나의 대화 시나리오를 선택한다. 선택된 대화 세트의 답변 문장을 이용하여 대답하는 원리다.

이처럼 심심이는 1억 개의 대화 시나리오를 기반으로 답변하기 때문에 사용자의 여러 대화 주제에 유연한 대응이 가능하다. 더불어 구조가 간단해서 가르치기 쉽다는 점이 장점이다. 간단한 가르치기 방법으로 고가의 딥러닝을 활용하지 않고, 그보다 뛰어난 사람의 두뇌를 지속적으로 활용할 수 있다. BERT나 GPT3 등을 활용한 여러 실험에서 대화 기술은 현세대 딥러닝 기술로 극복할 수 없음이 밝혀지고 있다. 또 빠른 검색이 가능하기 때문에 수많은 대화 시나리오를 온전히 사용할 수 있다.

눈길을 끄는 것은 심심이의 나쁜 말 처리 기술이다. 사람의 두뇌가 직접 처리한 데이터를 모아 자동화하는 흐름이 나쁜말 처리 기술 개발로 고스란히 이어진 셈이다. 심심이의 나쁜말 처리 기술은 네 단계로 발전한 것이 특징이다. 가장 먼저 나쁜 말 신고 제도를 꼽을 수 있다. 채팅 중 심심이가 나쁜 말을 하면 즉각 신고를 할 수 있도록 시스템이 설정돼 있다. 신고 누적 횟수가 많아지면 해당 대회 세트를 나쁜 말로 간주해 필터링하는 것이다.

아울러 문장의 유사성을 이용해 나쁜 말 확률을 계산하는 통계적 추정(STAPX), 크라우드 소싱으로 전수 검사를 진행하는 전수 검사 프로젝트(Mission A), Mission A 데이터를 기반으로 딥러닝을 이용해 자동화를 시키는 과정 등도 적용한 것이 특징이다.

심심이는 이러한 과정을 토대로 향후 나아갈 최종 목표를 공개하며 이목을 집중시키고 있다. 서비스 면에서 심심이가 추구하는 핵심 가치는 사용자의 말에 공감을 할 수 있는 챗봇, 사용자와 관심을 주고받는 챗봇, 사용자와 맥락이 있는 대화를 하는 챗봇이다. 이를 위해 향후 더욱 발전하는 챗봇으로 도약할 수 있도록 연구개발 노력을 경주한다는 각오다.

심심이 최정회 대표는 “핵심 가치를 구현하기 위해서는 핵심 기능이 반드시 갖춰져야 하는데, 이전 대화 및 상황에 맞게 대화할 수 있어야 하고 또 심심이가 대화를 이끌어 갈 수 있어야 한다.”며 “미국의 글로벌 기업이나 단체가 내놓는 기술을 답습하거나 같은 모델로 더 크게만 만들면 될 거라는 생각에 갇혀 있는 흐름이 안타깝다. 

기술이 아닌 가치를 먼저 생각하고 추구할 가치에 맞는 기술을 찾거나 만들어 낼 때 오리지널리티를 가지게 된다. 심심이는 생산자와 사용자가 함께 모델을 향상시켜 나가는 방식을 추구하며 이러한 가치와 기능을 만족하는 심심이를 만들기 위해 지금보다 더 발전된 심심이 모델이 필요한 만큼 꾸준한 개발과 노력을 펼칠 것”이라고 전했다. 

저작권자 © 파이낸셜포스트 무단전재 및 재배포 금지
관련기사