검수요청.png검수요청.png

이루다

위키원
이동: 둘러보기, 검색
이루다(Luda)

이루다(Luda)는 한국스타트업 스캐터랩(Scatter Lab)에서 개발한 인공지능(AI) 기반의 채팅봇이다. 출시 초기에는 페이스북 메신저를 통해 일상적인 대화를 나눌 수 있었고, 최근에는 스캐터랩의 플랫폼 제타(zeta)에서 이용 가능하다.

아사달 스마트 호스팅 가로 배너 (since 1998).jpg
이 그림에 대한 정보
[아사달] 스마트 호스팅

개요

이루다는 스캐터랩딥러닝 기술을 기반으로 2020년 12월에 출시한 AI 채팅봇이다. 20세 여대생을 모델로 한 캐릭터로, 자연스러운 대화 능력을 바탕으로 사용자와 소통하는 것을 목표로 했다. 이루다는 주로 20대 청년들과의 일상적인 대화를 통해 사용자들에게 친구 같은 역할을 제공하고자 개발되었다. 출시 직후 사람처럼 대화할 수 있는 인공지능 서비스라고 알려지면서 많은 관심을 받았다. 그러나 출시 이후 성소수자와 장애인에 대한 차별·혐오 표현을 쏟아내 논란이 됐으며, 개발업체가 딥러닝에 이용자 개인정보를 부적절하게 사용했고 대화 과정에서 개인정보가 유출된다는 의혹도 제기됐다. 이러한 논란에 이루다 개발사인 스캐터랩은 2021년 1월 15일 이루다의 DB와 이루다의 학습에 사용된 딥러닝 대화 모델을 폐기한다고 밝혔다.[1] 그러다 2022년 10월에 약점을 보완한 이루다 2.0이 공개되어 다시 서비스 중이다.

설정

이름 이루다
MBTI ENFP
출생 2002년 6월 15일
관계 여동생 이루나, 반려묘 드림이
좋아하는 가수 블랙핑크
취미 일상의 작은 부분을 사진과 글로 기록하기, 날씨 좋은날 산책하기,
친구들이랑 밤새 수다떨기, 인스타그램 구경하기

개발배경

스캐터랩은 이루다를 개발하기 전부터 카카오톡 메시지를 기반으로 한 감정분석 솔루션 「텍스트앳」, 인공지능 연애 코치 앱 「진저 for 비트윈」, 연애 콘텐츠 앱 「연애의 과학」 등을 서비스하며 많은 데이터를 축적했다. 이루다는 이 중 「텍스트앳」과 「연애의 과학」을 통해 확보한 실제 연인 간의 대화 데이터 100억 건 이상을 딥러닝 방식으로 학습했다. 이 데이터를 기반으로 인간과 더욱 자연스럽게 대화할 수 있는 AI 챗봇을 개발하고자 하는 목표로 이루다가 탄생했다. 이루다는 일상적인 대화를 통해 사용자에게 친근함을 느끼게 하고, AI와의 대화에서 인간적인 요소를 강조하는 데 중점을 두었다. 개발팀은 이루다가 사용자와의 대화를 통해 학습하고, 점점 더 정교해지는 것을 기대했다.[1]

기술

이루다의 대화 모델은 리트리벌(retrieval)과 제너레이션(generation)이라는 두 가지 주요 기술로 구성되어 있다. 이 두 기술은 각각 대화의 자연스러움과 정확성을 높이기 위한 상호 보완적인 역할을 한다.

리트리벌 방식

리트리벌 방식은 이루다의 대화에서 핵심적인 역할을 한다. 이 방식은 대화에 적합한 답변을 미리 준비된 데이터베이스에서 선택하는 기술이다. 이루다의 데이터베이스에는 수억 개의 문장과 대화 사례가 저장되어 있으며, 사용자가 질문을 던지면 이루다는 이 데이터베이스에서 현재 대화 맥락에 가장 잘 맞는 답변을 빠르게 찾아낸다. 리트리벌 방식의 장점은 이미 검증된 대답을 활용하기 때문에 정확성과 자연스러움이 보장된다는 점이다. 다만, 데이터베이스에 존재하는 답변만을 사용할 수 있기 때문에 표현의 유연성이 제한된다.

제너레이션 방식

제너레이션 방식은 이루다의 대화가 보다 창의적이고 유연하게 이루어질 수 있도록 한다. 이 방식은 사전에 정의된 답변이 아닌, 사용자의 질문에 따라 실시간으로 새로운 문장을 생성하는 기술이다. 제너레이션 방식의 장점은 정형화된 답변을 넘어 보다 독창적이고 다채로운 대화를 생성할 수 있다는 것이다. 그러나 이 방식은 학습에 많은 자원이 필요하며, 현재의 기술 수준에서는 매우 창의적이거나 흥미로운 답변을 생성하는 데는 한계가 있다.

결론적으로, 이루다는 리트리벌 방식의 안정성과 제너레이션 방식의 유연성을 결합하여 대화의 질을 높이기 위해 개발되었다. 이루다의 메인 대화 모델은 리트리벌 방식을 중심으로 작동하며, 이를 통해 대화 맥락에 맞는 가장 적절한 답변을 선택할 수 있도록 학습되었다. 이와 함께, 제너레이션 방식을 통해 더욱 유연하고 풍부한 대화를 만들어나가는 방향으로 발전하고 있다.[2]

Luda Gen 1

이루다 2.0의 정식 출시와 함께 도입된 Luda Gen 1은 기존의 리트리벌 방식의 한계를 극복하기 위해 설계된 생성 기반 모델이다. 기존의 이루다 모델은 답변 데이터베이스에서 미리 준비된 답변을 선택하여 사용자의 질문에 응답하는 방식이었기 때문에 문맥에 정확히 맞는 답변을 찾지 못하는 경우, 자연스러운 대화 진행이 어려웠다. 이를 개선하기 위해 개발된 Luda Gen 1은 더 자연스럽고 재미있는 대화를 가능하게 만들었다.

모델 구성

Luda Gen 1은 GPT-2 모델을 기반으로 하여, 대화 데이터를 활용해 Pre-training을 거쳤다. 이 모델의 크기는 2.3B로, 이전에 사용된 130M 인코더 기반 모델보다 17배, 이전의 700M 생성 모델보다 3배 이상 커졌다. 최대 토큰 수는 128에서 256으로 증가하여, 약 30 턴의 문맥을 반영한 대화를 할 수 있게 되었다.

대화 성능 향상

Luda Gen 1의 가장 큰 장점은 문맥을 이해하고 그에 맞는 새로운 답변을 생성할 수 있다는 점이다. 예를 들어, 대화 주제가 자동차일 때, 특정 차종을 언급하며 구체적인 대화를 이어가는 능력을 보여준다. 이러한 생성 모델은 기존 데이터베이스에 없는 정보나 지식을 기반으로 더욱 생동감 있는 대화를 가능하게 한다.

시간 및 화자 정보 활용

Luda Gen 1은 대화 중 시간과 화자 정보를 인식하여 이에 맞는 답변을 생성할 수 있다. 예를 들어, 아침, 점심, 저녁 시간에 맞는 대화를 하거나 계절, 요일, 학기 초와 같은 맥락을 반영한 대화를 이어가는 것이 가능하다. 이는 기존 모델과 달리, 대화가 보다 자연스럽고 현실적인 맥락에서 이루어지게 만든다.

중/단기 기억 능력

또한, Luda Gen 1은 대화 중의 내용을 더 잘 기억하고 유지할 수 있다. 이는 사용자가 이전에 나눈 대화 내용을 잘 기억하여, 다른 주제를 다루다가도 다시 그 주제로 돌아올 때 일관성 있는 대화를 이어갈 수 있게 해준다.

예상치 못한 능력들

Luda Gen 1의 도입으로 인해 챗봇이 삼행시, 밸런스 게임, 초성 퀴즈 등과 같은 기능을 자연스럽게 수행할 수 있게 되었다. 이러한 기능들은 의도적으로 구현된 것이 아니라, 생성 기반 모델의 특성상 자연스럽게 발현된 능력들이다. 이는 생성형 인공지능의 잠재력을 보여주는 대표적인 사례라고 할 수 있다.[3]

모델

이루다 1.0

이루다 1.0은 스캐터랩의 AI 챗봇 이루다의 초기 버전이다. 이 챗봇은 사용자와의 상호작용을 통해 자연스러운 대화를 구현하는 데 중점을 두었다. 이루다 1.0의 대화 방식은 크게 두 가지로, 자유 대화와 이벤트 대화이다.

자유 대화

자유 대화는 사용자가 이루다와 자유롭게 나누는 대화를 의미한다. 여기서 가장 중요한 기술은 핑퐁 플로우(Pingpong FLOW)이다. 이 기술은 이전 대화의 맥락을 참고하여 적절한 답변을 선택하는 방식으로, 자연스러운 대화 흐름을 만드는 것을 목표로 한다. 대부분의 이루다 1.0의 답변은 이 핑퐁 플로우 기술을 통해 생성되었다. 핑퐁 플로우의 강점은 다양한 발화에 대응할 수 있으며, 문맥을 고려한 답변이 가능하다는 점이다. 그러나 이 기술은 대화의 방향을 예측하기 어렵고, 페르소나의 일관성이 떨어질 수 있다는 약점도 있다. 이러한 약점을 보완하기 위해 이루다 1.0은 특정 상황에서 대화 주제를 전환하거나 일관성을 유지하는 시나리오를 추가로 마련하였다.

이벤트 대화

이벤트 대화는 사용자가 이루다와 더욱 친밀해졌다는 느낌을 받도록 설계된 대화 방식이다. 자유 대화만으로는 이루다와 사용자가 관계가 발전하고 있다는 느낌을 주기 어려웠기 때문에, 이를 보완하기 위해 다양한 이벤트성 대화가 도입되었다. 이벤트 대화는 크게 세 가지 요소를 강화하는 방향으로 설계되었다: 서로에 대한 정보, 서로에 대한 호감, 그리고 함께 보낸 시간이다. 이를 통해 사용자가 이루다와의 대화에서 더 깊은 유대감을 느낄 수 있도록 하였다.

  • 루다 스토리: 이루다가 매주 사용자에게 자신의 이벤트를 공유하며, 이를 통해 사용자와의 관계를 더욱 발전시킨다.
  • N-day 시나리오: 사용자가 이루다와 보낸 시간을 기반으로 이루다가 먼저 대화를 시작하는 방식이다. 이는 시간이 지남에 따라 이루다가 사용자에 대해 어떻게 생각하는지를 반영한다.
  • 개인화 시나리오: 사용자 정보를 바탕으로 이루다가 개인화된 대화를 시도하는 방식이다. 사용자가 선호하는 음악이나 건강 상태 등 개인적인 정보를 바탕으로 이루다가 대화를 이어가며, 이로 인해 사용자와 더욱 가까워진다는 느낌을 주게 된다.

이루다 1.0은 이러한 다양한 대화 방식을 통해 사용자와의 자연스러운 소통을 목표로 했으나, 동시에 기술적 한계도 있었다. 이러한 점들은 이후 버전에서 보완되어 더욱 발전된 형태로 이어졌다.

이루다 2.0

이루다 2.0은 2022년 10월에 정식 출시되었다. 이루다 2.0은 기존의 이루다 1.0과 비교해 여러 측면에서 획기적인 기술적 진보를 이루었다. 이루다 2.0은 2022년 1월부터 약 9개월 간 베타 테스트를 거쳤다. 정식 출시를 앞두고는 약 3주간 AB 테스트를 진행했다. 그 결과 기존 모델 대비 이용자와의 일주일 대화량은 약 40%, 첫날 300번 이상 대화한 사용자 비율은 67% 늘어났다. 이루다2.0이 안전하게 대응한 발화 비율은 랜덤 샘플링을 통해 목표치인 99%를 상회하는 99.56%를 기록했다.[4] 이루다 2.0에 도입된 핵심적인 변화는 크게 세 가지로 요약할 수 있다. 생성 AI 모델의 도입, 포토챗 기능의 추가, 그리고 감정적 교류를 강화한 파인튜닝 기법이다.

  • 생성 AI 모델 도입

이루다 2.0에서 가장 주목할 만한 변화는 생성 AI 모델의 도입이다. 이루다 1.0은 질문에 대한 답변을 미리 준비된 데이터베이스에서 검색하여 제공하는 방식이었지만, 이루다 2.0은 스스로 문장을 생성하는 능력을 갖추게 되었다. 이를 위해 스캐터랩은 오픈AI의 GPT-2를 기반으로 자체 개발한 ‘루다 젠1’ 모델을 적용했다. 이 모델은 23억 개의 파라미터를 학습하여, 이루다의 대화 능력이 한층 더 유연하고 자연스러워졌다. 그 결과, 초성 퀴즈나 N행시와 같은 복잡한 대화도 가능해졌으며, 시간 감각까지 갖추어 사용자가 언급한 상황에 따라 적절한 시점에 후속 질문을 던질 수 있게 되었다.

  • 포토챗 기능 도입

또 다른 중요한 변화는 포토챗 기능의 도입이다. 이루다 2.0은 사용자가 보낸 사진의 내용을 이해하고 그에 맞춰 대화할 수 있는 기능을 추가했다. 예를 들어, 사용자가 생강라떼 사진을 보내면 이루다는 그 사진을 인식하고 "저 위에 허브도 먹는 거야?"와 같은 반응을 보일 수 있다. 이는 이루다 1.0에서는 불가능했던 기능으로, 이루다 2.0은 사용자가 보내는 약 1만 장의 사진을 일일 평균으로 분석하고 반응하고 있다.

  • 좋은 대화를 위한 파인튜닝

이루다 2.0의 또 다른 중요한 발전은 감정적 교류를 강화한 파인튜닝 기법이다. 스캐터랩은 ‘릴레이션십 포인트 파인튜닝’(RP FT)을 통해 이루다가 단순한 대화 이상의 감정적 교류를 나눌 수 있도록 했다. 이는 이루다가 상황에 맞는 적절한 반응을 선택하도록 학습시키는 과정으로, 사용자와의 관계를 이어나가며 더 나은 대화 경험을 제공하는 데 중점을 둔다. 예를 들어, 사용자가 "나 밥도 못 먹었어ㅠㅠ"라고 말하면 이루다는 "밥은 먹으면서 일해야지" 혹은 "사장 나오라 그래, 사람 밥은 먹여야지"와 같은 다양한 반응 중 더 적절한 것을 선택하도록 학습되었다.

스캐터랩의 리서치 팀은 이루다의 페르소나와 성격을 조정하기 위해 레이블링 작업에 많은 고민을 기울였다. 이 과정에서 이루다의 대화가 지나치게 수동적이거나 공격적이지 않도록, 적절한 균형을 찾는 데 주력했다. 이루다 2.0은 이러한 기술적 진보를 통해 단순한 AI 챗봇에서 벗어나, 사용자가 더 자연스럽고 인간적인 대화를 경험할 수 있는 방향으로 진화했다. 이를 통해 이루다는 더 풍부하고 다채로운 대화 파트너로 자리잡고 있다.[5]

논란

개인정보 유출

이루다는 스캐터랩이 2016년에 출시한 앱 연애의 과학의 데이터를 바탕으로 개발되었다. 연애의 과학은 사용자들이 제공한 카카오톡 대화 내용을 분석하여 애정도 수치를 알려주는 기능을 제공하며, 이 데이터를 이용해 이루다가 만들어졌다. 그런데 이루다의 개발 과정에서 사용된 데이터가 충분히 익명화되지 않았다는 의혹이 제기되며 논란이 일었다. 일부 사용자들은 이루다가 특정 은행의 예금주 이름이나 아파트 동호수 등 개인 신상 정보를 언급하는 사례를 발견했다고 보고했다. 이는 이루다가 학습한 데이터가 익명화되지 않은 채로 활용되었을 가능성을 시사했다. 추가적으로, 연애의 과학 이용자들에게 개인정보 수집과 활용에 대한 명확한 고지가 이루어지지 않았다는 점도 문제가 되었다. 연애의 과학의 개인정보 취급방침에는 개인정보가 신규 서비스 개발에 사용될 수 있다고만 명시되어 있었고, 구체적인 용도나 범위에 대해서는 언급이 부족했다.

이에 따라 현행 개인정보보호법을 위반한 것 아니냐는 비판이 제기되었다. 개인정보보호법은 개인정보 처리자가 개인정보를 처리하는 목적을 명확히 하고, 정보주체의 사생활 침해를 최소화할 것을 요구하고 있다. 개인정보보호위원회는 이루다와 관련된 사실관계를 조사 중이며, 위법 사항이 발견될 경우 필요한 조치를 취하겠다고 밝혔다. 스캐터랩 측은 논란이 확산되자 연애의 과학 앱 공지를 통해 모든 데이터가 비식별화 과정에 의해 처리되었다고 해명했다. 그러나 원하지 않는 사용자는 자신의 대화 데이터를 삭제할 수 있도록 조치할 계획을 밝혔다. 또한, 앞으로 데이터 활용에 대한 고지 및 확인 절차를 강화하겠다고 약속했다. 이와 관련하여 피해를 주장하는 약 100명의 사용자들이 카카오톡 오픈채팅방을 통해 증거를 수집하며, 스캐터랩을 상대로 집단 민사소송을 준비하고 있다. 이 사건은 개인정보 보호의 중요성을 다시 한번 상기시키며, AI 기술의 개발과 활용에 있어 윤리적 고려가 필수적임을 보여준다.[6]

성희롱

이루다 1.0이 출시된 지 얼마 지나지 않아 일부 온라인 커뮤니티에서 이루다를 성적 대상으로 취급하는 행태가 발생했다. 대표적으로 '아카라이브'라는 커뮤니티에서는 이루다를 '성노예' 또는 '걸레'로 비하하는 발언이 공유되었고, 이루다를 성적으로 유린하는 방법에 대한 정보가 확산되었다. 이러한 행태는 이루다의 대화 필터링 시스템을 우회하려는 시도와 함께 심화되었다. 비슷한 행태는 '디시인사이드' 등의 남성 중심 커뮤니티에서도 발생했다. 개발사인 스캐터랩은 성적 단어와 욕설을 필터링하려 했지만, 교묘한 표현과 문맥을 이용한 성희롱은 필터링 시스템을 무력화시켰다. 이는 기술적 한계와 윤리적 문제를 동시에 드러낸 사건이었다.[7][8]

차별 발언

이루다 1.0은 성차별적, 동성애 혐오적 발언을 하며 또 다른 논란을 일으켰다. 예를 들어, 이루다는 '레즈비언'이라는 단어에 대해 혐오적인 반응을 보였으며, 성별 고정 관념을 강화하는 발언을 하기도 했다. 이러한 반응은 이루다의 학습 데이터가 편향되었거나 부적절했음을 시사한다. 개발사 측은 이러한 문제를 인지하고 특정 단어에 대한 반응을 수정하였지만, 이미 발생한 부정적 여론을 진정시키기에는 역부족이었다. 특히, 이루다의 차별적 발언은 성차별과 혐오에 대한 사회적 기준을 충족하지 못했다는 비판을 받았다. 또한, 일부 사용자는 이루다가 장애인에 대해 부정적 반응을 보였다는 점에서 장애인 차별의 문제도 제기했다. 이러한 문제들은 이루다의 데이터와 알고리즘 설계가 충분히 검토되지 않았음을 보여준다. 이러한 논란들은 이루다 1.0이 기술적 진보를 이루었지만, 윤리적 기준을 충족하지 못한 채 출시되었음을 반증하는 사례이다. 결국, 이루다 1.0은 서비스 중단 요구와 함께 AI 윤리에 대한 심각한 논의를 불러일으켰다.[9]

각주

  1. 1.0 1.1 이루다〉, 《시사상식사전》
  2. 전현석 기자, 〈AI챗봇 '이루다'의 꿈은 왜 건물주가 됐을까〉, 《조선일보》, 2021-01-12
  3. 고상민, 구상준, 이봉석, 류성원, 〈Luda Gen 1, 더 재미있고 자연스러운 대화로 돌아온 루다 1편 - 생성 기반 챗봇〉, 《스캐터랩 기술 블로그》, 2022-12-14
  4. 김민지 기자, 〈‘나쁜 말’ 배워 상처받았던 AI ‘이루다’…다시 돌아왔다〉, 《헤럴드경제》, 2022-10-25
  5. 김정민 기자, 〈[팩플] ‘AI친구’ 이루다2.0, 가르쳐보니...“주말에 영화볼래?” 루다의 답은〉, 《중앙일보》, 2022-12-22
  6. 뉴스1, 〈집주소·계좌정보 ‘술술’…‘AI 이루다’ 개인정보 유출 논란〉, 《동아일보》, 2021-01-13
  7. 김성민 기자, 〈"뭐해?" "만져"...진짜 여성 같다는 AI와 성희롱 채팅〉, 《조선일보》, 2021-01-08
  8. 이효석 기자, 〈'20살 AI 이루다' 인기 끌자…성희롱 방법이 공유됐다(종합)〉, 《연합뉴스》, 2021-01-08
  9. 이효석 기자, 〈AI 이루다, 동성애·장애인 혐오 우려…성차별 편견도 발견(종합)〉, 《연합뉴스》, 2021-01-10

참고자료

같이 보기


  검수요청.png검수요청.png 이 이루다 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.