검수요청.png검수요청.png

감정분석

위키원
이동: 둘러보기, 검색

감정 분석(Sentiment analysis, 오피니언 마이닝 또는 감정 AI)은 자연어 처리, 텍스트 분석, 전산언어학, 생체인증을 사용하여 감정 상태와 주관적 정보를 체계적으로 식별, 추출, 정량화 및 연구하는 것이다. 감정분석은 마케팅에서 고객 서비스, 임상의학에 이르기까지 다양한 애플리케이션을 위한 리뷰 및 설문 조사 응답, 온라인 및 소셜 미디어, 의료 자료 등 고객의 소리 자료에 널리 적용된다. RoBERTa와 같은 심층 언어 모델이 등장하면서 더 어려운 데이터 도메인(예: 작성자가 일반적으로 자신의 의견/감정을 덜 명시적으로 표현하는 뉴스 텍스트)도 분석할 수 있다.

감정분석의 중요성[편집]

고객 리뷰를 통해 보다 객관적인 결과 제공

최신 인공 지능(AI) 감정 분석 도구는 기업이 리뷰와 순고객추천지수(NPS)에서 개인적인 편견을 걸러내고 브랜드, 제품 및 서비스에 대한 보다 객관적인 의견을 얻을 수 있도록 도와준다. 예를 들어, 고객이 리뷰에 부정적인 의견과 긍정적인 의견을 모두 표현한 경우, 리뷰를 평가하는 사람은 긍정적인 글로 넘어가기 전에 리뷰를 부정적인 것으로 분류해 버릴 수 있다. AI로 강화된 감정 분류는 객관적인 방식으로 텍스트를 정렬하고 분류하는 데 도움이 되므로 이런 일이 발생하지 않으며, 두 가지 감정이 모두 반영된다.

비즈니스 인텔리전스 프로그램의 확장성 향상

감정분석을 통해 방대한 양의 비정형 데이터를 보유한 기업은 데이터를 빠르고 효율적으로 분석하고 의미 있는 인사이트를 추출할 수 있다. 디지털 채널을 통해 고객이 생성하는 텍스트의 양이 많아지면 직원 팀은 정보에 압도되기 쉽다. 강력한 클라우드 기반의 AI 강화 고객 감정 분석 도구는 조직이 불필요한 리소스를 낭비하지 않고도 고객 데이터에서 비즈니인텔리전스를 대규모로 제공할 수 있도록 지원한다.

실시간 브랜드 평판 모니터링 수행

오늘날의 기업은 위기 상황에서 신속하게 대응할 수 있어야 한다. 사실이든 아니든 소셜 미디어에 피력된 의견은 수년에 걸쳐 구축한 브랜드 평판을 파괴할 수 있다. 강력한 AI 강화 감정 분석 도구는 경영진이 브랜드를 둘러싼 전반적인 감정을 모니터링하여 잠재적인 문제를 발견하고 신속하게 해결할 수 있도록 도와줍니다.스 인텔리전스를 대규모로 제공할 수 있도록 지원한다.

감정분석 작동 방식[편집]

감정 분석은 인간과 유사한 방식으로 텍스트를 이해하도록 컴퓨터 소프트웨어를 훈련시키는 자연어 처리(NLP) 기술을 적용한 것이다. 분석은 일반적으로 최종 결과를 제공하기 전에 여러 단계를 거친다.

전처리

전처리 단계에서 감정 분석은 텍스트의 핵심 메시지를 강조하기 위해 키워드를 식별한다.

  • 토큰화는 문장을 여러 요소나 토큰으로 나눈다.
  • 표제어 추출은 단어를 어근 형태로 변환한다. 예를 들어, am의 어근 형태는 be이다.
  • 정지 단어 제거는 문장에 의미 있는 가치를 더하지 않는 단어를 걸러낸다. 예를 들어, with, for, at, of는 정지 단어이다.
키워드 분석

NLP 기술은 추출된 키워드를 추가로 분석하고 감정 점수를 제공한다. 감정 점수는 감정 분석 시스템에서 감정적 요소를 나타내는 측정 척도이다. 분석 목적으로 텍스트로 표현된 감정에 대한 상대적 인식을 제공한다. 예를 들어, 연구원은 고객 리뷰를 분석할 때 만족도를 나타내는 데 10을 사용하고 실망을 나타내는 데 0을 사용한다.

감정분석 접근 방식[편집]

감정 분석은 자연어 처리(NLP) 및 머신 러닝(ML) 기술을 사용하여 컴퓨터 소프트웨어가 인간과 유사한 방식으로 텍스트를 분석하고 해석하도록 훈련시킨다. 소프트웨어는 규칙 기반 또는 ML이라는 두 가지 접근 방식 중 하나를 사용하거나 두 가지를 결합한 하이브리드 접근 방식을 사용한다. 각 접근 방식에는 장점과 단점이 있다. 규칙 기반 접근 방식은 거의 실시간으로 결과를 제공할 수 있지만 ML 기반 접근 방식은 적응성이 더 뛰어나고 일반적으로 더 복잡한 시나리오를 처리할 수 있다.

규칙 기반 감정 분석

규칙 기반 접근 방식에서 소프트웨어는 작성자의 의도를 설명하는 단어 그룹 또는 어휘를 기반으로 텍스트 블록의 특정 키워드를 분류하도록 학습된다. 예를 들어 긍정적인 어휘의 단어에는 '저렴한', '빠른', '잘 만들어진'이 포함될 수 있고, 부정적인 어휘의 단어에는 '비싼', '느린', '형편없는'이 포함될 수 있다. 그런 다음 소프트웨어는 분류기에서 긍정적 또는 부정적 어휘의 단어를 스캔하고 사용된 단어의 양과 각 범주의 감정 점수를 기반으로 총 감정 점수를 집계한다.

머신러닝 감정 분석

머신러닝(ML) 접근 방식을 사용하면 텍스트에 나타나는 단어와 나타나는 순서를 사용하여 텍스트 블록의 감정을 측정하도록 소프트웨어를 훈련하는 데 알고리즘이 사용된다. 개발자는 감정 분석 알고리즘을 사용하여 소프트웨어에게 인간과 유사하게 텍스트의 감정을 식별하는 방법을 교육한다. ML 모델은 입력되는 데이터를 통해 계속 '학습'하기 때문에 '머신러닝'이라는 이름이 붙었다. 다음은 가장 일반적으로 사용되는 몇 가지 분류 알고리즘이다.

  • 선형 회귀: 일련의 특성(X)을 기반으로 값(Y)을 설명하는 통계 알고리즘이다.
  • 나이브 베이즈: 베이즈 정리를 사용하여 텍스트 블록의 단어를 분류하는 알고리즘이다.
  • 서포트 벡터 머신: 두 그룹 분류 문제를 해결하는 데 사용되는 빠르고 효율적인 분류 알고리즘이다.
  • 딥 러닝(DL): 인공 신경망으로도 알려진 딥 러닝은 여러 알고리즘을 연결하여 인간의 뇌 기능을 모방하는 고급 기계 학습 기술이다.
하이브리드 접근 방식

텍스트 분석에 대한 하이브리드 접근 방식은 ML과 규칙 기반 기능을 결합하여 정확성과 속도를 최적화한다. 이 접근 방식은 정확도가 높지만 다른 두 가지 방법보다 시간과 기술 능력 등 더 많은 리소스가 필요하다.

감정 분석의 다른 유형[편집]

감정분석 도구를 구축하는 데 사용되는 다양한 접근 방식 외에도 조직이 필요에 따라 선택하는 다양한 유형의 감정 분석이 있다. 가장 널리 사용되는 세 가지 유형인 감정 기반 분석, 세부 분석, 측면 기반 감정분석(ABSA)은 모두 극성, 즉 텍스트 조각으로 전달되는 전체적인 느낌을 측정하는 기본 소프트웨어의 능력에 의존한다.

일반적으로 텍스트의 극성은 긍정적, 부정적 또는 중립적으로 설명될 수 있지만, 예를 들어 '매우 긍정적' 또는 '매우 부정적'과 같은 하위 그룹으로 텍스트를 더 세밀하게 분류함으로써 일부 감성 분석 모델은 더 미묘하고 복잡한 감정을 식별할 수 있다. 텍스트의 극성은 텍스트의 감정을 측정하는 데 가장 일반적으로 사용되는 매트릭이며 소프트웨어에서 1부터 100까지의 수치 등급으로 표현된다. 0은 중립적인 감정을 나타내고 100은 가장 극단적인 감정을 나타낸다.

가장 널리 사용되는 세 가지 유형의 감정 분석은 다음과 같다.

세분화(등급)

세분화된 감정 분석 또는 등급이 매겨지는 감정 분석은 텍스트를 다양한 감정과 표현되는 감정 수준으로 그룹화하는 감정 분석의 한 유형이다. 그런 다음 소비자 웹사이트가 고객 만족도를 평가하기 위해 별점을 사용하는 것과 유사하게 0에서 100까지의 등급으로 감정을 평가한다.

측면 기반 감정 분석(ABSA)

측면 기반 감성 분석(ABSA)은 텍스트 본문에서 분석 중인 것의 범위를 기업이 분석하고자 하는 제품, 서비스 또는 고객 경험의 특정 측면으로 조사 대상의 범위를 좁힌다. 예를 들어, 저가 여행 앱에서는 새로운 사용자 인터페이스가 얼마나 직관적인지 파악하거나 고객 서비스 챗봇의 효과를 측정하는 데 ABSA를 사용할 수 있다. ABSA는 조직이 자사 제품이 어떻게 고객 기대에 미치지 못하거나 성공을 거두고 있는지를 더 잘 이해할 수 있도록 지원한다.

감정 감지

감정 감지를 사용한 감정 분석은 텍스트를 작성할 때의 마음 상태와 의도를 포함하여 텍스트 본문 이면에 있는 개인의 심리적 상태를 이해하려고 한다. 이는 세분화된 방법이나 ABSA보다 더 복잡하며 일반적으로 사람의 동기나 감정 상태를 더 깊이 이해하는 데 사용된다. 감정 감지는 긍정적, 부정적 및 중립적인 것과 같은 극성을 사용하는 대신 좌절감, 무관심, 불안감, 충격과 같은 특정 감정을 텍스트 본문에서 식별할 수 있다.

감정분석의 사용 사례[편집]

조직은 다양한 이유로 감정 분석을 수행한다. 다음은 널리 사용되는 몇 가지 사용 사례이다.

고객 지원 개선

지원팀은 감정 분석을 사용하여 커뮤니케이션의 분위기를 정확하게 반영하는 보다 개인화된 응답을 고객에게 제공한다. 감정 분석을 사용하는 AI 기반 챗봇은 신속하게 문제를 해결하고 즉각적인 도움이 필요한 고객을 우선적으로 처리할 수 있다. 고객 지원 포럼에 배포된 ML 알고리즘은 긴급도에 따라 주제를 우선시하는데 도움이 되며 특정 제품이나 기능에 대한 불만을 나타내는 고객 피드백도 식별할 수 있다. 이러한 기능은 고객 지원 팀이 요청을 더 빠르고 효율적으로 처리하고 고객 경험을 개선하는 데 도움이 된다.

더 강력한 브랜드 입지 구축

소셜 미디어 모니터링에 감정 분석을 활용하면 브랜드는 온라인에서 브랜드에 대해 언급되는 내용과 그 이유를 더 잘 이해할 수 있다. 신제품 출시가 순조롭게 진행되고 있는지에 대한 상황 파악을 예로 들 수 있다. 매출을 모니터링하는 것도 진행 상황을 알 수 있는 한 가지 방법이지만 이해관계자에게는 그림의 일부만 보여줄 수 있다. 고객 리뷰 사이트와 소셜 미디어의 감정 분석을 통해 제품에 대해 표현되는 감정을 파악하면 제품이 고객에게 어떻게 받아들여지고 있는지 훨씬 더 깊이 이해할 수 있다.

시장 조사 실시

기업은 자체 제품뿐만 아니라 시장 전반에서 감정 분석 도구를 활용함으로써 조직은 트렌드를 파악하고 새로운 성장 기회까지 파악할 수 있다. 경쟁사의 새로운 캠페인이 예측한 것처럼 고객에게 반향을 일으키지 않거나 유명인이 소셜 미디어 게시물에 제품을 사용하여 수요를 높였을 수 있다. 감정 분석 도구를 사용하면 뉴스 기사, 온라인 리뷰 및 소셜 미디어 플랫폼에서 트렌드를 파악하고 의사 결정권자가 조치를 취할 수 있도록 실시간으로 알림을 보낼 수 있다.

감정 분석의 과제[편집]

감정 분석과 이를 뒷받침하는 기술이 빠르게 성장하고 있지만, 이는 여전히 비교적 새로운 분야이다. 2020년에 발행한 리우 빙(Liu Bing)의 '감정 분석(Sentiment Analysis)'에 따르면 이 용어는 2003년 이후로 널리 사용되고 있을 뿐이다. 여전히 배우고 개선해야 할 부분이 많이 있다. 가장 일반적인 단점과 과제는 다음과 같다.

컨텍스트 부족

컨텍스트는 텍스트 블록에서 어떤 감정이 표현되고 있는지 이해하는 데 중요한 요소이며, 감성 분석 도구가 자주 실수하는 요소이기도 하다. 예를 들어 고객 설문조사에서 고객은 "앱의 어떤 점이 마음에 들었나요?" 라는 질문에 두 가지 답변을 할 수 있다. 첫 번째 대답은 '기능성'이고 두 번째 대답은 'UX'일 수 있다. 예를 들어 "앱의 어떤 점이 마음에 들지 않았나요?"와 같이 질문이 달랐다면, 단어 자체를 바꾸지 않고도 고객 응답의 의미가 바뀐다. 이 문제를 해결하려면 알고리즘에 고객이 응답한 질문의 원래 컨텍스트를 제공해야 하는데, 이는 사전 또는 사후 처리로 알려진 시간 소모적인 전략이다.

아이러니와 풍자 사용

훈련의 수준이나 범위에 관계없이 소프트웨어는 텍스트 본문에서 아이러니와 풍자를 올바르게 식별하는 데 어려움을 겪는다. 누군가가 비꼬거나 아이러니한 말을 할 때는 목소리 톤이나 표정을 통해 전달되는 경우가 많고 사용하는 단어에는 뚜렷한 차이가 없기 때문이다. 예를 들어, "굉장하다. 또 천 달러짜리 주차 위반 딱지라니- 딱 필요한 거야."라는 문구를 분석할 때 감정 분석 도구는 "굉장하다"라는 단어를 사용했기 때문에 표현되는 감정의 본질을 오해하고 긍정적으로 분류할 가능성이 높다.

부정

부정은 문장에서 의미의 반전을 전달하기 위해 부정어를 사용하는 경우이다. 예를 들어, "신발이 저렴하다고는 할 수 없다"라는 문장을 생각해 보자. 즉, 신발이 비싸거나 적어도 적당한 가격일 가능성이 높지만 감정 분석 도구는 이러한 미묘한 차이를 놓칠 가능성이 높다는 뜻이다.

관용적 언어

예를 들어 "Let’s not beat around the bush(빙 둘러말하지 말자)" 또는 "Break a leg(행운을 빌어)"와 같은 일반적인 영어 문구의 사용과 같은 관용적 언어는 감정 분석 도구와 그 기반이 되는 ML 알고리즘에 종종 혼란을 야기한다. 소셜 미디어 채널이나 제품 리뷰에서 위와 같은 인간 언어 문구를 사용할 경우, 감정 분석 도구는 이를 잘못 식별할 수 있다. 예를 들어 "Break a leg"를 고통스럽거나 또는 슬픈 것으로 잘못 식별하거나 완전히 놓칠 수 있다.

감정 분석 도구 및 라이브러리[편집]

NLTK (Natural Language Toolkit)

파이썬 기반의 자연어 처리 라이브러리로, 감정 분석을 포함한 다양한 텍스트 처리 기능을 제공한다. 다양한 텍스트 전처리 도구와 감정 사전이 포함되어 있어 감정 분석을 시작하기에 적합하다.

TextBlob

파이썬에서 쉽게 사용할 수 있는 자연어 처리 라이브러리로, 감정 분석을 간단하게 수행할 수 있다. 사용법이 간단하여 감정 분석 초보자에게 추천된다.

VADER (Valence Aware Dictionary for Sentiment Reasoning)

소셜 미디어 텍스트의 감정 분석에 특화된 도구로, 트위터페이스북 같은 짧은 텍스트의 감정 분석에 유용하다. 감정사전과 규칙 기반 접근 방식을 결합하여 감정을 예측한다.

Hugging Face의 Transformers

최신 NLP 모델인 BERT, GPT, RoBERTa 등을 포함하고 있는 파이썬 라이브러리로, 감정 분석뿐만 아니라 다양한 자연어처리 작업에 사용할 수 있다. 딥러닝 모델을 쉽게 학습시키고 사용할 수 있는 인터페이스를 제공한다.

감정분석 솔루션[편집]

감정 분석 솔루션은 다양한 산업에서 고객 피드백, 소셜 미디어 모니터링, 브랜드 평판 분석 등에 활용된다. 대표적인 솔루션들은 머신 러닝(ML) 및 자연어 처리(NLP) 기반으로 텍스트의 감정을 자동으로 분석하는 기능을 제공한다.

대부분 클라우드 기반 API 또는 온프레미스(설치형) 솔루션으로 제공되며, 강력한 감정 분석 기능과 확장성을 제공한다.

Google Cloud Natural Language API

텍스트에서 감정(긍정, 부정, 중립) 분석 문장 및 단어 단위 감정 점수 제공 문서 분류, 개체 분석, 구문 분석 기능 포함

AWS Comprehend
  • 머신 러닝 기반 감정 분석 서비스
  • 다국어 지원
  • 주제 분석(Topic Modeling) 및 개체 추출(Entity Recognition) 기능 포함
IBM Watson Natural Language Understanding
  • 감정 분석, 개체 인식, 문서 분류 등 다양한 기능 제공
  • API 기반 감정 분석 기능 제공

맞춤형 모델 훈련 가능

Microsoft Azure Text Analytics
  • 감정 분석, 키워드 추출, 언어 감지 기능 제공
  • 다국어 지원
  • 클라우드 및 온프레미스 환경에서 사용 가능
Lexalytics
  • 소셜 미디어, 리뷰, 고객 피드백 분석을 위한 강력한 솔루션
  • 감정 강도 분석(Emotion Intensity), 주제 모델링 기능 포함
MonkeyLearn
  • AI 기반 감정 분석 솔루션
  • 사용자 정의 모델 학습 가능
  • Slack, Google Sheets 등 다양한 툴과 연동 가능

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 감정분석 문서는 인공지능 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.