랭체인(LangChain)은 자연어 처리(NLP)와 인공지능(AI) 모델을 활용하여 다양한 애플리케이션을 개발할 수 있도록 돕는 오픈소스 인공지능 개발 프레임워크이다. 주로 대화형 AI, 챗봇, 정보 검색 시스템 등에서 사용되며, 여러 가지 기능을 통합하여 복잡한 작업을 수행할 수 있도록 설계되었다.
랭체인은 거대언어모델(LLM)을 활용한 애플리케이션 개발을 돕는 프레임워크로, 특히 자연어 처리 기반 응용 프로그램을 효과적으로 구축할 수 있도록 다양한 도구와 기능을 제공한다. 이를 통해 개발자는 LLM을 활용한 체인 작업, 데이터 소스 통합, 사용자 맞춤형 대화 설계 등을 간편하게 구현할 수 있다. 랭체인은 다양한 모듈로 구성되어 있어, 사용자가 필요에 따라 특정 기능을 선택하고 조합할 수 있다. 예를 들어, 텍스트 생성, 정보 검색, 데이터베이스 연결 등 다양한 기능을 쉽게 통합할 수 있다. 또한 프롬프트를 효과적으로 관리할 수 있는 기능을 제공한다. 이를 통해 사용자는 AI 모델에 대한 입력을 최적화하고, 더 나은 결과를 얻을 수 있다. API, 데이터베이스, 파일 시스템 등 다양한 데이터 소스와도 통합할 수 있어, 실시간 데이터에 기반한 응답을 생성할 수 있다. 주로 고객지원, 정보제공, 예약 시스템 등 다양한 분야에서 챗봇을 구축하는 데 사용되며, 대량의 데이터에서 필요한 정보를 효율적으로 검색하고 제공하는 시스템 및 데이터 분석 결과를 바탕으로 자동으로 보고서를 생성하는 애플리케이션에 활용될 수 있다.
랭체인은 2022년 10월 해리슨 체이스(Harrison Chase)에 의해 처음 공개되었다. 해리슨 체이스가 머신러닝 스타트업인 로버스트 인텔리전스(Robust Intelligence)에서 근무할 시절, 오픈소스 프로젝트로 공개했다. 이 프로젝트는 깃허브의 수백 명의 기여자의 개선 사항, 트위터의 최신 토론, 프로젝트 디스코드 (소프트웨어) 서버의 활발한 활동, 많은 유튜브 튜토리얼, 샌프란시스코와 런던의 모임을 통해 빠르게 인기를 얻었다. 2023년 4월 랭체인이 법인화되었고 새로운 스타트업은 벤치마크로부터 1,000만 달러의 초기 투자를 발표한 지 일주일 만에 벤처 회사 세쿼이아캐피탈로부터 최소 2억 달러의 가치로 2,000만 달러 이상의 자금을 조달했다.
랭체인은 오픈AI의 챗GPT 출시와 거의 같은 시기에 등장하여 LLM 활용을 혁신하는 중요한 도구로 자리 잡았다. 초기 단계부터 개발자 커뮤니티가 적극적으로 참여하며 프레임워크의 기능을 확장했고, 현재는 다양한 언어 모델과 통합되어 뛰어난 확장성을 자랑한다. 2023년 10월 랭체인은 LCEL(LangChain Expression Language) 프로토타입에서 프로덕션 지원 애플리케이션으로의 전환을 촉진하도록 설계된 배포 도구인 랭서브(LangServe)를 출시했다.[1]
랭체인에는 여러 모듈(module)들이 존재한다. 랭체인의 핵심인 언어 모델과 인터페이스를 지원하는 모델 I/O(Model I/O), 한 모듈의 출력을 다른 모듈의 입력으로 연결하여 여러 구성 요소를 결합할 수 있도록 도와주는 체인(Chain), 일정 기간의 과거 데이터를 저장하고 접속할 수 있도록 지원하는 메모리(Memory) 등이다. 사용자는 이렇게 사전에 설정된 모듈을 적당히 혼합하여 컴포넌트(component)로 만들고, 각 구성요소 간의 파이프라인을 설정해 일관된 단일 애플리케이션을 구축할 수 있다. 여러 개의 모듈이 모여 하나의 구성요소를 만들고, 또 이렇게 모인 구성요소를 체인으로 엮으면서, 마치 차곡차곡 블록을 쌓고 합쳐가듯 최종 애플리케이션을 완성하게 되는 방식이다.[2]
- LLM 체인 구성: 랭체인은 대화형 AI에서 텍스트 생성이나 데이터 분석 등 다양한 작업을 수행하는 체인을 쉽게 구성할 수 있는 기능을 제공한다. 이를 통해 LLM의 결과를 다른 프로세스로 연결하여 보다 복잡한 응용 프로그램을 구축할 수 있다.
- 데이터 소스 통합: 문서, 데이터베이스, API 등 다양한 외부 데이터 소스를 연결하여 검색 및 분석을 수행할 수 있다. 이를 통해 LLM의 정보 활용성을 극대화하며, 예를 들어 특정 데이터베이스에서 정보를 검색해 사용자 질문에 답변하는 시스템을 만들 수 있다.
- 프롬프트 관리: 랭체인은 다양한 상황에서 사용할 수 있는 프롬프트 템플릿과 함께 프롬프트 관리 기능을 제공한다. 이를 통해 사용자는 일관된 프롬프트를 작성하고 유지할 수 있다.
- 대화 컨텍스트 관리: 사용자의 이전 대화 내용을 유지하며 문맥에 맞는 답변을 생성하는 기능을 포함한다. 이를 통해 보다 자연스러운 대화 경험을 제공할 수 있다.
- 사용자 행동 기반 학습: 사용자 피드백과 행동 데이터를 분석하여 결과를 점진적으로 개선하며, 시간이 지나면서 더 정교한 사용자 맞춤형 서비스를 제공할 수 있다.[3]
작동 원리[편집]
- 데이터 소스 연결
랭체인은 PDF, 웹페이지, CSV, 데이터베이스 등 다양한 외부 데이터 소스와 통합을 지원한다. 이를 통해 애플리케이션은 LLM에 전달할 컨텍스트를 구축하고 필요한 데이터를 검색할 수 있다.
- 단어 임베딩
외부 소스에서 가져온 데이터는 벡터 형식으로 변환되어야 하며, 이를 단어 임베딩 모델을 통해 처리한다. 랭체인은 사용자가 선택한 LLM에 적합한 최적의 임베딩 모델을 자동으로 선택한다.
- 벡터 데이터베이스 통합
변환된 임베딩은 벡터 데이터베이스에 저장되어 유사도 검색에 활용된다. 랭체인은 파인콘(Pinecone)과 같은 벡터DB는 물론 메모리 내 배열과도 통합된다.
- 언어모델(LLM) 통합
오픈AI, 코히어, AI21과 같은 주요 상용 LLM부터 허깅페이스에 공개된 다양한 오픈소스 모델까지 폭넓게 지원한다. 이를 통해 개발자는 다양한 언어모델을 실험적으로 활용할 수 있다.[3]
구성 요소[편집]
- 모델 I/O : 프롬프트를 관리하고 공통 인터페이스를 통해 언어모델을 호출하고 모델 출력에서 정보를 추출할 수 있게 한다.
- 체인 : 랭체인의 체인은 여러 모듈과 LLM을 결합하여 데이터 처리 및 결과 도출을 위한 효율적인 워크플로우를 구축한다. 예를 들어, 문서를 요약한 뒤 그에 대한 감정 분석을 수행하는 체인을 생성할 수 있다.
- 에이전트(Agents) : 에이전트는 리액트(ReAct) 프롬프트 기법을 사용하여 동적 작업 수행을 지원한다. 이 모듈은 LLM을 추론 엔진으로 활용해 프롬프트를 행동 계획으로 변환한다.
- 메모리 : LLM은 기본적으로 상태를 저장하지 않지만, 랭체인의 메모리 모듈은 단기메모리 및 장기메모리를 추가하여 대화 기록을 관리한다. 이는 레디스(Redis)와 같은 외부 데이터베이스와 연계하여 더욱 효과적으로 작동한다.
- 콜백 : 개발자는 랭체인의 콜백 시스템을 통해 애플리케이션의 다양한 단계에서 데이터를 로깅하거나 작업을 스트리밍하는 등의 작업을 수행할 수 있다.
- 데이터 연결(Data Connectors) : 외부 문서를 로드하고 단어 임베딩으로 변환한 뒤 벡터 데이터베이스에 저장하는 ETL 파이프라인을 구성할 수 있다.[3]
설치 및 사용 방법[편집]
- 라이브러리 설치
pip install langchain
- 오픈AI API 키 설정 후 모델 초기화
from langchain_openai import ChatOpenAI
model = ChatOpenAI(temperature=0.7)
- 체인 구성
from langchain_core.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate.from_messages([('system', 'Translate to {language}:'), ('user', '{text}')])
참고자료[편집]
- 〈랭체인〉, 《위키백과》
- Janakiram MSV, 〈랭체인(LangChain)이란 무엇인가?〉, 《삼성SDS》, 2023-09-18
- 〈랭체인(LangChain), 그것이 알고 싶다〉, 《이글루》, 2023-11-04
- 이지현, 〈LLM옵스 개발사 랭체인, 2500만 달러 투자 유치〉, 《CIO》, 2024-02-15
같이 보기[편집]
 이 랭체인 문서는 인공지능 모델에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
[접기]인공지능 : 인공지능 서비스, 인공지능 모델 □■⊕, 인공지능 데이터, 인공지능 기술, 인공지능 로봇, 인공지능 기업, 인공지능 인물, 인공지능 역사
|
|
인공지능 모델
|
CAG • FFN • GPT • GRU • ILSVRC • LAM • LMM • MCP • MHSA • NER • RAG • RoBERTa • SARSA • Seq2Seq • SLM • T5 • TTT • VGG넷 • Word2Vec • 거대언어모델(LLM) • 결정트리모델 • 그래프 신경망(GNN) • 다층퍼셉트론 • 단층퍼셉트론 • 레즈넷(ResNet, 잔차신경망) • 랜덤 포레스트 • 르넷(LeNet) • 모바일넷 • 방사신경망 • 버트(BERT) • 베이시안 신경망 • 볼츠만 머신 • 비전 트랜스포머(ViT) • 사이클 GAN • 상태공간모델(SSM) • 생성대립신경망(GAN) • 생성형 AI • 샴 네트워크 • 순환신경망(RNN) • 스타일 GAN • 신경 • 신경기계번역(NMT) • 신경망 • 신경망 구조 • 심층신경망(DNN) • 심층신뢰신경망(DBN) • 알렉스넷 • 앙상블 • 언어모델 • 예측모델 • 이미지넷 • 인공신경망(ANN) • 장단기기억 네트워크(LSTM) • 제한 볼츠만 머신(RBM) • 전방전달신경망(FFNN) • 카페 • 코헨 자기조직 신경망 • 통계적 기계번역(SMT) • 트랜스포머 • 퍼셉트론 • 합성곱 신경망(CNN) • 홉필드 네트워크
|
|
인공지능 알고리즘
|
DDPG • DQN • K-NN 알고리즘 • RMSprop • VAE • VLA • 결정이론적 메타추론 • 결정트리 • 경사하강법 • 관계형 네트워크(RN) • 기울기 • 기울기 소실 • 기울기 폭발 • 뉴런 • 동적 계획법 • 디퓨전 모델 • 랜덤포레스트 • 레이어 정규화 • 마스킹 • 매개변수 • 멀티헤드 셀프어텐션 • 멀티헤드 잠재 어텐션(MLA) • 메타추론 • 모멘텀 • 미니배치 경사하강법 • 반영식 아키텍처 • 배깅 • 배치 경사하강법 • 병렬분산처리(PDP) • 복잡도 • 부스팅 • 분산 샌드박스 • 셀프어텐션 • 수시 알고리즘 • 수퍼얼라인먼트 • 순전파 • 스태킹 • 아담(Adam) • 아담W • 양방향 비고정값 암호 체계(TSID) • 어텐션(주의 메커니즘) • 에이전트체인(CoA) • 역전파 • 역치 • 온도 • 욜로(YOLO) • 은닉층 • 인공지능(AI) • 인코더-디코더 어텐션 • 입력층 • 자비에르 초기화 • 잔차연결 • 잠재 디리클레 할당(LDA) • 잠재의미분석 • 장기의존성문제 • 정렬위장 • 주성분분석(PCA) • 초기가중치 • 초매개변수(하이퍼 파라미터) • 출력층 • 층위 • 텍스트마이닝 • 파이 • 페이스넷 • 학습률 • 허 초기화(He 초기화) • 확률분포 • 확률적 경사하강법
|
|
인공지능 함수
|
GELU 함수 • ReLU 함수(렐루함수) • 가중치 • 가중합 • 결과값 • 계단함수(스텝함수) • 교란변수 • 균등분포 • 다중회귀분석 • 독립변수 • 라쏘 • 로그함수 • 로지스틱 함수 • 로짓변환 • 리키 ReLU 함수 • 릿지 • 맨해튼 거리 • 몬테카를로 방법 • 미분 • 미시함수 • 민코프스키 거리 • 베이즈 정리 • 베이지안 추론 • 볼록함수 • 분산 • 비선형함수 • 빅-오 표기법 • 사인(sin) • 사전확률 • 사후확률 • 삼각함수 • 선형변환 • 선형함수 • 소프트맥스 함수 • 손실 • 손실함수 • 스위시 함수 • 시그모이드 함수 • 안장점 • 에너지 함수 • 연결함수(Concat 함수) • 연속변수 • 오목함수 • 웨이블릿 변환 • 유클리드 거리 • 이산변수 • 입력값 • 전이함수 • 정규분포 • 정규화 • 종속변수 • 체비셰프 거리 • 체인룰 • 최소제곱법 • 출력값 • 코사인(cos) • 코사인 유사도 • 탄젠트(tan) • 탄젠트 함수 • 통계 • 편미분 • 편향 • 평균절대오차 • 평균제곱근오차 • 평균제곱오차 • 푸리에 변환 • 하이퍼볼릭 탄젠트 함수(tanh) • 합성곱 • 확률 • 활성화 함수 • 회귀 • 회귀분석 • 후버손실함수
|
|
인공지능 프레임워크
|
네모 • 랭그래프 • 랭서브 • 랭스미스 • 랭체인 • 상태머신(FSM) • 케라스 • 크루AI • 텐서플로 • 파이토치 • 패스트API
|
|
위키 : 인공지능, 개발, 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인물, 행사, 일반
|
|
[접기]개발 : 프로그래밍, 소프트웨어, 데이터, 솔루션 □■⊕, 보안, 하드웨어, 컴퓨터, 사무자동화, 인터넷, 모바일, 사물인터넷, 게임, 메타버스, 디자인
|
|
솔루션
|
CMS • CRM • DRM • ERP • HMS • LCMS • LMS • PMS • SCM • VOC • 그룹웨어 • 모니터링 솔루션 • 솔루션 • 웹빌더 • 위키 • 지식관리시스템(KMS) • 커스터마이징 • 패키지 소프트웨어 • 패키지 제품
|
|
프레임워크
|
넥스코어 • 노드제이에스(node.js) • 닷넷(.NET) • 라프제이(Laf/J) • 랭그래프 • 랭체인 • 레일즈 • 마이바티스(MyBatis) • 맵리듀스 • 스트럿츠 • 스프링 부트 • 스프링 시큐리티 • 스프링 프레임워크 • 아두이노 • 아이바티스(iBatis) • 아파치 스파크 • 애니프레임 • 앵귤러제이에스(Angular.js) • 에이에스피닷넷(ASP.NET) • 인텔리제이 아이디어(IntelliJ IDEA) • 장고 • 전자정부 표준 프레임워크 • 파이토치 • 패스트API • 페이저블(Pageable) • 플러터(Flutter) • 하둡 • 하이버네이트
|
|
콘텐츠관리시스템
|
iCS • 드루팔 • 아사프로 • 오픈웍스 • 워드프레스 • 윅스 • 줌라 • 지니웍스 • 콘텐츠와이즈 • 홈스토리 • 홍익인간
|
|
홈페이지 솔루션
|
GPKI • LBS • PKI • 게시판 • 공인인증서 • 구글 애널리틱스 • 구글 애드센스 • 그누보드 • 네이버 애널리틱스 • 넷퍼넬 • 달력 • 대댓글 • 댓글 • 덱스트업로드 • 마토모 • 방명록 • 블로그 • 비즈니스 애널리틱스 • 선플 • 설문조사 • 소셜로그인 • 스킨 • 아이핀 • 악플 • 에이스카운터 • 웹로그 • 위젯 • 익스프레스엔진(제로보드XE) • 인증 • 접속통계 • 제로보드 • 지핀(G-PIN) • 카운터 • 커뮤니티 • 테크노트 • 투표 • 파일업로드 • 회원관리
|
|
이메일 솔루션
|
깨비메일 • 메일플러그 • 썬더메일 • 에어즈락메일
|
|
쇼핑몰 솔루션
|
고도몰 • 굿모닝샵 • 메이크샵 • 카페24 쇼핑몰 • 퍼스트몰 • 후이즈몰
|
|
동영상 솔루션
|
1그램플레이어 • 5K플레이어 • ACG플레이어 • KM플레이어 • VLC미디어플레이어 • 곰플레이어 • 디코더 • 와우자 • 웹엑스 • 인코더 • 코덱 • 코디 • 팟플레이어
|
|
검색 솔루션
|
검색 • 검색엔진 • 독크루저 • 레피아 • 루씬 • 마리너 • 미르서치 • 서치포뮬러원 • 아이트리니티 • 엑스텐 • 엑스퍼서치 • 일래스틱서치
|
|
리포팅툴
|
사이냅 • 알메이트차트 • 오즈리포트 • 유비리포트 • 차트 • 크로닉스리포트(리포트 디자이너) • 클립리포트(렉스퍼트)
|
|
BI 솔루션
|
BI • BI매트릭스 • OLAP • 옥타곤 • 코그너스 • 태블로
|
|
연계 솔루션
|
메심 • 비즈위버 • 웹크롤러 • 이크로스 비즈아이 스위트 • 인디고 • 코어브릿지 • 크롤러 • 프로버스
|
|
데이터 솔루션
|
BTL 데이터 인테그레이터 • ETL 솔루션 • 딥솔루션 • 아이샤크 • 이노쿼츠 • 인포매티카 • 탈렌드 • 탈렌드 오픈스튜디오 • 테라스트림
|
|
자료공유 솔루션
|
구글 드라이브 • 나스 • 드롭박스 • 시놀로지 나스 • 원드라이브 • 웹하드
|
|
그룹웨어
|
거래처 관리 • 구글 워크스페이스 • 규정관리 • 근태관리 • 노츠 • 노트 • 다우오피스 • 다이렉트 클라우드 • 더존 솔루션 • 메일플러그 • 브레인스톰 • 비즈메카 • 엘지 유플러스 그룹웨어 • 연락처 • 연락처 관리 • 오피스365 • 온타임 • 웍스모바일 • 위하고 • 인사관리 • 일정관리 • 전자결재 • 지스위트 • 지투웍스 • 코디네이터 • 팀포커스 • 하이웍스 • 핸디 • 헬로윈
|
|
클라우드 솔루션
|
오픈네뷸라 • 오픈스택 • 유칼립투스 • 클라우드스택 • 클라우드잇
|
|
지도 솔루션
|
구글 지도 • 네이버 지도 • 바이두 지도 • 지도 • 지도 API • 카카오 지도 • 티맵
|
|
모바일 솔루션
|
모피어스
|
|
기타 솔루션
|
딥오씨알 • 리무트콜 • 스카우터 • 알서포트
|
|
위키 : 인공지능, 개발, 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인물, 행사, 일반
|
|