🔥알림🔥
① 테디노트 유튜브 - 구경하러 가기!
② LangChain 한국어 튜토리얼 바로가기 👀
③ 랭체인 노트 무료 전자책(wikidocs) 바로가기 🙌

LangChain Expression Language(LCEL) 원리 이해와 파이프라인 구축 가이드

2024년 02월 03일 3 분 소요

이 블로그 글에서는 LangChain Expression Language(LCEL) 원리 이해와 LCEL 에 기반한 파이프라인 구축의 기본을 소개합니다.

사용자 입력부터 모델 응답까지의 단계별 프로세스를 설명하며, 이를 통해 AI 시스템의 작동 원리를 이해할 수 있습니다.

주요내용

🤖 AI 체인 생성: 프롬프트, 모델, 출력 파서를 연결하는 방법
🌐 LangChain Expression Language(LCEL): 구성 요소를 결합하는 방법
🛠 전체 파이프라인 구축: 사용자 입력에서 결과 출력까지의 과정

기본 예시: 프롬프트 + 모델 + 출력 파서

가장 기본적이고 일반적인 사용 사례는 prompt 템플릿과 모델을 함께 연결하는 것입니다. 이것이 어떻게 작동하는지 보기 위해, 각 나라별 수도를 물어보는 Chain을 생성해 보겠습니다.

# API KEY를 환경변수로 관리하기 위한 설정 파일
from dotenv import load_dotenv

# API KEY 정보로드
load_dotenv()

PromptTemplate

from langchain.prompts import PromptTemplate

from_template() 메소드를 사용하여 PromptTemplate 객체 생성

# template 정의
template = "{country}의 수도는 어디인가요?"

# from_template 메소드를 이용하여 PromptTemplate 객체 생성
prompt_template = PromptTemplate.from_template(template)
prompt_template

PromptTemplate(input_variables=['country'], template='{country}의 수도는 어디인가요?')

# prompt 생성
prompt = prompt_template.format(country="대한민국")
prompt

'대한민국의 수도는 어디인가요?'

# prompt 생성
prompt = prompt_template.format(country="미국")
prompt

'미국의 수도는 어디인가요?'

Model(LLM)

ChatOpenAI

OpenAI 사의 채팅 전용 Large Language Model(llm) 입니다.

객체를 생성할 때 다음을 옵션 값을 지정할 수 있습니다. 옵션에 대한 상세 설명은 다음과 같습니다.

temperature

사용할 샘플링 온도는 0과 2 사이에서 선택합니다. 0.8과 같은 높은 값은 출력을 더 무작위하게 만들고, 0.2와 같은 낮은 값은 출력을 더 집중되고 결정론적으로 만듭니다.

max_tokens

채팅 완성에서 생성할 토큰의 최대 개수입니다.

model_name: 적용 가능한 모델 리스트

링크: https://www.teddynote.com/openai/openai-models/
링크: https://platform.openai.com/docs/models

from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    model="gpt-3.5-turbo",
    max_tokens=2048,
    temperature=0.1,
)

Output

from langchain_core.output_parsers import StrOutputParser

output = StrOutputParser()

Chain 생성

LCEL(LangChain Expression Language)

여기서 우리는 LCEL을 사용하여 다양한 구성 요소를 단일 체인으로 결합합니다


chain = prompt | model | output_parser

| 기호는 unix 파이프 연산자와 유사하며, 서로 다른 구성 요소를 연결하고 한 구성 요소의 출력을 다음 구성 요소의 입력으로 전달합니다.

이 체인에서 사용자 입력은 프롬프트 템플릿으로 전달되고, 그런 다음 프롬프트 템플릿 출력은 모델로 전달되며, 그 다음 모델 출력은 출력 파서로 전달됩니다. 각 구성 요소를 개별적으로 살펴보면 무슨 일이 일어나고 있는지 상세히 이해할 수 있습니다.

# 주어진 나라에 대하여 수도를 묻는 프롬프트 템플릿을 생성합니다.
prompt = PromptTemplate.from_template("{country}의 수도는 어디인가요?")
# ChatOpenAI 모델을 초기화합니다.
model = ChatOpenAI(model="gpt-3.5-turbo-1106")
# 문자열 출력 파서를 초기화합니다.
output_parser = StrOutputParser()

# 프롬프트, 모델, 출력 파서를 연결하여 처리 체인을 구성합니다.
chain = prompt | model | output_parser

# 완성된 Chain 을 이용하여 country 를 '대한민국'으로 설정하여 실행합니다.
chain.invoke({"country": "대한민국"})

'대한민국의 수도는 서울입니다.'

# 완성된 Chain 을 이용하여 country 를 '미국'으로 설정하여 실행합니다.
chain.invoke({"country": "미국"})

'미국의 수도는 워싱턴 D.C.입니다.'

전체 파이프라인

절차를 순서대로 살펴보겠습니다.

원하는 주제에 대한 사용자 입력을 {"topic": "양자역학"}로 전달합니다.
prompt 컴포넌트는 사용자 입력을 받아 topic을 사용하여 프롬프트를 구성한 후 PromptValue를 생성합니다.
model 컴포넌트는 생성된 프롬프트를 가져와 OpenAI LLM 모델에 평가를 위해 전달합니다. 모델에서 생성된 출력은 ChatMessage 객체입니다.
마지막으로, output_parser 컴포넌트는 ChatMessage를 받아 이를 Python 문자열로 변환하며, 이는 invoke 메서드에서 반환됩니다.


graph LR

    A(입력: topic=양자역학) --> |Dict| B(PromptTemplate)

    B --> |PromptValue| C(ChatModel)

    C --> |ChatMessage| D(StrOutputParser)

    D --> |String| F(결과)

prompt 또는 prompt | model과 같은 체인의 작은 버전을 테스트하여 중간 결과를 확인하고자 하는 경우에 대해 유의하세요.

이 코드는 prompt 객체와 model 객체를 사용하여 대화형 AI 시스템을 시뮬레이션합니다. 먼저, prompt.invoke 메서드를 호출하여 사용자 입력에 대한 프롬프트 값을 생성합니다. 그런 다음, prompt 객체와 model 객체를 파이프 연산자(|)로 연결하고 invoke 메서드를 호출하여 AI 모델이 생성한 응답을 반환합니다.

이 과정에서 AI 모델은 ‘양자역학’이라는 주제에 대한 쉽게 이해할 수 있는 답변을 생성합니다.

# prompt 를 PromptTemplate 객체로 생성합니다.
prompt = PromptTemplate.from_template("{topic} 에 대해 쉽게 설명해주세요.")

# input 딕셔너리에 주제를 'ice cream'으로 설정합니다.
input = {"topic": "양자역학"}

# prompt 객체의 invoke 메서드를 사용하여 input을 전달하고 대화형 프롬프트 값을 생성합니다.
prompt.invoke(input)

# prompt 객체와 model 객체를 파이프(|) 연산자로 연결하고 invoke 메서드를 사용하여 input을 전달합니다.
# 이를 통해 AI 모델이 생성한 메시지를 반환합니다.
(prompt | model).invoke(input)

AIMessage(content='양자역학은 아주 작은 입자들이 움직이는 규칙을 설명하는 물리 이론입니다. 양자역학에 따르면 입자들은 확률적인 방식으로 움직이며, 위치나 운동 상태를 정확히 예측할 수 없습니다. 또한 입자들은 파동과 입자 둘 다의 성질을 가지고 있어 이해하기 어려운 이론입니다. 양자역학은 아주 작은 스케일에서의 물리 현상을 설명하는 데 사용되며, 원자나 입자물리학 등의 분야에서 중요한 이론으로 활용됩니다.')

# parse_output 메서드를 사용하여 AI 모델이 생성한 메시지 문자열로 출력합니다.
(prompt | model | output_parser).invoke(input)

'양자역학은 아주 작은 입자들인 원자나 분자의 움직임을 설명하는 물리 이론입니다. 이 이론은 전통적인 물리학에서는 설명하기 어려웠던 현상들을 설명할 수 있게 해주는데, 예를 들면 원자 내부의 입자들의 행동이나 빛이 입자처럼 행동하는 현상 등을 설명합니다.\n\n양자역학은 매우 이상한 현상들을 포함하고 있는데, 예를 들면 입자가 동시에 여러 장소에 있을 수 있다거나, 두 개의 입자가 서로 떨어져 있어도 하나의 입자처럼 행동할 수 있다는 것 등이 있습니다. 이런 현상들은 우리가 흔히 경험하는 일상적인 물리 법칙과는 매우 다르기 때문에 이해하기 어려울 수 있지만, 양자역학은 이런 현상들을 수학적으로 설명하고 실험적으로 검증할 수 있게 해줍니다.'

Reference

본 튜토리얼은 LangChain 튜토리얼 노트북 파일을 참조하여 작성하였습니다.

원문 바로가기

Twitter Facebook LinkedIn

LangChain Expression Language(LCEL) 원리 이해와 파이프라인 구축 가이드

기본 예시: 프롬프트 + 모델 + 출력 파서

PromptTemplate

Model(LLM)

Output

Chain 생성

전체 파이프라인

Reference

공유하기

댓글남기기

참고

poetry 의 거의 모든것 (튜토리얼)

LangGraph Retrieval Agent를 활용한 동적 문서 검색 및 처리

[Assistants API] Code Interpreter, Retrieval, Functions 활용법

[LangChain] 에이전트(Agent)와 도구(tools)를 활용한 지능형 검색 시스템 구축 가이드