LangChain封装自定义的LLM:从基础到实战
创作时间:
作者:
@小白创作中心
LangChain封装自定义的LLM:从基础到实战
引用
CSDN
1.
https://blog.csdn.net/hugo_lei/article/details/137411885
本文将介绍如何使用LangChain封装自定义的LLM(大语言模型)。通过一个简单的"hello world"示例,展示如何实现自定义的LLM类。
背景
想基于ChatGLM3-6B用LangChain做LLM应用,需要先了解下LangChain中对LLM的封装。本文以一个hello world的封装来示例。
LangChain中对LLM的封装
继承关系:BaseLanguageModel——》BaseLLM——》LLM
LLM类
简化和LLM的交互
_call抽象方法定义
@abstractmethod
def _call(
self,
prompt: str,
stop: Optional[List[str]] = None,
run_manager: Optional[CallbackManagerForLLMRun] = None,
**kwargs: Any,
) -> str:
"""Run the LLM on the given prompt and input."""
BaseLLM类
BaseLLM类其实有两个abstract方法:_generate方法和_llm_type方法
注意:LLM类仅实现了_generate方法,未实现_llm_type方法
@abstractmethod
def _generate(
self,
prompts: List[str],
stop: Optional[List[str]] = None,
run_manager: Optional[CallbackManagerForLLMRun] = None,
**kwargs: Any,
) -> LLMResult:
"""Run the LLM on the given prompts."""
@property
@abstractmethod
def _llm_type(self) -> str:
"""Return type of llm."""
BaseLanguageModel类
和语言模型交互的基础抽象类。
"""Abstract base class for interfacing with language models.
All language model wrappers inherit from BaseLanguageModel.
"""
LangChain封装自定义的LLM
封装一个MyLLM类,继承自LLM类,实现最简单的hello world功能。
需要实现两个函数:
- _llm_type方法
- _call方法
from typing import Any, List, Optional
from langchain.llms.base import LLM
from langchain_core.callbacks import CallbackManagerForLLMRun
class MyLLM(LLM):
def __init__(self):
super().__init__()
@property
def _llm_type(self) -> str:
return "MyLLM"
def _call(self, prompt: str, stop: Optional[List[str]] = None, run_manager: Optional[CallbackManagerForLLMRun] = None, **kwargs: Any) -> str:
if len(prompt) < 10:
return prompt
else:
return prompt[:10]
mllm = MyLLM()
print(mllm._llm_type)
# mllm._llm_type = "haha" _llm_type该属性是无法被修改的
print(mllm("hello world!"))
关于@property
@property常用在实例方法前,目的在于把该实例方法转换为同名的只读属性,方法可以像属性一样被访问。
@property的作用主要有两个:
- @property装饰的只读属性不能被随意篡改
- 相比于类的普通属性,@property装饰的只读属性可以添加逻辑语句,例如:
@property
def enable(self):
return self.age > 10
参考
- LLM大语言模型(八):ChatGLM3-6B使用的tokenizer模型BAAI/bge-large-zh-v1.5-CSDN博客
- LLM大语言模型(七):部署ChatGLM3-6B并提供HTTP server能力
- LLM大语言模型(四):在ChatGLM3-6B中使用langchain_chatglm3-6b langchain-CSDN博客
- LLM大语言模型(一):ChatGLM3-6B本地部署-CSDN博客
热门推荐
丹田降脂丸的副作用和禁忌是什么
基于YOLOv8的运动目标检测与追踪系统设计
氢燃料电池技术及发展
Cache —— 局部性原理和工作原理
舵机技术深度解析,让机器人更智能
放鱼苗前如何调整水质?
贾静雯个人资料:一位耀眼明星的生平与事业
一种竹叶蛙跳跃研究平台及测量方法与流程
吃西红柿能美白皮肤?想多了,不过……
丹田内养修炼:炼好丹田小太极,生龙活虎享余生!
杭州市直辖的历程与现状
适合管理岗培训的项目有哪些
UNO纸牌游戏规则详解:从入门到精通
世界三大信用评级机构,金融界核弹级的存在
掌握煮水饺的绝招:告别粘连、散烂和生熟不均
在 Mac 上安装 PHP 指南
智能电表如何用大数据守护用电安全
雷电将军与丘丘人的合作技巧之深入探究与全面解析
软件产品需要生产许可证吗?
剖腹产的健康宣教
理解和熟悉正整数和负整数的底层存储格式和运算
茅茅虫论文写作:论据选用六大原则
什么是强迫行为
DeepSeek技术社区:DeepSeek多模态搜索模型的本地部署与优化指南
山西左权:红色文化赋能乡村振兴示范区建设
中国贫困地区儿童营养不良状况显著改善,为全球提供范例
优化在规划确立之后,从执行的角度把目标执行到位
贵州“金字塔”火了!谁的鬼斧神工?
购买股票的正确方法是什么?这种方法在不同市场环境下的效果如何?
模运算详解:从基础概念到实际应用