差别
这里会显示出您选择的修订版和当前版本之间的差别。
| 两侧同时换到之前的修订记录 前一修订版 后一修订版 | 前一修订版 | ||
| langchain二次开发:核心组件详解_models [2026/04/03 10:39] – [2.1.2 Chat Models(对话模型)] 张叶安 | langchain二次开发:核心组件详解_models [2026/04/03 10:42] (当前版本) – [作业] 张叶安 | ||
|---|---|---|---|
| 行 55: | 行 55: | ||
| **使用场景**: | **使用场景**: | ||
| - | * 聊天机器人 | + | |
| - | * 多轮对话系统 | + | * 多轮对话系统 |
| - | * 需要角色设定的场景 | + | * 需要角色设定的场景 |
| <code python> | <code python> | ||
| 行 80: | 行 80: | ||
| **特点**: | **特点**: | ||
| - | * 输出是数值向量,不是文本 | + | |
| - | * 捕捉语义信息 | + | * 捕捉语义信息 |
| - | * 用于相似度计算和检索 | + | * 用于相似度计算和检索 |
| **代表模型**: | **代表模型**: | ||
| - | * OpenAI: `text-embedding-3-small`, | + | |
| - | * 开源: `sentence-transformers`系列 | + | * 开源: `sentence-transformers`系列 |
| **使用场景**: | **使用场景**: | ||
| - | * 语义搜索 | + | |
| - | * 文本聚类 | + | * 文本聚类 |
| - | * RAG系统中的文档检索 | + | * RAG系统中的文档检索 |
| <code python> | <code python> | ||
| 行 887: | 行 887: | ||
| ==== 核心概念回顾 ==== | ==== 核心概念回顾 ==== | ||
| - | - **三种模型类型** | + | |
| - | * LLMs: 文本补全模型 | + | * LLMs: 文本补全模型 |
| - | * Chat Models: 对话模型(最常用) | + | * Chat Models: 对话模型(最常用) |
| - | * Embeddings: 文本向量模型 | + | * Embeddings: 文本向量模型 |
| - | - **主要集成** | + | |
| - | * OpenAI: gpt-3.5-turbo, | + | * OpenAI: gpt-3.5-turbo, |
| - | * Anthropic: Claude 3系列 | + | * Anthropic: Claude 3系列 |
| - | * 本地: HuggingFace, | + | * 本地: HuggingFace, |
| - | * 云服务: Azure, Vertex AI | + | * 云服务: Azure, Vertex AI |
| - | - **关键参数** | + | |
| - | * temperature: | + | * temperature: |
| - | * max_tokens: 控制输出长度 | + | * max_tokens: 控制输出长度 |
| - | * frequency/ | + | * frequency/ |
| - | - **进阶技巧** | + | |
| - | * 模型降级策略 | + | * 模型降级策略 |
| - | * 智能路由 | + | * 智能路由 |
| - | * 批量请求 | + | * 批量请求 |
| - | * 结果缓存 | + | * 结果缓存 |
| ==== 选择决策树 ==== | ==== 选择决策树 ==== | ||
| 行 930: | 行 930: | ||
| ==== 作业 ==== | ==== 作业 ==== | ||
| - | - 实现一个模型对比工具,对同一个问题比较不同模型的回答 | + | |
| - | - 为你的应用设计一个智能模型路由系统 | + | - 为你的应用设计一个智能模型路由系统 |
| - | - 实现一个带成本预算限制的LLM调用器 | + | - 实现一个带成本预算限制的LLM调用器 |
| - | - 测试本地模型的部署和调用 | + | - 测试本地模型的部署和调用 |