langchain二次开发:核心组件详解_models

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

后一修订版
前一修订版
langchain二次开发:核心组件详解_models [2026/04/03 10:38] – 创建 张叶安langchain二次开发:核心组件详解_models [2026/04/03 10:42] (当前版本) – [作业] 张叶安
行 10: 行 10:
  
 **特点**: **特点**:
-* 传统的文本补全接口 +  * 传统的文本补全接口 
-* 通常通过调用 `predict()` 或 `generate()` 方法 +  * 通常通过调用 `predict()` 或 `generate()` 方法 
-* 适合简单的文本生成任务+  * 适合简单的文本生成任务
  
 **代表模型**: **代表模型**:
-* OpenAI: `text-davinci-003`, `gpt-3.5-turbo-instruct` +  * OpenAI: `text-davinci-003`, `gpt-3.5-turbo-instruct` 
-* 开源: `LLaMA`, `Mistral`, `Falcon`+  * 开源: `LLaMA`, `Mistral`, `Falcon`
  
 **使用场景**: **使用场景**:
-* 文本补全 +  * 文本补全 
-* 简单的文本转换 +  * 简单的文本转换 
-* 需要直接控制输入格式的场景+  * 需要直接控制输入格式的场景
  
 <code python> <code python>
行 45: 行 45:
  
 **特点**: **特点**:
-* 基于消息角色的架构(System、Human、AI) +  * 基于消息角色的架构(System、Human、AI) 
-* 更好的对话上下文理解 +  * 更好的对话上下文理解 
-* 现代主流模型的标准接口+  * 现代主流模型的标准接口
  
 **代表模型**: **代表模型**:
-* OpenAI: `gpt-3.5-turbo`, `gpt-4`, `gpt-4-turbo` +  * OpenAI: `gpt-3.5-turbo`, `gpt-4`, `gpt-4-turbo` 
-* Anthropic: `claude-3-opus`, `claude-3-sonnet`, `claude-3-haiku` +  * Anthropic: `claude-3-opus`, `claude-3-sonnet`, `claude-3-haiku` 
-* 开源: `LLaMA-2-Chat`, `Vicuna`+  * 开源: `LLaMA-2-Chat`, `Vicuna`
  
 **使用场景**: **使用场景**:
-* 聊天机器人 +  * 聊天机器人 
-* 多轮对话系统 +  * 多轮对话系统 
-* 需要角色设定的场景+  * 需要角色设定的场景
  
 <code python> <code python>
行 80: 行 80:
  
 **特点**: **特点**:
-* 输出是数值向量,不是文本 +  * 输出是数值向量,不是文本 
-* 捕捉语义信息 +  * 捕捉语义信息 
-* 用于相似度计算和检索+  * 用于相似度计算和检索
  
 **代表模型**: **代表模型**:
-* OpenAI: `text-embedding-3-small`, `text-embedding-3-large`, `text-embedding-ada-002` +  * OpenAI: `text-embedding-3-small`, `text-embedding-3-large`, `text-embedding-ada-002` 
-* 开源: `sentence-transformers`系列+  * 开源: `sentence-transformers`系列
  
 **使用场景**: **使用场景**:
-* 语义搜索 +  * 语义搜索 
-* 文本聚类 +  * 文本聚类 
-* RAG系统中的文档检索+  * RAG系统中的文档检索
  
 <code python> <code python>
行 887: 行 887:
 ==== 核心概念回顾 ==== ==== 核心概念回顾 ====
  
-- **三种模型类型** +  - **三种模型类型** 
-  * LLMs: 文本补全模型 +    * LLMs: 文本补全模型 
-  * Chat Models: 对话模型(最常用) +    * Chat Models: 对话模型(最常用) 
-  * Embeddings: 文本向量模型+    * Embeddings: 文本向量模型
  
-- **主要集成** +  - **主要集成** 
-  * OpenAI: gpt-3.5-turbo, gpt-4系列 +    * OpenAI: gpt-3.5-turbo, gpt-4系列 
-  * Anthropic: Claude 3系列 +    * Anthropic: Claude 3系列 
-  * 本地: HuggingFace, Ollama, llama.cpp +    * 本地: HuggingFace, Ollama, llama.cpp 
-  * 云服务: Azure, Vertex AI+    * 云服务: Azure, Vertex AI
  
-- **关键参数** +  - **关键参数** 
-  * temperature: 控制创造性 +    * temperature: 控制创造性 
-  * max_tokens: 控制输出长度 +    * max_tokens: 控制输出长度 
-  * frequency/presence_penalty: 减少重复+    * frequency/presence_penalty: 减少重复
  
-- **进阶技巧** +  - **进阶技巧** 
-  * 模型降级策略 +    * 模型降级策略 
-  * 智能路由 +    * 智能路由 
-  * 批量请求 +    * 批量请求 
-  * 结果缓存+    * 结果缓存
  
 ==== 选择决策树 ==== ==== 选择决策树 ====
行 930: 行 930:
 ==== 作业 ==== ==== 作业 ====
  
-- 实现一个模型对比工具,对同一个问题比较不同模型的回答 +  - 实现一个模型对比工具,对同一个问题比较不同模型的回答 
-- 为你的应用设计一个智能模型路由系统 +  - 为你的应用设计一个智能模型路由系统 
-- 实现一个带成本预算限制的LLM调用器 +  - 实现一个带成本预算限制的LLM调用器 
-- 测试本地模型的部署和调用+  - 测试本地模型的部署和调用
  
  
  
  

该主题尚不存在

您访问的页面并不存在。如果允许,您可以使用创建该页面按钮来创建它。

  • langchain二次开发/核心组件详解_models.1775183910.txt.gz
  • 最后更改: 2026/04/03 10:38
  • 张叶安