langchain二次开发:核心组件详解_models

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录 前一修订版
后一修订版
前一修订版
langchain二次开发:核心组件详解_models [2026/04/03 10:40] – [2.1.3 Embedding Models(嵌入模型)] 张叶安langchain二次开发:核心组件详解_models [2026/04/03 10:42] (当前版本) – [作业] 张叶安
行 887: 行 887:
 ==== 核心概念回顾 ==== ==== 核心概念回顾 ====
  
-- **三种模型类型** +  - **三种模型类型** 
-  * LLMs: 文本补全模型 +    * LLMs: 文本补全模型 
-  * Chat Models: 对话模型(最常用) +    * Chat Models: 对话模型(最常用) 
-  * Embeddings: 文本向量模型+    * Embeddings: 文本向量模型
  
-- **主要集成** +  - **主要集成** 
-  * OpenAI: gpt-3.5-turbo, gpt-4系列 +    * OpenAI: gpt-3.5-turbo, gpt-4系列 
-  * Anthropic: Claude 3系列 +    * Anthropic: Claude 3系列 
-  * 本地: HuggingFace, Ollama, llama.cpp +    * 本地: HuggingFace, Ollama, llama.cpp 
-  * 云服务: Azure, Vertex AI+    * 云服务: Azure, Vertex AI
  
-- **关键参数** +  - **关键参数** 
-  * temperature: 控制创造性 +    * temperature: 控制创造性 
-  * max_tokens: 控制输出长度 +    * max_tokens: 控制输出长度 
-  * frequency/presence_penalty: 减少重复+    * frequency/presence_penalty: 减少重复
  
-- **进阶技巧** +  - **进阶技巧** 
-  * 模型降级策略 +    * 模型降级策略 
-  * 智能路由 +    * 智能路由 
-  * 批量请求 +    * 批量请求 
-  * 结果缓存+    * 结果缓存
  
 ==== 选择决策树 ==== ==== 选择决策树 ====
行 930: 行 930:
 ==== 作业 ==== ==== 作业 ====
  
-- 实现一个模型对比工具,对同一个问题比较不同模型的回答 +  - 实现一个模型对比工具,对同一个问题比较不同模型的回答 
-- 为你的应用设计一个智能模型路由系统 +  - 为你的应用设计一个智能模型路由系统 
-- 实现一个带成本预算限制的LLM调用器 +  - 实现一个带成本预算限制的LLM调用器 
-- 测试本地模型的部署和调用+  - 测试本地模型的部署和调用
  
  
  
  

该主题尚不存在

您访问的页面并不存在。如果允许,您可以使用创建该页面按钮来创建它。

  • langchain二次开发/核心组件详解_models.1775184013.txt.gz
  • 最后更改: 2026/04/03 10:40
  • 张叶安