一、从提示工程到 RAG

课程核心框架

提示词：应用层核心技术，核心目标为设计合适的 Prompt
RAG：当前最流行的 AI 技术，同时存在较多应用难点
RAG 高级技巧：实现 Query 与知识库的双向适配（双向奔赴）

一、提示词（Prompt）

1.1 核心定位

Prompt 是与大语言模型（LLM）交互的唯一方式。
大模型应用层的所有设计与开发，最终目的都是为了向 LLM 传递适配的 Prompt，实现预期的模型输出。

思考疑问：不同大模型对同一 Prompt 的响应效果差异的核心原因是什么？如何针对特定模型优化 Prompt？

1.2 Prompt 内容分类

对 Prompt 进行结构化拆分，可分为六大核心模块：

身份设定：定义模型的角色（如店员、答疑助手、分析师）
背景设定：明确交互的场景、前提条件
参考资料：为模型提供回答的依据和信息来源
样例：给出回答的示范，引导模型匹配输出格式 / 逻辑
指令：明确要求模型完成的具体任务
限制条件：划定回答的边界（如字数、逻辑、内容范围）

1.3 按样例数量的分类（Prompt 工程核心范式）

根据 Prompt 中是否包含样例、样例数量多少，分为三类核心范式，是实现模型 上下文学习（In-Context-Learning） 的关键：

Zero-Shot（零样本）：Prompt 中不包含任何样例，让模型直接根据指令完成任务
One-Shot（单样本）：Prompt 中包含1 个样例，为模型提供基础的输出参考
Few-Shot（少样本）：Prompt 中包含 少量（2 个及以上） 样例，让模型通过样例学习输出逻辑

思考疑问：Few-Shot 中样例的数量是否存在最优值？过多的样例是否会导致模型输出偏差？

1.4 实战关键问题

如何动态在 Prompt 中添加样例，适配不同的用户问题场景（如课件中妈妈挑选 Switch 和 PS5 的导购场景），是 Prompt 工程的实战重点。

思考疑问：动态添加样例时，如何平衡样例的相关性和 Prompt 的长度，避免超出模型输入限制？

二、RAG（检索增强生成）

2.1 核心定义

RAG 即Retrieval-Augmented Generation（检索增强生成），核心逻辑为：模型在回答用户问题前，先执行一轮内部知识搜索，再结合检索到的信息生成答案。

2.2 与上下文学习的关联

将参考资料、样例直接嵌入 Prompt 中让模型学习的方式，属于In-Context-Learning（上下文学习），是 RAG 的基础形式，但该形式存在明显局限性。

2.3 基础形式的核心痛点

大模型对 Prompt 的字数存在硬性限制，无法嵌入大量参考资料；
当 Prompt 内容过多时，模型的性能会严重下降，回答的准确性、逻辑性降低。

思考疑问：不同大模型的 Prompt 字数限制阈值是多少？内容过载导致性能下降的技术原理是什么？

2.4 RAG 的核心解决思路

通过构建可检索的知识库，替代直接在 Prompt 中嵌入大量信息，核心两步：

构建可检索的知识库，对知识进行标准化处理；
模型接收到用户问题后，先调用知识库检索相关信息，再结合检索结果生成答案。

2.5 RAG 的核心执行流程

思考疑问：文档分块的粒度如何确定？分块过细或过粗对检索和生成效果有何影响？

2.6 核心定位总结

RAG 是当前全世界最流行的 AI 技术，但因检索精度、知识处理、Prompt 增强等环节存在较多技术难点，也被称为AI 领域最大的坑。

三、RAG 的高级技巧：双向奔赴

核心目标：实现用户 Query 的优化与知识库的适配处理双向配合，提升 RAG 的检索精度和答案生成质量，避免单一优化某一方导致的效果不佳。

3.1 Query 改写技巧（优化用户问题侧）

检索 Query 默认直接使用用户提出的原始问题，但原始问题存在明显问题：

用户的自然语言表达方式会增加检索难度；
多轮对话场景下，原始问题的上下文依赖会导致检索逻辑崩溃。

3.1.1 核心改写原则

汇总上下文所有信息，提炼用户的核心诉求作为新的检索 Query，替代原始问题。

3.1.2 常见的用户问题类型及改写要点

针对不同类型的用户问题，需针对性提炼核心诉求，常见类型包括：

上下文依赖型：如 “保修多久？”“还有其他颜色吗？”（需结合前文确定指代的产品 / 对象）
对比型：如 “哪个保修时间更长？”（需明确对比的主体和维度）
模糊指代型：如 “都支持无线充电吗？”（需明确 “都” 对应的具体对象）
多意图型：如 “有几个颜色？尺码齐全吗？大概什么时候能到货？”（需拆分 / 汇总多个核心诉求）
反问型：如 “这不会也得等一个月吧？”（需转化为正向的疑问，如 “该产品的到货时间是多久？”）
条件型：如 “有没有 500 元以下的、适合女生用的那种？”（需保留所有限定条件并明确核心需求）

思考疑问：多轮对话中，如何高效汇总上下文信息，避免改写后的 Query 遗漏关键信息？

3.2 知识库处理技巧（优化知识存储侧）

实现与 Query 改写的双向配合，核心从场景理解和技术理解两个维度对知识库进行精细化处理，具体要求：

对场景的理解：精准预判目标场景下用户的所有问题类型和常见提问方式，让知识库匹配用户的提问习惯；
对技术的理解：
- 对用户问题进行标准化分类；
- 为不同类型的问题匹配专属的知识库；
- 针对不同知识库的特性，设计个性化的知识处理方式（如分块、向量化、存储策略）。

3.3 实战应用案例：课程答疑助手

以 “课程答疑助手” 为例，需构建多维度的专属知识库，实现不同问题的精准检索，包括：

coze 平台知识库：适配平台操作相关问题；
课程视频知识库：适配课程内容、知识点相关问题；
微信群问答知识库：适配学员常见的个性化问题、实操问题。

思考疑问：多知识库并存时，如何设计检索的优先级和融合策略，提升检索效率？

3.4 核心结论

RAG 的效果优化并非单一的 Query 改写或单一的知识库建设，而是需要实现Query 侧与知识库侧的双向适配、协同优化，即 “双向奔赴”，才能实现检索精度和答案质量的大幅提升。