一、 从提示工程到 RAG
本文介绍了从提示工程到RAG的核心内容。提示工程是应用层核心技术,通过设计Prompt(包括身份设定、背景、参考资料、样例、指令和限制条件)与大语言模型交互,分为Zero-Shot、One-Shot和Few-Shot三种范式。RAG(检索增强生成)通过构建可检索知识库,解决Prompt字数限制和性能下降问题,执行流程包括知识库构建和检索生成。高级技巧强调“双向奔赴”:优化用户Query(如改写上下文依赖、对比型问题)和适配知识库处理(基于场景和技术理解,构建多维度专属知识库),协同提升检索精度和答案质量。
课程核心框架
- 提示词:应用层核心技术,核心目标为设计合适的 Prompt
- RAG:当前最流行的 AI 技术,同时存在较多应用难点
- RAG 高级技巧:实现 Query 与知识库的双向适配(双向奔赴)
一、提示词(Prompt)
1.1 核心定位
- Prompt 是与大语言模型(LLM)交互的唯一方式。
- 大模型应用层的所有设计与开发,最终目的都是为了向 LLM 传递适配的 Prompt,实现预期的模型输出。
思考疑问:不同大模型对同一 Prompt 的响应效果差异的核心原因是什么?如何针对特定模型优化 Prompt?
1.2 Prompt 内容分类
对 Prompt 进行结构化拆分,可分为六大核心模块:
- 身份设定:定义模型的角色(如店员、答疑助手、分析师)
- 背景设定:明确交互的场景、前提条件
- 参考资料:为模型提供回答的依据和信息来源
- 样例:给出回答的示范,引导模型匹配输出格式 / 逻辑
- 指令:明确要求模型完成的具体任务
- 限制条件:划定回答的边界(如字数、逻辑、内容范围)
1.3 按样例数量的分类(Prompt 工程核心范式)
根据 Prompt 中是否包含样例、样例数量多少,分为三类核心范式,是实现模型 上下文学习(In-Context-Learning) 的关键:
- Zero-Shot(零样本):Prompt 中不包含任何样例,让模型直接根据指令完成任务
- One-Shot(单样本):Prompt 中包含1 个样例,为模型提供基础的输出参考
- Few-Shot(少样本):Prompt 中包含 少量(2 个及以上) 样例,让模型通过样例学习输出逻辑
思考疑问:Few-Shot 中样例的数量是否存在最优值?过多的样例是否会导致模型输出偏差?
1.4 实战关键问题
如何动态在 Prompt 中添加样例,适配不同的用户问题场景(如课件中妈妈挑选 Switch 和 PS5 的导购场景),是 Prompt 工程的实战重点。
思考疑问:动态添加样例时,如何平衡样例的相关性和 Prompt 的长度,避免超出模型输入限制?
二、RAG(检索增强生成)
2.1 核心定义
RAG 即Retrieval-Augmented Generation(检索增强生成),核心逻辑为:模型在回答用户问题前,先执行一轮内部知识搜索,再结合检索到的信息生成答案。
2.2 与上下文学习的关联
将参考资料、样例直接嵌入 Prompt 中让模型学习的方式,属于In-Context-Learning(上下文学习),是 RAG 的基础形式,但该形式存在明显局限性。
2.3 基础形式的核心痛点
- 大模型对 Prompt 的字数存在硬性限制,无法嵌入大量参考资料;
- 当 Prompt 内容过多时,模型的性能会严重下降,回答的准确性、逻辑性降低。
思考疑问:不同大模型的 Prompt 字数限制阈值是多少?内容过载导致性能下降的技术原理是什么?
2.4 RAG 的核心解决思路
通过构建可检索的知识库,替代直接在 Prompt 中嵌入大量信息,核心两步:
- 构建可检索的知识库,对知识进行标准化处理;
- 模型接收到用户问题后,先调用知识库检索相关信息,再结合检索结果生成答案。
2.5 RAG 的核心执行流程

思考疑问:文档分块的粒度如何确定?分块过细或过粗对检索和生成效果有何影响?
2.6 核心定位总结
RAG 是当前全世界最流行的 AI 技术,但因检索精度、知识处理、Prompt 增强等环节存在较多技术难点,也被称为AI 领域最大的坑。
三、RAG 的高级技巧:双向奔赴
核心目标:实现用户 Query 的优化与知识库的适配处理双向配合,提升 RAG 的检索精度和答案生成质量,避免单一优化某一方导致的效果不佳。
3.1 Query 改写技巧(优化用户问题侧)
检索 Query 默认直接使用用户提出的原始问题,但原始问题存在明显问题:
- 用户的自然语言表达方式会增加检索难度;
- 多轮对话场景下,原始问题的上下文依赖会导致检索逻辑崩溃。
3.1.1 核心改写原则
汇总上下文所有信息,提炼用户的核心诉求作为新的检索 Query,替代原始问题。
3.1.2 常见的用户问题类型及改写要点
针对不同类型的用户问题,需针对性提炼核心诉求,常见类型包括:
- 上下文依赖型:如 “保修多久?”“还有其他颜色吗?”(需结合前文确定指代的产品 / 对象)
- 对比型:如 “哪个保修时间更长?”(需明确对比的主体和维度)
- 模糊指代型:如 “都支持无线充电吗?”(需明确 “都” 对应的具体对象)
- 多意图型:如 “有几个颜色?尺码齐全吗?大概什么时候能到货?”(需拆分 / 汇总多个核心诉求)
- 反问型:如 “这不会也得等一个月吧?”(需转化为正向的疑问,如 “该产品的到货时间是多久?”)
- 条件型:如 “有没有 500 元以下的、适合女生用的那种?”(需保留所有限定条件并明确核心需求)
思考疑问:多轮对话中,如何高效汇总上下文信息,避免改写后的 Query 遗漏关键信息?
3.2 知识库处理技巧(优化知识存储侧)
实现与 Query 改写的双向配合,核心从场景理解和技术理解两个维度对知识库进行精细化处理,具体要求:
- 对场景的理解:精准预判目标场景下用户的所有问题类型和常见提问方式,让知识库匹配用户的提问习惯;
- 对技术的理解:
- 对用户问题进行标准化分类;
- 为不同类型的问题匹配专属的知识库;
- 针对不同知识库的特性,设计个性化的知识处理方式(如分块、向量化、存储策略)。
3.3 实战应用案例:课程答疑助手
以 “课程答疑助手” 为例,需构建多维度的专属知识库,实现不同问题的精准检索,包括:
- coze 平台知识库:适配平台操作相关问题;
- 课程视频知识库:适配课程内容、知识点相关问题;
- 微信群问答知识库:适配学员常见的个性化问题、实操问题。
思考疑问:多知识库并存时,如何设计检索的优先级和融合策略,提升检索效率?
3.4 核心结论
RAG 的效果优化并非单一的 Query 改写或单一的知识库建设,而是需要实现Query 侧与知识库侧的双向适配、协同优化,即 “双向奔赴”,才能实现检索精度和答案质量的大幅提升。