什么是 Prompt 工程？为什么同一个大模型，换一种问法输出效果可能天差地别？

Question

吴师兄 · Accepted Answer

答案要点 Prompt 工程是通过设计输入文本（提示词），在不改动模型参数的前提下引导模型给出更好输出的方法 大模型本质是"根据上文预测下文"，prompt 就是那个"上文"；上文变了，模型认为合理的下文自然跟着变 效果差异大的原因：任务描述是否明确、有没有示例、有没有指定角色/格式/推理步骤 常用技巧：明确任务与约束、给示例（few-shot）、让模型分步思考（思维链）、指定输出格式 它是成本最低的优化手段：先调 prompt，不行再考虑 RAG 或微调 核心概念 Prompt 工程（Prompt Engineering）是指通过精心设计给大模型的输入文本——包括任务描述、上下文、示例和输出要求——来引导模型产生期望输出的一门实践，全程不修改模型的任何参数。理解它的关键是理解大模型的工作方式：模型做的事是"给定前文，预测下一个词"，prompt 就是这个前文；前文提供的信息和暗示不同，模型认为"最合理的下文"就完全不同，所以问法不同、结果天差地别。 为什么 prompt 不同，效果天差地别 任务是否说清楚："帮我写点东西"和"写一封 200 字以内、语气正式的请假邮件"，后者把目标、长度、语气都约束住了，模型不用猜 有没有示例：给 2~3 个输入输出示例（few-shot，少样本提示），模型会模仿示例的格式和风格，往往比纯文字描述规则更有效 有没有引导推理：让模型"一步一步分析"（思维链，CoT），复杂问题的正确率通常显著提升 角色和语境："你是一位资深律师"会把模型的用词和严谨程度带向对应语料的风格 实践中的基本套路 一个结构良好的 prompt 通常包含：角色设定 + 任务描述 + 背景材料 + 示例 + 输出格式要求。写完先用小批量样本测试，按 bad case 迭代改写——像调试代码一样调试 prompt。 入门之后，可以往思维链（CoT）、结构化输出、prompt 效果的自动化评估，以及 prompt 与 RAG/微调的选型边界深入。

什么是 Prompt 工程？为什么同一个大模型，换一种问法输出效果可能天差地别？

口语版讲法(约2分钟)

面试官可能的追问

同模块相关题目