Zero-shot 和 Few-shot 分别是什么意思？在 prompt 里放几个例子，为什么就能改变模型的行为？

Question

吴师兄 · Accepted Answer

答案要点 Zero-shot（零样本）：不给示例，只用文字描述任务，让模型直接作答 Few-shot（少样本）：在 prompt 里放几个"输入→输出"示例，让模型照着模式做 两者都不更新模型参数，靠的是上下文学习（In-Context Learning）能力 例子能生效，是因为模型在预训练中学会了"识别并延续上文中的模式" 示例的质量、格式一致性、标签均衡都影响效果；简单任务 zero-shot 够用，格式复杂或任务含糊时 few-shot 更稳 核心概念 Zero-shot（零样本）指在 prompt 中不提供任何示例、仅靠自然语言描述任务就让模型完成，例如直接说"判断这句话的情感是正面还是负面"；Few-shot（少样本）指在提问前先给出几个完整的输入输出示例，再让模型处理新输入——这两个词里的 shot 就是"示例"的意思。它们背后共同的机制叫上下文学习（In-Context Learning）：模型不改任何参数，只凭上下文里的信息临时"学会"任务。 几个例子为什么能改变行为 大模型的本职是"延续上文最合理的模式"。当上文连续出现三组"输入→输出"对，对模型来说最合理的续写，就是对新输入产出同样模式的输出 示例传递了文字难以说清的信息：输出格式、详略粒度、边界情况怎么处理——示范一遍胜过描述十句 这不是训练：权重没有任何变化，"学到"的东西只存在于当前上下文，会话一换就消失，所以叫"上下文"学习 怎么选、怎么用 | 场景 | 建议 | |------|------| | 任务常见、要求简单 | Zero-shot 即可，省 token | | 输出格式要求严格 | Few-shot，示例统一格式 | | 任务边界模糊、有易错情况 | Few-shot，把易错情况放进示例 | 注意：示例之间格式要一致，标签分布尽量均衡（别全是正面例子），数量通常 2~5 个即可——放太多占上下文窗口，效果还未必更好。 入门之后，可以往上下文学习的机制、示例的动态检索挑选、few-shot 与微调的对比选型深入。

Zero-shot 和 Few-shot 分别是什么意思？在 prompt 里放几个例子，为什么就能改变模型的行为？

口语版讲法(约2分钟)

面试官可能的追问

同模块相关题目