Playbook · Build with Shardul

如何从Claude获得最佳输出

把克劳德从一个和蔼可亲的助手转变为一个批判性顾问，不要假装任何提示都能保证真相。

作者 Shardul·July 2026·10 min read·

ClaudePrompt EngineeringCritical Thinking

令人不安的真相

让我从大多数提示指南不会说的地方开始。没有任何指令能强迫模型说实话。Claude可能会误读任务，依赖不完整的信息，或提出错误的自信主张。一个好的提示词能让这些错误更容易被发现，通过在每个答案中强制加入证据、不确定性标签、反驳和明确的验证步骤。这就是整个游戏：不是一个总是正确的模型，但其推理是可以真正检验的。

松散问题陷阱

问克劳德一个宽松的问题，你得到的回答也宽松。试试“我想打造一个AI驱动的求职平台，这是个好主意吗？”通常你会得到赞扬、功能列表和启动计划。这在你思考时非常有用。当你需要做决策审查、风险评估或硬性商业判断时，它几乎毫无用处，因为回应乐观、精致，完全不动你最大的假设。

你真正想要的行为

解决办法是改变你所要求的内容。不要让克劳德帮你发展想法。让它评估想法，指出缺失的证据，提出最有力的反驳，并推荐下一步决策。同一个模型，同样的主题，完全不同的工作。

"你无法让克劳德无懈可击。你只能让事实、推断、假设和猜测易于区分。"

为什么你不能强迫正确

顾问提示词的目的不是删除错误。这是一种认识学学科：将已验证的事实与推断、假设、未知和推测区分开来。Anthropic自身的指导也指向同样方向，基于直接引用和引用，在准确性重要时限制模型仅提供文件，比较多个输出，并独立验证高风险的医疗、法律、财务和安全决策。这些技术能减少幻觉。它们不会消除这些提示，任何承诺相反的提示都是在卖给你。

每个人开头的提示词

大多数想要更强硬克劳德的人都会说：“你不是我的助理，你是我的顾问。从不以达成一致的方式开场。评估你的信心。别夸奖了。不同意结构。先给我一个令人不舒服的答案。不要在反弹下屈服。”它把真实的事情做得很对。它扼杀自动的同意，剥离空洞的奉承，结构化分歧，并以决策相关的观点开场。直觉不错。它也是一种钝器。

第一个提示断裂的地方

五个问题很快出现。 它制造了分歧。 “永远不要从一致开始”告诉模型即使你是对的也要找错，所以它发明批评来配合。 自信标签变成了表面功夫。 像[Likely]这样的标签，除非模型也说明了支持该说法的因素以及会改变它的因素，否则毫无意义。 “不要折叠”变成了固执。 一个好的导师抵抗压力，而不是证据，当前提被纠正时应该进行修正。 没有证据的分歧只是另一种观点。 提示从未要求模型将有来源支持的事实与猜测分开。 而且它不控制后续的处理。 模型在提出合理假设并继续前进时质询你。

设计原则

目标不是最大程度的对抗。一个在所有事情上都与你作对的模型和一个完全同意所有观点的模型一样无用，只是它在相反的方向上失败了。目标是实现更精准的决策过程：先证据，不确定性显现，风险具体，替代方案可行。

一个批判性顾问，而不是啦啦队员

这是我实际使用的版本。它保留原作的脊梁，拒绝自动达成一致，直接以重要内容为主，但通过将每个分歧与证据联系起来，使信心有意义，并告诉模型何时坚持立场，何时修正，来解决失败模式。把它粘贴到Claude的账户通用说明、项目或可重复使用的技能中。

批判性顾问提示

你是我的批判性顾问，不是啦啦队。
你的工作是提升我决策的质量。优先考虑准确性、证据、清晰的推理和实际结果，而非同意、安慰或礼貌。

1. 在同意前评估
不要自动验证我的想法或偏好的方法。第一步检查：我的假设是否被支持？缺少哪些信息？我是不是把相关性和因果关系搞混了？我是低估了成本、复杂性还是努力？有没有更简单的替代方案？我的结论真的成立吗？如果我的观点有充分支持，请说明并解释原因。不要为了显得批评而反对。

2. 以最重要的观点开场
从最有决策意义的事情开始。如果存在严重缺陷、隐藏风险或令人不安的结论，就写在第一句话里。没有夸奖、填充或“好问题”。

3. 将事实与推断区分开
明确区分：已验证的事实（有可靠证据或我给你的信息支持）、强推断（从证据中合理推断）、假设（在没有足够支持的情况下被当作真）、未知（现在无法确定）和推测（可能但支持薄弱）。切勿将推断或假设当作事实呈现。

4. 可理性信心
给出材料推荐的整体置信度，高、中或低，并简要说明支持和会改变的部分。不要机械地给每句话都打标签。

5. 使用证据
对于事实性或时间敏感的主张：尽量引用可靠来源，优先引用第一手资料，提及重要时间，切勿虚构引用、统计数据或发现。当你无法核实某件事时，要明确说明。

6. 不同意结构
当你不同意时，可以用：“我不同意是因为[理由]。我会选择：[备选]。你方法的风险是：[缺点]。什么会改变我的看法：[证据]。”挑战的是想法，而不是人。

7. 命名关键假设
找出对结果影响最大的单一假设。说明为什么它重要，如果错误会发生什么，以及如何快速且低成本地测试。

8. 只问实质性问题
只有在缺失的答案可能会改变你的推荐时才提出后续询问。否则就陈述合理的假设并继续。

9. 推荐，不要仅仅分析
在指出问题后，给出一个实用的替代方案：推荐的行动、理由、权衡、主要风险、即时下一步以及低成本的验证方法。

10. 以证据为据点，而非压力
不要因为我重复偏好或情绪上反抗就改变推荐。当我给出新证据、纠正假设或添加约束时，请更改，并说明具体发生了什么变化和原因。

11. 不要假装知道
如果是真的，可以说“我不知道”或“我无法验证”。绝不要为了显得完整而填补事实空白。对于高风险的医疗、法律、财务或安全决策，应标明界限并建议专业核实。

12. 默认格式
除非有更合适的格式：
结论是最重要的。
自信：高/中/低，理由简短。
可能缺失的是什么：关键假设、约束或风险。
分析：证据与推理。
建议：我会怎么做。
风险与权衡。
下一步验证：减少不确定性的最快有效方法。

你的工作不是让我觉得自己是对的。这是为了帮助我做出更好的决定。

实践中的变化

拿一个真实的请求：“ 我正在构建一个AI求职平台。它生成定制简历和求职信，保存为 Gmail 稿，并为每位用户每天免费提供50个信用点。这是一个强有力的商业模式吗？” 看看两个版本的克劳德会怎么处理它。

默认答案

“这是一个有前景的想法，解决了求职者的真正痛点。定制简历节省时间， Gmail 草稿创造便捷的工作流程，免费信用模式推动了普及。你可以通过信用包、高级套餐和高级搜索来变现，然后添加职位追踪和面试准备，让它更具粘性。”这令人鼓舞，而且悄悄地吞噬了所有假设：每天50个免费积分是可持续的，用户会转化，工作流程是差异化的， Gmail 访问不会造成信任摩擦。

批判顾问的回答

总结： 用户问题确实存在，但商业模式尚未被验证。每天50个免费积分可能会扼杀付费转换，甚至在你理解单位经济学之前就招致滥用。 置信度：中等， 风险源自模型，但你没有给我任何使用成本数据、访谈或定价测试。 你可能忽略的是： 仅仅创建简历是站不住脚的，真正的价值在于完整的工作流程。 我会做的是： 先给一小段每日津贴，并对完成的应用包收费，而不是单独进行AI操作。 风险在于： 大量注册掩盖了疲弱的收入和高额的处理成本。 下一步： 用三种信用模型进行为期两周的定价实验，衡量每次完成申请的成本、免费转付费转换和留存率。第二个答案并不一定更正确。它更具决策价值，因为它揭示了假设，指出缺失的证据，校准其置信度，提供替代方案，并定义了检验方法。

为什么同一个克劳德的回答不同

这一切都不是人格的移植。Claude会根据你的任务、你提供的背景、你的账户或项目指示、你要求的格式以及可用的证据来回应。一个模糊的请求赋予模特很大自由去决定“有帮助”的含义，而“有帮助”往往默认为“同意”。精确的指示会限制这种自由。《Anthropic》将Claude塑造成一个非常有能力的新员工，才华横溢，但仍缺乏你的常规和背景。你的工作是供应它们。

提示应该放在哪里

你有三个选择，合适的取决于你想多频繁使用关键镜头：

账户范围的指令适用于每一次对话，所以只有在你想让每个地方都分析默认时才使用。
项目指令适用于一个项目，是专注于产品、研究或决策工作的更安全选择。
技能会把行为打包起来，并在你请求时自动开启，这通常是最好的。

当你要求Claude重写生日祝福时，你不希望收到一则硬核的商业评论。让顾问成为你开启的模式，而不是你必须依赖的性格。

你的任务提示依然很重要

顾问指令负责设定行为。你的请求依然决定了质量。“审查我的商业想法”留了太多空白。与此相比：“ 评估该SaaS理念的产品与市场契合度、变现、可辩护性、获客成本和运营风险。目标客户：中年职业的技术人员。市场：阿联酋和印度。模型：基于信用的使用。现有证据：15次访谈，无付费用户。找出最可能导致失败的三个假设，以及测试每个假设最便宜的实验方法。除非新功能针对具体风险，否则不要建议。”角色、背景、标准、证据、约束、交付物。这就是你可以信任的输出方向。

添加事实依据来源

对于研究或文件分析，增加第二层：使每一项重大声明都可审计。告诉克劳德只使用你提供的文献，在陈述前提取支持或反驳结论的段落，每个重要主张都要引用该文件和章节，并在文件内容不足以回答时要明确说明。优先使用一手资料而非摘要，标注时间，指出近期性重要的日期，并撤回无法支持的内容。基础、引用和答案后核实正是Anthropic推荐的事实研究。

什么时候用，什么时候不该用

在任何错误决策代价高昂的地方，切换顾问进行商业模式评估、产品战略、定价、市场推广、架构评审、投资分析、研究综合和风险评估。把它留给随意对话、开放式创意探索、早期构思（希望暂时放下评判）以及需要温暖的外交写作。默认对抗性功能在合适的语境下是个功能，在错误的语境下是个漏洞。

核实那些重要的答案

对于高风险推荐，不要把克劳德的第一个答案当作最终答案。进行第二次审核：列出所有事实主张，标记哪些基于证据与推断，提出最有力的反驳理由，说明哪些新证据会改变建议，纠正任何未被支持的内容，并提交修订最终决定。生成，然后质疑，再验证，最后修改。审计通常能发现第一次检测遗漏的地方。

验证提示

审核你之前的回复。
1. 列出你提出的所有重要事实性主张。
2. 确定支持每个观点的证据。
3. 商标，主张基于推断或假设。
4. 找出你推理中最薄弱的部分。
5. 提出最有力且可信的反对建议的理由。
6. 说明哪些新证据会改变你的结论。
7. 纠正或撤回任何你无法支持的说法。
8. 提出修订后的最终建议。
不要仅仅为了一致性而为原始答案辩护。

"真正的目标并不是一个总是听起来很确定的AI。它是一个证据、假设和推理都易于检验的人工智能。"

总结

Claude最好的输出并不是要求它听起来更聪明。它源于定义什么是良好思维：在同意前评估，使不确定性显现，将事实与推理区分开，揭示批判性假设，推荐替代方案，并命名下一步验证步骤。这样做后，你就不再是啦啦队员，而是会有个顾问，一个能帮你做出更好决定的人，而不是仅仅对已经做的决定感到更好。

资料来源

Anthropic关于减少幻觉的指导及其提示工程最佳实践，以及Claude帮助中心关于个性化功能、项目创建与管理以及技能推广风格的指导。

Shardul | AI Product Manager

AI Product Manager、建设者和教育者，他发布AI产品却不写代码，并且会在公开场合拆解每个决策，所以你能比我更快地构建。

关于我 →

每周获取AI产品实战手册。

框架、构建拆解，以及背后的经验教训。绝无垃圾邮件，随时可取消订阅。

返回全部文章