Anthropic 发布 Claude 新版 AI “宪法”

作者： CBISMB

责任编辑：邹大斌

来源： CBISMB

时间： 2026-01-22 11:21

关键字： Claude,Anthropic,AI,提示

点赞： 522

收藏： 69

Anthropic PBC 发布 Claude “宪法”的新版本。该文件规定了该系列大型语言模型应如何处理用户提示。

该公司最初于2023年5月发布了该文件的初版，其中包含旨在防止 Claude 生成有害或无用输出的指令。然而，Anthropic 发现这些指令存在某些局限性，因此决定制定新版“宪法”。

其中一个主要挑战在于，Claude 难以将 Anthropic 的指导原则应用于新情境。如果某条大语言模型的安全指令未明确说明应如何回应特定提示，模型就可能生成错误的回答。

据 Anthropic 表示，新版“宪法”通过不仅提供指令、还解释“为何希望模型以特定方式行事”，从而解决了这一问题。这种解释使大语言模型更容易将其应用到不熟悉的新任务中。

更新后的“宪法”围绕四项核心指令展开。第一条是要求 Claude “真正提供帮助”，即确保其输出与用户需求保持一致。例如，“宪法”指出，该系列大语言模型不应生成开发者未指定的编程语言代码。

文件的下一部分规定，Claude 应做到“广泛安全”。Anthropic 解释称，这意味着模型不得执行用户明令禁止的操作，同时还应对其决策过程保持透明。

“宪法”的另外两项核心优先事项是确保 Claude “具备广泛伦理意识”，并遵守 Anthropic 提供的“更具体的指导方针”。其中一些方针明确了该系列大语言模型应如何抵御越狱（jailbreaking）尝试；另一些则为 Claude 与第三方应用程序交互提供了指导。

该“宪法”是 Claude 训练数据集的一部分。此外，该系列大语言模型还会利用这份文件生成额外的合成训练数据。例如，Claude 会通过模拟适用“宪法”准则的聊天对话来生成合成数据。

Anthropic 表示，这份文件还有其他用途。客户可据此判断某个提示回复是否符合 Claude 的“宪法”准则；若不符合，他们可向 Anthropic 提交反馈。

该公司已将该“宪法”以知识共享 CC0 1.0 公共领域许可协议发布，公众可免费使用。Anthropic 的主要竞争对手 OpenAI Group PBC 也为其自身的 AI “宪法”采用了相同的许可协议。OpenAI 的文件涵盖了许多与 Claude 指南相同的话题，并已成为 GPT-5 训练数据集的一部分。

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

Anthropic 发布 Claude 新版 AI “宪法”

相关推荐

智库专家

解决方案