Anthropic 发布 Claude 新版 AI “宪法”

作者: CBISMB

责任编辑: 邹大斌

来源: CBISMB

时间: 2026-01-22 11:21

关键字: Claude,Anthropic,AI,提示

浏览: 0

点赞: 0

收藏: 0

Anthropic PBC 发布 Claude “宪法”的新版本。该文件规定了该系列大型语言模型应如何处理用户提示。

该公司最初于2023年5月发布了该文件的初版,其中包含旨在防止 Claude 生成有害或无用输出的指令。然而,Anthropic 发现这些指令存在某些局限性,因此决定制定新版“宪法”。

其中一个主要挑战在于,Claude 难以将 Anthropic 的指导原则应用于新情境。如果某条大语言模型的安全指令未明确说明应如何回应特定提示,模型就可能生成错误的回答。

据 Anthropic 表示,新版“宪法”通过不仅提供指令、还解释“为何希望模型以特定方式行事”,从而解决了这一问题。这种解释使大语言模型更容易将其应用到不熟悉的新任务中。

更新后的“宪法”围绕四项核心指令展开。第一条是要求 Claude “真正提供帮助”,即确保其输出与用户需求保持一致。例如,“宪法”指出,该系列大语言模型不应生成开发者未指定的编程语言代码。

文件的下一部分规定,Claude 应做到“广泛安全”。Anthropic 解释称,这意味着模型不得执行用户明令禁止的操作,同时还应对其决策过程保持透明。

“宪法”的另外两项核心优先事项是确保 Claude “具备广泛伦理意识”,并遵守 Anthropic 提供的“更具体的指导方针”。其中一些方针明确了该系列大语言模型应如何抵御越狱(jailbreaking)尝试;另一些则为 Claude 与第三方应用程序交互提供了指导。

该“宪法”是 Claude 训练数据集的一部分。此外,该系列大语言模型还会利用这份文件生成额外的合成训练数据。例如,Claude 会通过模拟适用“宪法”准则的聊天对话来生成合成数据。

Anthropic 表示,这份文件还有其他用途。客户可据此判断某个提示回复是否符合 Claude 的“宪法”准则;若不符合,他们可向 Anthropic 提交反馈。

该公司已将该“宪法”以知识共享 CC0 1.0 公共领域许可协议发布,公众可免费使用。Anthropic 的主要竞争对手 OpenAI Group PBC 也为其自身的 AI “宪法”采用了相同的许可协议。OpenAI 的文件涵盖了许多与 Claude 指南相同的话题,并已成为 GPT-5 训练数据集的一部分。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。