AWS 新增全托管 AI 模型:Qwen3 和 DeepSeek-V3.1
作者: CBISMB
责任编辑: 邹大斌
来源: ISMB
时间: 2025-09-19 14:53
关键字: AWS,AI,Qwen,大模型
浏览: 497
点赞: 20
收藏: 2
亚马逊云科技公司(AWS)近日宣布,将其 AI 模型组合扩展至两款全新的全托管开源权重模型:Qwen3 和 DeepSeek-V3.1。
这两款新模型为客户提供了更大的灵活性,帮助依赖 Amazon Bedrock 生成式 AI 服务的企业更好地满足其不断变化的业务需求。
开源权重模型(open-weight models)向开发者提供了更高的模型权重透明度,使其更易于针对特定应用场景对模型进行定制。此次新增的开源权重模型加入到了 Amazon Bedrock 已有的模型生态中,该生态还包括来自 Meta、Mistral AI 和 OpenAI 等领先开发者的模型。
目前市场上有大量在不同领域表现出色的模型。阿里巴巴推出的 Qwen3 在复杂编程和通用推理方面表现优异;而 DeepSeek-V3.1 模型则在数学、编程和智能体任务方面展现出卓越性能。Qwen3 是 Amazon Bedrock 产品组合中首个全托管的 Qwen 模型系列。
企业级安全与数据控制
尽管这些模型本身是免费开放的,但通过在 Bedrock 中使用,客户可以享受亚马逊的企业级安全保障,包括数据加密和严格的访问控制,从而确保数据隐私并满足合规要求。客户对其数据拥有完全控制权:AWS 不会将模型的输入和输出数据共享给模型提供方,也不会将其用于改进基础模型。
AWS 技术总监 Shaown Nandi 在六年前加入 AWS 之前,曾担任新闻集团(News Corp.)旗下道琼斯公司(Dow Jones)的首席信息官。他表示,AWS 将在亚洲、拉丁美洲、欧洲和北美等关键全球市场推出这些新模型。
Nandi 指出,许多企业常见的应用场景较为狭窄,而通用大模型往往过于庞大。“你可能需要一个更小、更便宜的模型,这完全没问题,因为应用场景多种多样,”Nandi 说,“我们特别看到,开源权重模型在成本和选择上具有显著优势。此外,像 Llama 这类模型,AWS 支持模型蒸馏,Bedrock 上的客户能够将模型压缩到更小的规模,同时保留大部分准确性,蒸馏后的运行成本可能降低多达30倍。”
“无论是选择更窄的模型、进行模型蒸馏,还是避免某些专有模型(如智能体应用场景)的高额授权费用——这些开源权重模型的价值正在这些方面凸显出来。”他补充道。
Nandi 还提到,拉丁美洲和部分亚洲地区的客户尤其希望根据本地需求对模型进行调优,而开源权重模型使这一目标更容易实现。“我看到国际市场,以及美国的初创企业和其他公司对此有大量需求。”他表示。
速度与灵活性兼备
开源权重模型还能满足企业对速度和灵活性的需求。“开源权重模型的独特之处在于其可微调和可定制的能力,”Nandi 说,“我们看到客户正在尝试这些模型,无论是进行蒸馏还是不同规模的微调,实际上是在为自己的行业或业务构建出类似专属的小型语言模型(SLM)。”
Qwen3 的能力
AWS 表示,客户现在可以访问 Qwen3 系列中的四个全新开源权重模型。这些多语言模型能够规划多步骤工作流、集成工具和 API,并在任务中处理长上下文窗口。其中两个通用模型同时提供“思考”和“非思考”两种推理模式。
此外,AWS 在公告中形象地描述:如果 Qwen3 模型是“人”,那么它们“能流利使用数十种语言,并拥有涵盖广泛主题的百科全书式知识,从解释科学概念到撰写创意故事皆可胜任。”
DeepSeek-V3.1 的优势
DeepSeek-V3.1 模型的核心优势在于其混合推理能力,能够在快速响应与深度、透明的思考之间取得平衡,客户可根据所解决问题的类型在不同模式间切换。
此外,这些模型能效极高:它们很少将简单查询转化为冗长的讨论,同时仍保持高水平的专业能力以支持战略决策。更重要的是,模型能清晰解释其推理过程,使用户更容易理解其推荐背后的逻辑。
基于客户反馈持续优化
没有人能告诉 AWS 或任何模型开发者,应该在哪些市场推出哪些模型。因此,他们依靠倾听客户声音、分析使用数据,并据此对部署和更新计划做出合理判断。
“最后这一点至关重要,”Nandi 说,“我们希望填补空白,让客户拥有充分的选择权。目前正涌现出大量新的智能体应用场景,我们不断面临增加更多模型的压力。”目前,AWS 已提供数百个模型,并持续扩展新模型的可用区域。
另一个重要的客户反馈来源是 Bedrock 的模型评估工具。“它使用一个大型语言模型作为‘裁判’,”Nandi 解释道,“根据你输入的参数,它会告诉你哪个模型最适合你。这是我们为客户提供自动化反馈的可扩展方法,在 Bedrock 中已成为改变游戏规则的工具。”
此次新增模型,以及将 Amazon Bedrock 模型推向更多全球区域的战略,对 AWS 而言具有明确的商业意义。这些举措将为其现有及未来客户提供日益强大的基础模型解决方案,助力其业务持续增长。