IBM首席执行官:更小、特定于领域的GenAI模型是未来

作者:

CBISMB

责任编辑:

邹大斌

来源:

ISMB

时间:

2025-05-09 09:04

关键字:

IBM GenAI 大模型 LLM Granite

目前,由于众多数据中心、云服务和边缘环境之间缺乏整合与协调,生成式人工智能(GenAI)模型仅能访问企业数据中的1%,IBM首席执行官Arvind Krishna表示。要改变这一现状,就需要开发更小型、专用的生成式AI模型,这些模型可针对特定领域的任务(如人力资源、销售、零售和制造)进行定制。

周二,在波士顿举行的IBM Think 2025大会上,Krishna阐述了公司未来的重点方向:整合开源的大语言模型和小语言模型,使其能够被企业轻松部署和定制。

“小模型具有极高的准确性,”Krishna说道。“它们的速度快得多,运行成本也低得多。你还可以选择在任何地方运行它们。它不是用来取代更大AI模型的,而是与大型模型并行使用,并可以将其定制得更贴合企业需求。”

除了更容易部署和定制之外,Krishna指出,小型AI模型的运行成本最多比传统大语言模型便宜30倍。

他说,正如自上世纪90年代以来存储和计算成本大幅下降一样,AI技术也会随着时间推移显著变得更便宜。“当这种情况发生时,你就可以将AI应用到更多问题上。”他补充道。“计算机科学中并没有一条定律说AI必须保持昂贵和庞大。这是我们正在面对的工程挑战。”

Krishna强调了IBM推出的Granite系列开源AI模型——参数范围在30亿到200亿之间的中小型模型,并比较了其与像GPT-4这样的超大规模模型(参数超过1万亿)。他还指出,OpenAI、Meta等其他AI模型开发商也在专注于打造“迷你”版本,例如GPT o3和GPT o4 mini,以及Llama 2和Llama 3,据报道这些模型的参数数量都在80亿以下。

IBM最新的Granite 3.0模型已集成在其WatsonX平台中,该平台是IBM为企业设计的AI和数据平台,旨在帮助企业规模化地构建、训练、调优和部署AI模型,特别是为特定业务应用场景服务。Granite 3.0于去年10月发布,是IBM提供可扩展、高效且可定制商业AI解决方案战略的重要组成部分。

“AI实验的时代已经结束,”Krishna表示。“成功将由整合能力和业务成果来定义。这也是我们今天所宣布的重点。通过我们的WatsonX Orchestrate系列产品,你现在可以在不到五分钟内创建自己的AI代理。”

WatsonX Orchestrate还配备了150个预构建的AI模型,适用于各种用途。

为了实现嵌入式AI网络连接地理分布广泛的数据源,IBM在Think大会上宣布与电信公司Lumen Technologies建立合作伙伴关系。双方将专注于在数据生成地附近进行实时AI推理,以降低企业在大规模采用生成式AI过程中的成本和延迟,并解决安全障碍。

Lumen首席执行官Kate Johnson表示,该公司正启动数十年来最大规模的一次网络升级和扩建;Lumen的网络现在将在边缘位置运行WatsonX,从而在数据产生的源头提供更安全的数据访问能力,克服传统网络可能带来的延迟问题。

她说:“我们为那些希望从AI中获得最大收益的企业带来了‘近距离’的力量。想象一下你在使用AI模型时,不断将所有数据上传到云端再等待结果。这种方式既昂贵又缓慢,安全性也远不如预期。而结合WatsonX的边缘能力,我们可以实现实时推理。”

Johnson还表示:“所有的边缘节点都连接到了网络架构中。它是无处不在的,覆盖了所有应用场景。”

例如,生成式AI可以在临床环境中用于对患者记录进行实时诊断。当医生检查患者时,相关数据会被输入本地数据库,生成式AI可以访问这些数据,并结合来自其他地点(如医院数据中心)的历史数据。

“这是一项颠覆性的技术,甚至可能挽救生命。”她说道。

她还举例说明了AI在“熄灯工厂”(lights-out manufacturing)中的运作方式——这种完全由机器人运营的制造设施会产生大量数据,每毫秒的响应时间都至关重要。

她说:“我们现在看到,工厂正在寻找靠近生产线的数据中心,从网络连接到电力和冷却系统。我们的联合解决方案几乎可以开箱即用,为企业提供强大的支持。”


地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-2
京公网安备:11010502051901号
ICP证:京B2-20230255