生成式AI全栈创新,亚马逊云科技年末“放大招”

作者:

鲍蓉

责任编辑:

鲍蓉

来源:

ISMB

时间:

2024-12-26 10:31

关键字:

亚马逊云科技 生成式AI

近日,2024亚马逊云科技re:Invent大会圆满落幕。作为云计算行业的盛会,re:Invent素以务实为导向,每年都会密集发布大量的产品和创新,今年也不例外,亚马逊云科技发布了多项突破性技术,无论是在广度还是深度上均超过了往年。

为了帮助企业应对生成式AI转型挑战,亚马逊云科技发布了针对生成式AI的全栈式联动创新,涵盖了基础设施、模型工具和应用,更加侧重于产品的实际应用和工具优化,希望能在各个层面帮助企业落地大模型,降低应用成本。

全栈联动创新,推动生成式AI发展

近两年,随着生成式AI日新月异,亚马逊云科技创新发布的节奏也在加快。以前每年主要在re:Invent发布重大特性,现在re:Invent只是发布生成式AI特性的一个窗口,以Amazon Bedrock为例,在re:Invent期间陆续发布了21个新特性。

在生成式AI领域,亚马逊云科技全面强化基础设施、模型和应用三层技术栈,在这个架构之下,充分利用自研芯片、模型、数据等综合能力,力求在性能与成本之间取得平衡。

本次re:Invent大会最引人瞩目的无疑是亚马逊云科技一口气发布了Amazon Nova系列6个自研大模型,涵盖文本对话、图片生成、视频生成,性能比肩GPT-4o,精准锚定多元应用场景。

Amazon Nova提供Micro、Lite、Pro和Premier四个基础模型,其中,Amazon Nova Micro、Lite和Pro应用成本比Amazon Bedrock中表现最佳的模型至少降低75%,同时也是Amazon Bedrock中对应类别速度最快的模型。

除此之外,Amazon Nova还推出了图形生成模型Canvas和视频生成模型Reel。

Canvas能帮助客户生成高质量图像,且具备图像编辑功能。全球最大的营销广告代理公司电通,目前正在使用Canvas来进行创意优化,当Canvas 整合到创意工作流之后,电通的创意团队通过几天就完成了过去几周才能完成的工作。

Reel最大的亮点是视频生成质量和低延迟,它提供了性能和成本之间的最佳平衡。目前Reel可以创建时长6秒的视频,像Runway一样模拟摄像机运镜,只需简单输入文本或图片就能产出工作室水平的专业视频。

对于未来更多的应用场景,多模态将是用户关注的焦点。明年一季度,亚马逊云科技将陆续推出两个创新模型speech to speech和any to any,实现文本、音频和视频的全模态内容输入输出,把多模态进化直接拉升到天花板。

这次发布会,亚马逊云科技还全面升级了Amazon Bedrock,它是亚马逊云科技Working Backwards从客户做生成式AI应用创新需求出发,而设计的生成式AI应用开发一站式服务平台。

Amazon Bedrock首家提供Luma AI和poolside模型,更新了Stability AI的最新模型,而且通过Amazon Bedrock Marketplace平台,用户可以使用领先供应商提供的100多个基础大模型,这应该是目前访问种类最多的大模型集市了。

除了Amazon Bedrock,面向生成式AI应用开发者的Amazon Q也同样优秀。

这次Amazon Q Developer辅助编程平台升级的重点之一是传统工作负载的现代化转型,它可以帮助开发人员将Windows.NET应用迁移至Linux的速度提升4倍,许可成本最多降低40%,或是将⼤型主机现代化的时间缩短最多50%,把原本需要多年才能完成的项⽬缩短到⼏个季度完成。

亚马逊云科技大中华区产品部总经理陈晓建表示,亚马逊云科技不仅在云的核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈取得突破,让不同层级的创新相互赋能、协同进化。他认为,只有这样全栈联动的大规模创新才能真正满足当今客户的发展需求。

亚马逊云科技大中华区产品部总经理 陈晓建

面向于构建者和开发者,选择大于一切

面对层出不穷的新模型,究竟怎样的大模型才是最适合自己的,这是很多企业想要得到的答案,而亚马逊云科技的态度是,选择的权利大于一切,你可以不需要,但我不能没有。通过 Amazon Bedrock,亚马逊云科技希望每个应用场景都能找到最适配的模型。

今年Amazon Bedrock平台全面升级,推出了低延迟优化推理、模型蒸馏、提示词缓存等功能,大幅提升推理效率,同时通过自动推理检查功能和多智能体协作等创新,进一步增强AI安全性并推动智能体发展。

比如很多企业在追求大模型高性能的同时如何控制成本?这里就用到Amazon Bedrock的模型蒸馏技术,只需要选择合适的基础模型,系统就能基于更大、更准确的模型蒸馏出更小、更高效的模型,通过蒸馏得到的模型运行速度提高5倍,成本降低75%。

另外,针对目前让人头痛的AI幻觉问题,Amazon Bedrock推出了自动推理检查功能,基于数学和逻辑,帮你检查模型给出的内容是否准确,并清晰展示模型推理的过程,有效地避免因幻觉产生的事实性错误。

想像一下,原本需要一周才能完成的任务,现在只需要一个小时就能实现,这就是Amazon Bedrock多智能体协作功能。利用Amazon Bedrock,企业可以实现多个功能不同的Agent并行运行,还可根据自身需求,设置一个主管Agent来协调其它Agent的运行,实现高效协作。

除了面向大模型使用者的Amazon Bedrock外,面向生成式AI应用开发者的Amazon Q也引发了广泛关注。

Amazon Q是一款功能强大的生成式AI助手,它对开发者来说非常友好,能够让没有任何专业能力的人也能快速地使用到生成式AI的功能。

其新推出的自动化智能体可自动执行单元测试、文档生成和代码审查等流程,还能帮助不同经验水平的用户进行运营排错,通过与GitLab的深度集成,为开发人员带来AI驱动的无缝开发体验,有效解决了在碎片化的软件开发生命周期中代码混乱的问题。

Amazon Q Business也发布新功能,提升了其与Amazon Q in QuickSight的洞察能力,增强跨应用的生成式AI体验,它为流行商业应用提供50余种操作,还具备使用智能体执行复杂工作流的能力,可简化工作流程自动化方式,如Asana、GE医疗等客户和合作伙伴已开始利用这些新功能转变工作方式。

技术革新背后能否惠及每个用户

自2023年大模型横空出世,技术创新节奏越来越快,但对于企业来讲,只有降低技术的应用成本,才能让更多的组织和个人参与其中。

比如亚马逊云科技发布的Amazon Nova基础大模型,相比业界主流大模型,使用成本降低了75%,通过高性能与成本的平衡,直接拉低了模型使用的“门槛”,让更多开发者和用户有能力参与到模型推理的创新中来。

事实上,Amazon Nova最大的特点是其与亚马逊云科技基础设施的无缝集成,通过Amazon Bedrock平台,企业可以直接对这些模型进行微调和知识蒸馏,使其更好地适应特定的业务需求。

当然,除了生成式AI的重磅发布之外,亚马逊云科技在计算、存储和数据库等核心领域持续创新,共同为生成式AI提供稳定可靠的计算和存储能力支持。

本次re:Invent亚马逊云科技宣布搭载Amazon Trainium2的Amazon EC2 Trn2实例现已正式在海外区域推出,与当前⼀代基于GPU的实例相⽐,Amazon Trainium2的性价⽐提升了30-40%,这是迄今为止最为强大的生成式AI实例,这样的性能表现也是其他云服务商⽆法企及的。

同时亚马逊云科技还宣布下一代芯片Amazon Trainium3将于明年推出,这款采用3纳米制造工艺,计算性能将提升到Trainium2的两倍,能效提升40%,客户能够以更低的成本、更高的效率去构建规模更大、性能更强的模型应用。

我们知道,每一个应用程序不光需要计算,也需要存储,很多客户考虑,我需要有一个海量的存储规模,我还需要一个简单的访问方式,我同时也需要能够通过 Amazon S3去支持各种类型的数据存储方式。

亚马逊云科技也一直在探索如何让产品支持到今天越来越重要的数据分析和AI应用场景。本次亚马逊云科技推出了专为Iceberg 表优化的Amazon S3 Tables创新功能,其查询速度可以提升到3倍,和常规的Amazon S3存储桶相比,每秒可处理的事务数量是之前的10倍。同时,Amazon S3还新增Metadata元数据功能以实现自动获取和实时更新。

可以看出,亚马逊云科技始终坚持基于客户需求不断创新,着眼长远发展。据悉,2025年,亚马逊云科技将向全球初创企业提供超10亿美元云计算资源,助力其迈向成功。截至今日,亚马逊云科技拥有数百万客户,是全球各行业大型企业首选的云服务提供商。

此次2024 re:Invent也是诚意满满,发布了一系列生成式AI产品和云服务产品,构建者可以利用这些创新工具重构业务,助力业务创新,推动生成式AI的技术普惠。对于企业来说,在生成式AI的浪潮下,积极拥抱和学习并利用先进的生成式AI工具才是明智之举,不要等潮水退去时,才发现自己在裸泳。

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-2
京公网安备:11010502051901号
ICP证:京B2-20230255