阿里云PolarDB:从云原生迈向AI原生

作者:

邹大斌

责任编辑:

邹大斌

来源:

ISMB

时间:

2025-02-28 11:18

关键字:

阿里云 PolarDB 数据库 云计算 CXL

2月26日,在备受瞩目的阿里云PolarDB开发者大会上,阿里云宣布了一个重磅消息:PolarDB成功刷新了全球数据库性能及性价比排行榜的纪录,其性能达到了原纪录的2.5倍,而成本仅为原纪录的63%。这一成就标志着阿里云在数据库技术领域迈出了又一里程碑式的步伐。这一卓越表现的背后是阿里云PolarDB在技术和架构上的持续深耕与创新,特别是在云计算和AI技术领域的不断探索,正是这些创新使PolarDB从原生数据库华丽转身为云原生+AI原生数据库,并将有力推动整个数据库产业的加速发展。

Model as Operator:让AI与数据无缝对接

自2022年底ChatGPT的火爆问世引爆生成式AI技术以来,特别是今年DeepSeek的脱颖而出,企业对于AI应用的热情空前高涨。面对这股AI浪潮,数据库领域应如何作为?

在阿里云智能集团副总裁、数据库产品事业部掌舵人李飞飞看来,当前的AI热潮仍处于上半场阶段,主要聚焦于大模型和训练方面,而更为精彩的下半场即将拉开帷幕,即AI在各行各业的深入落地,而这离不开数据库的强大支撑。

数据作为AI的基石,其与AI的结合方式主要有两种:一是将数据提取出来,交由大模型进行训练或推理;二是让大模型直接贴近数据,即贴近数据库,未来这一模式将成为主流趋势,也是数据库领域的新机遇。

“受数据重力(Data Gravity)效应的影响,未来更多的AI应用将在数据产生的源头涌现,而数据库将在其中扮演至关重要的角色。”李飞飞强调道。

李飞飞的这一观点与Gartner的预测不谋而合。Gartner预计,到2028年,80%的生成式AI业务应用将在企业现有的数据管理平台上开发。这里的“现有数据管理平台”指的就是当前的数据库系统。

基于此洞察,PolarDB正致力于将各类模型融入数据库,以便就近为模型的训练和推理提供所需素材。在开发者大会上推出的内置大模型的PolarDB AI版本正是这一理念的体现。PolarDB AI版新增了一种AI节点,内置了10余种AI算法,涵盖通义千问、DeepSeek全系列产品,并支持用户自定义模型。AI节点采用了模型算子化的形态,即“Model as Operator”,用户可以通过API和SQL语句的方式直接调用,从而在数据库内部直接进行搜索推理优化。

李飞飞指出,这种方式只需保存一份数据,有效节约了存储成本,同时避免了数据的搬运,显著降低了用户的部署成本。

不仅如此,PolarDB还将模型的构建、部署等行为都算子化,用户只需通过一句SQL语句即可实现模型的创建和部署。

值得一提的是,在助力用户加速AI的开发和部署的同时,PolarDB自身也在积极拥抱AI。例如,PolarDB将热门的DeepSeek接入后台,帮助DBA快速定位故障,极大提升了运维效率。

除了在AI领域的发力外,PolarDB还在HTAP、Serverless等技术上持续精进。李飞飞表示,用户的需求可能多种多样,而PolarDB的目标是:通过一款产品来满足用户的多元化需求,让用户无需做出复杂的选择,让技术决策变得更加轻松。为此,PolarDB在传统RW节点和RO节点的基础上,增加了AI节点、HTAP节点、搜索节点、向量节点等专用节点从而在一个核心的基础上同时支持分布与集中、OLAP与OLTP、MySQL、PG、Oracle等多种场景。

“阿里云PolarDB将Data+AI全面融合,旨在为用户提供更加普惠、易用的数据管理平台,帮助个人开发者和企业用户利用数据驱动创新。我们将持续面向云原生、AI驱动的方向演进,让AI时代的数据库开发像‘搭积木’一样简单,显著降低数据库的应用门槛。”李飞飞信心满满地表示。

软硬协同优化,推动技术不断前行

众所周知,随着云计算的普及,数据库创新的主战场已经转移到云数据库领域。早在2019年,Gartner就曾预测,到2027年,云数据库将占据整个数据库市场份额的70%。而Gartner的数据显示,在2023年,数据库市场整体规模已经突破了1000亿美元大关,而云数据库的市场份额已经达到了61%。显然,很有可能不用等到2027年,云数据库的市场份额就会达到70%。

作为云原生数据库的代表,PolarDB一直深耕云计算领域,特别是借助阿里云平台的强大优势,通过软硬件的协同优化来提升数据库的整体性能,改善用户体验,降低总体拥有成本。

李飞飞表示,阿里云的目标是结合PolarDB的软件技术,将硬件的所有潜能充分挖掘出来,从而为用户提供极致性价比的数据服务。

三层解耦就是PolarDB软硬协同优化的一个典范。所谓“三层解耦”是在“存储”和“计算”两层解耦的基础上再进一步,增加了内存的池化。此前,PolarDB已经实现了三层解耦,而在今年的大会上,PolarDB又宣布了该技术的最新进展——基于CXL的三层解耦。

李飞飞介绍道,PolarDB利用CXL高速互联技术,实现了机架内部不同节点内存之间的通讯带宽和效率的大幅提升。与传统的RDMA高速网络相比,CXL技术将内存交互的性能提升了一个数量级,跨节点交互延迟缩短至百纳秒级别。在相同配置下,PolarDB的扩展性提升了三倍,成本降低了50%。

今年,阿里云还将推出全球首款基于CXL(Compute Express Link)交换机的数据库专用服务器。不过,李飞飞在接受采访时表示,这款数据库专用服务器目前并不对外出售,仅供阿里云内部使用。

为了进一步优化性能,阿里云自主研发了SmartSSD和AliSCM持久化内存,并结合阿里云的存储引擎PolarStore和分布式文件系统PolarFS 2.0来提升数据库的性能和可靠性。例如,基于SmartSSD的软硬协同压缩技术,由于是硬件级别的压缩,因此几乎没有性能损耗。

除此之外,阿里云还与英特尔携手合作,利用英特尔至强处理器内置的AMX来提升AI模型在PolarDB中的执行效率,实现向量加速和推理加速。

正是这些技术的运用,确保了PolarDB的卓越表现,不仅助力PolarDB以优异成绩登顶TPC-C榜单,同时也赢得了广大客户的广泛认可和信赖。目前,PolarDB的客户数量已经超过1万家,部署的CPU核心数更是突破了100万大关。

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-2
京公网安备:11010502051901号
ICP证:京B2-20230255