本报(chinatimes.net.cn)记者卢晓 北京报道
进入AI时代,如何让数据这个关键的生产要素在更简单易用的同时发挥更大价值,一直是数据库厂商们思考的重要方向。
2月26日,在2025阿里云PolarDB开发者大会上,PolarDB数据库对外释放出让数据库更智能以及走性价比路线这两个坚定信号。而近日,阿里CEO吴泳铭对外宣布的高达3800亿元的巨大基建投资,无疑让包括数据库在内的云和AI领域竞争更加火热。
阿里云智能集团副总裁、数据库产品事业部负责人李飞飞当天在接受包括《华夏时报》记者在内的媒体记者采访时认为,现在已到AI下半场,今年一定是AI应用爆发元年,要抓住这个机会,更好地和现有的业务流程、数据流程结合,把成本降到更低,把资源优势打满,让数据真正发挥价值。
让数据库去推理
让AI应用开发变得如同搭乐高积木一样简单,是数据库在AI时代的价值之一。
2月26日,PolarDB正式推出内置大模型的PolarDB AI版本,帮助个人和企业开发者快速部署并上线AI应用。据其介绍,PolarDB AI节点采用模型算子化形态,支持用户在数据库内部直接进行搜索推理优化,在线推理吞吐量可提升10倍以上。记者观察到,除了自家的通义千问,Deepseek等外部大模型也被内嵌到PolarDB中。
PolarDB数据库从2017年开始正式公测,2018年上线。与传统数据库不同,它是阿里集团内部业务面临去IOE(IBM、Oracle、EMC 三家外资IT巨头的合称),以及业务互联网化带来的请求波峰、波谷剧烈变化的背景下所诞生的云原生数据库。进入大模型时代,如何将大模型和云原生数据库结合起来,让数据发挥更大价值,成为影响PolarDB未来方向的关键。
看起来,PolarDB并不想只充当基础大模型的底层燃料,而是希望能掌握更多主动权。通过内嵌大模型实现推理功能,并将其应用在更多场合就是它找到的路径之一。阿里云智能集团数据库产品事业部产品管理技术架构部负责人王远当天也对记者表示,“未来所有的推理,所有基于大模型的这些数据去驱动的推理,都会发生在数据库里面,这是我们看到的一个方向。”
在加码推理背后,相对大模型的框架和算法长时间没有出现大的突破,一批真正依赖大模型的AI应用争相涌出,意味着眼下这波由大模型掀起的AI热潮进入下半场。
李飞飞当天对包括《华夏时报》记者在内的媒体记者表示,大模型前期的主要工作聚焦在集中式的预训练,但随着大模型的普及,尤其是DeepSeek的出圈以及一系列的开源模型,相信今年AI agent的应用开发一定会爆发,碎片化的推理服务会无处不在,“PolarDB作为一个在线数据库系统,如何将模型的能力,AI的能力和数据库有机地结合起来,一定会成为非常有意思的挑战。”
性价比之战
除了让数据库具备大模型的推理功能,数据库也同大模型一样较量起了性价比。
2月26日,阿里云宣布,根据国际数据库事务处理性能委员会(TPC,Transaction Processing Performance Council)官网披露,PolarDB数据库以每分钟20.55亿笔交易(tpmC)和单位成本0.8元人民币(price/tpmC)的成绩刷新TPC-C性能和性价比双榜的世界纪录。记者从阿里云方面了解到,TPC-C是由TPC组织制定的针对衡量在线事务处理(OLTP)系统性能的基准测试,是一场长达40小时的数据库性能“极限挑战”赛。
李飞飞告诉记者,这次打榜的性价比成绩相较之前的最好成绩优化了1/3左右,其中用到的优化网络带宽、透明压缩盘以及专属的IaaS资源池等技术并不只是为了打榜做的命题作文,而是要真实用到中小客户场景中。他透露,中小客户选择 PolarDB数据库,用上这些技术,最终大概也能减去1/ 3的成本。
而对于如何实现更高的性价比,李飞飞当天表示,Polar DB正在把资源充分利用起来,通过100%吃掉所有的资源,最终体现出性能提升。他当天以龟兔赛跑来举例,即虽然有更强的硬件,但如果跑跑停停,就还不如用稍微差点的硬件但把它打满,让它一直在跑,到最后反而会赢。
需要提及的是,目前数据库行业竞争激烈,有业内人士在跟记者交流时表示,国内目前大概存在200—300家数据库,其中包括蚂蚁的OceanBase数据库、华为的GaussDB数据库等行业头部公司,安全和价格是这些数据库激烈竞争的重要维度。
去年11月26日,IDC发布的报告显示,2024上半年中国关系型数据库软件整体市场规模为19.3亿美元,同比增长10.7%,阿里云以27%的市场份额位居榜首,其中,公有云部署模式已成为中国数据库的市场主流,市场规模是本地部署模式的2倍以上,而阿里云在这个细分市场中也以38%的份额位居首位。据记者了解,关系型数据库目前在中国数据库总体市场中占比超过六成。
不过,在谈及追求性价比将可能带来的数据库行业价格战时,李飞飞也强调,“掀桌子自砍三刀的降价,阿里数据库绝对不会干,还是要通过市场化极致技术的优化,获得成本的极度优化提升,这也是公共云的价值,即资源池化带来的规模效果,带来边际成本下降。”
责任编辑:黄兴利 主编:寒丰