关键字: [亚马逊云科技, 生成式AI, TiDB, 亚马逊云科技, 数据库平台, 全球客户, 高扩展性, 人工智能]
导读在本次演讲中,德迈先生介绍了PingCAP公司及其TiDB数据库产品,重点阐述了TiDB如何借助亚马逊云科技的平台,为全球客户提供高扩展性、高可用性的分布式数据库服务。他强调了扩展性对于应对大规模数据交互的重要性,并分享了TiDB通过计算存储分离的架构设计来实现线性扩展的技术细节。此外,德迈先生还展示了TiDB与Defy和DeepSik等AI工具相结合,为开发者提供快速构建AI应用的能力,充分发挥了云原生数据库在AI时代的优势。
演讲精华以下是小编为您整理的本次演讲的精华。
在一个风和日丽的春天,德迈先生,现任PingCAP亚太区技术负责人,应邀来到深圳,与大家分享了一场精彩的演讲。他长期从事数据库和数据管理领域的工作,包括在MDM的DBTool Infra做过HBase,在华为研发过高斯200数仓,在阿里云负责过数据库海外业务,还帮助过初创企业制定全球战略。如今,他的主要任务是为PingCAP在东南亚及大陆区域的海外客户提供服务。
PingCAP成立于2013年4月,如今已走过10年的发展历程,在全球拥有近10个办公室,得到了客户和投资人的大力支持。PingCAP只做一件事情,那就是专注于开发分布式关系数据库TiDB。TiDB是一款完全自研的、兼容MySQL的分布式数据库,符合严格的ACID事务要求,具有高可用、高弹性和高扩展性,同时支持事务和实时分析。目前,包括Airbnb、Linkin、中国建设银行、美国主要移动支付公司、印尼虾皮(Shrimp)、印度物流公司Flipkart等在内的3000多家企业客户,都在使用TiDB。
德迈强调,扩展性对于数据库来说至关重要。他回忆起15年前的一个经历,当时道琼斯工业平均指数因为计算机自动化高频交易而闪崩1000点,这在有史以来400年的股票交易历史上从未发生过。当时德迈所支持的一家美国股票交易所,由于白天交易量巨大,晚上做报表时无法完成,他不得不与客户一起熬夜,因为当时的数据库无法提供足够的弹性来应对这种情况。
如今,这种超大规模的交易在各行各业每天都在发生,弹性对数据库来说愈发重要。这就是PingCAP开发基于计算存储分离架构的TiDB的原因。TiDB的架构由多个组件组成:PD负责管理事务核心的时间戳和整个系统的元数据;TiDB是无状态的计算引擎,可以在应用程序无感知的情况下进行扩缩容;TiKV是通过计算存储分离实现的存储引擎,可以单独扩容,并通过Raft协议保证数据高可用,它基于Log Structured Merge Tree提供高压缩率和高性能事务能力;TiFlash是一个可选的列存引擎,可以提供比行存更高一到两个数量级的复杂查询能力,满足事务和分析的需求。
德迈表示,TiDB不仅是一款数据库,更是一个数据库平台,可以基于私有云和公有云提供全托管服务,包括可观测性、数据备份、容灾、数据迁移等数据管理能力。TiDB的架构设计和工程实现为其全球化战略奠定了坚实基础。
要走向全球,PingCAP重视三个关键要素:信任、安全合规和生态伙伴。首先,真实的开源是TiDB赢得信任的第一步,也是与用户直接交流、获得产品与市场契合度的直接手段。其次,PingCAP从5年前就开始满足SOC 2的合规要求,并每年都在这方面迈进一步,确保TiDB可以满足全球各地区金融、信息管理、医疗等领域的合规需求。第三,TiDB需要与生态中的其他产品合作,融入用户习惯的工具链,成为全球客户日常使用软件的一部分。
在这一过程中,亚马逊云科技(亚马逊云科技)是PingCAP的重要合作伙伴。2019年,PingCAP虽然仍处于初创阶段,但已经开始与亚马逊云科技合作。2021年,TiDB云数据库服务在亚马逊云科技上首发。如今,TiDB在亚马逊云科技上的营收已达3500万美元,并连续两年获得亚马逊云科技最佳合作伙伴称号。在亚马逊云科技上,TiDB提供了Serverless、Dedicated和Self-Managed三种部署模式。Serverless模式只在客户使用时收费,停机时计算成本为零,适合按需付费场景。Dedicated模式则是为核心业务保驾护航而设计的。Self-Managed模式允许客户自由灵活地进行内部部署和配置。正是得益于亚马逊云科技成熟的云平台和上下游产品支持,客户才能在熟悉的环境中利用好TiDB,继续开发和运行自己的业务。
其中,日本游戏公司卡普空(Capcom)就是一个典型案例。每当卡普空发布新游戏时,预期的爆款会带来峰值流量,这时全球部署的TiDB就能为玩家提供坚实的数据基础。
2025年,TiDB将面临AI爆发带来的新挑战。为此,TiDB推出了NextGen架构,希望能够更好地利用Amazon S3对象存储的可靠性,并通过微服务的模块化设计,将存储和计算的性价比成本分别提高5倍和2倍。
具体来说,NextGen架构将冷热数据分离,冷数据存储在EBS上,热数据存储在具有11个9的数据可靠性的S3上。同时,微服务可以将数据后台需要做的工作,如压缩、备份、日志处理、索引构建等与实际客户业务隔离开来,实现计算的微服务隔离,从而保证业务稳定性,降低CPU成本。凭借这种新架构,云托管的TiDB可以实现与当前架构相比TCO降低一半的效果,同时提供同样的业务能力。NextGen架构还可以实现从Serverless到Dedicated的灵活部署,为2025年的AI做好准备。
2023年被称为“疯狂买卡阶段”,当时所有人都在囤积GPU,谁买到了就是赢家,很多公司都在做大语言模型训练。2024年则是“卖卡时代”,智算云兴起,高端GPU卡价格也出现断崖式下跌。据了解,2024年国内有60%的高端GPU卡处于闲置状态。到2024年底,一台配备了最新一代H100 GPU的服务器价格从原来的300万人民币降到了200万人民币左右。2025年,随着英伟达推出了B200系列GPU,智算云市场迎来了新的变革。
2025年,以DeepSik为首的AI初创企业终于走出阵痛期,它们将AI开发的门槛降低到个人和小型企业可以承受的程度,这与过去完全不同。在这一年,开发者(ToD)和专业人士(ToP)将成为AI SaaS的主要客户群体。
在这一背景下,TiDB与DeepSik和Defy合作,为AI开发者提供了一站式的数据库解决方案。Defy提供大语言模型框架,是一个典型的AI SaaS公司。但由于业务爆发式增长,Defy一度扩展到30万个数据库实例,面临高额的管理成本和业务不稳定的问题。通过与TiDB合作,TiDB的多租户能力和线性自动扩展能力帮助Defy解决了扩展瓶颈。Defy的CEO卢豫表示,有了TiDB,Defy的用户可以专注构建GenAI应用,工程师可以使用TiDB的API自动化管理所有数据,大大减少了时间和人力消耗。而TiDB的Serverless能力则确保了AI开发早期不需要承担闲置资源的成本。
在现场,德迈请工程师现场演示了如何在20分钟内,使用Defy框架、DeepSik模型和TiDB数据库,开发并部署一个AI应用程序。这个应用可以对企业内部文档进行语义理解和问答,为企业带来显著的工作效率提升。对开发者来说,他不需要了解数据库细节,只需使用这三个组件,就能快速构建AI应用。这种开发模式类似于30年前LAMP(Linux、Apache、MySQL、PHP)时代的创新,将极大降低AI应用的开发门槛。整个演示过程中,工程师仅使用了6000多个Token,相当于每秒只需消耗少量计算资源。
德迈设想,如果把这个应用用于深圳华强北的元器件销售,将能够让销售人员根据企业私域数据,快速查询所需零件的库存、价格、生产周期和成本,大幅提高工作效率。
总的来说,TiDB作为一款云原生分布式数据库,通过与亚马逊云科技深度集成,为全球客户提供了高扩展、高可用的事务型和分析型数据库服务。在AI时代,TiDB进一步拥抱了AI技术,为开发者提供了向量数据库能力,助力构建AI应用。亚马逊云科技作为坚实的云平台支撑,让TiDB的全球化之路不断前行。通过与DeepSik和Defy的合作,TiDB为AI开发者提供了高效、经济、一站式的数据库解决方案,助力AI应用的快速开发和部署,降低了AI应用开发的门槛。
下面是一些演讲现场的精彩瞬间:
During a beautiful spring day in Beijing, the speaker reminisces about the strong winds of the previous weekend and expresses joy in gathering with people from all over the country, united as residents of Shenzhen.
TiDB, in collaboration with 亚马逊云科技, aims to leverage AI and distributed cloud-native technologies to provide a scalable and cost-effective database solution for handling peak traffic from popular game releases like those from Capcom.
TiDB’s new architecture separates hot and cold data, leveraging S3 for hot data with 11 nines of durability, reducing TCO by 50% while maintaining business stability and enabling flexible deployment for future AI initiatives.
AI行业在2023年经历了疯狂买卡阶段,2024年则迎来智算云兴起和GPU卡价格大幅下降的变革时期。

亚马逊云科技与 TiDB 携手打造 AI 时代的数据库平台,助力企业走向全球。TiDB 是一款自研的兼容 MySQL 的分布式数据库,具有高可用、高扩展性和支持事务与实时分析的特点。其独特的架构设计使其能够在云环境中实现弹性扩展,满足当今数据量爆炸增长的需求。
TiDB 作为一个全球化的公司,与亚马逊云科技的合作关系源远流长,从 2019 年开始便已建立合作伙伴关系。如今,TiDB 已在亚马逊云科技平台上实现了可观的营收,并连续两年获得亚马逊云科技最佳合作伙伴称号。亚马逊云科技为 TiDB 提供了成熟的云生态和上下游产品支持,确保客户能够在熟悉的环境中利用 TiDB 实现业务需求。
面向 AI 时代,TiDB 正在与亚马逊云科技深度融合,通过创新的 NextGen 技术,利用 S3 存储和微服务架构,将存储和计算的性价比提高数倍。同时,TiDB 的 Serverless 能力使其在 AI 开发早期阶段降低了资源成本门槛。通过与 Defy 和 DeepSik 等 AI 公司的合作,TiDB 为开发者和专业人士提供了一站式的 AI 应用开发和发布平台,大幅缩短了从开发到上线的时间,助力企业快速响应市场需求。
亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者。提供200多类广泛而深入的云服务,服务全球245个国家和地区的数百万客户。做为全球生成式AI前行者,亚马逊云科技正在携手广泛的客户和合作伙伴,缔造可见的商业价值 – 汇集全球40余款大模型,亚马逊云科技为10万家全球企业提供AI及机器学习服务,守护3/4中国企业出海。返回搜狐,查看更多