- +1
观察|DPU为何被称为“未来计算三大支柱”?
·据IDC统计,全球算力需求平均每3.5个月翻一倍。DPU的出现首先要解决的就是网络数据包处理的问题。随着核心网、汇聚网朝着100G、200G发展,接入网也达到50G、100G时,CPU无法提供足够的算力来处理数据包了。
·DPU的一个核心议题即关于定制化和标准化。不断互动的结果即芯片厂家和一些主流客户形成行业共识,建立一个开源开放的行业生态。
英伟达创始人黄仁勋2020年将DPU与CPU、GPU并列称为“未来计算三大支柱”,虽然DPU此后才逐渐成为芯片投资的热门赛道,但实际上,巨头们的角逐早已开始。
2015年,英特尔收购Altera,并于2021年发布IPU类DPU产品;Marvell从2018年开始陆续收购了Cavium、Avera Semiconductor和芯片初创公司Innovium;赛灵思2019年宣布收购Solarflare,2020年发布Alveo系列加速卡产品,2022年又被AMD收购;Fungible于2019年提出了DPU的概念,后专注于DPU设计;2020年,英伟达69亿美元收购以色列网络芯片商Mellanox,并将BlueField产品线更名为Nvidia DPU,后又以400亿美元收购芯片设计公司ARM;AMD收购赛灵思以补齐FPGA短板,今年又以约19亿美元收购云服务提供商Pensando,也正式进入DPU领域。
“如果说是世界排名前五的芯片公司都在做的赛道,你就可以认为这是一个兵家必争之地。”芯启源CEO卢笙曾在一次专访中说道。
从2021年开始,DPU项目成为国内VC/PE的焦点。今年早些时候,英伟达的博客中写道,“DPU已经成为以数据为中心的加速计算模型的第三个成员。”
赛迪顾问预计,从2023年开始全球DPU市场规模将突破百亿美元,并进入年增长率超50%的快车道。而中国DPU市场规模在2023年也将超300亿元人民币,呈现跳跃式增长,2025年国内市场规模将达到565.9亿元,五年复合增速达170.60%。
那么,DPU究竟是何方神圣?为什么黄仁勋将其称为“未来计算三大支柱”?
DPU是干什么的?
DPU,即Data Processing Unit的缩写,直译为数据处理单元。
“DPU的出现首先要解决的就是网络数据包处理的问题。随着核心网、汇聚网朝着100G、200G发展,接入网也达到50G、100G时,CPU无法提供足够的算力来处理数据包了。而且,网络带宽的增速来自于应用的丰富、数据中心规模的扩大、数字化进展的驱动,而CPU性能增速却随着摩尔定律的放缓而下降,这进一步加剧了服务器节点上CPU的计算负担。”中科院计算技术研究所研究员、中科驭数董事长鄢贵海分析道。
自1950年代以来,CPU(中央处理器)一直是计算设备的核心;1990年代以来,GPU(图形处理单元)扮演重要角色。据IDC统计,全球算力需求平均每3.5个月翻一倍,而进入后摩尔定律时代以后,传统以CPU为中心的“CPU+xPU”多元化异构计算架构在性能提升上逐渐乏力。
从CPU性能与网络带宽发展趋势来看:网络带宽CAGR(复合年均增长率)从2010年前的30%提升至当前的45%。与之相对应的CPU性能CAGR从2010年前的23%下降至当前的3.5%,RBP指标从1附近上升到10以上,CPU应对网络带宽增长带来的计算需求压力不断增大。
CPU既要处理大量的上层应用,又要维持底层软件的基础设施,还要处理各种特殊任务(IO类协议),不堪重负。如果把“负担”从CPU上卸载下来,包括将网络进程、虚拟化功能卸载到专用硬件上,就能释放巨量算力。
“我们需要一个为网络而生的指令集的架构——DPU,来释放巨量算力,统一高效调度算力,提供‘网络+算力’新模式。” 卢笙说,“GPU更多为了人工智能算法和算力的提升,或游戏的渲染等。但当数据从边缘端传到云的时候,它必须事先加密打包成网络包,到了云以后,经过防火墙,再把加密的工作反向回来。这就需要有一颗芯片,把这些加密网络包的数据进行还原,这样分发后CPU、GPU才能看得懂。”
DPU可以执行原本需要CPU处理的网络、存储和安全等任务,顺滑地接手CPU所不擅长的网络协议处理、数据加解密、数据压缩等数据处理任务,并且对各类资源分别管理、扩容、调度。
对芯片有深度了解的读者可能在这里就会有一个疑问,难道是现有数据中心的CPU、GPU、路由器、交换机不能继续作为“面向基础设施层的数据处理单元”了吗?鄢贵海解答道,“计算系统的研究很大程度上是‘优化’的研究;现有的基础设施不是不能,而是不够‘优化’。”
同时,DPU还有一个重要的价值——安全。业内人士分析,DPU作为一个独立的处理器,具有完全可编程性,兼具安全或测量启动功能,可以看作是通往主机的网络流量的消防带。DPU可实现基础设施可信的解决方案,仅启动处于供应商高度保护、特定版本的操作系统,运行特定的软件堆栈,而与主机软件完全隔离。以英伟达的DPU为例,当计算机系统物理上不联网时,DPU可防止入侵,从而承载了物理隔离安全特性的功能。
DPU核心议题:定制化和标准化
一般情况下,我们会认为定制设计才可实现性能和效率的最优,但放到真实的市场环境中,可能就有不一样的看法。
定制意味着没有冗余,必然同时带来覆盖场景较小的问题,这时候就需要考虑研发成本。而如果芯片设计为了覆盖尽可能多的场景,不得不实现功能超集,那实际的功能利用率和资源效率反而不是最高。
另一方面则事关应用生态。定制设计功能完全确定,那就难以覆盖复杂计算场景的差异化要求。这包括横向的不同用户的差异化需求,以及纵向的单个用户的迭代变化。即使同一场景,不同芯片厂家的定制设计引擎架构依然五花八门,毫无生态可言。
芯片厂家肯定期待一颗芯片被众多厂家采用,甚至希望用户捆绑到私有的架构平台上形成依赖。而用户需要的是所有芯片供应商提供一致性的硬件平台,一方面是不希望形成特定厂家依赖,另一方面是跨硬件平台迁移需要硬件一致性。
“现在整个行业发展特别快,尤其是数字经济,各行各业的需求非常碎片化,不太可能把这些都集成进芯片,所以我们的DPU是基于一个高度可编程的生态。”卢笙对澎湃新闻(www.thepaper.cn)说。
芯启源近日发布了全面开放的数据基础虚拟化及加速开发平台CODIVA。芯启源产品市场总监曹辉介绍,通过CODIVA,芯启源的合作伙伴和业内开发人员可以利用平台开放出的API接口,构建适合自身业务系统的网络、安全、存储、管理等数据基础设施。
这可能也是不断互动的结果,即芯片厂家和一些主流客户一起形成行业共识,建立一个开源开放的行业生态。
中国DPU芯片的发展机会
对比中美在DPU芯片方面的表现,鄢贵海认为,“DPU的性能问题,一方面是设计问题,比如结构是否优秀、功能是否完善等,另一方面是生产制造问题。从综合产品力来看,我们虽然局部技术上占有优势,整体上还难以与西方芯片巨头如英伟达、迈威等相匹敌,因此,目前DPU的整体格局还是典型的‘西强东弱’。”
同时,鄢贵海补充道,中国算力需求是全球最强劲的,服务器的需求增速全球第一,国家层面还有“新基建”中的“算力基础设施”的宏大布局、今年2月启动的“东数西算”战略布局、运营商开始广泛投入的“算力网络”的建设等。这不仅为DPU的发展提供了机遇,给整个信息技术、计算技术的发展都提供了新的机会。
卢笙也表示,“好消息是中国厂商和国际厂商都在同一起跑线上。”随着需求增长,中国市场本身体量很大,同时国家大力推进数字经济,这都给中国厂商发展提供了很好的土壤。卢笙认为,中国厂商在DPU领域能够脱颖而出的最大优势在于中国数字经济的应用场景走在世界前列,比如随处可见的移动支付等。
中国计算机学会专家曾在《DPU:以数据为中心的专用处理器》中估计,用于数据中心的DPU的使用量将达到和数据中心服务器等量的级别,每年以千万级新增,算上存量的替代,5年总体的需求将突破两亿枚。
在可预见的未来,DPU将主要应用于数据中心/云计算、智能驾驶、数据通信等领域,同时可能提升在网络安全、信创、国防军工等细分市场的渗透率。目前看来,云计算是DPU的主要应用场景。2017-2019 年,我国云计算行业规模增速均在 30%以上,2022年,我国云计算市场规模预计为2951.5 亿元。
这样的预期也带来了DPU芯片赛道的投资热潮。
仅在2021年,芯启源便完成了3轮融资,投资方包括软银中国、SIG海纳亚洲、中国互联网投资基金、华润资本润科基金、兴旺投资等。同一时间,大禹智芯、中科驭数、星云智联、益思芯等公司也成为VC/PE围猎的对象。其中,大禹智芯、中科驭数都在2021年完成了两轮数亿融资。
除此之外,互联网巨头如腾讯、美团、字节跳动、百度等也涌入了DPU赛道。比如2021年10月成立的云脉芯联,天使轮融资的投资方除了IDG资本和壁仞科技外,还有字节跳动的身影,美团和百度则同看中了星云智联。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司