澎湃Logo
下载客户端

登录

  • +1

阿里要软硬件一体化:发布最高性能AI推理芯片含光800

澎湃新闻记者 承天蒙
2019-09-25 10:51
来源:澎湃新闻
10%公司 >
字号

9月25日,全球最高性能AI推理芯片含光800发布。  主办方供图

9月25日,由阿里巴巴集团主办的云计算行业峰会-云栖大会在杭州开幕。会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋宣布,阿里巴巴第一颗自研芯片,全球最高性能AI推理芯片含光800发布。

张建锋同时宣布,基于含光800的AI云服务正式上线,性价比可提升100%。

发布含光800芯片时,张建锋拿出一张芯片展示,称“这个芯片真的非常大”。

发布会现场。

张建锋通过图表展示,该芯片的性能和能效均超过了友商的水平。

据达摩院介绍,在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍,张建锋称:“含光800是阿里巴巴在芯片领域的万里长征第一步。”

发布会现场。

据张建锋介绍,含光800的研发用了互联网公司的速度,从完成设计到流片只用了一年半的时间。张建锋表示,阿里将成为一家软硬件一体化的公司。

张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”

含光为上古三大神剑之一,该剑含而不露,光而不耀,正如含光800带来的无形却强劲的算力。在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。

含光800性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。

含光800已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。

过去半年,平头哥先后发布玄铁910、无剑SoC平台。随着含光800的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和AI芯片,实现了芯片设计链路的全覆盖。

    责任编辑:孙扶
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈