油(yóu)然(rán)而(ér)生(shēng)为什么会上热搜?

最后编辑时间:2023-07-24 07:07:07 来源:未知 作者:未知 阅读量: 未知

  7月11日,英特尔宣布正式面向中国市场推出第二代深度学习加速器——Habana Gaudi2,该产品可用于加速AI训练及推理,合作方名单上包括了浪潮信息、新华三、超聚变等中国的主要服务器厂商。

  “在过去六个月,AI加速芯片因为大模型的关系忽然又再火了一把,接下来我们会有更多的资源投入,利用本土团队让这些中国定制版的产品能够加速落地。”英特尔公司执行副总裁、数据中心与人工智能事业部总经理Sandra Rivera对第一财经表示,未来会在合法合规的情况下推出更多针对中国市场的定制产品。

  Habana Gaudi 2作为英特尔AI战略的关键产品之一,有望打破目前芯片市场的固有格局。

  Habana Labs成立于2016年,主要研发方向为人工智能、深度学习计算等,创业初期就得到了英特尔的投资,而后在2019年12月以20亿美元被其正式收购。

  根据英特尔官方信息,Habana的第二代加速器Gaudi2主要解决了大规模语言模型、生成式AI模型的强算力需求问题。从参数看,该芯片采用台积电7nm工艺制造,集成24个可编程的Tenor张量核心(TPC)、48MB SRAM缓存、21个10万兆内部互连以太网接口(ROCEv2 RDMA)、96GB HBM2E高带宽内存(总带宽2.4TB/s)、多媒体引擎等,支持PCIe 4.0 x16,最高功耗800W。

  在性能上,根据机器学习与人工智能开放产业联盟MLCommons在六月底公布的AI性能基准测试MLPerf Training 3.0结果显示,Gaudi2是除了英伟达产品外,唯一能把MLPerf GPT 3.0模型跑起来的芯片。

  在发布会上,英特尔更是毫不避讳将产品与英伟达的同类产品进行比较,官方展出的PPT显示,Gaudi2运行ResNet-50的每瓦性能约是英伟达A100的2倍,运行1760亿参数BLOOMZ模型的每瓦性能约达A100的1.6倍。

  “英特尔正在降低人工智能的准入门槛,并强化客户在云端通过网络和智能边缘部署这一关键业务技术的能力,从而帮助构建中国人工智能的未来。”Sandra Rivera表示,虽然是定制版本,但是在性能上没有打折,网速和国际版相比从24个网口变成21个网口,但整个性能还是基本一致的。

  “在4月份的时候,看到了各种人工智能带来的芯片需求,包括Gaudi在内,需求至少翻了两倍以上。”Sandra透露,英特尔在2025年将会把Gaudi的AI芯片跟GPU路线图合二为一,推出一个更整合的GPU产品,以构造可持续的软件生态。

  伴随着大模型的火热,目前全球各大芯片公司都在积极进行AI芯片的布局。除了英伟达、英特尔等海外芯片厂商外,初创公司如Wave Computing、Groq、寒武纪、比特大陆等也加入了竞争的行列,陆续推出了针对AI的芯片和硬件系统。

  在此前举行的世界人工智能大会(WAIC)上,包括昆仑芯、登临、瀚博、天数智芯、燧原、墨芯、沐曦在内的芯片厂商也展示了各自AI芯片的能力。据不完全统计,目前与大模型“沾边”的AI芯片厂商已经超过三十家。

  在业内人士看来,以GPU、FPGA、ASIC为代表的AI芯片是目前可规模商用AI芯片的主要阵地,这类芯片主要基于传统芯片架构,对某类特定算法或者场景进行AI计算加速。此外,还有偏向于前沿技术的类脑芯片、可重构通用AI芯片等,但距离大规模商用还有较长距离。

(责任编辑:管理)