登录

华为AI芯片昇腾910C的技术特点、市场前景

嘉峪检测网 2025-05-12 20:25

导读:本文介绍了华为AI芯片昇腾910C的技术特点、市场前景。

突破在当今数字化时代,AI技术的快速发展对芯片的算力和能效提出了前所未有的要求。Ascend 910C作为国产AI芯片的代表之一,其技术突破和市场表现备受关注。本文将结合摩根士丹利(Morgan Stanley)的最新研报以及其他相关机构的研究,深入解析华为昇腾910C的技术特点、市场前景以及投资机会。

 

据 DeepSeek 的研究人员称,在推理方面,它能达到英伟达 H100 性能的 60%。虽然昇腾 910C 并非性能冠军,但它能够成功减少中国对英伟达 GPU 的依赖。‘

 

根据Lennart Heim的分析,Ascend 910C在FP16精度下的算力约为800 TFLOPS,内存带宽约为3.2 TB/s,性能大约达到英伟达H100的80%。尽管存在差距,但Ascend 910C在成本和能效比方面具有显著优势,单卡成本约为1800美元,仅为H100的1/5。

 

910C 处理器的推理性能超出预期。此外,通过对 CANN 内核进行手动优化,其效率还能进一步提高。DeepSeek's 对Ascend的原生支持及其 PyTorch 代码库,使得从 CUDA 到 CANN 的转换能够轻松无缝进行,从而更易于将华为的硬件集成到人工智能工作流程中。

 

 

一, 910C 架构和 升级突破

 

(一)简介

 

Ascend 910C芯片 double 910B FP16 600TFLOPS采用了华为自研的达芬奇架构,具有强大的计算能力和能效比,能够支持多种深度学习框架和算法,广泛应用于Cloud computing, edge computing和Aiot等领域。这款芯片的主要特点包括高性能、高能效比、多种应用场景和开放性

 

Ascend910C并非AI training的最佳选择。该领域,Nvdia仍保持着无可争议的领先地位。 

Ascend 910C 选择了相对成熟的技术:将两颗独立的 Ascend 910B 芯片分别放置在各自的Interposer,再通过有机基板将两个Interposer连接起来。这种封装方式虽然在芯片间互联带宽上可能低于 NVIDIA 的先进封装方案,但具有更低的成本、更高的良率以及更快的量产速度。

通过这种Dual-core interconnect架构,Ascend 910C 的运算能力和存储器容量达到了 Ascend 910B 的两倍,同时增强了对各类 AI 工作负载数据的支持能力

下图是封装示意图 (非官方)

(二)子模块910B分析

 

 

 

Ascend 910B

是Ascend 910的升级版本,采用中芯国际的N+1工艺(等效7nm)

 

芯片尺寸为21.32 mm × 31.22 mm,面积665.61 mm²

 

• FP16算力:约320 TFLOPS。

• INT8算力:约640 TOPS。

• 显存:64GB HBM2e。

• 显存带宽:400 GB/s。

• 功耗:310W。

在架构和性能上进行了优化,以适应更复杂的AI计算任

其Virtuvian芯片包含25个“新达芬奇”AI核心,可能是对原有达芬奇核心的改进,以适应新的工艺和性能需求

 

• CANN生态:华为通过CANN(Compute Architecture for Neural Networks)软件栈和MindSpore框架支持910C,兼容TensorFlow和PyTorch,提升开发者友好性。

 

安装CANN工具包(以5.1.RC2版本为例)

 

wget https://ascend-repo.obs.cn-east-2.myhuaweicloud.com/CANN/5.1.RC2/Ascend-cann-toolkit_5.1.RC2_linux-aarch64.run

 

chmod +x Ascend-cann-toolkit_5.1.RC2_linux-aarch64.run

 

./Ascend-cann-toolkit_5.1.RC2_linux-aarch64.run --install

 

 

达芬奇架构(Da Vinci Core)

 

 

二、Ascend 910C:技术突破与战略意义

 

(一)技术突破

 

Ascend 910C是首款基于SMIC N+2(7nm), 包含530亿个晶体管. 的AI训练芯片。通过Chiplet package,和上一代类似,Ascend 910C将多个小芯片拼接成一个大芯片,实现了算力的显著提升。其核心参数如下:

 

• 算力:在FP16精度下,单卡算力达到781.25TFLOPS,综合性能对标

 

英伟达H100的60%-95%。

 

• 能效比:功耗为310W,通过系统级优化(如CloudMatrix384超节点)实现万卡集群线性度>95%,MFU达到55%。

 

• 成本优势:单卡成本约为1800美元,仅为H100的1/5,售价约2万元人民币,推动企业AI部署成本降至传统方案的20%。世界前10AI部署至今没有国内芯片算力卡

 

(二)战略意义

 

Ascend910C的推出不仅标志着国产AI芯片在技术上的重大突破,还在战略上具有深远意义:

 

• 打破封锁:Ascend910C打破了对华AI芯片的技术封锁,成为H20特供版的替代首选。

 

• 支撑“东数西算”工程:Ascend910C为国产算力的自主可控提供了核心支持,助力“东数西算”工程的顺利推进。

 

• 推动AI普惠化:通过大幅降低训练成本,Ascend910C推动了AI技术的普惠化,使更多企业能够负担得起高性能AI计算。

 

三、核心利好:量产加速、生态完善与政策红利

 

(一)量产与订单速发

 

Ascend910C的量产计划已经明确:

 

• 产能规划:2025年Q2开始量产,首批出货量达到7万颗,全年目标出货量为80万颗。2026年将推出支持FP8的910D版本

 

• 客户验证:阿里、腾讯、百度等头部企业已完成测试,比亚迪、深圳龙岗区已落地AI质检与城市中枢项目。还中标了深圳政务AI系统32亿元订单,进一步巩固了其在市场中的地位。

 

(二)技术迭代与生态协同

 

Ascend910C在软件和生态方面也取得了显著进展:

 

• 软件适配:AscendMindSpore 2.6支持类DeepSeek V3/R1 Moe架构模型,系统吞吐率提升2.8倍。

 

• 产业链合作:与80家伙伴联合开发大模型一体机,适配160+第三方模型,覆盖金融、智能制造等场景。

 

 

 

(三)政策与成本驱动

 

在政策和成本方面,Ascend910C也具有显著优势:

 

• 国产替代:在美制裁下,Ascend910C成为国内智算中心的核心算力底座,订单量突破7万片(价值20亿美元)。

 

• 成本优势:训练成本仅为行业巨头的3%-5%,推动AI普惠化。

 

四、产业链核心供方:从芯片制造到场景落地

 

(一)上游:芯片制造与封装

 

• SMIC(688981):Ascend910C的代工方,N+2工艺良率提升至50%,2025年相关收入或超50亿元。

 

(二)中游:核心零部件

 

• 华丰科技(688629):高速背板连接器市占率70%,单台Ascend服务器需8-12个连接器,2025年营收增量或达24亿元。

 

• 泰嘉股份(002843):Ascend服务器电源独家代工,单卡电源价值量超5000元,出口美国业务占比不足2%,关税影响有限。

 

(三)下游:服务器与行业应用

 

• 拓维信息(002261):推出Atlas800服务器,参与多地智算中心建设,2025年订单预计翻倍。

 

• 神州数码(000034):Ascend服务器代工龙头,2024年市占率超30%,中标深圳政务AI系统32亿元订单。

 

(四)配套技术:液冷与散热

 

• 申菱环境(301018):Ascend液冷一供,单千瓦解决方案价值4000元,2025年市场规模或超百亿。

 

• 网宿科技(300017):浸没式液冷方案进入商用阶段,PUE均值低至1.049,技术溢价空间显著。

 

五、风险与挑战

 

尽管Ascend910C在技术、市场和政策方面都取得了显著进展,但仍面临一些挑战:

 

• 技术瓶颈:7nm能效比落后于英伟达4nm产品,HBM内存与先进封装仍依赖海外技术。

 

• 产能压力:SMIC扩产进度及封装厂商产能能力制约出货量。

 

• 生态短板:CUDA生态成熟度远超Ascend,开发者迁移需长期投入。正如英伟达CEO黄仁勋所言:“大多数的AI新创都奠基于英伟达的CUDA平台,英伟达的策略就是让平台衍生出庞大的软件生态,让后者难以突破。

 

五、市场表现与未来展望

 

(一)市场表现

 

根据摩根士丹利的最新研报,中国在GPU领域的自给率正在快速提升。2024年中国人工智能GPU的自给率为34%,预计到2027年将提升至82%。这一增长主要得益于Ascend系列和寒武纪等本土供应商的努力。华为Ascend910C作为其中的代表,其性能和市场表现尤为突出。

 

(二)未来展望

 

摩根士丹利预测,到2027年,中国云人工智能市场规模将达到480亿美元,占全球总量的20%。Ascend910C及其后续产品将在这一市场中扮演重要角色。此外,SMIC的产能扩张和良率提升也将为Ascend910C的量产提供有力支持。

 

(三)量化数据

 

• 自给率:2024年34%,2027年预计提升至82%。小米利用自己出色的整合能力把暴力都会做成白菜价, 

 

• 市场规模:2027年全球云人工智能市场规模预计达到2390亿美元,中国占20%。

 

• 产能:SMIC预计为Ascend910C分配2.6万片晶圆/月的产能,假设良率为30%-50%。

 

六、供应链

 

从短期来看,Ascend910C的量产与订单放量将直接拉动上游硬件(连接器、电源)的需求。中长期来看,需要关注软件生态突破与国产替代政策的落地。建议关注以下核心标的:

 

• 华丰科技:高速背板连接器市场领导者,受益于Ascend服务器的快速出货。

 

• 泰嘉股份:Ascend服务器电源独家代工,市场地位稳固。

 

• SMIC:作为Ascend910C的代工方,受益于工艺良率提升和订单增长。

 

• 申菱环境:液冷技术领先,为Ascend910C的提供散热需求。

 

同时,建议投资者关注液冷、封装等配套环节的技术迭代,这些领域也将迎来新的发展机遇。

 

七、总结

 

Ascend910C作为国产AI芯片的代表,不仅在技术上取得了重大突破,还在市场和政策方面展现了强大的竞争力。尽管面临技术瓶颈和生态短板等挑战,但随着技术的不断进步和政策的支持,Ascend910C有望在AI芯片市场中占据重要地位。对于投资者来说,Ascend910C及其产业链的核心标的提供了丰富的投资机会,值得长期关注。

来源:芯芯有我

关键词: 芯片

相关资讯

我要检测 电话咨询