1、NPU能提高AI算法运行效率
根据观研报告网发布的《中国NPU行业现状深度分析与投资前景研究报告(2025-2032)》显示,NPU即神经网络处理单元,采用专门优化的神经网络计算架构,来处理特定的任务,主要被用于加速计算。通过对NPU硬件层面优化,能高效处理神经网络算法中矩阵乘法、卷积等数学运算。相较于GPU和CPU,NPU在AI计算上性能和能效有了明显提升,用来提高AI算法运行效率。
NPU与GPU区别
特性 | NPU | GPU |
设计初衷 | 专用于神经网络计算 | 最初用于图形渲染,现广泛用于通用计算 |
计算能力 | 高效的神经网络推理 | 强大的并行计算能力,主要用于云端 |
灵活性 | 专用硬件,较低的灵活性 | 通用性高,可以编程实现各种计算任务 |
能效比 | 高 | 相对较低 |
典型应用 | 深度学习推理,边缘计算,实时处理 | 图形渲染,深度学习训练和推理,科学计算 |
资料来源:观研天下整理
2、AI算力提升带来NPU行业需求端爆发
NPU专用于AI运算,核心是矩阵乘法运算,CNN是主要算法之一,本质上由大量的乘法累加计算组成。随新AI应用、模型与需求的发展,NPU有望快速上量。根据数据,2020-2024年我国AI算力规模由134.2 EFLOPS增长至725.3 EFLOPS,CAGR为52.5%。
数据来源:观研天下整理
同时,在智能手机上运行端侧生成式AI的AI算力门槛约为30TOPS,旗舰智能机在2021-2022年逐步达到这一标准、且仍在进步,预计2025年将达到60TOPS以上。而生成式AI应用的繁荣,将驱动所需算力的实质性增长。根据相关资料,每天基于生成式AI的搜索查询超过100亿次,其中移动端占比超过60%;智能手机基于精准的端侧用户画像,与大模型结合,伴随对话功能的不断改进,将逐步成为真正的个人助手。
手机厂商内嵌AI大模型概况
手机厂商 | 大模型研发 | 应用进展 | |
苹果 | 与中国多厂商测试大模型 | iOS18发布Apple Intelligence大模型(端侧30亿),并积极与OPENAI和谷歌接触 | 宣布年内国行机引入通义大模型 |
华为 | HarmonyOS4接入盘古大模型 | HarmonyOSNEXT搭载盘古大模型5.0(端侧15-70亿) | 小艺接入DeepSeek |
三星 | 自研大模型Gauss | GalaxyZ系列首次引入谷歌GeminiNano大模型(端侧约30亿) | 推出自有生成式多模态AI模型Gauss2;Bixby接入智谱智能AI |
OPPO | ColorOS14搭载AndesGPT大模型 | 大模型升级为AndesGPT-2.0(端侧70亿) | 宣布折叠旗舰OPPO Find N5接入DeepSeek-R1 |
vivo | OriginOS4搭载蓝心大模型 | OriginOS5搭载全新蓝心大模型矩阵(最高端侧跑通130亿参数) | OriginOS官宣将深度融合满血版DeepSeek |
荣耀 | 逐步开始引入 | MagicOS9.0支持30亿参数的端侧大语言模型 | YOYO智能体商店上线DeepSeek-R1尝鲜版 |
资料来源:观研天下整理
3、智驾渗透率提升,驱动更高算力需求,我国NPU行业需求将持续释放
而在智能驾驶方面,以高通智驾系统为例,其感知软件栈和驾驶策略软件栈需始终于本地运行,所以智驾对时延的要求极其严苛,云端无法针对此类工作负载发挥任何作用。高通在2024年末发布的座舱与智驾芯片,应用增强的Hexagon NPU,较此前一代AI算力有大幅提升,且后期可继续通过外挂NPU的方式继续扩展算力。
高通车载NPU芯片参数
类别 | 型号 | 发布年份 | 制程 | 核心数 | 场景 |
座舱 | 骁龙Cockpit Elite(8397) | 2024 | 4nm | - | 配对Ride Elite |
骁龙SA8295 | 2023 | 5nm | 8 | / | |
骁龙SA8155 | 2021 | 7nm | 8 | / | |
智驾 | 骁龙RideElite(8797)(舱驾一体) | 2024 | 4nm | - | 针对L2+L3 |
骁龙8650 | 2023 | 4nm | 8 | 已应用于零跑、大疆车载“成行平台”,本田、通用、大众、宝马等预计25-26年逐步搭载。 | |
骁龙8540 | 2023 | 5nm | 16 | 未量产 |
资料来源:观研天下整理
由此可见,随着智驾解决方案支持GenAI模型,汽车对端侧算力的要求将进一步提升,并且伴随越来越多车企布局智能驾驶市场,我国NPU行业在该领域的需求将持续释放。
各车企智能驾驶布局情况一览
车企 | 产品 | 是否依赖高精地图 | 感知算法/大模型 | 端到端规划 | 城市NOA开城进展(需陆续OTA) |
特斯拉 | FSD12 | 无需高精地图 | 首个端到端自动驾驶系统 | (已推送北美所有内部员工)FSDV12可用于北美全地区道路 | / |
蔚来 | NAD | 不依赖高精地图 | BEV Transformer大模型:0ccupany占用网络 | 实现数据驱动(端到端前置能力)的规划网络 | 覆盖726城 |
理想 | ADMax3.0 | 不依赖高精地图 | BEV大模型:0ccupancy占用网络 | 规划算法逐步切换为时空联合规划算法;模块化架构提升为大模型为主的端到端架构 | 覆盖全国 |
小鹏 | XNGP | 不依赖高精地图 | 基于BEV Transformer的Xnet(24年Xnet2.0具备0ccupancy) | 2024年XNGP+有望实现端到端 | 覆盖全国 |
华为 | ADS2.0 | 不依赖高精地图 | Bev Transformer大模型:基于0ccupancy的GOD2.0 | - | 覆盖全国 |
资料来源:观研天下整理
4、机器人产业进入快速发展期,市场需求驱动NPU行业爆发
NPU在机器人使用广泛,有加速计算、降低系统功耗、实现实时交互和决策等优势。在机器人进行深度学习任务,如语音识别、图像分类、目标跟踪时,NPU能显著加快计算速度,比传统CPU和GPU更高效地处理大量数据。进入2025年,国内多家人形机器人企业相继宣布各自的量产消息,市场需求驱动NPU行业爆发。2025年1月17日,乐聚(深圳)机器人技术有限公司在北汽越野车公司举行了乐聚第100台全尺寸人形机器人交付仪式。该公司表示,乐聚人形机器人已迈入批量交付新阶段。未来如果技术加速突破、成本快速下降,我国人形机器人规模展望千亿元甚至万亿元市场,预计2030年有望达约8700亿元。

数据来源:观研天下整理(WYD)