专业的编程技术博客社区

网站首页 > 博客文章 正文

Imagination E 系列 GPU :图形与 AI 的融合计算引擎,边缘智能新架构

baijin 2025-06-13 11:12:15 博客文章 4 ℃ 0 评论

芝能智芯出品


Imagination Technologies 推出全新一代 E 系列 GPU IP,首次在 GPU 架构中深度融合 AI 加速能力,面向图形与边缘 AI 双重工作负载,实现最高 200 TOPS 的计算性能,并显著优化功耗与面积效率。


通过创新的神经核心(Neural Core)与突发处理器(Burst Processor)设计,E 系列不仅保留了图形渲染的强大能力,还打通了 AI 工作负载低精度(INT8/FP8)运算的加速路径。


我们从架构设计、系统集成、功耗控制和应用适配四个维度出发,以可编程 GPU 为基础,融合图形与 AI 算力需求,为车载智能、AI PC、工业视觉与消费终端打造面向未来的统一计算平台。



Part 1

重新定义架构边界:

从 GPU 到 AI 计算核心的深度融合


战略转向:从 NNA 到神经核心的架构一体化


Imagination 在 2023 年终止独立神经网络加速器(NNA)的研发,标志着其 AI 路线由“专用硬件”转向“架构融合”。


其核心判断是:专用 NPU 难以持续保持高效利用率与可扩展性,特别是在多任务边缘系统中。



E 系列 GPU 的 AI 加速由两个关键模块组成:


神经核心(Neural Core):集成至 GPU 内部,支持 INT8/FP8 精度矩阵运算,最大算力达 200 TOPS。


突发处理器(Burst Processor):优化调度与数据复用,降低 AI 工作负载的数据移动开销,提高执行效率。


这一设计复用了 GPU 原有寄存器、缓存、调度器等资源,从根本上减少独立 AI 加速器所需的 SRAM、逻辑区域和数据搬运路径,显著优化 PPA(性能、功耗、面积)指标。



架构优化:纹理单元+压缩引擎的跨用途再利用



E 系列 GPU 延续 PowerVR 架构的并行渲染设计,同时对部分图形单元进行了“AI 化”改造:


纹理格式支持 + 数据格式转换单元,可直接适配 INT8、FP8、bfloat16 等低精度 AI 张量;


图形压缩单元(如 BC、ASTC)扩展支持压缩 AI 权重与中间结果;


共享缓存机制(TCM)提升计算和图形任务的协同效率。


在实际硬件上,E 系列可在四核配置下实现约 13 TFLOPS 的 FP32 浮点图形性能,配合 200 TOPS 的 AI 运算,为边缘系统提供统一的可编程处理器平台。



Part 2

以系统为导向:

面向边缘 AI 的功耗

与延迟最优化工程实现



内存亲和与数据局部性:AI 能效优化的核心


与传统独立 NPU 依赖片外 DRAM 不同,E 系列强调片上局部内存计算优先(Local-first),其神经核心主要使用:


紧耦合内存(TCM)进行中间特征图的快速读写;


高速共享缓存进行多任务间数据交换;


避免反复访问外部 LPDDR/DDR,提高数据能效比。


这种“靠近数据计算”架构设计,与现阶段 SoC 系统内大量数据交互特点高度契合,可使整体功耗降低 30% 以上。


突发处理器通过降低流水线深度、减少调度开销,使 E 系列在处理小模型或分片 AI 工作负载时,能保持稳定性能密度,是传统深流水专用 NPU 难以做到的。



多任务与虚拟化能力:从图形扩展到异构智能协同


在支持 AI 工作负载之外,E 系列提供了增强的多任务调度与 QoS(服务质量)机制:


最多可支持 16 个零开销虚拟机 并行运行,适配多域安全架构(特别面向车载)


分层调度系统:底层硬件调度器处理数据依赖,RISC-V 控制器管理任务优先级;


支持 OpenCL、Vulkan、TVM、oneAPI 等标准生态,开发门槛低,迁移路径清晰。



这使得 E 系列不仅能完成图形渲染与 AI 推理,还能胜任工业控制、人机交互、系统监控等多元异构任务,为边缘计算系统提供统一调度和资源控制能力。


小结

融合架构的战略价值

E 系列引领边缘智能的计算新路径


E 系列是 GPU 架构与边缘 AI 应用深度融合的新阶段。面对终端侧 AI 计算日益增长的多样性与能效需求,Imagination 准确把握了三大关键工程趋势:


一是以融合设计替代传统专用逻辑,通过 AI 与图形任务的模块复用,显著提升架构密度与调度效率;


二是强调数据亲和性作为性能驱动核心,从依赖外部数据搬运转向本地高效复用,实现边缘智能场景下的功耗优化;


三是构建标准化工具链,全面支持主流异构计算 API 与编译器,降低系统集成门槛,提升开发效率与可持续部署能力。


面向 AI PC、工业视觉、智能驾驶舱乃至智能手机与可穿戴设备等多元边缘场景,E 系列 GPU 不仅仅是一颗高性能图形处理器,更是一个面向未来的通用型 AI 图形融合计算引擎,为系统设计者提供以最小面积与功耗代价实现图形与 AI 协同处理的硬件基础。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表