
车载人工智能计算芯片关键技术分析
(一)架构设计
车载人工智能计算芯片采用多核异构的集成化设计,其硬件主要包括计算核心、系统外设、数据外设三部分 。一是计算核心,主要包括 CPU核心、AI处理器等。CPU主要用于 提供标量算力 。AI处理器主要用于提供AI算力支撑,其类型主要包括神经网络计算单元、图像处理单元、数字处理单元 等一种或多种组合。二 是系统外设,主要 用于 维持芯片 基本的 正常运转,主要包括 电源、复位 、计数器、看门狗等。三 是数据外设,主要用于芯片和外界进行数据交换,主要包括模数转换、总线控制器、总线收发器、通用输入输出接口等。
架构设计在安全性方面应考虑功能安全、信息安全的协同设计。功能安全方面,需要采用系统化设计的思想,即目标应用中涉及安全的模块,都需要满足功能安全设计要求。信息安全方面,通常采用集成的 硬件安全模块,为系统提供全方位的数据保护。此外在车载人工智能计算芯片的安全设计过程中, 由于 功能安全以及信息安全不是孤立的,需同时考虑 这两 个维度的要求, 通过对二者进行 协同设计来保证系统 的 安全性。
(二)软硬件协同
设计软硬件协同设计可以实现车载人工智能计算芯片的综合优化。车载人工智能计算 芯片 的 算法与硬件架构深度耦合, 二者的 协同设计是实现 高效 人工智能 计算的重要 手段 。软硬件协同设计通过软件设计与硬件设计的并行开发与相互反馈,协调软件和硬件之间的制约关系,有利于缩短开发周期并降低开发成本,其重点和难点在于软 件任务与硬件任务的划分 与 调度, 实现 在 满足 目标约束 的 条件下提升 芯片的 整体计算能力。此外,软硬件协同设计可采用计算芯片作为中心载体,通过构建完备的异构计算体系,支持数据驱动人工智能系统进化,即利用实际驾驶场 景获取数据,通过系统开发、测试、安全评估等自动化迭代过程,促进计算芯片架构的优化设计。
软硬件协同设计需要综合考虑多个因素的影响。软硬件协同设计需要根据自动驾驶的应用场景设计深度学习算法, 制定合理的 算法优化 与 硬件架构 调整策略 通过 反复迭代 达到 硬件加速 的需求 。在开发策略方面,应考虑平衡精度和性能、数据链路的完整性(前后处理和网络加速相互配合)、多模型灵活调度、网络加速与应用直接配合等。在用户应用方面,需要考虑软件开发工具链与车载人工智能计算芯片的适配程度,并保证软件开发工具的开放性与便利性。此外,为实现兼容算法设计的快速迭代,硬件架构设计应具备一定的前瞻性 以适配汽车电气架构的设计要求 。
(三)互联通信和存储
互联通信主要包含外部通信总线和内部通信总线 。外部通信总线主要用于外部通信和外部扩展,既包含高速总线,如千兆 /万兆以太网、PCIe3.0/4.0等;又包含 传统总线,如 MIPI、 CANFD、 CAN、 SPI、UART、 I2C等;还包括存储扩展总线,如 LPDDR、 eMMC、 UFS接口等。为满足不同级别自动驾驶开发的灵活性要求,单个芯片设计算力通常可以满足当前辅助 驾驶的发展要求,多个芯片通过总线互联的方式(如使用 PCIe3.0/4.0总线)满足 更高 的算力需求。内部通信 总线用于实现芯片内部多个 组件 之间的数据交互。随着自动驾驶对数据需求的日益提高,芯片内部各 组件 间的数据交换需求不断提升,内部总线通信 通常采用 增加片内带宽、 应用 低功耗管理技术 、 优化内部空间布局等方法进行统筹设计, 以满足 内部数据 传输的 快速 性、稳定性 等要求。此外,未来应用缓存一致性总线可以实现多个芯片的缓存一致性互联,从而为自动驾驶提供跨片缓存无缝扩展能力。
内存布局通常采用片外内存加多级 片内缓存的方式,存内计算等新型内存技术亟待突破。内存带宽是限制 车载人工智能计算 芯片 计算性能提升 的一个关键要素,数据的存取速度直接影响着 AI芯片的处理速度。为了提升数据的存取速度,当前 AI芯片常采用片内缓存加片外内存的方案。对于片外存储,目前常采用高带宽存储器或低功耗双倍速率同步动态随机存储器。对于片 内存储, 目前 常采用 静态随机存取存储器,且可使用 增加片内缓存容量方法提高缓存带宽。在内存新技术研究方面, 存内计算将计算和存储合二为一,通过电路设计使存储器具有计算能力,将大部分计算放在存储器内完成,从而减少了处理器访问存储器的频率,如基于 NOR闪存的存算一体人工智能推理芯片。应用该技术可以使芯片实现低能耗、高效率、低延时等优点。目前,受限于 技术原因 ,存内计算尚未得到大规模应用。
(四)可靠性与安全性
车载人工智能计算芯片需满足严苛的设计标准、规范的体系要求以及生产测试要求,以实现高可靠性和长期(>10年)的质保承诺。车载芯片的可靠性要求指芯片设计的运行环境应覆盖车辆及其电控单元的应用环境要求,如温度、湿度等要求。可靠性设计需考虑晶体管老化导致晶体管性能变化,以及片上金属导线在大电流与高温下长期工作带来的可靠性问题。需要结合车规 级 芯片的规格要求进行电子迁移等规则检查,避免局部电流过大引起导线的可靠性问题。同时为满足部分电路大电流负载需要,对导线做加宽设计。在生产制造阶段还应考虑 选择符合要求的工艺和材料。目 前可靠性测试的主要参考标准是 AEC-Q100。AEC-Q100规定了一系列 可供参考的可靠性 测试,同时定义了应力测试驱动型认证的要求以及 IC认证的参考测试条件;根据工作温度、耐久性与可靠度 等工作 要求差异 AEC-Q100将汽车电子产品分为四个等级,并提出了相应的测试要求。
车载人工智能计算芯片安全性主要考虑功能安全和信息安全。功能安全主要 考虑复杂的车载系统中芯片可能出现的失效, 通过合理的安全机制的监控和诊断 ,及时发现潜在的失效,并及时进行失效处理功能安全的主要 参考 标准是 ISO 26262《道路车辆 功能安全》。信息安全主要考虑安全启动、用户认证、访问控制、数字签名、数据加密与解密等要求,常通过支持硬件加密与解密 (含国密算法 、密钥管理及验签、安全 /可信启动、安全升级、数据安全存储、安全与非安全域隔离等方式加以实现。目前信息安全的主要参考是 ISO/SAE 21434《道路车辆 网络安全》 及密码安全相关的标准 。此外,在芯片软件过程改进及能力评定方面,需参考 A-SPICE相关标准。
(五)算力与制程工艺选择
峰值算力并不能完整体现出AI处理器的真实处理能力, 该能力同时 受 到 多种因素的影 响。汽车自动驾驶的发展对芯片算力的要求不断提升通常业界会 将峰值算力 选做 衡量 车载人工智能计算 芯片的主要指标,但峰值算力只反映其理论上的最大 AI计算能力,实际应用场景中 AI处理器的处理能力受到 软件 SDK Software Development Kit,软件开发工具包)、模型、环境、模型输入等多重因素的影响,仅使用峰值算力单个指标来判断芯片的 AI计算能力具有很大的局限性。此外,由于芯片算法演进速度远超硬件改进速度, 使得 AI性能的评估方法与 不断演进的 算法之间存在脱节的问题。
芯片制程工艺不断提升,其选择需综合考虑成本、功耗、车规级要求等多个因素。芯片性能需求的不断提升驱动着芯片制程工艺的不断发展。制程工艺的选择需要考虑车规级芯片的特殊要求,如代工厂是否符合 IATF16949 质量管理体系的要求、制造工艺本身是否已经通过 AEC Q100 可靠性验证并达到目标产品的可靠性等级要求、是否可以采购针对该工艺节点的成熟 IP 等。制程工艺的选择还需要综合考虑制程发展、成本、供应链等因素,国内芯片厂商主要以实现量产化为目的,而非单纯追求先进性。
(六)基准测试
基准测试可作为评价人工智能芯片性能的参考依据之一,目前缺乏面向车用领域的专用基准测试方法。各大公司针对芯片关键性能(尤其在 算力方面)展开了激烈的竞争,基准测试成为展现其芯片性能的重要途径。国内外多个行业组织机构都推出了相关 AI性能评测方法或标准, 表 1举例展示了四种基准测试方法 。现有的 AI芯片基准测试评价对象以偏通用领域人工智能芯片为主,兼顾个别细分领域。关注的内容主要包括测试指标选择、测试场景选择、以及测试结果的表示等。目前AI芯片基准测试常选用典型神经网络模型的测试结果
来评价 AI芯片整体性能,该方法面临 的主要挑战在于需要不断提升芯片的泛化能力,通常芯片应用典型网络模型可以获得良好的性能表现,但当典型神经网络模型被更换为其他类型或其自身出现更新时,芯片性能可能表现出某种程度的下降。车载人工智能计算芯片属于AI芯片的一个细分领域,有其特殊的场景、模型、性能等要求,目前亟待提出面向车载人工智能计算芯片的专用基准评测标准。
国内外基准测试标准或方法简介
文章转载自公众号:智能汽车设计
