韩国首尔,2024 年 4 月 16 日 --- 完整内存子系统 IP 提供商 OPENEDGES Technology, Inc. (OPENEDGES,科斯达克股票代码:394280) 很高兴宣布推出 ENLIGHT Pro, 这种最先进的推理神经处理器单元 (NPU) IP 的性能比上一代 ENLIGHT(或 ENLIGHT Classic) 高出四倍,使其成为高性能边缘设备(包括汽车、相机等)的理想解决方案。 ENLIGHT Pro 经过精心设计,可提供增强的灵活性、可扩展性和可配置性,以紧凑的面积提高整体效率。
ENLIGHT Pro 支持Transformer模型,这是现代人工智能 (AI) 应用程序,特别是大型语言模型 (LLM)的关键要求。LLM在文本识别和生成等任务中发挥着重要作用,他们在广泛的数据集上使用深度学习技术进行训练。汽车行业预计将采用LLM来为客户的询问提供即时、个性化和准确的答复。
▲ OPENEDGES Technology NPU 工程师 Steven Kang 在办公室专注工作
ENLIGHT Pro 的独特之处在于 8 位整型处理性能达到每时钟周期 4096 个MAC, 速度是其前身的四倍,并且在 14nm 上运行频率高达 1.0GHz。它提供从 8 TOPS (每秒亿万亿次操作) 到数百TOPS的性能范围,并针对灵活性和可扩展性进行了优化。ENLIGHT Pro支持张量变换操作,包括切片、分割和转置,并支持多种数据类型 --- 整型 8、16、32和浮点(FP) 16和32 --- 确保跨计算任务的灵活性。该矢量处理器实现了每时钟周期完成64个FP16 MAC,并包含一个 32x2 KB 的矢量寄存器文件 (VRF)。 此外,还提供单核、双核和四核以及可扩展的任务映射,例如多模型、数据并行和张量并行。
ENLIGHT Pro集成了RISC-V CPU矢量扩展和自定义指令,这包括对Softmax 和本地存储访问的支持,从而增强了其整体灵活性。它配备了一个软件工具包,支持广泛使用的网络格式,例如ONNX (PyTorch)、TFLite (TensorFlow) 和CFG (Darknet)。ENLIGHT Pro 通过网络编译器简化浮点网络到整型网络的转换,并通过网络编译器生成NPU命令和网络参数。由此,ENLIGHT Pro 一经推出就已经成功赢得了客户。
OPENEDGES以其卓越的先进内存子系统IP解决方案(包括NoC、DDR控制器和DDR PHY)而闻名,在全球市场上树立了一个重要的里程碑,其IP已获得全球60多种 SoC 产品的授权。在NPU设计领域,实现高吞吐量和功效始终至关重要。然而,在NPU 性能不断发展的格局下,内存带宽被视为一个关键瓶颈,超出了人工智能处理能力。 随着数据集变得越来越庞大,处理大量数据的效率关键取决于可用的内存带宽。OPENEDGES的 ENLIGHT Pro与其内存子系统IP结合进行了高度优化,形成了紧密集成的解决方案,推动SoC 实现极高的带宽效率。
▲ NPU 团队负责人Jake Choi开发NPU IP“ENLIGHT系列
“OPENEDGES 非常感谢 ENLIGHT Pro 开发背后的优秀团队,他们的奉献精神和承诺加速了该项目的推出。” OPENEDGES的NPU团队负责人Jake Choi说道, “在我们最近获得的ISO9001:2015认证的基础上,OPENEDGES正在积极追求ISO26262 汽车安全完整性等级 (ASIL) B以及我们的内存子系统IP的更高合规性级别。”
Comments