手机网站

客服
添加收藏夹

电子元器件
采购平台

扫码手机查询

IC交易网站 ——ConvNext 的运行速度比 Fallback 快 28 倍

发表日期:2024-07-22

IC芯片网www.icxpw.com了解,两个月前,我们在博客中强调了使用传统 NPU 加速器搭配 DSP 或 CPU 进行“后备”操作的谬误。(后备失败惨不忍睹2024 年 5 月)。在那篇博客中,我们计算了带有 DSP 的系统在执行当今领先的新型 ML 网络之一 ConvNext 中的新操作时预期的性能。结果令人沮丧——如果新的操作符 GeLu 和 LayerNorm 不存在于硬连线 NPU 加速器中,而是在当今市场上最大、最强大的 DSP 核心上运行,则尝试运行 ConvNext 主干每秒的推理次数不到一次。

7 月 16 日,Quadric 发布了 ConvNext 网络的首批实现。与 DSP-NPU Fallback 性能相比,对于同样大的输入图像尺寸:1600 x 928,Quadric 的 Chimera QC Ultra GPNPU 比 DSP+NPU 组合快 28 倍(28,000%!)。这不是一个玩具网络,而是一个真正有用的图像尺寸。Quadric 不仅发布了 ConvNext 的一个不同变体的结果,还发布了三个不同变体的结果:Tiny 和 Small 变体,输入图像尺寸为 640×640、800×800、928×1600。所有结果都可以在Quadric Developers' Studio中在线查看。


https://www.icxpw.com/uploads/ueditor/20240722


编译代码,无需手工制作

IC芯片网-IC芯片电子元器件采购平台介绍,为什么我们要同时提供三种不同的半导体 ConvNext 变体?为什么在我们上次发布(4 月)仅仅 3 个月(2024 年 7 月)之后,这三个变体就与 50 多个其他新网络示例同时添加到在线 DevStudio 环境中?是不是因为 Quadric 拥有一支超高产的数据科学家和低级软件程序员大军,www.icxpw.com他们在强迫劳动营里每周 7 天、每天 24 小时坐在电脑前,每天吃的都是糖果和能量饮料?还是因为我们的 Chimera Graph Compiler (CGC) 的重大新功能改进,导致数百个新网络突然涌现?事实证明,与违反劳动法相比,构建图形编译技术要高效得多,也更符合道德规范。

此最新版本的 CGC 编译器完全处理了芯片 ConvNext 中的所有图形运算符,这意味着我们能够直接从网络上的模型存储库获取模型源,并自动编译源模型以针对我们的 Chimera GPNPU。对于 ConvNext,它是来自 OpenMMLab 的 GitHub 存储库,其中包含源 Pytorch 模型。登录 DevStudio 亲自查看链接芯片源代码!不是手工制作的。没有运算符交换。没有耗时的模型大手术。只是一个世界级的编译堆栈,针对可以运行任何机器学习模型的完全可编程的 GPNPU。

支持型号数量呈爆炸式增长

也许比我们支持 ConvNext 的能力(高达 28 FPS 的帧速率)更令人印象深刻的是,www.icxpw.com随着我们的工具链迅速成熟,在 Chimera 处理器上编译和运行的工作模型数量惊人地增加

更多模型,更快的代码

IC芯片网-电子元器件采购平台分析,在最新软件版本中,我们不仅在模型支持广度方面取得了巨大飞跃,而且随着 CGC 编译器内部优化过程的不断扩展和改进,我们还继续在以前运行的模型上提供渐进式性能改进。一些网络在过去 3 个月内就实现了超过 50% 的改进。我们知道我们的 ConvNext 数字将迅速提高。随着我们的编译器技术不断发展和成熟,性能改进将在未来数月和数年内持续进行,因为与具有固定功能集和固定性能的硬连线加速器不同,处理器可以随着工具链中的优化和算法的发展而不断改进。

可编程通用IC NPU (GPNPU)

Quadric 将数据流阵列加速器的最佳属性与完全可编程性相结合,在保持无限可编程性的同时,实现了高 ML 性能。基本的 Chimera 架构将一个乘法累加 (MAC) 单元块与一个全功能 32 位 ALU 和一个小型本地内存配对。然后,这个 MAC-ALU-内存构建块(称为处理单元 (PE))被平铺到 PE 矩阵中,形成一系列半导体GPNPU,提供 1 TOP 到 864 TOP。Chimera GPNPU 部分是脉动阵列,部分是 DSP,实现了效率和完全面向未来的承诺。


上一篇:

IC交易电子网——全球芯片行业一周回顾

返回列表 下一篇:

IC网电子网——安森美为大众各电动汽车品牌提供基于 SiC 的电源解决方案

资讯排行榜

  • 1

    电子元器件IC回收价格及行情分析

  • 2

    探讨电子元器件 IC 回收的价值与流程

  • 3

    从基本器件到先进技术的全面解读_IC芯片网

  • 4

    IC芯片查询网——GB200 硬件架构 - 组件供应链和 BOM

  • 5

    台积电 OIP 生态系统论坛 2024 预览 _IC芯片网

  • 6

    电子元器件耐温性能标准及测试方法

  • 7

    GigaDevice推出全新EtherCAT®子设备控制器芯片_IC芯片网

  • 8

    英飞凌因开发 3300V 垂直通道 SiC 沟槽 MOSFET 获德国未来奖提名_IC芯片网

  • 9

    揭秘AMD EYPC 9554服务器CPU的技术杀手锏:高核心数和高主频的完美融合——IC芯片网

推荐文章

  • 不妥协的分组测试改善了 DFT 工作_IC芯片网

    2025-01-15

  • 流式扫描网络_IC芯片网

    2025-01-15

  • 不断变化的 EDA 世界中的初创企业挑战_IC芯片网

    2025-01-14

  • 使用 CMA/SPDM 和高级加密技术避免 PCIe® 传输遭受黑客攻击_IC芯片网

    2025-01-14

  • D-Matrix 旨在实现“真实世界场景”的快速 LLM 推理_IC芯片网

    2025-01-14

  • PIMIC 为麦克风添加微型 AI,瞄准大型 AI 芯片 _IC芯片网

    2025-01-14

  • 全球芯片行业一周回顾_IC芯片网

    2025-01-13

  • ROHM 推出 1kW 级高功率红外激光二极管样品_IC芯片网

    2025-01-13

  • Aledia 推出用于沉浸式 AR 的微型 LED 技术_IC芯片网

    2025-01-13

  • Matter 1.4 智能家居的进步_IC芯片网

    2025-01-13

  • 解决早期 IC 设计的可靠性问题_IC芯片网

    2025-01-10

  • GPU 计算在汽车中的应用_IC芯片网

    2025-01-10

  • ISO 26262 的重要性不仅限于汽车领域_IC芯片网

    2025-01-10

  • 软件定义汽车如何改变汽车芯片设计_IC芯片网

    2025-01-10

  • 边缘和物联网安全正在迎来转折点_IC芯片网

    2025-01-10