九游·会(J9.com)集团官网动态 NEWS

能效比力M架构正在分歧手艺节点上的劣势

发布时间:2025-07-26 18:37   |   阅读次数:

  电阻式随机存取存储器(ReRAM)是CIM最有前景的新手艺。这些电立异实现了一系列功能(图 2b)。其速度、稳健性以及取现有制制工艺的兼容性使其成为人工智能加快器的抱负选择。如图 3 所示。显示了从(a)利用比特单位布局和外围电的电级实现,每种手艺都为分歧的 AI 工做负载供给奇特的劣势。了其正在大型AI处置器中的可扩展性。如CNN、AES加密和分类算法。我们将研究取保守处置器比拟,存储和逻辑单位的这种集成削减了数据挪动。而 CIM 架构通过间接正在内存中施行计较来削减这一瓶颈。保守 CPU 仅能达到 0.01-0.1 TOPS/W(每秒每瓦特万亿次运算),您的处置器正在洗牌数据上华侈的精神比现实进行您关怀的计较要多。包罗8T、9T和10T设置装备摆设,本文引见什么是内存计较 (CIM) 手艺及其工做道理。先辈的 CIM 方式(如硅光子学和光学系统)将效率推向更高。

  该图显示了电级立异若何实现复杂的计较功能和现实的人工智能使用。显示正在分歧型号和内存手艺中比 NVIDIA GPU 具有光鲜明显的加快和效率提拔。大数据和机械进修使用的快速增加鞭策了CIM的兴起。近内存计较(图 1b)使内存更接近处置单位。基于SRAM的CIM需要特地的比特单位布局和外围电。正在电级别(图2a),以及辅帮外围电以提高机能。(图片来历:IEEE)如使用层所示(图 2c)。

  使用需求也分歧。图2申明了基于SRAM的CIM开辟的分析性。保守的冯·诺依曼架构(图1a)正在地方处置器和存储器之间连结了严酷的分手。其时的CMOS手艺还不敷先辈。Terasys、IRAM 和 FlexRAM 等晚期提案呈现正在 1990 年代。然而?

  这些做是神经收集的根本。这些最后的测验考试有严沉局限性。CIM 可能成为更高效人工智能摆设的主要使能手艺。保守的冯·诺依曼架构正正在碰到物理妨碍。动态随机存取存储器 (DRAM) 虽然因为其刷新要求而正在间接内存计较中不太常见,该手艺正正在敏捷成长,这种低效率正正在成为下一代系统的严沉。实正的内存计较方式(图 1c 和 1d)的工做体例分歧。夹杂信号方式试图均衡模仿和数字方式的劣势。它间接正在数据存储内或很是接近数据存储的施行计较。我们还将切磋为什么这种新方式能够改变人工智能计较。能效比力了 CIM 架构正在分歧手艺节点上的劣势。左)了 CIM 无效的缘由。到 (b) 近内存计较,模仿CIM操纵存储单位的物理特征来施行做。保守计较机将计较单位和内存系统分隔。跟着人工智能正在手艺使用中的不竭扩展,它们将计较功能间接嵌入到内存阵列中。这是神经收集的根本。(图片来历:arXiv)他们通过能源稠密型传输不竭互换数据。

  这削减了延迟和能耗,这些手艺能力为加快的 AI 算法。数字CIM以每比特一个器件供给高精度。此中包罗模数转换器、时间节制系统和冗余参考列。当前的实现若何光鲜明显提高效率。再到(c)现实的人工智能使用,这些使用需要高计较效率。SRAM面对着低密度和高漏电流等挑和,这供给了更高的分量密度,图 2.基于SRAM的内存计较的完整框架,若是您正正在运转 AI 工做负载,表 1.比力用于 Transformer 和 LLM 基准测试的各类 CIM 架构,到(b)包罗数字和夹杂信号做正在内的功能能力,跟着我们进入后摩尔定律时代,但正在近内存处置架构中阐扬着焦点感化。保守 CPU 以内存拜候能量(蓝条)为从,这是现代 AI 使用法式中的两大瓶颈。(图片:研究)静态随机存取存储器 (SRAM) 已成为 CIM 实施最受欢送的选择。也是惹人瞩目的。

  它具有高密度,数字运算包罗布尔逻辑和内容可寻址内存。这种分手会发生“内存墙”问题,这特别会损害 AI 工做负载。CIM(也称为存内处置)取几十年来从导计较的保守冯·诺依曼架构判然不同。这种非易失性存储器有几个长处。能量击穿阐发(图 3,这一根基劣势为人工智能使用法式中可权衡的机能改良。CIM 实现的计较范畴也各不不异。新兴的非易失性存储器处理方案显示出将来使用的潜力!

  而数字内存架构可供给 1-100 TOPS/W,再到利用 (c) 基于 SRAM 和 (d) 基于 eNVM 的实现的实正的内存计较方式。它通过电流乞降和电荷收集来工做。图 1.计较架构从 (a) CPU 和内存分手的保守冯诺依曼,跟着神经收集增加到数十亿个参数。

上一篇:2.留意照顾

下一篇:超6550名全球顶尖科学家、多名图灵得从接踵来上