深度学习和人工智能带来的变革伴随着巨大的成本。例如, OpenAI 的 ChatGPT 算法每天至少要花费 10 万美元才能运行。 这可以通过加
深度学习和人工智能带来的变革伴随着巨大的成本。例如, OpenAI 的 ChatGPT 算法每天至少要花费 10 万美元才能运行。 这可以通过加速器或旨在有效执行深度学习的特定操作的计算机硬件来减少。然而,这样的设备只有在材料层面上能够与主流的硅基计算硬件集成时才可行。
这阻碍了一个非常有前途的深度学习加速器——电化学随机存取存储器阵列 (ECRAM) 的实施——直到伊利诺伊大学香槟分校的一个研究团队首次实现了 ECRAM 到硅晶体管的材料级集成。由材料科学与工程系研究生崔劲松和曹庆教授领导的研究人员最近在自然电子杂志上报道了一种使用可在制造过程中直接沉积在硅上的材料设计和制造的ECRAM器件,实现了第一个实用的ECRAM基于深度学习的加速器。
“其他 ECRAM 设备具有深度学习加速器所需的许多难以获得的特性,但我们是第一个实现所有这些特性并与硅集成而没有兼容性问题的产品,”Cao 说。“这是该技术广泛使用的最后一个主要障碍。”
ECRAM 是一个存储单元,或在同一物理位置存储数据并将其用于计算的设备。这种非标准的计算架构消除了在内存和处理器之间传输数据的能源成本,允许非常高效地执行数据密集型操作。
ECRAM 通过在门和通道之间移动离子来对信息进行编码。施加到栅极端子的电脉冲将离子注入通道或从通道中吸取离子,由此产生的通道电导率的变化会存储信息。然后通过测量流过通道的电流来读取它。栅极和通道之间的电解质可防止不需要的离子流动,从而使 ECRAM 能够将数据保留为非易失性存储器。
研究团队选择了与硅微制造技术兼容的材料:用于栅极和通道的氧化钨、用于电解质的氧化锆以及作为移动离子的质子。这使得设备可以集成到标准微电子设备上并由其控制。其他 ECRAM 设备从神经过程甚至可充电电池技术中汲取灵感,并使用有机物质或锂离子,这两种物质都与硅微加工不相容。
此外,Cao 组设备还有许多其他功能,使其成为深度学习加速器的理想选择。“虽然硅集成至关重要,但理想的存储单元必须具备一系列特性,”Cao 说。“我们选择的材料具有许多其他令人满意的特性。”
由于栅极和通道端子使用相同的材料,因此将离子注入通道和从通道抽取离子是对称操作,简化了控制方案并显着提高了可靠性。该通道一次可靠地保持离子数小时,这足以训练大多数深度神经网络。由于离子是质子,是最小的离子,因此设备切换得非常快。研究人员发现,他们的设备可以持续超过 1 亿次读写循环,并且比标准内存技术更高效。最后,由于材料与微细加工技术兼容,设备可以缩小到微米级和纳米级,从而实现高密度和计算能力。
研究人员通过在硅微芯片上制造 ECRAM 阵列来执行矩阵向量乘法来展示他们的设备,这是一种对深度学习至关重要的数学运算。矩阵条目或神经网络权重存储在 ECRAM 中,该阵列通过使用存储的权重来改变产生的电流,对表示为施加电压的矢量输入执行乘法运算。此操作以及权重更新是在高度并行的情况下执行的。
“我们的 ECRAM 设备将最适用于对芯片尺寸和能耗敏感的 AI 边缘计算应用程序,”Cao 说。“与基于硅的加速器相比,这就是这种类型的设备具有最显着优势的地方。”
研究人员正在为新设备申请专利,他们正在与半导体行业合作伙伴合作,将这项新技术推向市场。Cao 表示,这项技术的主要应用是自动驾驶汽车,它必须快速了解周围环境并利用有限的计算资源做出决策。他正在与伊利诺斯州电气和计算机工程学院合作,将他们的 ECRAM 与铸造厂制造的硅芯片集成,并与伊利诺伊州计算机科学学院合作,以利用 ECRAM 的独特功能开发软件和算法。
声明本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们