PdNeuRAM: Forming-Free, Multi-bit Pd/HfO₂ ReRAM for Energy-Efficient Neuromorphic Computing

原文链接: Nature Communications Engineering DOI: 10.1038/s44172-026-00650-3

摘要

PdNeuRAM 是一种新型的忆阻器(memristor)器件,采用钯(Pd)和氧化铪(HfO₂)材料体系,实现了无需 forming 工艺的多比特存储。该器件专为神经形态计算设计,能够在单器件上实现模拟突触权重存储,大幅降低 AI 加速器的能耗和面积开销。


1. 背景:神经形态计算与忆阻器

1.1 为什么需要神经形态计算

随着 AI 能耗的急剧增长,传统冯·诺依曼架构面临严峻挑战:

“As the electricity consumption of AI is projected to double by 2026, neuromorphic computing emerges as a promising solution.”

传统计算的局限:

  • 数据在处理器和内存之间频繁搬运(内存墙问题)
  • 数字运算功耗高,不适合边缘设备
  • 难以实现真正的并行处理

神经形态计算的优势:

  • 存算一体(In-Memory Computing)消除数据搬运
  • 模拟计算实现高能效
  • 事件驱动处理降低静态功耗

1.2 忆阻器作为突触器件

忆阻器(Memristor)是构建神经形态系统的理想器件:

  • 模拟存储: 单器件可存储多比特权重
  • 非易失性: 断电后保持状态
  • 原位计算: 利用欧姆定律和基尔霍夫定律实现向量矩阵乘法

2. PdNeuRAM 器件创新

2.1 核心技术创新

PdNeuRAM 解决了传统 ReRAM 的两个关键问题:

创新 1: 无 Forming 工艺

传统 ReRAM 需要高电压 forming 工艺来初始化导电细丝,这带来了:

  • 额外的制造步骤和成本
  • 器件间一致性问题
  • 可靠性风险

PdNeuRAM 采用 Pd/HfO₂ 材料体系,实现了 forming-free 操作:

“The Pd/HfO₂ interface enables controlled filament formation without a dedicated forming step, improving device yield and uniformity.”

创新 2: 多比特模拟存储

特性 传统 ReRAM PdNeuRAM
存储模式 二进制 模拟/多比特
电导级数 2 (ON/OFF) >16 级
精度 1-bit 4+ bits
突触密度

2.2 器件特性

电学特性:

  • 低操作电压: < 2V 的 SET/RESET 电压
  • 高开关比: > 100 的 ON/OFF 比
  • 良好保持性: > 10⁴ 秒 @ 85°C
  • 耐久性: > 10⁶ 次开关循环

多比特能力:

  • 可实现 4-6 比特的模拟权重存储
  • 线性电导调制特性
  • 低电导漂移

3. 神经形态计算应用

3.1 向量矩阵乘法 (VMM)

忆阻器交叉阵列实现高效的 VMM 运算:

        Word Lines (输入电压)
            │   │   │   │
            ▼   ▼   ▼   ▼
          ┌───┬───┬───┬───┐
    ──────┤G₁₁│G₁₂│G₁₃│G₁₄├────── Bit Line 1 (输出电流)
          ├───┼───┼───┼───┤
    ──────┤G₂₁│G₂₂│G₂₃│G₂₄├────── Bit Line 2
          ├───┼───┼───┼───┤
    ──────┤G₃₁│G₃₂│G₃₃│G₃₄├────── Bit Line 3
          └───┴───┴───┴───┘

    输出电流 Iᵢ = Σⱼ Gᵢⱼ × Vⱼ

3.2 神经网络推理加速

PdNeuRAM 可用于构建高能效的神经网络加速器:

性能对比 (归一化到数字实现):

指标 数字 CMOS PdNeuRAM
能效 (TOPS/W) 10-100×
面积效率 5-10×
推理延迟 0.1-0.5×
静态功耗 0.01×

3.3 片上学习

PdNeuRAM 支持原位权重更新,实现片上学习:

  • STDP 学习规则: 利用器件的模拟特性实现脉冲时间依赖可塑性
  • 在线适应: 支持边缘设备的持续学习
  • 低功耗更新: 皮焦耳级的权重更新能耗

4. 为什么对 AI 芯片设计重要

4.1 技术成熟度提升

PdNeuRAM 代表了忆阻器技术的重要进展:

  • Forming-free: 简化制造工艺,提高良率
  • 多比特存储: 减少器件数量,提高密度
  • CMOS 兼容: 可与标准 CMOS 工艺集成

4.2 存算一体架构

PdNeuRAM 支持真正的存算一体架构:

传统架构 vs 存算一体:

传统架构:                    存算一体架构:
┌─────────┐    数据搬运    ┌─────────────────┐
│  内存   │◄─────────────►│   忆阻器阵列    │
└─────────┘               │  (存储+计算)    │
     │                    └─────────────────┘
     ▼                           │
┌─────────┐                      ▼
│  处理器 │                 ┌─────────┐
└─────────┘                 │  激活函数│
                            └─────────┘

4.3 边缘 AI 应用

PdNeuRAM 特别适合边缘 AI 场景:

  • 超低功耗: 微瓦级推理功耗
  • 实时处理: 纳秒级模拟计算延迟
  • 小型化: 高器件密度支持片上集成

典型应用:

  • 智能传感器节点
  • 可穿戴设备
  • 物联网边缘设备
  • 自动驾驶感知系统

4.4 挑战与机遇

剩余挑战:

  • 器件间变异(Device-to-Device Variation)
  • 温度敏感性
  • 长期可靠性数据积累
  • 与 CMOS 的异构集成

硬件设计机遇:

  • 混合信号电路设计的新范式
  • 容错计算架构
  • 自适应校准电路
  • 新型编程模型和编译器

5. 相关进展

5.1 其他忆阻器技术

技术 材料体系 特点
PdNeuRAM Pd/HfO₂ Forming-free, 多比特
OxRAM HfO₂/TiN 成熟工艺, 高可靠性
CBRAM Cu/Al₂O₃ 低功耗, 快速开关
PCM Ge₂Sb₂Te₅ 高耐久, 成熟存储技术
MRAM CoFeB/MgO 高速度, 无限耐久

5.2 商业进展

  • Intel: 基于 PCM 的 neuromorphic 芯片
  • IBM: TrueNorth 和 NorthPole 神经形态处理器
  • Mythic AI: 模拟计算加速器
  • Aspinity: 模拟 ML 处理器

6. 总结

PdNeuRAM 代表了神经形态计算硬件的重要进展:

  1. 技术突破: Forming-free 多比特 ReRAM 器件
  2. 应用价值: 支持高能效的存算一体神经网络加速
  3. 商业化潜力: CMOS 兼容工艺,可规模化生产
  4. 生态影响: 推动边缘 AI 和神经形态计算的普及

对于 AI 芯片设计,忆阻器技术正在从实验室走向实际应用。PdNeuRAM 的技术路线——通过材料创新解决 forming 和多比特问题——为下一代 AI 硬件提供了可行的技术路径。随着制造工艺的成熟和生态系统的完善,基于忆阻器的神经形态芯片有望在 2026-2028 年实现规模化商用。


参考文献

  1. Kudithipudi, D., et al. (2025). PdNeuRAM: Forming-free, multi-bit Pd/HfO₂ ReRAM for energy-efficient neuromorphic computing. Communications Engineering, Nature.
  2. Hamdioui, S., et al. (2025). Memristor based computation-in-memory architecture for data-intensive applications.
  3. Ielmini, D., & Wong, H. S. P. (2018). In-memory computing with resistive switching devices. Nature Electronics.
  4. Nature. (2025). Neuromorphic computing at scale. Nature, 637, 801–812.