Research Article
PdNeuRAM: Forming-Free Multi-Bit ReRAM for Energy-Efficient Neuromorphic Computing
PdNeuRAM: Forming-Free, Multi-bit Pd/HfO₂ ReRAM for Energy-Efficient Neuromorphic Computing
原文链接: Nature Communications Engineering DOI: 10.1038/s44172-026-00650-3
摘要
PdNeuRAM 是一种新型的忆阻器(memristor)器件,采用钯(Pd)和氧化铪(HfO₂)材料体系,实现了无需 forming 工艺的多比特存储。该器件专为神经形态计算设计,能够在单器件上实现模拟突触权重存储,大幅降低 AI 加速器的能耗和面积开销。
1. 背景:神经形态计算与忆阻器
1.1 为什么需要神经形态计算
随着 AI 能耗的急剧增长,传统冯·诺依曼架构面临严峻挑战:
“As the electricity consumption of AI is projected to double by 2026, neuromorphic computing emerges as a promising solution.”
传统计算的局限:
- 数据在处理器和内存之间频繁搬运(内存墙问题)
- 数字运算功耗高,不适合边缘设备
- 难以实现真正的并行处理
神经形态计算的优势:
- 存算一体(In-Memory Computing)消除数据搬运
- 模拟计算实现高能效
- 事件驱动处理降低静态功耗
1.2 忆阻器作为突触器件
忆阻器(Memristor)是构建神经形态系统的理想器件:
- 模拟存储: 单器件可存储多比特权重
- 非易失性: 断电后保持状态
- 原位计算: 利用欧姆定律和基尔霍夫定律实现向量矩阵乘法
2. PdNeuRAM 器件创新
2.1 核心技术创新
PdNeuRAM 解决了传统 ReRAM 的两个关键问题:
创新 1: 无 Forming 工艺
传统 ReRAM 需要高电压 forming 工艺来初始化导电细丝,这带来了:
- 额外的制造步骤和成本
- 器件间一致性问题
- 可靠性风险
PdNeuRAM 采用 Pd/HfO₂ 材料体系,实现了 forming-free 操作:
“The Pd/HfO₂ interface enables controlled filament formation without a dedicated forming step, improving device yield and uniformity.”
创新 2: 多比特模拟存储
| 特性 | 传统 ReRAM | PdNeuRAM |
|---|---|---|
| 存储模式 | 二进制 | 模拟/多比特 |
| 电导级数 | 2 (ON/OFF) | >16 级 |
| 精度 | 1-bit | 4+ bits |
| 突触密度 | 低 | 高 |
2.2 器件特性
电学特性:
- 低操作电压: < 2V 的 SET/RESET 电压
- 高开关比: > 100 的 ON/OFF 比
- 良好保持性: > 10⁴ 秒 @ 85°C
- 耐久性: > 10⁶ 次开关循环
多比特能力:
- 可实现 4-6 比特的模拟权重存储
- 线性电导调制特性
- 低电导漂移
3. 神经形态计算应用
3.1 向量矩阵乘法 (VMM)
忆阻器交叉阵列实现高效的 VMM 运算:
Word Lines (输入电压)
│ │ │ │
▼ ▼ ▼ ▼
┌───┬───┬───┬───┐
──────┤G₁₁│G₁₂│G₁₃│G₁₄├────── Bit Line 1 (输出电流)
├───┼───┼───┼───┤
──────┤G₂₁│G₂₂│G₂₃│G₂₄├────── Bit Line 2
├───┼───┼───┼───┤
──────┤G₃₁│G₃₂│G₃₃│G₃₄├────── Bit Line 3
└───┴───┴───┴───┘
输出电流 Iᵢ = Σⱼ Gᵢⱼ × Vⱼ
3.2 神经网络推理加速
PdNeuRAM 可用于构建高能效的神经网络加速器:
性能对比 (归一化到数字实现):
| 指标 | 数字 CMOS | PdNeuRAM |
|---|---|---|
| 能效 (TOPS/W) | 1× | 10-100× |
| 面积效率 | 1× | 5-10× |
| 推理延迟 | 1× | 0.1-0.5× |
| 静态功耗 | 1× | 0.01× |
3.3 片上学习
PdNeuRAM 支持原位权重更新,实现片上学习:
- STDP 学习规则: 利用器件的模拟特性实现脉冲时间依赖可塑性
- 在线适应: 支持边缘设备的持续学习
- 低功耗更新: 皮焦耳级的权重更新能耗
4. 为什么对 AI 芯片设计重要
4.1 技术成熟度提升
PdNeuRAM 代表了忆阻器技术的重要进展:
- Forming-free: 简化制造工艺,提高良率
- 多比特存储: 减少器件数量,提高密度
- CMOS 兼容: 可与标准 CMOS 工艺集成
4.2 存算一体架构
PdNeuRAM 支持真正的存算一体架构:
传统架构 vs 存算一体:
传统架构: 存算一体架构:
┌─────────┐ 数据搬运 ┌─────────────────┐
│ 内存 │◄─────────────►│ 忆阻器阵列 │
└─────────┘ │ (存储+计算) │
│ └─────────────────┘
▼ │
┌─────────┐ ▼
│ 处理器 │ ┌─────────┐
└─────────┘ │ 激活函数│
└─────────┘
4.3 边缘 AI 应用
PdNeuRAM 特别适合边缘 AI 场景:
- 超低功耗: 微瓦级推理功耗
- 实时处理: 纳秒级模拟计算延迟
- 小型化: 高器件密度支持片上集成
典型应用:
- 智能传感器节点
- 可穿戴设备
- 物联网边缘设备
- 自动驾驶感知系统
4.4 挑战与机遇
剩余挑战:
- 器件间变异(Device-to-Device Variation)
- 温度敏感性
- 长期可靠性数据积累
- 与 CMOS 的异构集成
硬件设计机遇:
- 混合信号电路设计的新范式
- 容错计算架构
- 自适应校准电路
- 新型编程模型和编译器
5. 相关进展
5.1 其他忆阻器技术
| 技术 | 材料体系 | 特点 |
|---|---|---|
| PdNeuRAM | Pd/HfO₂ | Forming-free, 多比特 |
| OxRAM | HfO₂/TiN | 成熟工艺, 高可靠性 |
| CBRAM | Cu/Al₂O₃ | 低功耗, 快速开关 |
| PCM | Ge₂Sb₂Te₅ | 高耐久, 成熟存储技术 |
| MRAM | CoFeB/MgO | 高速度, 无限耐久 |
5.2 商业进展
- Intel: 基于 PCM 的 neuromorphic 芯片
- IBM: TrueNorth 和 NorthPole 神经形态处理器
- Mythic AI: 模拟计算加速器
- Aspinity: 模拟 ML 处理器
6. 总结
PdNeuRAM 代表了神经形态计算硬件的重要进展:
- 技术突破: Forming-free 多比特 ReRAM 器件
- 应用价值: 支持高能效的存算一体神经网络加速
- 商业化潜力: CMOS 兼容工艺,可规模化生产
- 生态影响: 推动边缘 AI 和神经形态计算的普及
对于 AI 芯片设计,忆阻器技术正在从实验室走向实际应用。PdNeuRAM 的技术路线——通过材料创新解决 forming 和多比特问题——为下一代 AI 硬件提供了可行的技术路径。随着制造工艺的成熟和生态系统的完善,基于忆阻器的神经形态芯片有望在 2026-2028 年实现规模化商用。
参考文献
- Kudithipudi, D., et al. (2025). PdNeuRAM: Forming-free, multi-bit Pd/HfO₂ ReRAM for energy-efficient neuromorphic computing. Communications Engineering, Nature.
- Hamdioui, S., et al. (2025). Memristor based computation-in-memory architecture for data-intensive applications.
- Ielmini, D., & Wong, H. S. P. (2018). In-memory computing with resistive switching devices. Nature Electronics.
- Nature. (2025). Neuromorphic computing at scale. Nature, 637, 801–812.