Research Article
Taalas: 模型专用硬件 - 将AI模型转化为硅芯片
Taalas: 模型专用硬件 - 将AI模型转化为硅芯片
摘要
Taalas是一家AI芯片初创公司,通过模型硬件化技术实现1000倍性能提升。公司提出将AI模型权重直接固化为芯片晶体管,彻底消除内存墙问题。
论文要点
| 项目 | 内容 |
|---|---|
| 问题定义 | AI推理效率低下,90%能耗用于内存数据传输(内存墙问题) |
| 方法框架 | 模型专用化硬件架构:模型权重固化为晶体管电路,实现物理层面的存算合一 |
| 核心模块 | 权重固化层(MaskROM) + SRAM动态层(KV缓存) |
| 实验设置 | Llama 3.1 8B模型,台积电6nm工艺,815mm²芯片面积 |
| 实验结果 | 17000 tokens/s推理速度,性能/瓦提升1000倍,成本降低20倍 |
| 优点 | 消除内存墙,无需HBM/3D堆叠/液冷,单芯片即完整AI系统 |
| 局限 | 模型依赖性强(模型更新需重新定制硬件),3位量化精度损失 |
总结
Taalas通过模型硬件化重新定义AI芯片架构,是挑战英伟达的新尝试