AI Infra：Transformer 模型转换为 SNN 模型的工具调研

将 Transformer 模型（一种基于注意力机制的连续激活人工神经网络，ANN）转换为脉冲神经网络（SNN），本质上是桥接连续计算与离散脉冲编码的范式转变

一、脉冲神经网络（SNN）的优缺点

SpikingJelly：

GitHub: https://github.com/fangwei123456/spikingjelly

SNN Toolbox：

自动化 ANN 到 SNN 转换，支持 Keras/PyTorch 模型，但原生针对 CNN（如 MNIST），Transformer 需 hack（如线性化注意力）
特征：模拟 spiking 神经元（LIF/IF），测试工具链完整
局限：不支持非卷积架构，Transformer 转换易过拟合时序噪声

GitHub: https://github.com/NeuromorphicProcessorProject/snn_toolbox。

SpikeZIP-TF：

全等价 ANN-SNN 转换，专为 Transformer 设计，通过激活量化构建精确映射，避免精度退化（ImageNet 83.82%，SST-2 93.79%）
工作原理：ZIP 量化（零点偏移）+ 时序展开，确保 spike 率等价于 ReLU 输出
开源，易集成 Hugging Face Transformer

GitHub: https://github.com/Intelligent-Computing-Research-Group/SpikeZIP_transformer

Transformer-to-SNN-ECMT（Expectation Compensation Multi-Threshold）：

首个高精度、低延迟 Transformer 转换，引入期望补偿模块（用前 T-1 步信息预测 T 步输出）+ 多阈值神经元，精度损失仅 1%，4 时步下功耗降 65%
非线性模块 → 补偿残差 → 平行归一化 → spiking 输出
适用于 ViT/BERT 等

GitHub: https://github.com/h-z-h-cell/Transformer-to-SNN-ECMT

SpikedAttention：

https://neurips.cc/virtual/2024/poster/94181

SIT-Conversion：

https://www.preprints.org/manuscript/202410.2403/v1

ANN2SNN_COS（Calibrating Offset Spikes）：

GitHub: https://github.com/hzc1208/ANN2SNN_COS

ANN2SNN_SRP（Residual Membrane Potential）：

GitHub: https://github.com/hzc1208/ANN2SNN_SRP

SNN-conversion-QCFS：

GitHub: https://github.com/putshua/SNN-conversion-QCFS。

在有训练 Transformer 模型原始数据的情况下，厂商更有机会训练一个效果接近的 SNN 模型，专门用于处理实际使用过程中超长上下文的case，以降低成本

标签：ai