Welcome
Transformer详解 Transformer详解
1.IntroductionTransformer 是一个完全基于自注意力机制(Self-Attention)的编解码器模型,它摒弃了传统的 RNN 和 CNN,通过多头注意力捕捉序列的全局依赖关系,并利用前馈神经网络进行特征变换,辅以残差