目录

位置敏感模型和位置不敏感模型

  • 位置敏感模型:RNN和TextCNN等
  • 位置不敏感模型:attention

绝对位置编码和相对位置编码

绝对位置编码

现在普遍使用的一种方法Learned Positional Embedding编码绝对位置,相对简单也很容易理解。直接对不同的位置随机初始化一个postion embedding,加到word embedding上输入模型,作为参数进行训练。

相对位置编码

两种编码相对位置的方法:Sinusoidal Position Encoding和Complex embedding。

  • 余弦位置编码

  • 复数位置编码

参考

  • https://mp.weixin.qq.com/s/DQvhw6gTJt2V_8CPD0jHEQ