一张图系列 - “position_embedding” - 码农知识堂

一张图系列 - “position_embedding”
关于位置编码，我感觉应该我需要知道点啥？
1. 0、需要知道什么知识？
2. multi head atten 计算
3. 复数的常识
4. 1、embedding 是什么？
5. position embedding常识、概念，没有会怎样？
6. 交换token位置，没有PE的话，atten怎么变化？
7. 2、PE如何实现？需要什么特性？
8. sin, cos 频率、周期、波长、如何转换？
9. 为什么这么设计？是如何演进的？
10. 三角位置编码有哪些重要特性？代码如何实现？
11. 3、绝对位置编码&相对位置编码的定义与分类
12. 绝对位置编码
13. 相对位置编码
14. ROPE原理推导、外推长度？
15. 4、ROPE的具体实现代码
16. 实现方式1
17. 实现方式2
什么是position_encoding:

Positional encoding 是在 transformer 模型中用于表示单词位置信息的一种技术。它的主要作用有:
1. 在 transformer 模型中,由于attention机制是并行计算的,输入的词向量不包含顺序信息,需要positional encoding来表示单词位置。
2. 让模型学习单词之间的相对位置关系,从而明确上下文语义。
3. 允许模型学习词序信息,判断词语顺序是否重要。比如"little boy"和"boy little"在语义上是不同的。
4. 通过在词向量中加入位置信息,可以帮助注意力机制学习句子中单词的相关程度。位置邻近的单词更可能有关联。
5. Positional encoding一般通过在词向量中加入正弦曲线来实现。通过不同频率的正弦曲线来表示词语的相对位置。
6. Positional encoding使得模型对词序变化更加鲁棒,能处理词序调整后的句子。
总之,Positional encoding为transformer模型提供了顺序信息,是实现transformer表征能力的重要组成部分。它让模型明确单词顺序和上下文关系,从而更好地理解语义。

参考链接：

1、十分钟读懂旋转编码（RoPE）

2、RoPE引起的长度外推思考

3、六种位置编码的代码实现及性能实验

4、图解Transformer系列一：Positional Encoding（位置编码）

5、Transformer中的位置编码(Position Encoding)

6、【OpenLLM 009】大模型基础组件之位置编码-万字长文全面解读LLM中的位置编码与长度外推性（上）

7、开源LLM大模型位置编码探索
```
文章首发在“小晨的AI工作室”
因为无法上传高清大图，请公众号回复“rope”进行下载原图。
```
相关阅读:
MongoDB安装及进程介绍
 Linux—搭建Apache(httpd)服务
 UGUI父对象自适应子元素布局解决方案
 linux系统调用拦截Centos7.6（二）のSSH连接
 初学Flutter：实现底部导航切换
 Docker(三)、Dockerfile探究
 DC-4 靶机
 面试：自定义view / viewgroup 相关问题
 Cloud
自动化测试3:Junit单元测试框架
原文地址：https://blog.csdn.net/sinat_15355869/article/details/134429229