码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 一张图系列 - “position_embedding”


    关于位置编码,我感觉应该我需要知道点啥?

    1. 0、需要知道什么知识?

    2. multi head atten 计算

    3. 复数的常识

    4. 1、embedding 是什么?

    5. position embedding常识、概念,没有会怎样?

    6. 交换token位置,没有PE的话,atten怎么变化?

    7. 2、PE如何实现?需要什么特性?

    8. sin, cos 频率、周期、波长、如何转换?

    9. 为什么这么设计?是如何演进的?

    10. 三角位置编码有哪些重要特性?代码如何实现?

    11. 3、绝对位置编码&相对位置编码的 定义与分类

    12. 绝对位置编码

    13. 相对位置编码

    14. ROPE原理推导、外推长度?

    15. 4、ROPE的具体实现代码

    16. 实现方式1

    17. 实现方式2

    什么是position_encoding:

    Positional encoding 是在 transformer 模型中用于表示单词位置信息的一种技术。它的主要作用有:

    1. 在 transformer 模型中,由于attention机制是并行计算的,输入的词向量不包含顺序信息,需要positional encoding来表示单词位置。

    2. 让模型学习单词之间的相对位置关系,从而明确上下文语义。

    3. 允许模型学习词序信息,判断词语顺序是否重要。比如"little boy"和"boy little"在语义上是不同的。

    4. 通过在词向量中加入位置信息,可以帮助注意力机制学习句子中单词的相关程度。位置邻近的单词更可能有关联。

    5. Positional encoding一般通过在词向量中加入正弦曲线来实现。通过不同频率的正弦曲线来表示词语的相对位置。

    6. Positional encoding使得模型对词序变化更加鲁棒,能处理词序调整后的句子。

    总之,Positional encoding为transformer模型提供了顺序信息,是实现transformer表征能力的重要组成部分。它让模型明确单词顺序和上下文关系,从而更好地理解语义。

    参考链接:

    1、十分钟读懂旋转编码(RoPE)

    2、RoPE引起的长度外推思考

    3、六种位置编码的代码实现及性能实验

    4、图解Transformer系列一:Positional Encoding(位置编码)

    5、Transformer中的位置编码(Position Encoding)

    6、【OpenLLM 009】大模型基础组件之位置编码-万字长文全面解读LLM中的位置编码与长度外推性(上)

    7、开源LLM大模型位置编码探索

    1. 文章首发在“小晨的AI工作室”
    2. 因为无法上传高清大图,请公众号回复“rope”进行下载原图。
  • 相关阅读:
    MongoDB安装及进程介绍
    Linux—搭建Apache(httpd)服务
    UGUI父对象自适应子元素布局解决方案
    linux系统调用拦截Centos7.6(二)のSSH连接
    初学Flutter:实现底部导航切换
    Docker(三)、Dockerfile探究
    DC-4 靶机
    面试:自定义view / viewgroup 相关问题
    Cloud
    自动化测试3:Junit单元测试框架
  • 原文地址:https://blog.csdn.net/sinat_15355869/article/details/134429229
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号