码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • neon常用指令(updating)


    函数参考手册:
    https://developer.arm.com/architectures/instruction-sets/simd-isas/neon/intrinsics
    并在左侧选择neon\

    039%2Fimage.png&pos_id=img-zzYBGlM1-1694746128006)



    Neon 128bit寄存器,所以可支持并行运算 加快运算速度 减少循环
    CPU运算比加载数据快,速度瓶颈在加载数据这里。



    指令集命名形式,后续有例子说明:
    在这里插入图片描述




    变量支持如下:此外int还分为int8,int16,int32.对应定点开发s8,s16, s32 Float uint 类似int
    在这里插入图片描述




    以下为目前开发中所涉及的常用指令
    初始化指令
    vld1q_s16 load 16x8
    vld1_s16 load 16x4
    示例:
    在这里插入图片描述
    在这里插入图片描述


    vdup_n_s16(n) 初始化int16x4_t 变量,全为n
    vdupq_n_s16(n) 初始化int16x8_t 变量,全为n


    乘法指令:
    16x8 vqdmulhq_s16 ( 16x8, 16x8) Lshl 1 and extractH and saturating
    16x8 vqrdmulhq_s16 (16x8 , 16x8) Lshl 1 and extractH and saturating + rounding
    V vector q saturating r rouding d Doubling mul mult h extrachH q 区分int16x8与int16x4
    16x4 vqdmulh_s16 ( 16x4, 16x4) Lshl 1 and extractH


    相反数:
    int16x8 vnegq_s16(int16x8) negate int16x8
    int16x8 vqnegq_s16(int16x8) negate + saturating
    int16x4 vneg_s16(int16x4) negate int16x4


    取低位指令
    int16x4 vget_low_s16(int16x8_t) 取int16x8_t 前4个值出来


    移位指令
    int16x4 vqshl_n_s16(s16x4 , shift) 左移shift位并饱和处理
    int16x8 vqshlq_n_s16(s16x8, shift) 左移shift位并饱和处理
    int16x4 vshr_n_s16(s16x4,shift) 右移shift位
    int16x8 vshrq_n_s16(s16x8,shift) 右移shif

  • 相关阅读:
    操作系统备考学习 day6(2.3.2 - 2.3.4)
    【无标题】
    Python爬虫|基础知识点详细汇总(requests、urllib、re、bs4、xpath、多线程、协程、数据保存、selenium)
    微软出品自动化神器【Playwright+Java】系列(十二)测试框架的设计与开发
    金仓数据库KingbaseES客户端编程开发框架-Hibernate Spatial(3. Hibernate-Spatial 配置)
    攻防演练案例讲溯源
    ShuffleNet v2网络结构复现(Pytorch版)
    写给数据科学家:GitHub实践指南教程;交互式图像标注工具(像素级);Kindle高亮笔记的导出工具;人脸分析库;前沿论文 | ShowMeAI资讯日报
    你的RPCvs佬的RPC
    黑马JVM学习笔记-内存结构
  • 原文地址:https://blog.csdn.net/qq_43681115/article/details/132897435
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号