【CN110038301A】数据处理方法、装置、电子设备及存储介质【专利】

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910290213.5
(22)申请日 2019.04.11
(71)申请人 网易(杭州)网络有限公司
地址 310052 浙江省杭州市滨江区长河街
道网商路599号4幢7层
(72)发明人 冯艺 
(74)专利代理机构 北京润泽恒知识产权代理有
限公司 11319
代理人 莎日娜
(51)Int.Cl.
A63F 13/60(2014.01)
(54)发明名称
数据处理方法、装置、电子设备及存储介质
(57)摘要
本申请提供了一种数据处理方法、装置、电
子设备及存储介质。

其中方法包括:调用SSE指令
函数,将用于保存原始数据的第一内存地址和用
于保存运算结果的第二内存地址传入所述SSE指
令函数的参数;利用所述SSE指令函数调用非对
齐内存读取接口函数从所述第一内存地址中读
取所述原始数据,并将所述原始数据加载到SSE
寄存器中;利用所述SSE指令函数调用逻辑运算
函数对所述原始数据进行逻辑运算,并将运算结
果保存至所述SSE寄存器中;利用所述SSE指令函
数调用非对齐内存写入接口函数将所述运算结
果写入所述第二内存地址。

本申请能够保证数学
库的SSE指令函数在普通的x86机器上正确运行,
提高数学库整体的运算效率。

权利要求书3页 说明书15页 附图17页CN 110038301 A 2019.07.23
C N 110038301
A
权 利 要 求 书1/3页CN 110038301 A
1.一种数据处理方法,其特征在于,所述方法包括:
调用SSE指令函数,将用于保存原始数据的第一内存地址和用于保存运算结果的第二内存地址传入所述SSE指令函数的参数;
利用所述SSE指令函数调用非对齐内存读取接口函数从所述第一内存地址中读取所述原始数据,并将所述原始数据加载到SSE寄存器中;
利用所述SSE指令函数调用逻辑运算函数对所述原始数据进行逻辑运算,并将运算结果保存至所述SSE寄存器中;
利用所述SSE指令函数调用非对齐内存写入接口函数将所述运算结果写入所述第二内存地址。

2.根据权利要求1所述的方法,其特征在于,所述将所述原始数据加载到SSE寄存器中的步骤,包括:
在所述原始数据为单精度浮点类型的矩阵数据时,将所述矩阵数据中的每一列数据加载到一个SSE寄存器中;
在所述原始数据为单精度浮点类型的向量数据时,将所述向量数据加载到一个SSE寄存器中。

3.根据权利要求1所述的方法,其特征在于,所述调用SSE指令函数,将用于保存原始数据的第一内存地址及用于保存运算结果的第二内存地址传入所述SSE指令函数的参数的步骤,包括:
利用Mat4类中定义的Mat4指令函数通过统一MathUtil函数接口调用MathUtil类中定义的MathUtil指令函数,将所述第一地址和所述第二地址传入所述MathUtil指令函数的参数;
利用所述MathUtil指令函数通过第一SSE函数接口调用MathUtilSSE类中定义的所述SSE指令函数,将所述第一地址和所述第二地址传入所述SSE指令函数的参数。

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
删除MathUtil.h头文件中定义的第二SSE函数接口;所述第二SSE函数接口的参数为__ m128类型传递;
在所述MathUtilSSE类中定义所述第一SSE函数接口;所述第一SSE函数接口的参数为内存地址传递。

5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在所述MathUtil指令函数中添加调用所述SSE指令函数的SSE实现语句;
所述利用所述MathUtil指令函数通过第一SSE函数接口调用MathUtilSSE类中定义的SSE指令函数的步骤,包括:
利用所述MathUtil指令函数执行所述SSE实现语句,通过第一SSE函数接口调用MathUtilSSE类中定义的SSE指令函数。

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将用于声明数据结构与成员函数的头文件中,xmmintrin.h头文件修改为mmintrin.h 头文件,并删除union数据结构封装;
将MathUtil.h头文件中,xmmintrin.h头文件修改为mmintrin.h头文件;
在所述mmintrin.h头文件中定义有所述非对齐内存读取接口函数、所述逻辑运算函数
2。

相关文档
最新文档