IEEE754 单精度浮点型数据存储转换
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
1 转换工具 (2)
2 浮点数在内存中的表示 (2)
3 单精度浮点数转换为存储字节步骤 (2)
4 存储字节转换为单精度浮点数 (3)
1 转换工具
小程序:高级程序员工具
2 浮点数在内存中的表示
对于浮点类型的数据,采用单精度类型(float)和双精度类型(double)来存储,float 数据占32位,double数据占64位。无论是float还是double在存储方式上都是遵从IEEE 的规范的,float遵从的是IEEE R32.24,而double 遵从的是IEEE R64.53。
无论是单精度还是双精度在存储中都分为三个部分:
1. 符号位(Sign):0代表正,1代表为负
2. 指数位(Exponent):用于存储科学计数法中的指数部分,采用移位存储
3. 尾数位(Mantissa):尾数部分
float类型的存储方式如下图所示:
3130220
double类型的存储方式如下图所示:
6362510
3 单精度浮点数转换为存储字节步骤
将一个float型转化为内存存储格式的步骤为:
(1)先将这个实数的绝对值化为二进制格式。
(2)将这个二进制格式实数的小数点左移或右移n位,直到小数点移动到第一个有效数字的右边。
(3)从小数点右边第一位开始数出二十三位数字放入第22到第0位。
(4)如果实数是正的,则在第31位放入“0”,否则放入“1”。
(5)如果n是左移得到的,说明指数是正的,第30位放入“1”。如果n是右移得到的或n=0,则第30位放入“0”。
(6)如果n是左移得到的,则将n减去1后化为二进制,并在左边加“0”补足七位,放入第29到第23位。如果n是右移得到的或n=0,则将n化为二进制后在左边加“0”补足七位,再各位求反,再放入第29到第23位。
以12.5为例进行说明:
(1)12.5实数绝对值二进制形式是1100.1。
(2)向左移动3位,转换为科学计数法是1.1001E3,此时n=3。
(3)将小数点右边第一位开始输出23位放入第22到第0位,即尾数位为:
3130220
(4)12.5为正数,因此第31位放入“0”,即S=0。
(5)n是左移得到的,指数为正,则第30位放入“1”。
(6)n减去1为2,转换为二进制,左边加“0”补足七位,放入第29到第23位。此时,由(5)(6)得指数位为:
3130220
因此,12.5的存储形式为:(二进制)0 10000010 10010000000000000000000,(十六进制)0x41480000。
另外,因为浮点数1.0是一个特殊值,这里将解析流程进行分析:
(1)将1.0化为二进制后是1.00000000000000000000000。
(2)这时不用移动小数点了,这就是我们在转化方法里说的n=0的情况。
(3)将小数点右边的二十三位有效数字00000000000000000000000放入第22到第0位。
(4)因为1.0是正的,所以在第31位里放入“0”。
(5)因为n=0,所以在第30位里放入“0”。
(6)因为n=0,所以将0补足七位得到0000000,各位求反得到1111111,放入第29到第23位。
所以实数1.0存储格式表示是:(二进制)0 01111111 00000000000000000000000,(十六进制)0x3F800000。
4 存储字节转换为单精度浮点数
将一个内存存储的float二进制格式转化为十进制的步骤:
(1)将第22位到第0位的二进制数写出来,在最左边补一位“1”,得到二十四位有效数字。将小数点点在最左边那个“1”的右边。
(2)取出第29到第23位所表示的值n。当30位是“0”时将n各位求反。当30位是“1”时将n增1。
(3)将小数点左移n位(当30位是“0”时)或右移n位(当30位是“1”时),得到一个二进制表示的实数。
(4)将这个二进制实数化为十进制,并根据第31位是“0”还是“1”加上正号或负号即可。
同样以12.5的二进制为例:
(1)在最左边补一位“1”,得到二十四位有效数字。将小数点点在最左边那个“1”右边。
1.100100000000000000000001
(2)取出第29到第23位所表示的值n。由于30位是“1”,所有将n增1为0000011(即n=3)
(3)由于30位是“1”,将小数点右移3位,得到二进制实数为:
1100.100000000000000000001
(4)转换为十进制数,由于31位为“0”,所有结果为12.5
5 代码实现
一种技巧式的C语言实现方法: