IEEE754 单精度浮点型数据存储转换

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1 转换工具 (2)

2 浮点数在内存中的表示 (2)

3 单精度浮点数转换为存储字节步骤 (2)

4 存储字节转换为单精度浮点数 (3)

1 转换工具

小程序：高级程序员工具

2 浮点数在内存中的表示

对于浮点类型的数据，采用单精度类型（float）和双精度类型（double）来存储，float 数据占32位，double数据占64位。无论是float还是double在存储方式上都是遵从IEEE 的规范的，float遵从的是IEEE R32.24，而double 遵从的是IEEE R64.53。

无论是单精度还是双精度在存储中都分为三个部分：

1. 符号位(Sign)：0代表正，1代表为负

2. 指数位（Exponent）：用于存储科学计数法中的指数部分，采用移位存储

3. 尾数位（Mantissa）：尾数部分

float类型的存储方式如下图所示：

3130220

double类型的存储方式如下图所示：

6362510

3 单精度浮点数转换为存储字节步骤

将一个float型转化为内存存储格式的步骤为：

（1）先将这个实数的绝对值化为二进制格式。

（2）将这个二进制格式实数的小数点左移或右移n位，直到小数点移动到第一个有效数字的右边。

（3）从小数点右边第一位开始数出二十三位数字放入第22到第0位。

（4）如果实数是正的，则在第31位放入“0”，否则放入“1”。

（5）如果n是左移得到的，说明指数是正的，第30位放入“1”。如果n是右移得到的或n=0，则第30位放入“0”。

（6）如果n是左移得到的，则将n减去1后化为二进制，并在左边加“0”补足七位，放入第29到第23位。如果n是右移得到的或n=0，则将n化为二进制后在左边加“0”补足七位，再各位求反，再放入第29到第23位。

以12.5为例进行说明：

（1）12.5实数绝对值二进制形式是1100.1。

（2）向左移动3位，转换为科学计数法是1.1001E3，此时n=3。

（3）将小数点右边第一位开始输出23位放入第22到第0位，即尾数位为：

3130220

（4）12.5为正数，因此第31位放入“0”，即S=0。

（5）n是左移得到的，指数为正，则第30位放入“1”。

（6）n减去1为2，转换为二进制，左边加“0”补足七位，放入第29到第23位。此时，由（5）（6）得指数位为：

3130220

因此，12.5的存储形式为：（二进制）0 10000010 10010000000000000000000，（十六进制）0x41480000。

另外，因为浮点数1.0是一个特殊值，这里将解析流程进行分析：

（1）将1.0化为二进制后是1.00000000000000000000000。

（2）这时不用移动小数点了，这就是我们在转化方法里说的n=0的情况。

（3）将小数点右边的二十三位有效数字00000000000000000000000放入第22到第0位。

（4）因为1.0是正的，所以在第31位里放入“0”。

（5）因为n=0，所以在第30位里放入“0”。

（6）因为n=0，所以将0补足七位得到0000000，各位求反得到1111111，放入第29到第23位。

所以实数1.0存储格式表示是：（二进制）0 01111111 00000000000000000000000，（十六进制）0x3F800000。

4 存储字节转换为单精度浮点数

将一个内存存储的float二进制格式转化为十进制的步骤：

（1）将第22位到第0位的二进制数写出来，在最左边补一位“1”，得到二十四位有效数字。将小数点点在最左边那个“1”的右边。

（2）取出第29到第23位所表示的值n。当30位是“0”时将n各位求反。当30位是“1”时将n增1。

（3）将小数点左移n位（当30位是“0”时）或右移n位（当30位是“1”时），得到一个二进制表示的实数。

（4）将这个二进制实数化为十进制，并根据第31位是“0”还是“1”加上正号或负号即可。

同样以12.5的二进制为例：

（1）在最左边补一位“1”，得到二十四位有效数字。将小数点点在最左边那个“1”右边。

1.100100000000000000000001

（2）取出第29到第23位所表示的值n。由于30位是“1”，所有将n增1为0000011（即n=3）

（3）由于30位是“1”，将小数点右移3位，得到二进制实数为：

1100.100000000000000000001

（4）转换为十进制数，由于31位为“0”，所有结果为12.5

5 代码实现

一种技巧式的C语言实现方法：