IEEE 745浮点数标准
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IEEE 745浮点数标准
解读IEEE标准754:浮点数表示
如须转载请注明作者为Lolita@,并请保持文章的完整和提供转载
出处。
N的实际值n由下列式子表示:
其中:
★ n,s,e,m分别为N,S,E,M对应的实际数值,而N,S,E,M仅仅是一串二进制位。
★ S(sign)表示N的符号位。
对应值s满足:n>0时,s=0; n<0时,s=1。
★ E(exponent)表示N的指数位,位于S和M之间的若干位。
对应值e值也可正可负。
★ M(mantissa)表示N的尾数位,恰好,它位于N末尾。
M也叫有效数字位(sinificand)、系数位(coefficient), 甚至被称作“小数”。
三、浮点数格式
IEEE标准754规定了三种浮点数格式:单精度、双精度、扩展精度。
前两者正好对应C语言里头的float、double或者FORTRAN里头的real、double精度类型。
限于篇幅,本文仅介绍单精度、双精度浮点格式。
★ 单精度:N共32位,其中S占1位,E占8位,M占23位。
★ 双精度:N共64位,其中S占1位,E占11位,M占52位。
上图中,|E|表示E的二进制序列表示的整数值,例如E为"10000100",则
|E|=132,e=132-127=5 。
k则表示E的位数,对单精度来说,k=8,则bias=127,对双精度来说,k=11,则bias=1023。
此时m的计算公式如下图所示:
标准规定此时小数点左侧的隐含位为1,那么m=|1.M|。
如M="101",则
|1.M|=|1.101|=1.625,即 m=1.625
2、非规格化:当E的二进制位全部为0时,N为非规格化形式。
此时e,m 的计算都非常简单。
注意,此时小数点左侧的隐含位为0。
为什么e会等于(1-bias)而不是(-bias),这主要是为规格化数值、非规格化数值之间的平滑过渡设计的。
后文我们还会继续讨论。
有了非规格化形式,我们就可以表示0了。
把符号位S值1,其余所有位均置0后,我们得到了 -0.0; 同理,把所有位均置0,则得到 +0.0。
非规格化数还有其他用途,比如表示非常接近0的小数,而且这些小数均匀地接近0,称为“逐渐下溢(gradually underflow)”属性。
3、特殊数值:当E的二进制位全为1时为特殊数值。
此时,若M的二进制位全为0,则n表示无穷大,若S为1则为负无穷大,若S为0则为正无穷大; 若M的二进制位不全为0时,表示NaN(Not a Number),表示这不是一个合法实数或无穷,或者该数未经初始化。
五、范例
仔细研读第四点后,再回忆一下文章开头计算n的公式,你应该写出一个浮点编码的实际值n了吧?还不能吗?不急,我先给你示范一下。
我们假定N是一个8位浮点数,其中,S占1位,E占4位,M占3位。
下面这张表罗列了N
可能的正数形式,也包含了e、m等值,请你对照着这张表,重温一下第四点,你会慢慢明白的。
说实在的,这张表花了我不少功夫呢,幸好TeX画表格还算省事!
这张表里头有很多有趣的地方,我提醒一下:
★ 看 N 列,从上到下,二进制位表示是均匀递增的,且增量都是一个最小
二进制位。
这不是偶然,正是巧妙设计的结果。
观察最大的非规格数,发现恰好就是M全为1, E全为0的情况。
于是我们求出最大的非规格数为:
上面的公式中,h为M的位数(如范例中为3)。
注意,公式等号右边的第一项同时又是最小规格数的值(如范例中为 8/512 );第二项则正是最小非规格数的值(如范例中为1/512)即该浮点数能表示的最小正数。
★ 看 m 列,规格化数都是 1+ x 的形式,这个1正是隐含位1; 而非规格化数隐含位为0, 所以没有 "1+" 。
★ 看 n 列,非规格化数从上到下的增量都是 1/512, 且过渡到规格化数时,增量是平滑的,依旧是1/512。
这正是非规格化数中e等于(1-bias)而不是(-bias)的缘故,也是巧妙设计的结果。
再继续往下看,发现增量值逐渐增大。
可见,浮点数的取值范围不是均匀的。
六、实战
我们用一小段汇编来测试一下,浮点数在内存中是如何表示的。
测试环境:GentooLinux2006.0/GNU assembler version 2.16.1/GNU gdb 6.4/AMD XP1600+。
如下所示
代码:
~/coding/assemble $ gdb
(gdb) list
1 .section .data
2 f1:
3 .float 5
4 f2:
5 .float 0.1
6 .section .text
7 .global _start
8 _start:
9 nop
10
(gdb) x/f &f1
0x80490a4 <f1>: 5
(gdb) x/xw &f10x80490a4 <f1>: 0x40a00000
(gdb) x/f &f20x80490a8 <f2>: 0.100000001
(gdb) x/xw &f20x80490a8 <f2>: 0x3dcccccd
(gdb)
从上面的gdb命令结果可以看出,浮点数5被表示为 0x40a00000,二进制形式为( 0100 0000 1010 0000 (0000)
0000)。
红色数字为E,可以看出|E|=129>0, 则e=129-bias=129-127=2 ;蓝色数字为M, 且|E|>0,说明是规格化数,则m=|1.M|=|1.01000..000|=1.25 ; 由n的计算公式可以求得 n=(-1)^0 * 1.25 * 2^2 = 5,结果被验证了。
同样,你也可以验证一下十进制浮点数0.1的二进制形式是否正确,你会发现,0.1不能表示为有限个二进制位,因此在内存中的表示是舍入(rounding)以后的结果,即 0x3dcccccd, 十进制为0.100000001,误差0.000000001由此产生了。
七、未完成
关于浮点数,还有很多东西(比如舍入误差、除零异常等等)值得我们深入探讨,但已经无法在此继续。
这篇文章的目的仅在初步解释IEEE标准754对浮点数的规定以及一些奇妙的地方。
写这篇文章花掉了我整天的时间,但也使我彻底记住了以前让我胆怯的东西──最重要的是,希望这篇文章对大家有点用处,也算我为计算机科学基础理论版以及做的一点贡献。
参考书目:
①: Randall Hyde, The Art of Assembly Language, Vol.1, 4.2.1
②: Randal E. Bryant, David R. O’Hallaron, Computer Systems A Programmer’s Perspective (Beta Draft), PartⅠ,Chapt.Ⅱ, 2.4
③: Rechard Blum, Professional Assembly Language
主题词:单片机数制转换器,单片机浮点数转换器
人们研制电子计算机的初衷就是为了用于科学计算。
时至今日,尽管现在单片机应用领域宽广、色彩缤纷,但复杂计算仍不可或缺的内容。
针的对定点数不能胜任复杂计算的缺点,人们在实践中约定了不同格式、不同精度的浮点数,实现了浮点运算。
因为计算机只能识别二进制数,完成二进制数的运算,所以我们所说的浮点数一般都是指二进制浮点数。
与定点数相比,浮点数能较好地兼顾表达式数值范围,能简捷地表示出很大或很小的数值。
浮点由阶码和尾数两部分组成,阶码为带符号的整数,尾数为小于1带符号的小数(如尾数的绝对值还满足大于或等于1/2,则称该浮点数为规格化浮点数)。
计算过程中主要以足够长的尾数来保证数据的精度,以阶杩来调整数模(绝对值)的大小(即改变小数点的位置),并自动进行符号处理。
因此浮点数具有精度高、数的表达范围宽等特点,特别适用于计算过程复杂、精度要求高的场合。
目前单片机常用的浮点数格式,不外乎有四种格式:三字节格式、IEEE-754标准格式、IEEE-754标准变形1和IEEE-754标准变形2,
共4种格式。
作为单片机程序员来说,在编写程序时经常要检验程序中的浮点数运算结果是否正确,但手中又没有合适的检验工具,非常麻烦。
对此我就深有体会。
为此我收集整理有关浮资料,并编写了一款非常实用的转换工具,它能辅助你编写有关浮点数运算方便的程序,尤其是有关浮点数表格的制作,更是事半功倍。
你只需将要转换的十进制定点数编制成一个文本文件,利用FON浮点数转换器“载入”,如图(2),点击一下转换按钮,顷刻间便可完成一个文件数据的转换。
也可将浮点数转换为十进制定点数,即逆转换。
FON浮点数转换器,我也在工作中使用了两年多,效果非常好,为节省了不少时间。
下面是浮点数转换器的部分截屏:
单个数据转换(图1)
多组数据转换(格式1)(图2)
多组数据转换(格式2)(图3)主要用于制作浮点数表格
多组数据逆转换(图4),此时的定点数会出现此尾数差异,并不影响精度
单片机浮点数格式说明
★ MCS-51三字节格式:
浮点数格式如下:
地址eb BY0 BY1
内容 SEEE EEEE MMMM MMMM MMMM MMMM
用三个字节表示,第一个字节的最高位为数符S,正数为0,负数为1,其余七位为阶码(二进制补码形式);第二字节为尾数的高字节;第三字节为尾数的低字节,尾数用双字节BCD码纯小数(原码)来表示。
例:已知 a=-123.4;b=0.7577;c=56.34;d=1.276;
用BCD码浮点数表示时,分别为a=831234H;b=007577H;c=025634H;d=011276H。
★ MCS-51三字节浮点数规格化:
为了提高运算精度,正数的尾数最高位规定为1,负数的尾数的最高位规定为0,这种形式的浮点数为规格化数(又称浮点操作数)。
运算之前所有的浮点数都应转成规格化数。
*************************************************************
★ IEEE-754标准的格式:
一个浮点数用两个部分表示,尾数和2的幂,尾数代表浮点上的实际二进制数,2的幂代表指数,指数的保存形式是一个0到255的8位值,指数的实际值是保存值(0到255)减去127,一个范围在-127到+128
之间的值,尾数是一个24位值(代表大约7个十进制数),最高位MSB通常是1,因此省略不保存,一个符号位表示浮点数是正或负。
地址eb BY0 BY1 BY2
内容 SEEEEEEE E.MMMMMMM MMMMMMMM MMMMMMMM
S (第31位)代表符号(数符)位1是负,0是正;
E 偏移127的幂,二进制阶码=(EEEEEEEE)-127;
. 小数点;
M 24位的尾数保存在23位中,只存储23位,隐含最高位1。
此方法用最较少的位数实现了较高的有效位数,提高了精度。
零是一个特定值,幂是0 尾数也是0。
阶码的计算方法:
阶码采用指数的移码,阶码= 指数P+7FH
阶码(移码)eb=指数P+7FH
其中:指数P=int(Z),Z=ln(A)/ln(2)
由1位符号位、8位指数、23位有效数组成。
能表示的数据范围为:±1.2×10^(-38)~3.4×10^38,超出范围为溢出。
精度为2-24 即5.9× 10-8。
-------------------------------------------------------------
如果eb=P+7EH,那么指数P=int(Z)+1 ,
(广洲天龙AVR单片机浮点数格式定义的移码为7EH,而IEEE-754标准定义的是7FH,故我们取移码为7FH)-------------------------------------------------------------
* 在由二进制浮点数转为十进制定点数时,注意在尾数的左边有一个省略的小数点和1,这个1在浮点数的保存中经常省略,但在还原时应加上去。
**************************************************************
★ IEEE-754_1标准的格式:
地址eb BY0 BY1 BY2
内容 PtEEEEEEE S.MMMMMMM MMMMMMMM MMMMMMMM
Pt 代表阶符,阶符视阶的正负而定;
S 代表符号(数符)位,1是负,0是正;
. 小数点在数符的右边;
E 代表幂偏移,即指数偏差;
M 24位的尾数保存在23位中,只存储23位,隐含最高位1。
阶码的计算方法:
(1)十进制整数(可带小数):
阶码eb=指数P+7EH
其中:指数P=int(Z)+1,Z=ln(A)/ln(2)
(2)纯小数:
阶码eb=指数+7EH
其中:指数P=int(Z),Z=ln(A)/ln(2)
注:IEEE-754_1主要用于PIC系列单片机浮点数格式
***************************************************************
★ IEEE-754_2标准的格式:
地址eb BY0 BY1 BY2
内容 PtEEEEEEE S.MMMMMMM MMMMMMMM MMMMMMMM
Pt 代表阶符,阶符视阶的正负而定;
S 代表符号(数符)位1是负,0是正;
. 小数点在数符的右边;
E 代表幂偏移,即指数偏差;
M 24位的尾数保存在23位中,只存储23位,隐含最高位1。
阶码采用1字节移码,以80H~0FFH表示0~127,以01H~7FH表示-127~-1。
阶码的计算方法:
(1)十进制整数(可带小数):
阶码eb=指数P+80H
其中:指数P=int(Z)+1,Z=ln(A)/ln(2)
(2)纯小数:
阶码eb=指数+80H
其中:指数P=int(Z),Z=ln(A)/ln(2)
能表示的数据范围为:5.8×10^(-39)~1.7×10^38,超出范围为溢出。
---------------------------------------------------------------
注:Pt 表示阶符,Pt=0表示阶码为正数;Pt=1表示阶码为负数
(如0.1的阶为-3,则阶码=(-3)+ 80H=7DH )
IEEE-754_1与IEEE-754_2只是阶码字节的内容不同,而尾数的内容是相同的。
----------------------------------------------------------------
例:十进制数50.265化为32位规格化浮点数。
解 A=50.265,则Z=ln50.265/ln2,P=int(Z)+1,故P=6;
X=A/2P=50.265/26=0.785390625,将定点小数:0.785390625 转为二进制数为:
1100 1001 0000 1111 0101 1100B,取其24位,检查24位是否为1,否则,将二进制数左移,直至二进制数的最高位为1;隐含尾数整数的1,将二进制数的最高位改为数的数符位(正数为0,负数为1)。
则:0100 1001 0000 1111 0101 1100B = 49H,0FH,5CH;
而阶码eb=P+80H=6+80H=86H
二进制浮点数为:86H, 49H,0FH,5CH
****************************************************************
★ 浮点BCD码的格式:
浮点BCD码,是以纯小数(原码)来表示。
小数点的位置由阶来确定。
[阶符.阶码],数符.尾数(4字节),即带符号的阶码与带符号的尾数。
阶符:正数为“+”,可隐含;负数为“-”;
数符:正数为“+”,可隐含;负数为“-”;
阶码:根据小数点的位置来确定。
0.1-->阶符为“+”,数符为“+”,阶为00
0.01-->阶符为“-”,数符为“+”,阶为01
22.00-->阶符为“+”,数符为“+”,阶为02
-0.1-->阶符为“+”,数符为“-”,阶为00
-0.01-->阶符为“-”,数符为“-”,阶为01
-22.00-->阶符为“+”,数符为“-”,阶为02
阶-->这里所说的阶是十进制浮点数的阶,即为小数点的位置。
“+”阶小数点的位置向右移;“-”阶小数点的位置向左移。
如: [阶符.阶码],数符.尾数
-0.012345678,浮点BCD码为:[-01],-12345780H
0.012345678,浮点BCD码为: [-01],12345780H
0.12345678,浮点BCD码为: [00],12345780H
12345678,浮点BCD码为: [08],12345780H
-12345678,浮点BCD码为: [08],-12345780H
------------------------------------------------------------
注:在单片机编程中定义为:
阶符:正阶为00H,负阶为FFH
数符:正数为00H,负数为FFH
为了与人们的习惯相一至,在这里仍采用“+,-”号来表示。
**************************************************************
★ 浮点数错误判断及提示:
以下是IEEE-754标准所能表达数据的范围,其它标准请参照,只溢出的范围有所不同而已。
FFFFFFFH 不是一个数,提示:"输入有误"
7F80000H 正无穷大正溢出,提示:"正溢出"
FF80000H 负无穷大负溢出,提示:"负溢出"
附注:
(1)IEEE标准是美国电子电气工程师协会定义的国际标准浮点数格式;
(2)符号-表示数据的正负,在最高有效位(MSB)。
负数的符号位为1,正数的符号位为0;
(3)有效数字-表示数据的有效数字,反映数据的精度。
有效数字一般采用规格化形式,是一个纯小数,所以也被称为尾数、小数或分数。
(4)阶码与阶之间的换算公式为:移码(阶码)=补码(阶)+偏移量;阶=移码-偏移量
其中阶又称为指数;移码又称偏移码;80H(或7FH)为偏移量。
******************************************************************************************** *************************
四种浮点数对照表
输入数据51 三字节IEEE-754 标准IEEE-754_1 IEEE-754_2
0 000000H 00000000H 0000 0000H 0000 0000H
1 018000H 3F800000H 81000000H -1 818000H 81800000H 0.5 008000H 3F000000H 80000000H -0.5 808000H 80800000H 0.1 7DCCCDH 7D4CCCCDH -0.1 FDCCCDH 7DCCCCCDH π /180 7B8EFAH 7B0EFA35H Ln
2 00B172H 80317218H 01B505H 813504F3H
E ≈ 2.7182818 02ADF8H 822DF854H
90 07B400H 87340000H 10 -10 5FDBE7H 5F5BE6FFH 10 10 229503H A21502F9H 88.02969 07B00FH 87300F34H π /2 01C910H 81490FDAH 100.25 07C880H 42C88000H 87488000H 50.265 06C90FH 84490F5CH 86490F5CH -5 83A000H C0A00000H 83A00000H -12.5 C1480000H 84C80000H -12.345 C145851EH
2004-08-07 整理。