89C5l系列单片机历经20多年的发展,仍然长盛不衰,在工业控制及仪器仪表中得到广泛应用;用于89C5l单片机软件开发的Keil C51编译系统也日臻成熟,成为89C5l系列单片机软件开发的优先选择。在单片机系统开发中,经常遇到整数二十进制转换的问题,一般可以采用C语言中的标准函数sprintf()来实现;但由于该函数是通用格式输出函数,代码量大(超过l KB),用于整数二一十进制转换的运算时间过妊(在12 MHz晶振频率下超过l ms),这在计算密集(computation intensive)的应用中是一个影响系统性能的重要因素。在低功耗系统设计中,也必须考虑因为运算时间长而增加系统耗电量的问题。经常有网发询问如何高效地实现这种转换。笔者通过对二进制整数的深入分析,巧妙运用89C5l单片机的特殊单字节乘除指令,成功地实现了整数二一十进制转换的快速算法。本文将详细介绍快速算法,给出颇具实用性的优化代码,并与使用sprintf()函数的实现及传统的汇编代码实现进行性能比较。
1 传统的汇编代码实现
要实现快速运算,很自然地想到教科书中提到的双字节二进制整数转换成3字节
BCD码整数的子程序。其采用的算法是,依次将整数的每位左移至CY位,再把CY位左移至一个3字节队列中,并进行十进制调整。通过16次移位完成运算,结果为压缩格式的3字节BCD编码。
汇编子程序如下:
该算法代码简洁明了,只使用51条指令代码,但执行这段程序却要耗费312个指令周期。如果要符合C51调用规则,则要多出25个指令代码空间和21个指令周期,显然效率不高。
2 快速算法
快速算法从千位入手,首先求取整数中包含l 000的个数(以下称为“千数”)。求取了千数,其他问题就迎刃而解了。
设二进制整数以b=[b15…b0]表示,取值范围为O~65535。其高6位[b15…b10]取值范围为0~63,在整数中代表的数值为(0~63)*1024;后10位[b9…b0]代表的数值范围为O~l 023。可以写出如下算式:
可以用[b15…b10]作为整数中千数的预估。
余数的最大值为63×24+1 023=2535。这表明余数中最多还有2个l000,也就是说千数的预估误差最多为2,因此最多通过2次校正,就可求得千数的准确值。2次校正方法:
①如果余数高位字节≥4(即余数≥1024,这样用只是为了简化代码;也可以用余数≥1000的判定条件),则千数+l,余数~1000;
②如果余数≥l000,则千数+1,余数~l000。
至此就求出了千数。千数用10整除所得商和模余作为万位数和千位数。
从余数中求取百、十,个位数也很简单:
余数用100整除得到百位数。实际是先把余数右移2位,此时已成单字节数,再用单字节除指令进行除以25的操作,即得到百位数;而除去百位后的余数已是单字节数,可轻易取得十位数与个位数。
用C语言编写的函数如下:
在Keil C51集成环境中,为该函数生成汇编程序源码,再对源码进行优化,最后得到满足C51调用规则的、效率极高的汇编语言源代码。(源代码见本刊网站www.mesnct.com.cn——编者注。)
这个汇编语言源代码可以直接作为项目文件使用,也可以用来生成函数库。
3 性能比较
(1)与传统汇编语言的性能比较
符合C5l调用规则的传统汇编语言子程序占用76字节的代码空间,耗用333个指令周期;快速算法最多耗用107个指令周期,耗时只有传统算法的32%。
(2)与使用sprintf()函数相比较
使用如下的程序来比较二者的性能:
sprintf()函数占用1064字节的代码空间,耗用1151个指令周期;快速算法占用97字节的代码空间,最多耗用107个指令周期,只占使用sprintf()函数耗时的9.3%。
结论
无论是与传统汇编语言子程序,还是与使用sprintf()函数的程序相比,快速算法都有很大的速度优势;是一种针对8位机的创新算法,具有很强的工程实用性,值得推广应用。