目前,Microchip公司生产的PIC系列单片机以其低成本、低功耗、高性能、开发速度快且一次性用户可编程等优点迅速占领了国内市场,成为国内销售量最大的单片机。但国内介绍其C语言开发工具的书籍和文章却比较少,在开发过程中给广大程序员带来了许多困难和不便。
Microchip公司没有针对中低档系列PIC单片机的C语言编译器,但很多专业的第三方公司提供众多支持PIC单片机的C语言编译器,常见的有Hitech、CCS、IAR以及Bytecraft等公司。Hitech公司的PICC编译器稳定可靠,编译生成的代码效率高,在用PIC单片机进行系统设计和开发的工程师群体中得到广泛认可。因此,本文主要以HiTech PICC为基础,介绍PIC的C语言的基本特点。
1 HiTech PICC语言的特点
PICC基本上符合ANSI标准,但是不支持函数的递归调用,其主要原因是PIC单片机特殊的堆栈结构。PIC单片机中的堆栈是硬件实现的,其深度已随芯片固定,无法实现需要大量堆栈操作的递归算法;另外在PIC单片机中实现软件堆栈的效率也不是很高。为此,PICC编译器采用一种“静态覆盖”技术,以实现对C语言函数中的局部变量分配固定的地址空间。经这样处理后产生出的机器代码效率很高。当代码量超过4KB后,C语言编译出的代码长度与全部用汇编代码实现的差别已经不是很大(<10%),当然前提是在整个C代码编写过程中需时时注意所编写语句的效率。
2 PICC中的变量
PICC中的变量类型和标准C语言一样,这里不再重复。为了使编译器产生最高效的机器码,PICC把单片机中数据寄存器的bank交由编程员自己管理,因此在定义用户变量时必须自己决定这些变量具体放在哪一个bank中。如果没有特别指明,所定义的变量将被定位在bank0。定义在其他bank内的变量前面必须加上相应的bank序号,例如:
bank1 unsigned char temp;//变量定位在bank1中
中档系列PIC单片机数据寄存器的一个bank大小为128B,除前面若干字节的特殊功能寄存器区域,在C语言中某一bank内定义的变量字节总数不能超过可用RAM字节数。如果超过bank容量,在最后连接时会报错,大致信息如下:
Error[000]:Can’t find 0x12C words for psect rbss_1 in segmentBANK1
链接器提示,总共有0x12c(300)字节准备放到bank1中,但bank1容量不够。虽然变量所在的bank定位必须由编程员自己决定,但编写源程序时在进行变量存取操作前无需再特意编写设定bank的指令。C编译器会根据所操作的对象自动生成对应bank设定的汇编指令。为避免频繁的bank切换以提高代码效率,尽量把实现同一任务的变量定位在同一个bank内;对不同bank内的变量进行读写操作时也尽量把位于相同bank内的变量归并在一起进行连续操作。
bit型位变量只能是全局的或静态的。PICC将把定位在同一bank内的8个位变量合并成一个字节存放于一个固定地址。PICC对整个数据存储空间实行位编址,0x000单元第0位位地址是0x0000,以此类推,每个字节有8个位地址。如果一个位变量flag1被编址为0x123,那么实际的存储空间位于:
字节地址=0x123/8 = 0x24
位偏移=0x123%8 = 3
即flag1位变量位于地址为0x24字节的第3位。在程序调试时如果要观察flag1的变化,必须观察地址为0x24的字节而不是0x123。PICC在编译原代码时只要有可能,对普通变量的操作也将以最简单的位操作指令来实现。假设一个字节变量tmp最后被定位在地址0x20,那么
tmp | =0x80=>bsf 0x20.7
另外,函数可以返回一个位变量,返回的位变量将存放于单片机的进位位中返回。
3 PICC中的指针
3.1 指向RAM的指针
PICC在编译C源程序时,将指向RAM的指针操作最终用FSR来实现间接寻址。FSR能够直接连续寻址的范围是256B,所以一个指针可以同时覆盖2个bank的存储区域(bank0/1或bank2/3,一个bank区域是128 B)。要覆盖最大512B的内部数据存储空间,在定义指针时必须明确指定该指针适用的寻址区域。例如:
unsigned char *pointer0; //定义覆盖bank0/1的指针
bank2 char *pointer1;//定义覆盖bank2/3的指针
既然定义的指针有明确的bank适用区域,在对指针变量赋值时就必须实现类型匹配,否则将产生错误,例如:
unsigned char *pointer0; //定义指向bank0/1的指针
bank2 unsigned char buff;//定义bank2/3中的一个缓冲区
程序语句:
pointer() =buff;//错误!试图将bank2内的变量地址赋给指向bank0/1的指针
若出现此类错误的指针操作,PICC在最后链接时会告知类似于下面的信息:
Fixup overflow in expression (…)
3.2 指向ROM常数的指针
如果一组变量是已经被定义在ROM区的常数,那么指向其的指针可以这样定义:
const unsigned char company[]="software"
3.3 指向函数的指针
因为在PIC单片机这一特定的架构上实现函数指针调用的效率不高,因此,除非特殊算法的需要,建议大家尽量不要使用函数指针。
4 PICC中的子程序和函数
中档系列的PIC单片机程序空间有分页的概念,但用C语言编程时基本不用过多关心代码的分页问题。因为所有函数或子程序调用时的页面设定(如果代码超过一个页面)都由编译器自动生成的指令实现。
4.1 函数的代码长度限制
PICC决定了C源程序中的一个函数经编译后生成的机器码一定会放在同一个程序页面内。中档系列PIC单片机的一个程序页面的长度是2KB,用C语言编写的任何一个函数最后生成的代码不能超过2KB。如果为实现特定的功能确实要连续编写很长的程序,这时就必须把这些连续的代码拆分成若干函数,以保证每个函数最后编译出的代码不超过一个页面空间。
4.2 调用层次的控制
PIC单片机采用硬件堆栈,所以编程时函数的调用层次会受到一定限制。一般PIC系列的中档单片机硬件堆栈深度为8级。程序员必须自己控制子程序调用时的嵌套深度以符合这一限制要求。PICC在最后编译链接成功后可以生成一个链接定位映射文件(*.map),在此文件中有详细的函数调用嵌套指示图“call graph”,有些函数调用是编译时自动加入的库函数,这些函数调用从C源程序中无法直接看出,但在嵌套指示图上则一目了然。
5 C语言和汇编语言混合编程
单片机的一些特殊指令操作在标准的C语言语法中没有直接对应的描述,例如PIC单片机的清看门狗指令“clrwdt”和休眠指令“sleep”;单片机系统强调的是控制的实时性,为了实现这一要求,有时必须用汇编指令实现部分代码以提高程序运行的效率。在C程序中嵌入汇编指令有2种方法。
① 如果只需要嵌入少量几条汇编指令,PICC提供了一个类似于函数的语句:
asm("clrwdt");
这是在C源程序中直接嵌入汇编指令的最直接最容易的方法。
② 如果需要编写一段连续的汇编指令,PICC支持另外的一种语法描述:用“#asm”来开始汇编指令段,用“#endasm”结束。例如:
5.1 汇编指令寻址C语言定义的全局变量
所有C语言中定义的符号在编译后将自动在前面添加下划线“_”。因此,若要在汇编指令中寻址C语言定义的各类变量,一定要在变量前加上“_”符号,例如上例中的count是在C语言中定义的无符号全局变量,在汇编语言中只需在其前面加上“_”符号就可进行访问了。另外,对于C语言中定义的多字节全局变量,例如C语言中的如下定义:
int advalue;
在汇编语言里访问时就得分字节访问,例如:
asm(“movf_advalue+0.0”);//把advalue低字节中的数送到w里
asm(“rrf_advalue+1”)//把advalue高字节中的数左移一位
5.2 汇编指令寻址C函数的局部变量
前面已经提到,PICC对自动型局部变量(包括函数调用时的入口参数)采用一种“静态覆盖”技术,对每一个变量确定一个固定地址(位于bank0),嵌入的汇编指令对其寻址时只需采用数据寄存器的直接寻址方式即可,因此关键是要知道这些局部变量的寻址符号。建议读者先编写一小段C代码,其中有最简单的局部变量操作指令,把此源代码编译成对应的PICC汇编指令;查看C编译器生成的汇编指令是如何寻址这些局部变量的,自己编写的行内汇编指令就采用同样的寻址方式。
相对于汇编语言,用C语言编程的优势是毋庸置疑的:开发效率大大提高、人性化的语句指令及模块化的程序易于日常管理和维护、程序在不同平台间移植方便。所以既然使用C语言编程,就应该尽量避免嵌入汇编指令或编写汇编指令模块文件。例如:
变量的循环右移操作用C语言实现非常不方便,PIC单片机已有对应的移位操作汇编指令,因此用嵌入汇编的形式实现效率最高。对移位次数的控制,实际上变量count1的递减判零也可以直接用汇编指令实现,这样可节约代码,但用标准C语言描述更直观、更易于维护。
6 注意事项
① 既然所有的局部变量将占用bank0的存储空间,因此用户自己定位在bank0内的变量字节数将受到一定的限制,在实际使用时需注意。
② 当程序中把非位变量进行强制类型转换成位变量时,要注意编译器只对普通变量的最低位做判别:若最低位是0,则转换成位变量0;若最低位是1,则转换成位变量1。
③ 由于PIC系列单片机的内部资源十分有限,所以在允许的条件下应尽量使用无符号字符型变量,以节约空间。
④ PICC对绝对定位的变量不保留地址空间,例如:
unsigned char advalue @ 0x20;//advalue定位在地址0x20,相当于汇编语言中的伪指令
advalue EQU 20H
所以请读者慎用。
⑤ 尽量使用全局变量进行参数传递,使用全局变量最大的好处是寻址直观,只需在C语言定义的变量名前增加一个下划线符即可在汇编语句中寻址;使用全局变量进行参数传递的效率也比形参高。
⑥ 对于多字节变量(如int型、float型变量等)PICC遵循Little endian标准,即低字节放在存储空间的低地址,高字节放在高地址,编程时需注意。
7 结语
一般C语言产生的代码是比较繁琐的,所以要写出高质量、实用的C语言程序,就必须对单片机体系结构和硬件资源作详尽的了解。用C语言开发PIC系列单片机系统软件具有编写代码效率高、软件调试直观、维护升级方便、代码的重复利用率高、便于跨平台的代码移植等优点,因此C语言编程在单片机系统设计中的应用必将越来越广泛。