指针是C语言的根本,C/C++功能强大,主要体现在指针的灵活运用。灵活地应用指针,可有效地表示复杂的数据结构、可直接处理内存地址,动态分配内存、更简单有效的处理字符串和数组。本文着重介绍对指针概念的深入理解及多种用法。供初学者或相关教学的人员参考。
一、指针概念的理解
指针是一个特殊的变量,它里面存储的数值被解释成为内存里的一个地址。理解指针首先要明确指针四个方面的内容:指针的类型、指针所指向的类型、指针的值(指针所指向的内存区)和指针本身所占据的内存区。
1、指针的类型。
在该指针的定义语句中把指针变量名(pointer)去掉,就是这个指针的类型。这是指针本身所具有的类型。例如:
2、指针所指向的数据类型。
指针的类型(即指针本身的类型)和指针所指向的类型是两个概念。在通过指针来访问指针所指向的内存区时,指针所指向的类型决定了编译器将把那片内存区里的内容当做什么来看待。即指针从该内存地址开始一次取出多少字节作为一个整体进行处理。从语法上看,把指针声明语句中的指针变量名和变量名左边的指针声明符(*)去掉,就是指针所指向的类型。例如:
在指针的算术运算中,指针所指向的类型有很大的作用。例如pointer+n操作中,指针pointer增加了n*sizeof(指针所指向的类型)。
3、指针的值
指针的值是指针本身存储的数值,这个值将被编译器当作一个地址即指针所指向内存区的地址,而不是一个一般的数值。在32位程序里,所有类型的指针的值都是一个32位整数。
指针所指向的内存区就是从指针的值所代表的那个内存地址开始,长度为sizeof(指针所指向的类型)的一片内存区。通常,一个指针指向了某块内存区域,即该指针的值是这块内存区域的首地址。一个指针的值是XX,即该指针指向了以XX为首地址的一片内存区域。
指针所指向的内存区和指针所指向的类型是两个完全不同的概念。定义指针所指向的类型后,但由于指针还未初始化,所以它所指向的内存区是不存在的,也是无意义的。
4、指针本身所占据的内存空间
指针本身所占据的内存区可用函数sizeof(指针的类型)测试。在32位平台里,指针本身占据了4个字节的长度。指针本身占据的内存这个概念在判断一个指针表达式是否为左值时很有用。
5、将C程序返汇编后查看指针
C语言执行前会编译成机器语言的目标程序,而机器语言难以理解。可将C语言的源程序反汇编为汇编程序,查看指针的使用。例如:
C源程序:
main()
{chars='a';
char*p=&s;
putchar(*p);
}
反汇编后:
pushbp
movbp,sp
subsp,2
pushsi
movbyteptr[bp-1],97
leasi,wordptr[bp-1];si即指针p
moval,byteptr[si]
cbw
pushax
callnearptr_putchar
popcx
@1:
popsi
movsp,bp
popbp
ret
可以看出SI即是指针p,汇编语言通过lea指令完成指针的赋值。用寄存器间接寻址实现指针运算*p。在简单的指针运算中,用寄存器表示指针,复杂的指针则放入内存。
二、指针的使用
1、空指针
空指针在指针和链表中广泛使用,表示不指向任何对象的一种指针或分配失败。其值定义为NULL,它是在头文件“stdio.h”中定义的一个宏,其值与任何有效指针的值都不同,NULL是一个纯粹的零(段0,偏移量0),它可能被强制转换为void*或char*类型。即NULL可能是0或(void*)0等。
值得注意的是,绝对不能间接引用一个空指针,否则,程序可能会得到一个毫无意义的结果,或得到一个全部是零的值,甚至突然停止运行。
空指针和未初始化的指针是连两个截然不同的概念。空指针已经被明确不指向任何对象或函数,未初始化的指针可以指向任何位置。不同类型的空指针的内在的值可能是不同的。虽然编程者不需要知道其值,但是必须告知编译器需要的是何种类型的空指针。所以在必要的时候应加以区别。根据语法规定,一个指向常数0的指针在编译时会转化为空指针。因此在初始化、赋值或比较表达式中,一边是指针类型的变量或表达式,另一边是常数0,编译器则会将0转化成一个空指针,并生成一个确切类型的空指针的值。例如下列语句是完全合法的:char*p=0;if(p!=0)……
类似C/C++字符串以’\0’结尾的存储方式,利用空指针做二维字符数组的串结尾,可简化代码,提高效率。例如:
#include
#include
usingnamespacestd;
voidoutput(char*array[])
{while(*array)
{cout
}
voidmain(void)
{char*test[]={"abc","cde","fgh",NULL};//添加NULL,不指向任何地址
output(test);
cin.get();
}
2、指针的相减运算
从一般意义上讲,两个指针可以相减。
但作为一种编程工具,在程序中的任何操作都要考虑其物理意义,两个指向不同类型对象的指针其相减就没有任何意义,故不应该相减。同样不是同一组相关单元的两个指针其相减也没有任何意义,因此两个指针相减,只是在当两个指针指向相关同类型的对象时,通常是数组,才对它们进行相减,其值为两个指针所指向的对象之间相差的同类型的对象的个数,即数组元素的个数。
3、通过指针动态分配数组
在程序运行过程中,数组的大小是不能改变的。这种数组称为静态数组。静态数组对于事先不能准确估计数据量的情况,无法做到既满足处理需要,又不浪费内存空间。使用动态数组可以在程序运行过程中,根据实际需要指定数组的大小。动态数组本质上是一个指向数组的指针变量。在C/C++中,可利用内存申请和释放的库函数来实现动态数组。指向数组的指针变量可当作数组名使用。例如:
int*array=NULL,n,i;
printf(“Inputthenumberofelement:”);scanf(“%d”,&n);
//申请动态数组使用的内存块
array=(int*)malloc(sizeof(int)*n);
if(array==NULL)//内存申请失败,提示退出
{printf(“outofmemory,pressanykeytoquit……”);
exit(0);
}
printf(“Input%delements:”,n);
for(i=0;i
printf(“%delementsare:”,n);
for(i=0;i
free(array);//释放由malloc()函数申请的内存块
库函数malloc()的函数原型:void*malloc(unsignedsize),分配size字节的存储区。返回分配内存的起始地址,若内存不够返回0。malloc()函数的返回值是一个无类型指针,可以指向任何类型的数据。通常在实际使用malloc()函数时,将其返回值强制转换成被赋值指针变量的数据类型。运算符sizeof(变量名/类型名):求变量/类型占用的内存字节数(正整数)。在IBM-PC机上,sizeof(int)=2。库函数free()的函数原型:voidfree(void*p),释放由p指向的内存区。无返回值。原则上,使用malloc()函数申请的内存块,操作结束后,应及时使用free()函数予以释放。在循环使用malloc()函数时,如果不及时释放不再使用的内存块,很可能会耗尽系统的内存资源,从而导致程序无法继续运行。
C/C++本身没有提供分配动态多维数组的功能,而实践中确是经常需要的。
1)常用的方法是分配一个指针数组,然后初始化每个指针使其指向动态分配的一行元素。例如:
int**array=malloc(n*sizeof(int*));
for(i=0;i
array[i]=malloc(m*sizeof(int));
程序代码中可用sizeof(*array)代替sizeof(int*),用sizeof(**array)代替sizeof(int)。定义array为指向指针的指针(动态分配指针数组),然后为array分配n个元素,其中每个元素都为指针,指向一个一维数组。
2)在分配时也可以保持数组元素是连续的,但代价是之后重新分配行将更困难,要借助指针运算。例如:
int**array=malloc(n*sizeof(int*));
array[0]=malloc(n*m*sizeof(int));
for(i=1;i
array[i]=array[0]+i*m;
同样访问动态数组元素可以使用通常数组的表示方法如:array[i][j](其中0,0
3)另一种方法是使用指针数组:
int(*arr)[m]=malloc(n*sizeof(*arr));
无论使用那种方法分配的动态数组,在使用后都将其释放(free())。三维甚至更多维动态数组可以类似实现。
有调查显示,大部分程序缺陷与内存的错误访问有关。正是因为指针直接访问内存,所以使用指针也存在着潜在的危险。以至于不少语言,如JAVA,不提供对指针的操作,所有的内存访问的处理由编译器完成。而对于C/C++,指针的使用则是基本功,使用C/C++的编程者应深入理解其含义和多种用法,用好这柄双刃剑。