函数原型:
intsscanf(constchar*format[,argument]...);
其中的format可以是一个或多个:{%[*][width][{h|l|I64|L}]type|''|'\t'|'\n'|非%符号},
注:
1)、*亦可用于格式中,(即%*d和%*s)加了星号(*)表示跳过此数据不读入。
(也就是不把此数据读入参数中)
2)、{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。
3)、width:宽度,一般可以忽略,用法如:
constcharsourceStr[]="hello,world";
charbuf[10]={0};
sscanf(sourceStr,"%5s",buf);//%5s,只取5个字符
cout<<buf<<endl;
结果为:hello
4)、{h|I|I64|L}:参数的size,通常h表示单字节size,I表示2字节size,
L表示4字节size(double例外),l64表示8字节size。
5)、type:这就很多了,就是%s,%d之类。
6)、特别的:%*[width][{h|l|I64|L}]type表示满足该条件的被过滤掉,
不会向目标参数中写入值。如:
constcharsourceStr[]="hello,world";
charbuf[10]={0};
sscanf(sourceStr,"%*s%s",buf);
//%*s表示第一个匹配到的%s被过滤掉,即hello被过滤了
cout<<buf<<endl;
结果为:world
7)、支持集合操作:
%[a-z]表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)
%[aB']匹配a、B、'中一员,贪婪性
%[^a]匹配非a的任意字符,贪婪性
和正则表达式很相似,而且仍然支持过滤,即可以有%*[a-z]。
例子:
1、常见用法。
charbuf[512]={0};
sscanf("123456","%s",buf);
printf("%s\n",buf);
结果为:123456
2、取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。
sscanf("123456","%4s",buf);
printf("%s\n",buf);
结果为:1234
3、取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。
sscanf("123456abcdedf","%[^]",buf);
printf("%s\n",buf);
结果为:123456
4、取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。
sscanf("123456abcdedfBCDEF","%[1-9a-z]",buf);
printf("%s\n",buf);
结果为:123456abcdedf
5、取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。
sscanf("123456abcdedfBCDEF","%[^A-Z]",buf);
printf("%s\n",buf);
结果为:123456abcdedf
6、给定一个字符串iios/12DDWDFF@122,获取/和@之间的字符串,
先将"iios/"过滤掉,再将非'@'的一串内容送到buf中
sscanf("iios/12DDWDFF@122","%*[^/]/%[^@]",buf);
printf("%s\n",buf);
结果为:12DDWDFF
7、给定一个字符串““hello,world”,仅保留world。(注意:“,”之后有一空格)
sscanf(“hello,world”,"%*s%s",buf);
printf("%s\n",buf);
结果为:world
%*s表示第一个匹配到的%s被过滤掉,即hello被过滤了,如果没有空格则结果为NULL。
8、分隔字符串2006:03:18
inta,b,c;
sscanf("2006:03:18", "%d:%d:%d", &a, &b, &c);
9、分隔字符串2006:03:18-2006:04:18
charsztime1[16]="",sztime2[16]="";
sscanf("2006:03:18-2006:04:18","%s-%s",sztime1,sztime2);
10、分隔字符串2006:03:18-2006:04:18
charsztime1[16]="",sztime2[16]="";
sscanf("2006:03:18-2006:04:18","%[0-9,:]-%[0-9,:]",sztime1,sztime2);
仅仅是取消了‘-’两边的空格,却打破了%s对字符串的界定format-type中有%[]这样的typefield。如果读取的字符串,不是以空格来分隔的话,就可以使用%[]。%[]类似于一个正则表达式。[a-z]表示读取a-z的所有字符,[^a-z]表示读取除a-z以外的所有字符。
sscanf的功能很类似于正则表达式,但却没有正则表达式强大,所以如果对于比较复杂的字符串处理,建议使用正则表达式.