C语言中char类型的数据范围陷阱
C语言中char类型的数据范围陷阱
本文讨论了C语言中char类型的数据范围陷阱。通过一个具体的代码实例,展示了char类型在实际应用中可能遇到的问题,并详细解释了其背后的存储机制。
基础概念
1. char类型是什么
char类型本质上属于整型。因为char类型存储字符信息是通过存储对应的ASCII值来进行存储。而ASCII的值就是整数类型。
2. char类型的取值范围
char类型的存储大小只有一个字节,即8位二进制数。整型家族里都有 signed(有符号数) 和 unsigned(无符号数)两种类型。并且他们的默认类型都是 signed 类型。所以signed char 的取值范围:-128~127;(注:1000 0000 默认值位-128) unsigned char 的取值范围是:0 ~ 255 ;
代码实例演示
下图的strlen 函数是计算字符数组在‘\0’之前整个数组的长度。
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
int main()
{
char a[1000] = { 0 };
int i = 0;
for (i = 0; i < 1000; i++)
{
a[i] = -1 - i;
}
printf("%d", strlen(a));
// strlen 计算字符数组在'\0'之前的数据长度。
return 0;
}
运行结果
结果是255。很多人可能会好奇,上述内容提到默认的char类型的默认类型是signed (有符号数)类型。其存储的数据范围是**-128~127**。按理来说在这个for循环当中 ,i = 128时,存储的数据应该已经超了。可是为什么这里的strlen的结果是255,这表明了i 循环了256次。抱着这样的疑问,我们打开调试环境来看看循环进程。
循环进程的调试
我们可以看到,在i = 127时, char已经到达了有符号数的最小值-128;但是在 i = 128 时,char竟然有跳到了char类型的最大值 127。 这就是char类型存储的一个陷阱。
char类型的陷阱的解释
在上面的测试中我们已经明白了char类型在计算机的存储过程中并不是按照数学意义上的从大到小的顺序进行存储,而是按照下图所示的方式进行存储。这恰好说明了为什么 for循环在 -128之后直接跳到了127,这是因为在char类型的二进制存储中,1000 0000 - 1之后是 0111 1111;这是 127的值。所以数据类型的存取并不是按照数学意义上的从大到小,而是按照二进制的大小。-128的二进制为1000 0000,-1的二进制大小为1111 1111(因为负数在计算机中是以补码的形式存储的)。