《C陷阱与缺陷》读书笔记

在 C 语言中，符号中间的空白（包括空格符、制表符和换行符）将被忽略。
贪心法：C 语言中，每一个符号应该包含尽可能多的字符。
如果一个整型常量的第一个字符为 0，那么该常量将被视为八进制数。
用单引号引起的一个字符实际上代表一个整数，整数值对应于该字符在编译器所采用的字符集中的序列值；而用双引号引起的字符串，代表的却是一个指向无名数组起始字符的指针，该数组被双引号中的字符以及一个额外的二进制为 0 的字符 \0 初始化。
!= 的优先级比 & 高，加法运算符优先级比移位运算符高。
优先级表：
优先级助记：
1. 优先级最高的并不是真正意义上的运算符，包括数组下标，函数调用操作符，结构成员选择操作符。他们都是自左至右结合。
2. 单目运算符的优先级仅次于前者，在所有真正意义上的运算符中，他们的优先级最高。类型转换也是单目运算符，他们自右至左结合。接下来是双目运算符。其中，算术运算符优先级最高，移位运算符次之，关系运算符再次之，接着是逻辑运算符，赋值运算符，最后是条件运算符。
3. 我们需要记住的最重要两点是：(1). 任何一个逻辑运算符的优先级低于任何一个关系运算符；(2). 移位运算符优先级比算术运算符低，但比关系运算符高。
任何两个逻辑运算符都具有不同的优先级，所有按位运算符优先级要比顺序运算符高，每个「与」运算符要比相应的「或」高，而按位异或介于按位与和按位或之间。
注意不要在 if 或 while 语句后面写一个分号，如果要写，请用大括号括起来。实际上，这也是我们提倡的一种编程风格。
C 语言要求，在函数调用时即使函数不带参数，也应包括参数列表。因此，如果 f 是一个函数，f() 是一个函数调用语句，而 f 是一个什么也不做的语句，更精确的说，它计算函数 f 的地址，却并不调用该函数。
悬挂 else 问题的解决方法：else 总是与同一括号内最近的未匹配的 if 结合。
C 语言中只有一维数组，而且数组大小在编译时就作为一个常数确定下来。然而，数组元素可以是任何类型的对象，当然也可以是另外一个数组。
对于一个数组，我们只能做两件事：确定数组大小，以及获得指向该数组下标为 0 元素的指针。其他对数组的一切操作，都是通过指针来进行的。换句话说，任何一个数组下标运算都等同于一个对应的指针运算。
对于 int ar[12][13]，说明 ar 数组拥有 12 个数组类型的元素，其中每个元素都是拥有 13 个整型元素的数组（而不是反过来的）。因此，sizeof(ar) 的值是 12*13*sizeof(int)。
对于除 sizeof 之外的其他场合，ar 总被解释为指向数组起始元素的指针。
对于 int ar[12];，&ar 是一个指向数组的指针，而 ar 是指向数组首元素的指针。
int *p; 对指针的声明解释方式应该是 *p 是一个整型值，所以 p 就是一个指向整型元素的指针。
由于栈顶在内存中处于低地址空间，栈底处于高地址空间，故数组在入栈时是从后往前的（也就是由下标大的值依次往下标小的值压栈）。
C 语言中，字符串常量代表了一块包括字符串中所有字符以及一个空字符 \0 的内存区域的地址。
malloc 函数可能无法开辟足够的空间，因此可能返回空指针。然而，即使开辟成功，也应在使用完毕后及时释放该空间。
在字符串拷贝时，新开辟的空间大小往往是 strlen(s)+1。
C 语言无法将数组作为参数传递给一个函数。如果我们使用数组名作为参数，它会被转换为指向数组第一个元素的指针。但其他情况下不会这样转换，比如 extern char hello[]; 和 extern char *hello;。
C 语言中将一个常数转换为一个指针，得到的结果取决于具体的 C 编译器。但有一个例外，就是 0。编译器保证由 0 转换而来的指针不等于任何有效的指针。出于代码文档化的考虑，常数 0 经常用一个符号来代替：#define NULL 0。
将 0 转化为指针使用时，该指针绝对不能解除引用(dereference)。
避免「栏杆错误」的原则：
1. 首先考虑最简单情况下的特例，然后将得到的结果外推。
2. 仔细计算边界，绝不掉以轻心。
3. 或者将栏杆的边界设为左闭右开区间（直接相减，结果不用加一，即不对称边界）。
求值顺序：和运算符的优先级不是一回事。典型的运算符有 &&（若左边为假，则不会对右边求值），||（和 && 一样，先对左侧求值，只在需要时才对右侧操作数求值），?:（eg：a:b?c; 先对 a 求值，再根据 a 的值决定对 b 还是 c 进行求值），,（逗号，先对左侧求值，然后该值被丢弃，再对右侧操作数求值）。实际上，C 语言只有这四种运算符存在规定的求值顺序，其他运算符对其操作数的求值顺序是未定义的。
承上，要说明的是，分隔函数参数的逗号并非是逗号运算符。例如，函数 f 需要两个参数，则 f(x,y); 的求值顺序是未定义的；而函数 g 只需要一个参数，则 g(x,y) 先对 x 求值，然后将其丢弃，再对 y 求值。特别地，赋值运算符并不保证任何求值顺序。
关于整数运算：无符号数没有「溢出」之说，因为无符号数是以 2 的 n 次方为模（n 是结果中的二进制位数）。如果一个有符号数和一个无符号数进行运算，有符号数会被转换为无符号数，所以也不会溢出。
main 函数如果不写返回值，默认为 int。一个返回值为整型的函数如果返回失败，实际上隐式地返回了某个「垃圾」整数，只要该值不被用到，就无关紧要。但有些情况下对于 main 的返回值却并非如此，大多数 C 语言实现都通过 main 返回值来告知操作系统该操作是成功还是失败。典型的处理方案是，返回值为 0 代表执行成功，非0代表失败。如果该程序被别的程序调用，且 main 没有返回值，那么有可能看上去执行失败，得到令人惊讶的结果。
许多系统中连接器是独立于 C 语言实现的，且与 C 编译器分离，它不可能了解 C 语言的诸多细节。但它能够理解机器语言和内存布局。C 编译器有责任以适当的方式通知链接器，确保未指定初始值的外部变量初始化为 0。
static 定义的变量（或函数）的作用域值局限于本文件内，其他文件是不可见的。
如果一个函数在被定义或声明之前被调用，那么他的返回值类型默认为整型，但这往往会得出错误的结果。C 语言的规则是，如果一个未声明的标示符后面跟了一个开括号，那么它被视为一个返回整型的函数。
如果一个函数的参数中没有 float，short 或 char 类型的参数，在声明中可以省略其参数类型的说明。
如果在一个源文件中定义一个变量，在另一个源文件中用 external 声明它，则他们的类型必须相同（这是程序员的责任）。尤其注意，不要定义为 char name[]; 而声明为 char *name;。
对于 char c; (c=getchar())!=EOF;，c 被声明为 char 类型，而不是 int 类型，这意味着：c无法容纳所有可能的字符，特别是，可能无法容纳 EOF。一种可能是，某些合法的字符被「截断」后使得 c 的值与 EOF 相同；另一种可能是，c 根本无法取得 EOF 的值。对于前一种情况，文件将在复制的中途终止；对于后一种情况，程序将陷入死循环。但实际上，可能还有第三种情况，就是编译器直接在 while 中比较 getchar() 的返回值和 EOF，而不是将 c 拿来比较，这样的话，程序看起来「似乎」能够正确运行。
对文件的读写：为了保持与过去不能同时进行读写操作的程序向下兼容性，一个输入操作后不能直接紧跟一个输出操作，反之亦然。如果要同时进行输入和输出，必须在其中插入 fseek() 函数的调用。
所有的 C 语言实现中都包括有 signal() 库函数，作为捕获异步事件的一种方式。（要使用它，需引入 signal.h 头文件）。
因为函数调用有一定的开销，所以将一些小的函数定义为宏，可以提高运行时效率。但定义宏时，要确保其中的参数没有副作用，并且为每一个参数加上括号。
不能忽视宏中的空格；宏并不是语句；宏并不是函数；宏并不是类型定义；
对于标示符的规定，ANSIC 所能保证的只是，C 语言必须能够区别出前 6 个字符不同的外部名称，并不区分字母的大小写。因此，若两个函数的名称为 print_fields 和 print_float，或者 State 和 STATE，这样的命名就不恰当。
C 语言的定义中对 3 种不同类型整数的相对长度做了一些规定(short,int,long)：
1. 3 种类型的整数其长度是非递减的；
2. 一个普通整数（int）足够大以容纳任何数组下标；
3. 字符长度由硬件特性决定。
如果 c 是一个字符变量，想用 (unsigned)c 将其转化为无符号整数，这时会失败的。因为在字符c转化为无符号整数时，c 首先会被转化为 int 型整数，而此时可能得到非预期的结果。正确的方式是 (insigned char)c，因为 unsigned char 类型的字符在转化为无符号整数是无需转化为 int 型整数，而是直接进行转化。
对于移位运算符：向右移位时，如果被移位的对象是无符号数，那么空出的为将被 0 填充；若是有符号数，则既可用 0 填充（逻辑移位），也可用符号位填充（算数移位）。
移位计数允许的取值范围是 0~n（n 是该变量的二进制位数），即大于等于 0，而小于 n。因此，不可能在单次操作中将某个数的所有位都移出。为什么要有这个限制呢？原因是只要加上了这个限制，我们就能在硬件上高效的实现移位运算。
移位运算符的效率要比除法高效得多。但即使 C 实现将符号位复制到空出的位中，有符号整数的向右移位也不等同于除以 2 的某次幂。证明：(-1)>>1，这个操作结果一般不可能为 0，但 (-1)/2 在大多数 C 实现上结果都是 0。
内存位置 0：NULL指针，不指向任何对象。因此，除非是用于赋值或比较运算，出于其他任何目的使用NULL指针都是非法的。
除法运算时发生的截断：假定我们让 q=a/b;r=a%b;（假定 b 大于 0）。我们希望 a,b,q,r 之间维持的关系是：
1. 最重要的一点：我们希望 q*b+r==a，因为这是余数的定义。
2. 如果我们改变 a 的符号，我们希望改变 q 的符号，但不会改变其绝对值。
3. 当 b>0 时，我们希望保证 r>=0 且 r<b。
4. 但是很不幸，以上三条无法同时成立（可以自行验证）。因此 C 语言（或其他语言）在实现除法时，必须放弃其中的至少一条，大多数程序设计语言选择放弃第 3 条，而改为余数与被除数的正负号相同。然而，C 语言的定义只保证了性质1，以及当 a>=0 且 b>0 时，保证 |r|<|b| 以及 r>=0。
rand 函数有两个版本，分别是 VAX-11（返回值范围为 0~2³¹-1）和 AT&T（返回值范围为 0~2¹⁵-1）。如果我们用到了 rand 函数，就必须根据特定的 C 语言实现做出「剪裁」。ANSCI 标准中定义了一个常数 RAND_MAX，它的值等于随机数的最大取值。
在一个负数前加上 - 转化为整数有可能溢出。
建议：
1. 在编写程序时，考查最简单的特例。比如当部分输入数据为空或只有一个元素时。
2. 使用不对称边界。例如数组的下标。
3. 进行预防性编程。