深入理解C语言

深入理解C语言

Dennis Ritchie  过世了,他发明了C语言,一个影响深远并彻底改变世界的计算机语言。一门经历40多年的到今天还长盛不衰的语言,今天很多语言都受到C的影响,C++,Java,C#,Perl, PHP, Javascript, 等等。但是,你对C了解吗?相信你看过本站的《C语言的谜题》还有《谁说C语言很简单?》,这里,我再写一篇关于深入理解C语言的文章,一方面是缅怀Dennis,另一方面是告诉大家应该如何学好一门语言。(顺便注明一下,下面的一些例子来源于这个slides

首先,我们先来看下面这个经典的代码:

int main()
{
    int a = 42;
    printf(“%d\n”, a);
}

从这段代码里你看到了什么问题?我们都知道,这段程序里少了一个#include <stdio.h> 还少了一个return 0;的返回语句。

不过,让我们来深入的学习一下,

  • 这段代码在C++下无法编译,因为C++需要明确声明函数
  • 这段代码在C的编译器下会编译通过,因为在编译期,编译器会生成一个printf的函数定义,并生成.o文件,链接时,会找到标准的链接库,所以能编译通过。
  •  但是,你知道这段程序的退出码吗?在ANSI-C下,退出码是一些未定义的垃圾数。但在C89下,退出码是3,因为其取了printf的返回值。为什么printf函数返回3呢?因为其输出了’4′, ‘2’,’\n’ 三个字符。而在C99下,其会返回0,也就是成功地运行了这段程序。你可以使用gcc的 -std=c89或是-std=c99来编译上面的程序看结果。
  • 另外,我们还要注意main(),在C标准下,如果一个函数不要参数,应该声明成main(void),而main()其实相当于main(…),也就是说其可以有任意多的参数。

我们再来看一段代码:

#include <stdio.h>
void f(void)
{
   static int a = 3;
   static int b;
   int c;
   ++a; ++b; ++c;
   printf("a=%d\n", a);
   printf("b=%d\n", b);
   printf("c=%d\n", c);
}
int main(void)
{
   f();
   f();
   f();
}

这个程序会输出什么?

  • 我相信你对a的输出相当有把握,就分别是4,5,6,因为那个静态变量。
  • 对于c呢,你应该也比较肯定,那是一堆乱数。
  • 但是你可能不知道b的输出会是什么?答案是1,2,3。为什么和c不一样呢?因为,如果要初始化,每次调用函数里,编译器都要初始化函数栈空间,这太费性能了。但是c的编译器会初始化静态变量为0,因为这只是在启动程序时的动作。
  • 全局变量同样会被初始化。

说到全局变量,你知道 静态全局变量和一般全局变量的差别吗?是的,对于static 的全局变量,其对链接器不可以见,也就是说,这个变量只能在当前文件中使用。

我们再来看一个例子:

#include <stdio.h>
void foo(void)
{
    int a;
    printf("%d\n", a);
}
void bar(void)
{
    int a = 42;
}
int main(void)
{
    bar();
    foo();
}

你知道这段代码会输出什么吗?A) 一个随机值,B) 42。A 和 B都对(在“在函数外存取局部变量的一个比喻”文中的最后给过这个例子),不过,你知道为什么吗?

  • 如果你使用一般的编译,会输出42,因为我们的编译器优化了函数的调用栈(重用了之前的栈),为的是更快,这没有什么副作用。反正你不初始化,他就是随机值,既然是随机值,什么都无所谓。
  • 但是,如果你的编译打开了代码优化的开关,-O,这意味着,foo()函数的代码会被优化成main()里的一个inline函数,也就是说没有函数调用,就像宏定义一样。于是你会看到一个随机的垃圾数。

下面,我们再来看一个示例:

#include <stdio.h>
int b(void) { printf(“3”); return 3; }
int c(void) { printf(“4”); return 4; }
int main(void)
{
   int a = b() + c();
   printf(“%d\n”, a);
}

这段程序会输出什么?,你会说是,3,4,7。但是我想告诉你,这也有可能输出,4,3,7。为什么呢? 这是因为,在C/C++中,表达的评估次序是没有标准定义的。编译器可以正着来,也可以反着来,所以,不同的编译器会有不同的输出。你知道这个特性以后,你就知道这样的程序是没有可移植性的。

我们再来看看下面的这堆代码,他们分别输出什么呢?

int a=41; a++; printf("%d\n", a);
int a=41; a++ & printf("%d\n", a);
int a=41; a++ && printf("%d\n", a);
int a=41; if (a++ < 42) printf("%d\n", a);
int a=41; a = a++; printf("%d\n", a);

只有示例一,示例三,示例四输出42,而示例二和五的行为则是未定义的。关于这种未定义的东西是因为Sequence Points的影响(Sequence Points是一种规则,也就是程序执行的序列点,在两点之间的表达式只能对变量有一次修改),因为这会让编译器不知道在一个表达式顺列上如何存取变量的值。比如a = a++,a + a++,不过,在C中,这样的情况很少。

下面,再看一段代码:(假设int为4字节,char为1字节)

struct X { int a; char b; int c; };
printf("%d,", sizeof(struct X));
struct Y { int a; char b; int c; char d};
printf("%d\n", sizeof(struct Y));

这个代码会输出什么?

a) 9,10
b)12, 12
c)12, 16

答案是C,我想,你一定知道字节对齐,是向4的倍数对齐。

  • 但是,你知道为什么要字节对齐吗?还是因为性能。因为这些东西都在内存里,如果不对齐的话,我们的编译器就要向内存一个字节一个字节的取,这样一来,struct X,就需要取9次,太浪费性能了,而如果我一次取4个字节,那么我三次就搞定了。所以,这是为了性能的原因。
  • 但是,为什么struct Y不向12 对齐,却要向16对齐,因为char d; 被加在了最后,当编译器计算一个结构体的尺寸时,是边计算,边对齐的。也就是说,编译器先看到了int,很好,4字节,然后是 char,一个字节,而后面的int又不能填上还剩的3个字节,不爽,把char b对齐成4,于是计算到d时,就是13 个字节,于是就是16啦。但是如果换一下d和c的声明位置,就是12了。

另外,再提一下,上述程序的printf中的%d并不好,因为,在64位下,sizeof的size_t是unsigned long,而32位下是 unsigned int,所以,C99引入了一个专门给size_t用的%zu。这点需要注意。在64位平台下,C/C++ 的编译需要注意很多事。你可以参看《64位平台C/C++开发注意事项》。

下面,我们再说说编译器的Warning,请看代码:

#include <stdio.h>
int main(void)
{
    int a;
    printf("%d\n", a);
}

考虑下面两种编译代码的方式 :

  • cc -Wall a.c
  • cc -Wall -O a.c

前一种是不会编译出a未初化的警告信息的,而只有在-O的情况下,才会有未初始化的警告信息。这点就是为什么我们在makefile里的CFLAGS上总是需要-Wall和 -O。

最后,我们再来看一个指针问题,你看下面的代码:

#include <stdio.h>
int main(void)
{
    int a[5];
    printf("%x\n", a);
    printf("%x\n", a+1);
    printf("%x\n", &a);
    printf("%x\n", &a+1);
}

假如我们的a的地址是:0Xbfe2e100, 而且是32位机,那么这个程序会输出什么?

  • 第一条printf语句应该没有问题,就是 bfe2e100
  • 第二条printf语句你可能会以为是bfe2e101。那就错了,a+1,编译器会编译成 a+ 1*sizeof(int),int在32位下是4字节,所以是加4,也就是bfe2e104
  • 第三条printf语句可能是你最头疼的,我们怎么知道a的地址?我不知道吗?可不就是bfe2e100。那岂不成了a==&a啦?这怎么可能?自己存自己的?也许很多人会觉得指针和数组是一回事,那么你就错了。如果是 int *a,那么没有问题,因为a是指针,所以 &a 是指针的地址,a 和 &a不一样。但是这是数组啊a[],所以&a其实是被编译成了 &a[0]。
  • 第四条printf语句就很自然了,就是bfe2e104。还是不对,因为是&a是数组,被看成int(*)[5],所以sizeof(a)是5,也就是5*sizeof(int),也就是bfe2e114。

看过这么多,你可能会觉得C语言设计得真扯淡啊。不过我要告诉下面几点Dennis当初设计C语言的初衷:

1)相信程序员,不阻止程序员做他们想做的事。

2)保持语言的简洁,以及概念上的简单。

3)保证性能,就算牺牲移植性。

今天很多语言进化得很高级了,语法也越来越复杂和强大,但是C语言依然光芒四射,Dennis离世了,但是C语言的这些设计思路将永远不朽。

(请勿用于商业用途,转载时请注明作者和出处)

(转载本站文章请注明作者和出处 酷 壳 – CoolShell ,请勿用于任何商业用途)

好烂啊有点差凑合看看还不错很精彩 (62 人打了分,平均分: 4.13 )
Loading...

深入理解C语言》的相关评论

  1. void foo(void)
    {
    int a;
    printf(“%d\n”, a);
    }
    void bar(void)
    {
    int a = 42;
    }
    int main(void)
    {
    bar();
    foo();
    }
    这一段笔误很多啊~

  2. “但在C89下,退出码是3,因为其取了printf的返回值。为什么printf函数返回3呢?因为其输出了’4′, ’2′,’′ 三个字符。而在C89下,其会返回0,也就是成功地运行了这段程序。你可以使用gcc的 -std=c89或是-std=c99来编译上面的程序看结果。”

    后一个C89是不是C99啊?

  3. 1. 对于C/C++语言未定义的东西,不是“在C中,这样的情况很少”的问题,是绝对就不要写这样的代码,也不要去探讨它。7年前,一个搞Java的问我i=i++;那时候很傻,我用各种C/C++的编译器做了测试,并用Java编译器也做了测试,并探究哪个是正确的,最后在C++之父的网站上看到,这种情况以及其他很多情况在语言中是未定义,千万不要去写出他们,当然也更没有必要去研究、论证他们,没有定义的东西,编译器厂商怎么实现都可以。

    2. 对于字节对齐,不是单纯的向4的倍数对齐,如果采用各个编译器的默认参数,就说32位的程序,也是不一样的。至少cl.exe和gcc就是不一样的。感情趣自己研究下吧,不要把一个编译器的实现(gcc)作为这门语言的标准。

  4. 突然有个想法,大哥什么时候讲讲很多人说的很悬乎的 monad、continuation ? 每次都晕到不行。。。

  5. 文章不错~
    发现了两个小bug:
    ’4′, ’2′,’′ 三个字符。 => 应该是’4′, ‘2′,’\n′ 吧?
    在64位下,sizeof的size_t是unsigned long,而32位下是 unsigned int => 在32位和64位下都是unsigned long,只是unsigned long的size不一样,一个是4个字节,一个8个字节。

    1. 删了吗?不会吧。我重来不删贴,很多骂我的贴子我都不删。是不是因为有链接,被系统判成垃圾回复了。Sorry,本站的垃圾回复太多,一天几千个。

      关于你说的这个PPT,的确是的,本文的一些例子参考自那里。我在文中忘注明了,谢谢你的提醒。

  6. 但是,你知道为什么要字节对齐吗?还是因为性能。因为这些东西都在内存里,如果不对齐的话,我们的编译器就要向内存一个字节一个字节的取,这样一来,struct X,就需要取9次,太浪费性能了,而如果我一次取4个字节,那么我三次就搞定了。所以,这是为了性能的原因。
    —–
    这句我有点疑惑,即便不对齐,编译的结果应该还是一个基于field偏移的寻址,所谓“一个字节一个字节”(其实也不一定是1个字节一个字节,可能是2次字长)的抓取并不是编译器这边发生,而是在硬件级别。另外,在一些CPU架构下,比如arm不打开允许非对齐访问的bit的时候,对于非对齐数据长度的访问会导致alignment trap/bus error。

  7. 3. 还有还有那个printf是4, 3, 7还是3, 4, 7的问题,也是不应该写出这样的代码,而是”不跨平台”也不可以这样写。

  8. 陈皓 :
    你说的没错,我的意思是,sequence point这种情况不多。

    不好意思,理解是一样的,我理解错你的话了,:-)

  9. 我的编译器是gcc 4.4.5
    foo(), bar()那个例子, 不优化的时候输出的是随机数,优化的时候是输出0,

    ————————————-
    cc -Wall a.c
    cc -Wall -O a.c
    前一种是不会编译出a未初化的警告信息的,而只有在-O的情况下,再会有未初始化的警告信息。
    ————————————–
    我这加-Wall会给出a未初始化的警告。

    再就是: printf(“%x\n”, &a+1); “第四条printf语句就很自然了,就是bfe2e104”, 这个说法不对吧。
    a的地址是bfe2e100, &a的地址是bfe2e100, 但是&a的类型是 int *[5],因此&a+1的地址是:bfe2e100 + 1 * sizeof(int [5]), 即bfe2e114.

  10. GM :
    @bob
    通过pack可以直接修改对齐方式

    谢谢啊,我知道~~ :-)
    现在说的是用编译器的默认参数,并且不加预编译指令的情况。

  11. #include
    int main(void)
    {
    int a[5];
    printf(“%x\n”, a);
    printf(“%x\n”, a+1);
    printf(“%x\n”, &a);
    printf(“%x\n”, &a+1);
    }
    &a 是一个指向数组的指针,(&a+1) 和 &a的数值差是sizeof(a) : 20.

  12. 再次把那段著名的话搬出来:数组名可以被视作指针,(翻到c89文档下一页)当且仅当他作为函数实参传递给函数时。

  13. 对于字节对齐,大概记得当初自己对gcc和cl.exe的实验结果是这样的:(前提是默认参数 + 不使用pack、pack(push)、pack(pop)预编译指令)
    微软的编译器默认是按照4个字节对齐,GNU的是按照8个字节对齐。

    废话:当然如果考虑跨平台,最好是在文件读写、网络通信等用到的结构体加上pack指令包上,或者给编译器指定默认对齐参数。还有如果64位移植后的程序要保持跟32位兼容,也要这样做。这些废话不说,估计又得有人给我指正了,呵呵。

  14. a: bfc5dc4c
    a+1: bfc5dc50
    &a: bfc5dc4c
    &a+1: bfc5dc60
    &a[0]+1: bfc5dc50
    看到&a+1并不等于a+1;&a+1是增加了整个数组的长度。
    $gcc -v
    Using built-in specs.
    Target: i486-linux-gnu
    Configured with: ../src/configure -v –with-pkgversion=’Ubuntu 4.4.3-4ubuntu5′ –with-bugurl=file:///usr/share/doc/gcc-4.4/README.Bugs –enable-languages=c,c++,fortran,objc,obj-c++ –prefix=/usr –enable-shared –enable-multiarch –enable-linker-build-id –with-system-zlib –libexecdir=/usr/lib –without-included-gettext –enable-threads=posix –with-gxx-include-dir=/usr/include/c++/4.4 –program-suffix=-4.4 –enable-nls –enable-clocale=gnu –enable-libstdcxx-debug –enable-plugin –enable-objc-gc –enable-targets=all –disable-werror –with-arch-32=i486 –with-tune=generic –enable-checking=release –build=i486-linux-gnu –host=i486-linux-gnu –target=i486-linux-gnu
    Thread model: posix
    gcc version 4.4.3 (Ubuntu 4.4.3-4ubuntu5)

  15. 当然,虽然微软和GNU的编译器的默认对齐参数是不一样的,但是,大家应该知道,对齐这个问题,一定是要你的结构体里面的最大的类型超出编译器的那个参数,才会感觉到作用。这个废话没说,呵呵。32位程序,你要想试出来,必须用long long或者double。

  16. 很多都和接近机器的那一层有关, 编译器的特性很多都可以凭个人爱好来定义, 娱乐娱乐.

  17. 我刚又试了一下啊,貌似我把以前的实验结果记反了啊,呵呵,应该是:
    微软的编译器默认是按照8个字节对齐,GNU的是按照4个字节对齐。

    也就是
    struct A { long long a; char b; };
    sizeof(A), cl.exe是16,gcc是12.

  18. bob :
    1. 对于C/C++语言未定义的东西,不是“在C中,这样的情况很少”的问题,是绝对就不要写这样的代码,也不要去探讨它。7年前,一个搞Java的问我i=i++;那时候很傻,我用各种C/C++的编译器做了测试,并用Java编译器也做了测试,并探究哪个是正确的,最后在C++之父的网站上看到,这种情况以及其他很多情况在语言中是未定义,千万不要去写出他们,当然也更没有必要去研究、论证他们,没有定义的东西,编译器厂商怎么实现都可以。
    2. 对于字节对齐,不是单纯的向4的倍数对齐,如果采用各个编译器的默认参数,就说32位的程序,也是不一样的。至少cl.exe和gcc就是不一样的。感情趣自己研究下吧,不要把一个编译器的实现(gcc)作为这门语言的标准。

    我也这么认为.
    一个好的程序,应该是易懂的,无歧义的.

  19. 最后那个,如果是int *a,怎么会a == &a?这两个是不相等的啊。不太明白,请指教

  20. @GM
    因为我们的32位的CPU读数据的时候每一次都只能读4i+0, 4i+1, 4i+2, 4i+3这4个字节。假设你的东西没对齐,一个int跨边界了,读一个int就要读两次,读一个double就要读三次,岂不是很大的浪费……

  21. @bob
    一个结构的尺寸总是它里面“对齐尺寸”最大的那个。简单类型,譬如说数字,对齐尺寸跟他的尺寸一样,一个struct的对齐尺寸取的是成员里面最大的对齐尺寸。为什么要这么做呢?如果一个struct A{int i; char c;}是5个字节,那么A a[2]; &a[1].i就不对齐了,所以你使用了long long,导致这个struct的“对齐尺寸”变成8,因此总大小只能是16了。

  22. int a=41; a++ & printf(“%d\n”, a);
    这段程序我的机器显示出 “a上的运算结果可能是未定义的。”和“计算出的结果未被使用”什么原因???
    我用下列参数编译的 gcc -Wall -g -o0 -c

  23. vczh :
    @bob
    一个结构的尺寸总是它里面“对齐尺寸”最大的那个。简单类型,譬如说数字,对齐尺寸跟他的尺寸一样,一个struct的对齐尺寸取的是成员里面最大的对齐尺寸。为什么要这么做呢?如果一个struct A{int i; char c;}是5个字节,那么A a[2]; &a[1].i就不对齐了,所以你使用了long long,导致这个struct的“对齐尺寸”变成8,因此总大小只能是16了。

    谢谢啊,i knew。
    我说的是连个平台编译器默认参数的不同,看来”废话”还是说的少,说了那么多前提,还是这样,汗。

  24. vczh :
    @bob
    一个结构的尺寸总是它里面“对齐尺寸”最大的那个。简单类型,譬如说数字,对齐尺寸跟他的尺寸一样,一个struct的对齐尺寸取的是成员里面最大的对齐尺寸。为什么要这么做呢?如果一个struct A{int i; char c;}是5个字节,那么A a[2]; &a[1].i就不对齐了,所以你使用了long long,导致这个struct的“对齐尺寸”变成8,因此总大小只能是16了。

    “大家应该知道,对齐这个问题,一定是要你的结构体里面的最大的类型超出编译器的那个参数,才会感觉到作用。”我的这句话,你理解了?跟你是不是一个意思啊,呵呵。
    你的这个理论,“个结构的尺寸总是它里面“对齐尺寸”最大的那个”,你的那个理论是说明白了一半,而这一半我理解是”废话”,就是我觉得大家众所周知的结构体成员对齐的理论。最大类型的大小超出了编译器的限制,你试试用你的这个理论对吗?

  25. @vczh
    不好意思,一说到技术就有点儿急。
    我说明白点儿吧,你用gcc编译一下,把我写的那个结构体的大小打印出来看看,看看是几。能帮助你理解除了“一个结构的尺寸总是它里面“对齐尺寸”最大的那个”之外的另外一半理论,因为gcc默认结构体成员对齐参数是4,而不是8,微软默认是8。当然你可以通过参数指定。对于结构体里面的类型没有超过编译器参数或者pack指令的限制的时候,确实是你说的那样,但是这个我想没必要说,所有C/C++编译器实现都是一样的,我想说的是编译器默认参数的不同而已。

  26. “如果是 int *a,那么没有问题,a == &a” 说反了吧? 如果是数组a[] , a= &a 因为都是数据第一个元素的地址,如果是int *a , &a则是存放指针变量的地址,此时a!=&a 。

  27. @vczh
    你确定和我说的不是一个意思?

    我的意思是32bit数据线跨边界的读取不是一个内存周期读取1个字节,而是按4字节读取两次。文中是以字节应该是不对的。另外,这个动作也不是编译器做的,而是硬件。编译器对struct,仅仅生成按照字节对齐的便宜寻址而已

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注