一个fork的面试题

一个fork的面试题

前两天有人问了个关于Unix的fork()系统调用的面试题,这个题正好是我大约十年前找工作时某公司问我的一个题,我觉得比较有趣,写篇文章与大家分享一下。这个题是这样的:

题目:请问下面的程序一共输出多少个“-”?

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int main(void)
{
   int i;
   for(i=0; i<2; i++){
      fork();
      printf("-");
   }

   wait(NULL);
   wait(NULL);

   return 0;
}

如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。

要讲清这个题,我们首先需要知道fork()系统调用的特性,

  • fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
  • 还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。

所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-“);语句有buffer,所以,对于上述程序,printf(“-“);把“-”放到了缓存中,并没有真正的输出(参看《C语言的迷题》中的第一题),在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。

另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存

对于上面的问题,我们如果修改一下上面的printf的那条语句为:

printf("-\n");

或是

 printf("-");
fflush(stdout);

就没有问题了(就是6个“-”了),因为程序遇到“\n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“\n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“\n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。

我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main(void)
{
   int i;
   for(i=0; i<2; i++){
      fork();
      //注意:下面的printf有“\n”
      printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i);
   }
   sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树
   return 0;
}

于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)

ppid=8858, pid=8518, i=0
ppid=8858, pid=8518, i=1
ppid=8518, pid=8519, i=0
ppid=8518, pid=8519, i=1
ppid=8518, pid=8520, i=1
ppid=8519, pid=8521, i=1

$ pstree -p | grep fork
|-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521)
|            |            `-fork(8520)

面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:

注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)

这样,对于printf(“-“);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)

现在你明白了吧。(另,对于图中的我本人拙劣的配色,请见谅!)

(全文完)

(转载本站文章请注明作者和出处 酷 壳 – CoolShell ,请勿用于任何商业用途)

好烂啊有点差凑合看看还不错很精彩 (74 人打了分,平均分: 4.68 )
Loading...

一个fork的面试题》的相关评论

  1. 全缓冲 行缓冲 无缓冲 APUE有详细介绍。 估计和日志奋斗过的都能记得这东西。。。
    虽说APUE这东西又经典又出名,但是似乎认真看下来的人还真不多。

  2. 有一个疑问。对于第三个。在第一次fork时,为什么橙色的子进程也继承了父进程的缓冲区,为什么在橙色的子进程再次被fork时,只有阴影的褐色会多一次打印。而橙色的孙进程却没有您打一次了?同樣继承呀?

  3. 陈皓 :
    你可以试一试下面的程序:
    12345printf("----");sleep(5);printf("++++");sleep(5);printf("/n");

    ^_^, printf(“/n”)?

  4. 试了一下,真是8个-
    不过还是想不通,即使子进程继承了父进程的stdio缓冲区,当父进程或子进程往缓冲区里面写的时候,会引发copy on write,此后父子进程各持一个缓冲区副本,照理说不应该发生多打两个- 的问题才对呀。比如下面例子:

    main()
    {
        int id;
        char *p=malloc(4096);
        memset(p,'q',4096);
    	
        if(id=fork()>0) {
            p[0]='a'; //发生COW,kernel重新分配一个物理页面,
                      //将其映射到p所指的线性地址上,该页面
                      //第一个字节被设为'a',其余仍然为'q'
            write(1,p,2); //打印结果为aq
        } else if(!id) {
            p[1]='b';//发生COW,kernel重新分配一个物理页面,
                     //将其映射到p所指的线性地址上,该页面
                     //第二个字节被设为'b',其余仍然为'q'
            write(1,p,2);//打印结果为qb
        } else {
            exit(250);
        }
    }

    运行以上代码,打印输出为qbaq(kernel调度子进程先运行),可见父子进程写缓冲区,不会影响到彼此。但为何文中的例子,子进程的stdio缓冲区内容会受父进程printf的影响呢?难道stdio的缓冲区是用mmap()函数,开启MAP_SHARED标志位申请的?费解

  5. 有个问题不懂,pid(8519)也同样继承了8518的缓冲区,为什么只有pid(8520)多打印一次,pid(8519)不多输出一次呢?

  6. 今天笔试正好考了这个题目,我囧啊。。。。我之前看了,不过没确定记清楚,所以保底选了两个。以后不能这样了,一定要研究明白。

  7. 但是为什么在没有输出\n的情况下,运行多次结果不一样呢?有的时候是4,6或8.

  8. 呵呵,大家可以考虑一下如下代码的输出,以增加对这个的理解,多谢晧哥。

    int main(void)
    {
         int i;
         for (i = 0; i < 2; i++) {
             printf("-");
             fork();
         }
    }

    不止要知道输出多少个,并且要解释为什么,缓冲区是如何继承的。

  9. #include <stdio.h>
    #include <sys/types.h>
    #include <unistd.h>
    
    int main(void)
    {
       int i;
       for(i=0; i<2; i++){
          fork();
          printf("-, pid=%d; ", getpid());
          //fork();
       }
    
       return 0;
    }

    -, pid=4569; -, pid=4569; -, pid=4569; -, pid=4571; -, pid=4570; -, pid=4570; -, pid=4570; -, pid=4572;

    输出结果父进程多输出了,为什么?

  10. @memon
    确实,较早之前看此文不能很好理解,前些日子看APUE,今晚再看,就容易理解多了。经典的书就是经典,回去好好读。

  11. 按理说linux也是类UNIX操作系统,linux的fork应该是继承自UNIX,如果改成

    #include <stdio.h>
    #include <sys/types.h>
    #include <unistd.h> 
     
    int main(void)
    {
       int i;
       for(i=0; i<2; i++){
          fork();
          printf("-");
       }
       wait(NULL);
       wait(NULL);
       return 0;
    }

    再按照您说的就没有问题了,我觉得原来的题目可能没有考虑到进程的退出,如果面试题目按照原题的话,打出来应该是4个,不是6个,也不是8个

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注