学C语言有很长一段时间了想做做笔记把C和C相关的比较容易忽视的地方记下来也希望可以给需要的同学一些帮助。我的这些文章不想对C和C的语法进行讲解和罗列这些东西随便找一本书就讲的比我清楚我只是想把一般人忽视的地方尽自己所能描述一下。权当班门弄斧贻笑大方了。首先我想先从C和C的一些基本概念入手。main()函数稍微学过C和C的人都知道main()函数市所有C和C程序必不可少的东西。叫做主函数。所有的程序都应该从main()函数开始执行。但是你们又对这个函数了解多少呢我们都知道C和C是一种函数语言几乎绝大多数的功能都是通过各种函数的调用来实现的C和C也提供了丰富的函数库供编程人员调用。可虽然main()函数每个C程序都必须有的函数在C或者C的函数库里却没有叫做main()的函数它是需要程序设计人员实现的函数。而且你们发现了没有main并不是C和C的保留字。因此理论上你可以在其他地方使用main这个名字比如变量名、类名字、名字空间的名字甚至成员函数的名字。但是即使这样你也不能修改main()函数本身的函数名否则连接器就会报告错误。main()函数是C和C程序的入口这是因为C和C语言实现会有一个启动函数比如MS-C的启动函数就叫做mainCRTStartup()或者WinMainCRT-Startup()。在这个启动函数的最后会调用main()函数然后再调用exit()函数结束程序。如果没有main()函数当然会报错了。所以再C和C开发环境中main()函数其实是一个回调函数。它是需要我们来实现的。有些同学可能学过一些应用程序框架比如MFC什么的。这些程序代码中往往找不到main()函数这是因为那些应用程序框架把main()函数的实现给隐藏起来了main()函数在它们这里有固定的实现模式所以不需要我们编写。在连接阶段框架会自动将包含main()实现的库加进来连接。main()函数也是有原型的。这个原型已经是一种标准了在ISO/IEC14882中对main()的原型进行了定义。123intmain(){/*......*/}和intmain(intargc,char*argv[]){/*......*/}上面这两种形式是最具有可移植性的正确写法。当然不同的编译器可能会允许出现一些扩展。比如允许main()返回void或者有第三个参数char *env[]什么的。这个就要看具体的编译器文档了。关于返回值我们知道main()返回的是int类型的。到底返回什么是有不同含义的。一般情况下返回0表示程序正常结束返回任何非0表示错误或非正常退出。前面讲到了启动函数最后还会调用exit()函数。那么main()函数的返回值就会作为exit()函数的操作数来返回操作系统。在C当中对main()函数还有一些特殊的限制。比如不能重载不能内联不能定义为静态的不能取其地址不能由用户自己调用关于main()函数的参数它可以让编译好的执行程序具有处理命令行参数的能力。这里需要注意不要把“命令行参数”和main()函数的“函数实参”混淆这是两个不同的概念。命令行参数由启动程序截获并打包成字符串数组传递给main()的形参argv[]而包括命令字也就是执行文件自己的名字在内的所有参数的个数则被传递给形参argc。试一下吧咱们来模拟copy命令写个简单的文件拷贝程序。123456789101112131415161718192021222324252627282930313233343536373839//mycopy.c:文件拷贝程序。#include stdio.hintmain(intargCount,char* argValue[]){FILE*srcFile 0;FILE*destFile 0;intch 0;if(argCount ! 3){printf(使用方法%s 原文件 目标文件\n,argValue[0]);}else{if((srcFile fopen(argValue[1],r)) 0){printf(无法打开原文件\%s\!,argValue[1]);}else{if((destFile fopen(argValue[2],w)) 0){printf(无法打开目标文件\%s\!,argValue[2]);fclose(srcFile);}else{while((ch fgetc(srcFile)) ! EOF){fputc(ch,destFile);}fclose(srcFile);fclose(destFile);return0;}}}return1;}//用法mycopy C:\file1.dat D:\newfile.dat内部名称在编写C程序的时候如果没有main()函数连接器会报错。一般报错信息会提示“unresolved external symbol_main”。这里的_main其实就是编译器为main生成的内部名称。其实C和C语言在编译过程中都会按照特定的规则把用户定义的标识符函数、变量、类型、名字空间什么的转换为相应的内部名称。而这些规则还跟指定的连接规范有关。比如在C语言中main的内部名称就叫做_main。C语言这么做是告诉连接器这个东西是个函数。实际上C语言在所有函数的函数名前其实都是加了前缀“_”的以此来区别函数名和其他标识符名称。这种规范在C又是另一种样子。这是因为在C中所有函数只要不是局部于编译单元文件作用域的static函数就会是具有extern连接类型的和global作用域的全局函数。全局函数是不可以有同名的。但是在C里面可以在不同的作用域比如class,struct,union,namespace中定义同名的函数甚至在同一个作用域也可以定义同名函数也就是函数重载。那么转换为内部名称的连接规范就要复杂一些了。比如1234567891011121314classSample_1{charm_name[16];public:voidfoo(char*newName);voidfoo(intage);};classSample_2{charm_name[16];public:voidfoo(char*newName);voidfoo(boolsex);};在其他地方根据这两个类生成两个实例并进行操作123456Sample_1 a;Sample_2 b;a.foo(aaa);a.foo(100);b.foo(bbb);b.foo(false);这里有四个函数但是确是同一个名称。编译器应该怎么区分呢通过各自对象的成员标识符区分那是在代码中区分的但是在连接器看来所有函数其实都是全局函数而全局函数是不能重名的。所以为了避免二义在C中有一个名字修饰规则。也就是在函数名前面添加各级作用域的名称以及重载函数经过编码的参数信息。比如上面四次调用foo函数其实它们会调用四个具有全局名称的函数分别是Sample_1_foopch1Sample_1_fooint1Sample_2_foopch1Sample_2_fooint1。然而这种标准并不是强制的所以不同厂家开发的C编译器有可能会有些许不同而这也正是导致不同厂家的C编译器和连接器不能兼容的原因。那么好了当使用不同编程语言联合开发时候就要定义一个统一的规范这个规范叫做连接规范。这个很好理解了吧因为如果同一个标识符在不同编译单元中用不同的连接规范就会产生不一致的内部名称连接肯定会失败。所以在开发程序库的时候就一定要明确你要用那条连接规范。比如编写C程序是就要规定C连接规范extern “C”。大约有这么几种情况仅对一个类型、函数、变量或常量指定连接规范1234externCvoidWinMainCRTStartup();externCconstCLSID CLSID_DataConverter;externCstructStudent{/*....*/};externCStudent g_Student;对一段代码限定连接规范123456789101112131415161718#ifdef __cplusplusexternC{#endifconstintMAX_AGE 200;#pragma pack(push,4)typedefstruct_Person{char*m_Name;intm_Age;} Person, *PersonPtr;#pragma pack(pop)Person g_Me;int__cdeclmemcmp(constvoid*,constvoid*,size_t);void* __cdeclmemcpy(void*,constvoid*,size_t);void* __cdeclmemset(void*,int,size_t);#ifdef __cplusplus}#endif当前使用的是C编译器并且使用了extern C限定了一段代码的连接规范但又想在其中某行或某段代码保持C的连接规范。123456789101112131415161718192021222324#ifdef __cplusplusexternC{#endifconstintMAX_AGE 200;#pragma pack(push,4)typedefstruct_Person{char*m_Name;intm_Age;} Person, *PersonPtr;#pragma pack(pop)Person g_Me;#if __SUPPORT_EXTERN_CPP_externC{#endifint__cdeclmemcmp(constvoid*,constvoid*,size_t);void* __cdeclmemcpy(void*,constvoid*,size_t);#if __SUPPORT_EXTERN_CPP_}#endifvoid* __cdeclmemset(void*,int,size_t);#ifdef __cplusplus}#endif某个声明中指定了某个标识符的连接规范为extern “C”那么对应的定义也要指定extern “C”1234567891011121314151617#ifdef __cplusplusexternC{#endifmemcmp(constvoid*,constvoid*,size_t);#ifdef __cplusplus}#endif#ifdef __cplusplusexternC{#endifmemcmp(constvoid*p,constvoid*a,size_tlen){//功能实现}#ifdef __cplusplus}#endif其实如果是面向接口的编程就不用考虑这么多了。因为即使接口两端的内部名称不同只要使用了一致的成员对其和排列方式并遵守一致的调用规范一致的函数实现方式。也就是C一致的对象模型那么基本不会有什么问题的。变量和它的初始化在C和C中全局变量extern或static的存放在程序的静态数据区里面。这些变量在程序进入main()之前就被创建了并在main()结束后销毁C和C提供了一个默认的全局初始化器0。也就是编译器会默认的用0来初始化它们。函数内部的static变量和类的static成员也是在静态存储区因此也会默认初始化为0。除非你在创建的时候就提供了初值。这是编译器对静态变量的待遇。而对于其他的自动变量就需要我们给他初始化了。不要指望编译器自动对它们初始化。