1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > Linux 内核 C 语言深度解析

Linux 内核 C 语言深度解析

时间:2019-05-27 04:16:13

相关推荐

Linux 内核 C 语言深度解析

课程简介

在看一些 GNU 开源软件,或者阅读 Linux 内核、驱动源码时,相信大家和我一样,经常会遇到一些“看似熟悉”,但一仔细分析又不是很懂的 C 语言“稀奇古怪”的语法。其实这些都是 GNU C 对 C 语言语法的扩展。一般的教材中基本不会讲到这些,所以看不懂这些特殊的 C 语法应用也很正常。

此达人课将带领大家,一起学习 Linux 内核或 GNU 开源软件中对 C 语言各种扩展语法的使用,最终的目标是看懂 Linux 内核或 GNU 开源软件中这些“奇葩的语法”,扫除理解 Linux 内核驱动或 GNU 开源软件的语法障碍。

作者介绍

王利涛,嵌入式驱动工程师、CSDN 学院讲师,精通 C、Python 语言编程,精通 Linux、uC/OS 内核驱动及系统开发。在多家芯片公司从事 SOC 芯片验证测试、Linux/Android 下内核驱动开发、USB 驱动开发等工作。目前在开发《嵌入式工程师自我修养》互联网在线教程。

个人微信公众号:宅学部落(armlinuxfun)。

课程内容

第01课:Linux 内核中的 C 语言语法扩展

Linux 内核驱动中的奇怪语法

大家在看一些 GNU 开源软件,或者阅读 Linux 内核、驱动源码时会发现,在 Linux 内核源码中,有大量的 C 程序看起来“怪怪的”。说它是C语言吧,貌似又跟教材中的写法不太一样;说它不是 C 语言呢,但是这些程序确确实实是在一个 C 文件中。此时,你肯定怀疑你看到的是一个“假的 C 语言”!

比如,下面的宏定义:

#define mult_frac(x, numer, denom)( \{ \ typeof(x) quot = (x) / (denom); \ typeof(x) rem = (x) % (denom); \ (quot * (numer)) + ((rem * (numer)) / (denom)); \} \)#define ftrace_vprintk(fmt, vargs)\do {\ if (__builtin_constant_p(fmt)) {\ static const char *trace_printk_fmt __used\__attribute__((section("__trace_printk_fmt"))) = \ __builtin_constant_p(fmt) ? fmt : NULL;\\ __ftrace_vbprintk(_THIS_IP_, trace_printk_fmt, vargs); \ } else\ __ftrace_vprintk(_THIS_IP_, fmt, vargs); \} while (0)

字符驱动的填充:

static const struct file_operations lowpan_control_fops = { .open = lowpan_control_open, .read = seq_read, .write = lowpan_control_write, .llseek = seq_lseek, .release = single_release, };

内核中实现打印功能的宏定义:

#define pr_info(fmt, ...) __pr(__pr_info, fmt, ##__VA_ARGS__)#define pr_debug(fmt, ...) __pr(__pr_debug, fmt, ##__VA_ARGS__)

你没有看错,这些其实也是 C 语言,但并不是标准的 C 语言语法,而是我们 Linux 内核使用的 GNU C 编译器扩展的一些 C 语言语法。这些语法在 C 语言教材或资料中一般不会提及,所以你才会似曾相识而又感到陌生,看起来感觉“怪怪的”。我们在做 Linux 驱动开发,或者阅读 Linux 内核源码过程中,会经常遇到这些“稀奇古怪”的用法,如果不去了解这些特殊语法的具体含义,可能就对代码的理解造成一定障碍。

本教程,就是带领大家一起去了解 Linux 内核或者 GNU 开源软件中,常用的一些 C 语言特殊语法扩展,扫除阅读 Linux 内核或 GNU 开源软件时,这些扩展特性带给我们的语法阅读障碍和困惑。

C 语言标准和编译器

在进入正式课程之前,先给大家普及一下 C 标准的概念。在学习 C 语言时,大家在教材或资料上,或多或少可能见到过“ANSI C”的字眼。可能当时没有太在意,其实“ANSI C” 表示的就是 C 语言标准。

什么是 C 语言标准呢?我们生活的现实世界,就是由各种标准构成的,正是这些标准,我们的社会才会有条不紊的运行。比如我们过马路,遵循的交通规则就是一个标准:红灯停,绿灯行,黄灯亮了等一等。当行人和司机都遵循这个默认的标准时,我们的交通系统才会顺畅运行。电脑中的 USB 接口也是一种标准,当大家生产的 USB 产品都遵循 USB 协议这种通信标准时,我们的手机、U 盘、USB 摄像头、USB 网卡才可以在各种电脑设备上互插互拔。2G、3G、4G 也是一种标准,当不同厂家生产的基带芯片都遵循这种通信标准,我们所用的不同品牌、不同操作系统的手机才可能互相打电话、互相发微信、互相给对方点赞。

同样,C 语言也有它自己的标准。我们知道,C 语言程序需要通过编译器,编译生成二进制指令,才能在我们的电脑上运行。在 C 语言刚发布的早期,各大编译器厂商开发自己的编译器时,各自开发,各自维护,时间久了,就会变得比较混乱。这就会造成这样一种局面:程序员写的程序,在一个编译器上编译通过,在另一个编译器编译通不过。大家按各自的习惯来,谁也不服谁,就像春秋战国时代:不同的货币、不同的度量衡,不同的文字,都是中国人,因为标准不统一,所以交流起来很麻烦,这样下去也不是办法啊。

后来 ANSI(AMERICAN NATIONAL STANDARDS INSTITUTE: 美国国家标准协会,简称 ANSI)出山了,联合 ISO(国际化标准组织)召集各个编译器厂商大佬,各种技术团体,一起喝个茶、开个碰头会,开始启动 C 语言的标准化工作。期间各种大佬之间也是矛盾重重,充满各种争议,但功夫不负有心人,经过艰难的磋商,终于在1989年达成一致,发布了 C 语言标准,后来第二年又做了一些改进。于是,就像秦始皇统一六国、统一文字和度量衡一样,C 语言标准终于问世了!因为是在 1989 年发布的,所以人们一般称其为 C89 或 C90 标准,或者叫做 ANSI C。

C 标准内容

C 标准里主要讲了什么?

C 标准英文文档,洋洋洒洒几百页,讲了很多东西,但总体归纳起来,主要就是 C 语言编程的一些语法惯例,比如:

定义各种关键字、数据类型定义各种运算规则各种运算符的优先级和结合性数据类型转换变量的作用域函数原型函数嵌套层数函数参数个数限制标准库函数

C 标准发布后,大家都遵守这个标准:程序员开发程序时,按照这种标准写;编译器厂商开发编译器时,也按照这种标准去解析、翻译程序。不同的编译器厂商支持统一的标准,这样大家写的程序,使用不同的编译器,都可以正确编译、运行,大大提高程序的开发效率,推动了 IT 行业的发展。

C 标准的发展过程

C 标准并不是永远不变的,就跟移动通信一样,也是从 2G、3G、4G 到 5G 不断发展变化的。C 标准也经历了下面四个阶段:

K&R CANSI CC99C11

K&R C

K&R C 一般也称为传统 C。在 C 标准没有统一之前,C 语言的作者 Dennis Ritchie 和 Brian Kernighan 合作写了一本书《C 程序设计语言》。早期程序员编程,这本书可以说是绝对权威。这本书很薄,内容精炼,主要介绍了 C 语言的基本使用方法。后来《C 程序设计语言》第二版问世,做了一些修改:比如新增 unsigned int、long int、struct 等数据类型;把运算符 =+/=- 修改为 +=/-=,避免运算符带来的一些歧义和 Bug。这本书可以看作是 ANSI 标准的雏形。但早期的 C 语言还是很简单的,比如还没有定义标准库函数、没有预处理命令等。

ANSI C

ANSI C 是 ANSI(美国国家标准协会)在 K&R C 的基础上,统一了各大编译器厂商的不同标准,并对 C 语言语法和特性做了一些扩展,而发布的一个标准。这个标准一般也叫做 C89/C90,也是目前各种编译器默认支持的 C 语言标准。ANSI C 主要新增了以下特性:

增加 signed、volatile、const 关键字增加 void* 数据类型增加预处理器命令增加宽字符、宽字符串定义了 C 标准库……

C99 标准

C99 标准是 ANSI 1999 年在 C89 标准的基础上新发布的一个标准,该标准对 ANSI C 标准做了一些扩充,比如新增一些关键字,支持新的数据类型:

布尔型:_Bool复数:_Complex虚数:_Imaginary内联:inline指针修饰符:restrict支持long long、long double数据类型支持变长数组允许对结构体特定成员赋值支持16进制浮点数、float _Complex等数据类型……

除此之外,C99 标准也借鉴其它语言的一些优点,对语法和函数做了一系列改进,大大方便了程序员开发程序,比如:

变量声明可以放代码块的任何地方。ANSI C 规定变量的声明要全部写在函数语句的最前面,否则就会报编译错误。现在不需要这样写了,哪里需要使用变量,在哪里直接声明使用即可;源程序每行最大支持4095个字节。这个貌似足够用了,没有什么程序能复杂到一行程序有4KB个字符;支持//单行注释。ANSI C使用/**/没有C++的//注释方便,所以 C99 新标准借鉴过来了,也开始支持这种注释方式;标准库新增了一些头文件:如 stdbool.h、complex.h、stdarg.h、fenv.h 等。大家在 C 语言中经常返回的 true、false,其实这也是 C++ 里面定义的 bool 类型。那为什么我们经常这样写,而编器编译程序时没有报错呢,这是因为早期大家编程使用的都是 VC++6.0 系列,是 C++ 编译器。还有一种可能就是有些 IDE 对这个数据类型的数据做了封装。

C11 新标准

C11 标准是发布的最新 C 语言标准,修改了 C 语言标准的一些 Bug、新增了一些特性:

增加 _Noreturn,声明函数无返回值;增加_Generic:支持泛型编程;修改了标准库函数的一些 Bug:如 gets( )函数被 gets_s() 函数代替;新增文件锁功能;支持多线程;……

从 C11 标准的修改内容来看,也慢慢察觉到 C 语言未来的发展趋势:C 语言现在也在借鉴现在编程语言的优点,不断添加到自己的标准里面。比如现代编程语言的多线程、字符串、泛型编程等,C 语言最新的标准都支持。但是这样下去,C 语言是不是还能保持她“简单就是美”的优雅特色呢,我们只能慢慢期待了。但至少目前我们不用担心这些,因为 C11 新发布的标准,目前绝大多数编译器还不支持,所以我们暂时还用不到。

编译器对 C 标准的支持

标准是一回事,各种编译器支不支持是另一回事,这一点,大家要搞清楚。这就跟手机一样,不同时期发布的手机对通信标准支持也不一样。早期的手机可能只支持 2G 通信,后来支持 3G,现在发布的新款手机基本上都支持 4G了,而且可以兼容 2G/3G。

现在 5G 标准正在研发,快发布了,据说 年发布, 年商用。但是目前还没有手机支持 5G 通信,就跟现在没有编译器支持 C11 标准一样。

不同编译器,甚至对 C 标准的支持也不一样。有的编译器只支持 ANSI C,这是目前默认的 C 标准。有的编译器可以支持 C99,或者支持 C99 标准的部分特性。目前对 C99 标准支持最好的是 GNU C 编译器,据说可以支持 C99标准99%的新增特性。

编译器对 C 标准的扩展

不同编译器,出于开发环境、硬件平台、性能优化的需要,除了支持 C 标准外,还会自己做一些扩展。

在51单片机上用 C 语言开发程序,我们经常使用 Keil for C51 集成开发环境。你会发现 Keil for C51 或其他 IDE 里的 C 编译器会对 C 语言标准作很多扩展。比如增加各种关键字:

data:RAM 的低128B空间,单周期直接寻址;code:表示程序存储区;bit:位变量,常用来定义单片机的 P0~P3 管脚;sbit:特殊功能位变量;sfr:特殊功能寄存器;reentrant:重入函数声明。

如果你在程序中使用以上这些关键字,那么你的程序就只能使用51编译器来编译运行,你使用其它的编译器,比如 VC++6.0,是编译通不过的。

同样的道理,GCC 编译器,也对 C 标准做了很多扩展:

零长度数组语句表达式内建函数__attribute__特殊属性声明标号元素case 范围...

比如支持零长度数组。这些新增的特性,C 标准目前是不支持的,其它编译器也不支持。如果你在程序中定义一个零长度数组:

int a[0];

只能使用 GCC 编译器才能正确编译,使用 VC++ 6.0编译器编译可能就通不过,因为微软的 C++ 编译器不支持这个特性。

本教程主要内容

在 GNU 开源软件、Linux 内核中会大量使用 GCC 自己扩展的语法,这会对我们理解开源软件、Linux 内核代码带来一定障碍和困扰。本教程主要介绍 GNU C 对 C 标准扩展的一些常用语法和使用。终极目标是看懂 Linux 内核驱动、GNU 开源软件中这些特殊语法的应用,扫除这些特殊语法对我们理解内核代码带来的困扰和障碍。

本教程需要的学习环境

在本教程讲解中,会使用一些 arm-linux-gnueabi-gcc 等命令用来编译和反汇编程序。所以在学习本教程之前,确保你的电脑上有如下 Linux 环境或源代码:

Linux学习环境:Ubuntu、Fedora等皆可;arm-linux-gnueabi-gcc 交叉编译工具;Linux 内核源码:Linux 4.4.xU-boot-.09 源代码

备注

如果您手头暂时没有 Linux 学习环境,也可以在 Windows 环境下安装 C-Free 学习。教程中的 C 语言示例程序在 C-Free 环境下面也能编译通过。当然在这里,还是建议您使用虚拟机安装一个 Linux 学习环境,一个良好的环境更有利于我们的学习,在安装过程有什么疑惑,可以在我的读者圈或通过邮件(3284757626@)与我联系,也可以加入QQ群(475504428),参与技术讨论。

第02课:Linux 内核驱动中的指定初始化

什么是指定初始化

在标准 C 中,当我们定义并初始化一个数组时,常用方法如下:

int a[10] = {0,1,2,3,4,5,6,7,8};

按照这种固定的顺序,我们可以依次给 a[0] 和 a[8] 赋值。因为没有对 a[9] 赋值,所以编译器会将 a[9] 默认设置为0。当数组长度比较小时,使用这种方式初始化比较方便。当数组比较大,而且数组里的非零元素并不连续时,这时候再按照固定顺序初始化就比较麻烦了。

比如,我们定义一个数组 b[100],其中 b[10]、b[30] 需要初始化,如果还按照前面的固定顺序初始化,{}中的初始化数据中间可能要填充大量的0,比较麻烦。

那怎么办呢?C99 标准改进了数组的初始化方式,支持指定任意元素初始化,不再按照固定的顺序初始化。

int b[100] ={ [10] = 1, [30] = 2};

通过数组索引,我们可以直接给指定的数组元素赋值。除此之外,一个结构体变量的初始化,也可以通过指定某个结构体域直接赋值。

因为 GNU C 支持 C99 标准,所以 GCC 编译器也支持这一特性。甚至早期不支持 C99,只支持 C89 的 GCC 编译器版本,这一特性也被当作一个 GCC 编译器的扩展特性来提供给程序员使用。

指定初始化数组元素

在 GNU C 中,通过数组元素索引,我们就可以给某个指定的元素直接赋值。

int b[100] = { [10] = 1, [30] = 2 };

在{ }中,我们通过 [10] 数组元素索引,就可以直接给 a[10] 赋值了。这里有个细节注意一下,就是各个赋值之间用逗号 “,” 隔开,而不是使用分号“;”。

如果我们想给数组中某一个索引范围的数组元素初始化,可以采用下面的方式。

int main(void){ int b[100] = { [10 ... 30] = 1, [50 ... 60] = 2 }; for(int i = 0; i < 100; i++) { printf("%d ", a[i]); if( i % 10 == 0) printf("\n"); } return 0; }

在这个程序中,我们使用 [10 ... 30] 表示一个索引范围,相当于给 a[10] 到 a[30] 之间的20个数组元素赋值为1。

GNU C 支持使用 ... 表示范围扩展,这个特性不仅可以使用在数组初始化中,也可以使用在 switch-case 语句中。比如下面的程序:

#include<stdio.h>int main(void){ int i = 4; switch(i) { case 1: printf("1\n"); break; case 2 ... 8: printf("%d\n",i); break; case 9: printf("9\n"); break; default: printf("default!\n"); break; } return 0;}

在这个程序中,当 case 值为2到8时,都执行相同的 case 分支,可以通过 case 2 ... 8: 的形式来简化代码。这里同样也有一个细节需要注意,就是 ... 和其两端的数据范围2和8之间也要空格,不能写成2...8的形式,否则编译就会通不过。

指定初始化结构体成员变量

跟数组类似,在标准 C 中,结构体变量的初始化也要按照固定的顺序。在 GNU C 中我们也可以通过结构域来初始化指定某个成员。

struct student{ char name[20]; int age;};int main(void){ struct student stu1={ "wit",20 }; printf("%s:%d\n",stu1.name,stu1.age); struct student stu2= { .name = "wanglitao", .age = 28 }; printf("%s:%d\n",stu2.name,stu2.age); return 0;}

在程序中,我们定义一个结构体类型 student,然后分别定义两个结构体变量 stu1 和 stu2。初始化 stu1 时,我们采用标准 C 的初始化方式,即按照固定顺序直接初始化。初始化 stu2 时,我们采用 GNU C 的初始化方式,通过结构域名 .name 和 .age,我们就可以给结构体变量的某一个指定成员直接赋值。非常方便。

Linux 内核驱动注册

在 Linux 内核驱动中,大量使用 GNU C 的这种指定初始化方式,通过结构体成员来初始化结构体变量。比如在字符驱动程序中,我们经常见到这样的初始化:

static const struct file_operations ab3100_otp_operations = {.open = ab3100_otp_open,.read = seq_read,.llseek = seq_lseek,.release = single_release,};

在驱动程序中,我们经常使用file_operations这个结构体变量来注册我们开发的驱动,然后以回调的方式来执行我们驱动实现的相关功能。结构体file_operations在 Linux 内核中的定义如下:

struct file_operations { struct module *owner; loff_t (*llseek) (struct file *, loff_t, int); ssize_t (*read) (struct file *, char __user *, size_t, loff_t *); ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *); ssize_t (*read_iter) (struct kiocb *, struct iov_iter *); ssize_t (*write_iter) (struct kiocb *, struct iov_iter *); int (*iterate) (struct file *, struct dir_context *); unsigned int (*poll) (struct file *, struct poll_table_struct *); long (*unlocked_ioctl) (struct file *, unsigned int, unsigned long); long (*compat_ioctl) (struct file *, unsigned int, unsigned long); int (*mmap) (struct file *, struct vm_area_struct *); int (*open) (struct inode *, struct file *); int (*flush) (struct file *, fl_owner_t id); int (*release) (struct inode *, struct file *); int (*fsync) (struct file *, loff_t, loff_t, int datasync); int (*aio_fsync) (struct kiocb *, int datasync); int (*fasync) (int, struct file *, int); int (*lock) (struct file *, int, struct file_lock *); ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int); unsigned long (*get_unmapped_area)(struct file *,unsigned long, unsigned long, unsigned long, unsigned long); int (*check_flags)(int); int (*flock) (struct file *, int, struct file_lock *); ssize_t (*splice_write)(struct pipe_inode_info *, struct file *, loff_t *, size_t, unsigned int); ssize_t (*splice_read)(struct file *, loff_t *, struct pipe_inode_info *, size_t, unsigned int); int (*setlease)(struct file *, long, struct file_lock **, void **); long (*fallocate)(struct file *file, int mode, loff_t offset, loff_t len); void (*show_fdinfo)(struct seq_file *m, struct file *f); #ifndef CONFIG_MMU unsigned (*mmap_capabilities)(struct file *); #endif };

结构体file_operations里面定义了很多结构体成员,而在这个驱动中,我们只初始化了部分成员变量,通过访问结构体的成员来指定初始化,非常方便。

指定初始化的好处

这种指定初始化方式,不仅使用灵活,而且还有一个好处就是:代码易于维护。尤其是在 Linux 内核这种大型项目中,几万个文件,几千万的代码量,当成百上千个文件都使用file_operations这个结构体类型来定义变量并初始化时,那么一个很大的问题就来了:如果采用标准 C 那种按照固定顺序赋值,当我们的file_operations结构体类型发生改变时,如添加成员、减少成员、调整成员顺序,那么使用该结构体类型定义变量的大量 C 文件都需要重新调整初始化顺序,牵一发而动全身,想想这是多么可怕!

我们通过指定初始化方式,就可以避免这个问题。无论file_operations结构体类型如何变化,添加成员也好、减少成员也好、调整成员顺序也好,都不会影响其它文件的使用。有了指定初始化,再也不用加班修改代码了,妈妈再也不用担心我们整日加班,不回家吃饭了,多好!

第03课:宏构造利器——语句表达式

基础复习:表达式、语句和代码块

表达式

表达式和语句是 C 语言中的基础概念。什么是表达式呢?表达式就是由一系列操作符和操作数构成的式子。操作符可以是 C 语言标准规定的各种算术运算符、逻辑运算符、赋值运算符、比较运算符等。操作数可以是一个常量,也可以是一个变量。表达式也可以没有操作符,单独的一个常量甚至是一个字符串,也是一个表达式。下面的字符序列都是表达式:

2 + 32i = 2 + 3i = i++ + 3"wit"

表达式一般用来数据计算或实现某种功能的算法。表达式有2个基本属性:值和类型。如上面的表达式2+3,它的值为5。根据操作符的不同,表达式可以分为多种类型,如:

关系表达式逻辑表达式条件表达式赋值表达式算术表达式……

语句

语句是构成程序的基本单元,一般形式如下:

表达式 ;i = 2 + 3 ;

表达式的后面加一个; 就构成了一条基本的语句。编译器在编译程序、解析程序时,不是根据物理行,而是根据分号 ; 来判断一条语句的结束标记的。如 i = 2 + 3; 这条语句,你写成下面的形式也是可以编译通过的:

i =2 + 3;

代码块

不同的语句,使用大括号{}括起来,就构成了一个代码块。C 语言允许在代码块里定义一个变量,这个变量的作用域也仅限于这个代码块内,因为编译器就是根据{}来做入栈出栈操作来管理变量的作用域的。如下面的程序:

int main(void){ int i = 3;printf("i=%d\n",i); { int i = 4; printf("i=%d\n",i); } printf("i=%d\n",i); return 0;}运行结果为:i=3i=4i=3

语句表达式

语句表达式的定义

GNU C 对 C 标准作了扩展,允许在一个表达式里内嵌语句,允许在表达式内部使用局部变量、for 循环和 goto 跳转语句。这样的表达式,我们称之为语句表达式。语句表达式的格式如下:

({ 表达式1; 表达式2; 表达式3; })

语句表达式最外面使用小括号()括起来,里面一对大括号{}包起来的是代码块,代码块里允许内嵌各种语句。语句的格式可以是 “表达式;”这种一般格式的语句,也可以是循环、跳转等语句。

跟一般表达式一样,语句表达式也有自己的值。语句表达式的值为内嵌语句中最后一个表达式的值。我们举个例子,使用语句表达式求值。

int main(void){ int sum = 0; sum =({ int s = 0; for( int i = 0; i < 10; i++) s = s + i; s; }); printf("sum = %d\n",sum); return 0;}

在上面的程序中,通过语句表达式实现了从1到10的累加求和,因为语句表达式的值等于最后一个表达式的值,所以在 for 循环的后面,我们要添加一个 s; 语句表示整个语句表达式的值。如果不加这一句,你会发现 sum=0。或者你将这一行语句改为100; 你会发现最后 sum 的值就变成了100,这是因为语句表达式的值总等于最后一个表达式的值。

语句表达式内使用 goto 跳转

在上面的程序中,我们在语句表达式内定义了局部变量,使用了 for 循环语句。在语句表达式内,我们同样也可以使用 goto 进行跳转。

int main(void){ int sum = 0; sum =({ int s = 0; for( int i = 0; i < 10; i++) s = s + i; goto here; s;}); printf("sum = %d\n",sum);here: printf("here:\n"); printf("sum = %d\n",sum); return 0;}

在宏定义中使用语句表达式

语句表达式的亮点在于定义复杂功能的宏。使用语句表达式来定义宏,不仅可以实现复杂的功能,而且还能避免宏定义带来的歧义和漏洞。下面就以一个宏定义例子,让我们来见识见识语句表达式在宏定义中的强悍杀伤力!

假如你此刻正在面试,面试职位是:Linux C 语言开发工程师。面试官给你出了一道题:

请定义一个宏,求两个数的最大值

别看这么简单的一个考题,面试官就能根据你写出的宏,来判断你的 C 语言功底,来决定给不给你 Offer。

合格

对于学过 C 语言的同学,写出这个宏基本上不是什么难事,使用条件运算符就能完成:

#define MAX(x,y) x > y ? x : y

这是最基本的 C 语言语法,如果连这个也写不出来,估计场面会比较尴尬。面试官为了缓解尴尬,一般会对你说:小伙子,你很棒,回去等消息吧,有消息,我们会通知你!这时候,你应该明白:不用再等了,赶紧把这篇文章看完,接着面下家。这个宏能写出来,也不要觉得你很牛 X,因为这只能说明你有了 C 语言的基础,但还有很大的进步空间。比如,我们写一个程序,验证一下我们定义的宏是否正确:

#define MAX(x,y) x > y ? x : yint main(void){ printf("max=%d",MAX(1,2)); printf("max=%d",MAX(2,1)); printf("max=%d",MAX(2,2)); printf("max=%d",MAX(1!=1,1!=2)); return 0;}

测试程序吗,我们肯定要把各种可能出现的情况都测一遍。这不,测试第4行语句,当宏的参数是一个表达式,发现实际运行结果为 max=0,跟我们预期结果 max=1 不一样。这是因为,宏展开后,就变成了这个样子:

printf("max=%d",1!=1>1!=2?1!=1:1!=2);

因为比较运算符 > 的优先级为6,大于 !=(优先级为7),所以展开的表达式,运算顺序发生了改变,结果就跟我们的预期不一样了。为了避免这种展开错误,我们可以给宏的参数加一个小括号()来防止展开后,表达式的运算顺序发生变化。这样的宏才能算一个合格的宏:

#define MAX(x,y) (x) > (y) ? (x) : (y)

中等

上面的宏,只能算合格,但还是存在漏洞。比如,我们使用下面的代码测试:

#define MAX(x,y) (x) > (y) ? (x) : (y)int main(void){ printf("max=%d",3 + MAX(1,2)); return 0;}

在程序中,我们打印表达式 3 + MAX(1, 2) 的值,预期结果应该是5,但实际运行结果却是1。我们展开后,发现同样有问题:

3 + (1) > (2) ? (1) : (2);

因为运算符 + 的优先级大于比较运算符 >,所以这个表达式就变为4>2?1:2,最后结果为1也就见怪不怪了。此时我们应该继续修改这个宏:

#define MAX(x,y) ((x) > (y) ? (x) : (y))

使用小括号将宏定义包起来,这样就避免了当一个表达式同时含有宏定义和其它高优先级运算符时,破坏整个表达式的运算顺序。如果你能写到这一步,说明你比前面那个面试合格的同学强,前面那个同学已经回去等消息了,我们接着面试下一轮。

良好

上面的宏,虽然解决了运算符优先级带来的问题,但是仍存在一定的漏洞。比如,我们使用下面的测试程序来测试我们定义的宏:

#define MAX(x,y) ((x) > (y) ? (x) : (y))int main(void){ int i = 2; int j = 6; printf("max=%d",MAX(i++,j++)); return 0;}

在程序中,我们定义两个变量 i 和 j,然后比较两个变量的大小,并作自增运算。实际运行结果发现 max = 7,而不是预期结果 max = 6。这是因为变量 i 和 j 在宏展开后,做了两次自增运算,导致打印出 i 的值为7。

遇到这种情况,那该怎么办呢? 这时候,语句表达式就该上场了。我们可以使用语句表达式来定义这个宏,在语句表达式中定义两个临时变量,分别来暂储 i 和 j 的值,然后进行比较,这样就避免了两次自增、自减问题。

#define MAX(x,y)({\ int _x = x; \ int _y = y; \ _x > _y ? _x : _y; \})int main(void){ int i = 2; int j = 6; printf("max=%d",MAX(i++,j++)); return 0;}

在语句表达式中,我们定义了2个局部变量_x_y来存储宏参数 x 和 y 的值,然后使用 _x 和 _y 来比较大小,这样就避免了 i 和 j 带来的2次自增运算问题。

你能坚持到了这一关,并写出这样自带 BGM 的宏,面试官心里可能已经有了给你 Offer 的意愿了。但此时此刻,千万不要骄傲!为了彻底打消面试官的心理顾虑,我们需要对这个宏继续优化。

优秀

在上面这个宏中,我们定义的两个临时变量数据类型是 int 型,只能比较两个整型的数据。那对于其它类型的数据,就需要重新再定义一个宏了,这样太麻烦了!我们可以基于上面的宏继续修改,让它可以支持任意类型的数据比较大小:

#define MAX(type,x,y)({\ type _x = x; \ type _y = y; \ _x > _y ? _x : _y; \})int main(void){ int i = 2; int j = 6; printf("max=%d\n",MAX(int,i++,j++)); printf("max=%f\n",MAX(float,3.14,3.15)); return 0;}

在这个宏中,我们添加一个参数:type,用来指定临时变量 _x 和 _y 的类型。这样,我们在比较两个数的大小时,只要将2个数据的类型作为参数传给宏,就可以比较任意类型的数据了。如果你能在面试中,写出这样的宏,面试官肯定会非常高兴,他一般会跟你说:稍等,待会 HR 会跟你谈待遇问题。恭喜你,你拿到 Offer 了!

语句表达式在 Linux 内核中的使用

语句表达式,作为 GNU C 对 C 标准的一个扩展,在内核中,尤其是在内核的宏定义中,被大量的使用。使用语句表达式定义宏,不仅可以实现复杂的功能,还可以避免宏定义带来的一些歧义和漏洞。比如在 Linux 内核中,max_tmin_t的宏定义,就使用了语句表达式:

#define min_t(type, x, y) ({ \ type __min1 = (x);\ type __min2 = (y);\ __min1 < __min2 ? __min1 : __min2; })#define max_t(type, x, y) ({ \ type __max1 = (x);\ type __max2 = (y);\ __max1 > __max2 ? __max1 : __max2; })

除此之外,在 Linux 内核、GNU 开源软件中,你会发现,还有大量的宏定义使用了语句表达式。通过本节教程的学习,相信大家以后再碰到这种使用语句表达式定义的宏,肯定就知道是怎么回事了,心中有丘壑,再也不用慌。

第04课:Linux内核第一宏——container_of
第05课:零长度数组
第06课:U-boot 镜像自拷贝分析——section 属性
第07课:地址对齐那些事儿
第08课:变参函数的格式检查——format
第09课:链接过程中的强符号和弱符号
第10课:内联函数探究
第11课:有一种函数,叫内建函数
第12课:有一种宏,叫可变参数宏
第13课:总结与测试

阅读全文: /gitchat/column/5a5c61512be8c36114823584

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。