c语言编译器-编译器动手实践之：实现C语言函数定义的语法解析

C语言是一种面向过程的语言，面向过程是指，将实现一个逻辑功能的代码集中到一起，每次需要使用的时候，再调用这些代码集合，这种代码集合就是函数。写C语言其实就是写一个个函数，因此对函数实现的语法解析是C语言编译器语法解析中，最复杂的，我们以前解析的各种结构体媒体类型，变量定义等，都会嵌套在函数的实现中，于是函数实现的解析要能够对所有C语言额数据类型进行处理，因此函数定义的解析是最为复杂的。

对复杂问题的处理，最有效的办法就是分解，将复杂系统分解足够小，足够简单的模块，那么原来难以掌握的复杂系统就可以掌握了，我们这次也采用这种分而治之的办法，一点一滴的实现完全的函数定义解析。

这次我们先看看类似如下的函数定义，如何完成语法解析：

void f() {
int a;
int b;
a = 1;
b = 2;
int c;
c = a > b ? a : b;
return c;
}

我们看看，对应上面函数定义的相关语法：

ext_def->opt_specifiers funct_decl compound_stmt
compond_stmt->LC local_defs stmt_list RC
local_defs->def_list
expr->no_comma_expr
no_comma_expr->no_comma_expr EQUAL no_comma_expr
no_comma_expr->no_comma_expr QUEST no_comma_expr COLON no_comma_expr
no_comma_expr->binary
binary->unary
unary->NUMBER
unary->NAME
unary->STRING
stmt_list->stmt_list statement
stmt_list->statement
statement->expr SEMI
statement->RETURN expr SEMI
binary->binary RELOP binary
binary->binary EQUOP binary
binary->binary STAR binary
statement->local_defs

大家可以看到，语法表达式相当多，但是解析过程其实没有太复杂，我们先看个大概：对应的是函数实现{...}，大括号抱起来的哪部分，unary对应变量名，数字，或者字符串常量，在上面的例子中，变量a，b和数字2，3都属于unary，是unary的组合，像a=1，b=2之类的都属于，组合起来就是，例如语句c=a>b?a:b，就属于,它是由多个组合起来的，例如a>b就是一个。

expr其实就是的组合，为了简单起见，在这里先把他们俩等价，是多个expr的组合，又是多个的组合。

对应于变量定义，像int a,int b这种语句就是i，只不过这种变量的定义是在函数体内，属于局部变量。

一旦函数实现的解析全部完成后，我们接下来就进入类型检测阶段和代码生成了，后续我们可能会用java做一个c语言的解释器，然后再实现代码生成，，下面我们看看解析器是如何解析上面的函数的。

解析器的解析流程

1：读入void得到其对应的标签TYPE，然后通过一系列表达式转换

->TYPE

得到非终结符c语言编译器，这样我们得到起首表达式

-> 右边第一个非终结符了

2：接着读入函数名f，得到标签NAME，然后读入左括号，得到标签LP，读入右括号，得到标签RP，然后我们可以通过表达式-> LP RP进行操作，这样我们又得到了起首表达式右边第二个非终结符。

3：读入左大括号，得到标签LR，然后读入关键字int，得到标签TYPE，解析器触发的流程跟上面是一样的，通过表达式：

->TYPE

进行一系列回归后，得到非终结符

4：读入变量名a，得到标签NAME通过表达式：

->NAME

decl->

->decl

进行递归，然后读入分号，获得标签SEMI，这样的话解析堆栈上就满足：

def-> SEMI

于是后得到def，再通过表达式->def,->得到非终结符，这样起非终结符的右边第二个非终结符就产生了

5：接着读入 int b ;, 对该语句的解析与步骤4完全一样，于是可以得到非终结符，然后再通过表达式

-> .

递归，由此我们得到非终结符，这个非终结符是表达式右边的第3个符号。

6：接着读入变量名a, 返回标签NAME, 根据表达式：

UNARY -> .NAME

-> .UNARY

-> .

得到非终结符，

7：读入符号=，返回标签EQUAL, 读入等号后面的数值1，得到标签,然后通过表达式：

UNARY -> .

-> .UNARY

-> .

再次获得非终结符，这样我们就得到了表达式

-> . EQUAL

的右边部分，然后再通过表达式

EXPR -> .

进行, 然后读入分号SEMI, 于是表达式

-> .EXPR SEMI

的右边部分得到满足。最后通过表达式

-> 进行, 由此语句a = 1 ; 其实对应于非终结符

8：读入语句 b = 2, 解析过程跟上面一模一样.

9: 读取语句 int c; 它的解析跟步骤4一模一样。

10：接下来要解析的语句就是：

c = a > b ? a : b;

先把变量名c,读入，得到标签NAME,然后根据表达式：

UNARY -> .NAME

-> .UNARY

-> .

这样变量c就对应于非终结符c语言编译器，接着读入等号，返回标签EQUAL, 然后读入变量名c, 根据表达式：

UNARY -> .NAME

-> .UNARY

递归，也就相当于将a对应于, 接着读入>,得到标签RELOP, 接着读入变量b,推导方式跟a一样，将b对应于标签. 接着通过表达式：

-> . RELOP

进行递归，也就是 a > b 这个语句其实对应非终结符.

继续根据表达式：

-> .

将转换成，于是表达式

-> . EQUAL

右边就成立了，接着读入符号？返回标签QUEST, 读入问号后面的变量a,通过表达式：

UNARY -> .NAME

-> .UNARY

-> .

进行递归，这样变量a等价于非终结符。

读入冒号，得到标签COLON, 读入冒号后面的变量b ，b的解读推导方式与a一样，通过同样的变换后得到标签, 于是表达式：

-> . QUEST COLON

右边成立，整语句c = a > b ? a : b; 可以对应于非终结符。

11：通过表达式：

EXPR -> .

递归，然后读入分号，EXPR SEMI 结合就满足表达式

-> .EXPR SEMI

有了，再通过表达式

-> .

递归一次，这样当前解读到的所有语句：

int a;

int b;

a = 1;

b = 2;

int c;

c = a > b ? a : b;

都属于非终结符

12：读入关键字, 返回标签, 读入变量c,通过表达式表达：

UNARY -> .NAME

-> .UNARY

-> .

EXPR -> .

将变量c解读为EXPR，然后再读入分号，于是 EXPR SEMI构成表达式 -> . EXPR SEMI

的右边，因此得到非终结符，再通过表达式：

-> .

递归一次，于是大括号里面的所有语句全部被对应到。

13：读入右括号}, 也就是LC, 这样表达式：

-> .LC RC

就满足了，我们也就得到起首表达式右边最后一个非终结符。

14：此时我们可以根据起首表达式递归：

-> .

得到后，就可以自动回归到全局非终结符。

由此整个函数定义就可以被我们的语法解析器接收了。

限时特惠:本站持续每日更新海量各大内部创业课程，一年会员仅需要98元，全站资源免费下载
点击查看详情

站长微信:Jiucxh

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

NAME RP TYPE

发表回复取消回复

内部链接

站长联系

相关文章

发表回复 取消回复

发表回复取消回复