C语言是一种面向过程的语言,面向过程是指,将实现一个逻辑功能的代码集中到一起,每次需要使用的时候,再调用这些代码集合,这种代码集合就是函数。写C语言其实就是写一个个函数,因此对函数实现的语法解析是C语言编译器语法解析中,最复杂的,我们以前解析的各种结构体媒体类型,变量定义等,都会嵌套在函数的实现中,于是函数实现的解析要能够对所有C语言额数据类型进行处理,因此函数定义的解析是最为复杂的。
对复杂问题的处理,最有效的办法就是分解,将复杂系统分解足够小,足够简单的模块,那么原来难以掌握的复杂系统就可以掌握了,我们这次也采用这种分而治之的办法,一点一滴的实现完全的函数定义解析。
这次我们先看看类似如下的函数定义,如何完成语法解析:
void f() {
int a;
int b;
a = 1;
b = 2;
int c;
c = a > b ? a : b;
return c;
}
我们看看,对应上面函数定义的相关语法:
ext_def->opt_specifiers funct_decl compound_stmt
compond_stmt->LC local_defs stmt_list RC
local_defs->def_list
expr->no_comma_expr
no_comma_expr->no_comma_expr EQUAL no_comma_expr
no_comma_expr->no_comma_expr QUEST no_comma_expr COLON no_comma_expr
no_comma_expr->binary
binary->unary
unary->NUMBER
unary->NAME
unary->STRING
stmt_list->stmt_list statement
stmt_list->statement
statement->expr SEMI
statement->RETURN expr SEMI
binary->binary RELOP binary
binary->binary EQUOP binary
binary->binary STAR binary
statement->local_defs
大家可以看到,语法表达式相当多,但是解析过程其实没有太复杂,我们先看个大概:对应的是函数实现{...},大括号抱起来的哪部分,unary对应变量名,数字,或者字符串常量,在上面的例子中,变量a,b和数字2,3都属于unary, 是unary的组合,像a=1,b=2之类的都属于 ,组合起来就是,例如语句c=a>b?a:b,就属于,它是由多个组合起来的,例如a>b就是一个。
expr其实就是的组合,为了简单起见,在这里先把他们俩等价,是多个expr的组合,又是多个的组合。
对应于变量定义,像int a,int b这种语句就是i,只不过这种变量的定义是在函数体内,属于局部变量。
一旦函数实现的解析全部完成后,我们接下来就进入类型检测阶段和代码生成了,后续我们可能会用java做一个c语言的解释器,然后再实现代码生成,,下面我们看看解析器是如何解析上面的函数的。
解析器的解析流程
1:读入void得到其对应的标签TYPE,然后通过一系列表达式转换
->TYPE
->
->
->
得到非终结符c语言编译器,这样我们得到起首表达式
-> 右边第一个非终结符了
2:接着读入函数名f,得到标签NAME,然后读入左括号,得到标签LP,读入右括号,得到标签RP,然后我们可以通过表达式-> LP RP进行操作,这样我们又得到了起首表达式右边第二个非终结符。
3:读入左大括号,得到标签LR,然后读入关键字int,得到标签TYPE,解析器触发的流程跟上面是一样的,通过表达式:
->TYPE
->
->
进行一系列回归后,得到非终结符
4:读入变量名a,得到标签NAME通过表达式:
->NAME
->
decl->
->decl
进行递归,然后读入分号,获得标签SEMI,这样的话解析堆栈上就满足:
def-> SEMI
于是后得到def,再通过表达式->def,->得到非终结符,这样起非终结符的右边第二个非终结符就产生了
5: 接着读入 int b ;, 对该语句的解析与步骤4完全一样,于是可以得到非终结符,然后再通过表达式
-> .
-> .
递归,由此我们得到非终结符,这个非终结符是表达式右边的第3个符号。
6:接着读入变量名a, 返回标签NAME, 根据表达式:
UNARY -> .NAME
-> .UNARY
-> .
得到非终结符,
7: 读入符号=,返回标签EQUAL, 读入等号后面的数值1,得到标签,然后通过表达式:
UNARY -> .
-> .UNARY
-> .
再次获得非终结符,这样我们就得到了表达式
-> . EQUAL
的右边部分,然后再通过表达式
EXPR -> .
进行, 然后读入分号SEMI, 于是表达式
-> .EXPR SEMI
的右边部分得到满足。最后通过表达式
-> 进行, 由此语句a = 1 ; 其实对应于非终结符
8: 读入语句 b = 2, 解析过程跟上面一模一样.
9: 读取语句 int c; 它的解析跟步骤4一模一样。
10:接下来要解析的语句就是:
c = a > b ? a : b;
先把变量名c,读入,得到标签NAME,然后根据表达式:
UNARY -> .NAME
-> .UNARY
-> .
这样变量c就对应于非终结符c语言编译器,接着读入等号,返回标签EQUAL, 然后读入变量名c, 根据表达式:
UNARY -> .NAME
-> .UNARY
递归,也就相当于将a对应于, 接着读入>,得到标签RELOP, 接着读入变量b,推导方式跟a一样,将b对应于标签. 接着通过表达式:
-> . RELOP
进行递归,也就是 a > b 这个语句其实对应非终结符.
继续根据表达式:
-> .
将转换成, 于是表达式
-> . EQUAL
右边就成立了,接着读入符号?返回标签QUEST, 读入问号后面的变量a,通过表达式:
UNARY -> .NAME
-> .UNARY
-> .
进行递归,这样变量a等价于非终结符。
读入冒号,得到标签COLON, 读入冒号后面的变量b ,b的解读推导方式与a一样,通过同样的变换后得到标签, 于是表达式:
-> . QUEST COLON
右边成立,整语句c = a > b ? a : b; 可以对应于非终结符。
11: 通过表达式:
EXPR -> .
递归,然后读入分号,EXPR SEMI 结合就满足表达式
-> .EXPR SEMI
有了,再通过表达式
-> .
递归一次,这样当前解读到的所有语句:
int a;
int b;
a = 1;
b = 2;
int c;
c = a > b ? a : b;
都属于非终结符
12: 读入关键字, 返回标签, 读入变量c,通过表达式表达:
UNARY -> .NAME
-> .UNARY
-> .
EXPR -> .
将变量c解读为EXPR, 然后再读入分号,于是 EXPR SEMI构成表达式 -> . EXPR SEMI
的右边,因此得到非终结符,再通过表达式:
-> .
递归一次,于是大括号里面的所有语句全部被对应到。
13:读入右括号}, 也就是LC, 这样表达式:
-> .LC RC
就满足了,我们也就得到起首表达式右边最后一个非终结符。
14:此时我们可以根据起首表达式递归:
-> .
得到 后,就可以自动回归到全局非终结符。
由此整个函数定义就可以被我们的语法解析器接收了。
限时特惠:本站持续每日更新海量各大内部创业课程,一年会员仅需要98元,全站资源免费下载
点击查看详情
站长微信:Jiucxh