【编译原理】手工打造语法分析器
创作时间:
作者:
@小白创作中心
【编译原理】手工打造语法分析器
引用
CSDN
1.
https://blog.csdn.net/shuofxz/article/details/137476161
本文将详细介绍编译原理中语法分析器的构建方法,重点讲解递归下降算法和上下文无关文法,并通过具体的代码示例和AST树的生成过程,详细阐述如何处理左递归问题。
一、递归下降算法
还是这个例子:
int age = 45
我们给出这个语法的规则:
intDeclaration : Int Identifier ('=' additiveExpression)?;
如果翻译为程序的话,伪代码如下:
MatchIntDeclare(){
MatchToken(Int); // 匹配 Int 关键字
MatchIdentifier(); // 匹配标识符
MatchToken(equal); // 匹配等号
MatchExpression(); // 匹配表达式
}
输出的 AST 类似于:
Programm Calculator
IntDeclaration age
AssignmentExp =
IntLiteral 45
上面的过程,称为「递归下降算法」。从顶部开始不断向下生成节点,其中还会有递归调用的部分。
二、上下文无关文法
上面的例子比较简单,还可以用正则表达式文法来表示。但如果是个算数表达式呢?正则文法就很难表示了。
- 2+3*5
- 2*3+5
- 2*3
这时我们可以用递归的规则来表示:
additiveExpression
: multiplicativeExpression
| additiveExpression Plus multiplicativeExpression
;
multiplicativeExpression
: IntLiteral
| multiplicativeExpression Star IntLiteral
;
生成的 AST 为:
如果要计算表达式的值,只需要对根节点求值就可以了。这个就叫做「上下文无关文法」。
但你把上述规则翻译为代码逻辑时,会发现一个问题,无限递归。
我们先用个最简单的示例:
additiveExpression
: IntLiteral
| additiveExpression Plus IntLiteral
;
比如输入:
2+3
- 先判断其是不是
IntLiteral,发现不是 - 然后匹配
additiveExpression Plus IntLiteral,此时还没有消耗任何的 token - 先进入的是
additiveExpression,此时要处理的表达式还是2+3 - 又回到开始,无限循环
这里要注意的一个问题:
并不是觉得 2+3 符合 additiveExpression Plus IntLiteral 就能直接按照 + 拆分为两部分,然后两部分分别去匹配。这里是顺序匹配的,直到匹配到该语法规则的结束符为止。在 additiveExpression Plus IntLiteral 中 additiveExpression 的部分,也是在处理完整的 token 的(2+3)。
三、左递归解决方案
改为右递归
如何处理这个左递归问题呢?我们可以把表达式换个位置:
additiveExpression
: IntLiteral
| IntLiteral Plus additiveExpression
;
先匹配 IntLiteral 这样就能消耗掉一个 token,就不会无限循环了。
比如还是 2+3
2+3不是IntLiteral,跳到下面2+3的第一个字符是2被IntLiteral消耗掉,并结束IntLiteral匹配- 然后
+被Plus消耗掉 - 最后
3进入additiveExpression,匹配为第一条规则IntLiteral
这样就结束了,没有无限循环。
改写成算法是:
热门推荐
IPO与上市的区别是什么?
王者荣耀庄周技能全解析:弃鱼战术背后的智慧与生存之道
洗洁精除雾的原理是什么?如何正确使用洗洁精进行除雾?
科技前沿|银河系比想象中更大!我国科学家最新发现
八大运算律技巧在法律实务中的应用与解析
衣服上的签字笔油怎么洗掉 全棉衣服常见笔渍处理方法
小儿推拿的误区
检查胰岛素抵抗是否需要空腹
十大托梦案件:法律视角下的心理学与事实交织之谜
心脏病患者的心理支持:心理干预和支持策略
2.63万亿元 跨境电商聚新成势
减肥后恢复正常饮食,日常热量摄入应为多少
牙根吸收了是否必须进行拔除?牙根吸收的原因及处理方法解析
外币兑换人民币去哪个银行 中国银行可以随时兑换外币吗
水地暖和电地暖相比哪个更好?全面解析地暖系统的优缺点
社会工作者职业资格证在社区工作中有什么作用?
如何理解外汇图中的均线?这些技术指标如何帮助分析市场趋势?
《盒中之海》探索:中式语境下的克苏鲁神话与未知的恐惧
湖北生命健康产业加速迈向万亿规模
秦始皇陵现在还没挖掘,到底有什么原因,导致其“一定不能挖”?
抚远蔓越莓“链上起舞”点燃乡村振兴引擎
猫咪什么时候成年?性成熟与体成熟的区别
孕妇什么饮料不能喝
如何正确操作和维护硫变仪以确保硫化测试的准确性?
了解 token,以及使用token作为访问权限的令牌
基于Spark的城市空气质量分析与可视化系统设计
PM2.5、PM10、TSP国家规范标准:环境质量的关键指标
降尿酸的一个简单方法,快转告给高尿酸朋友们
蚌埠身份证办理指南:地点、依据、流程全解析
成达万高铁华蓥山隧道贯通 全线建设取得新突破