【编译原理】手工打造语法分析器
创作时间:
作者:
@小白创作中心
【编译原理】手工打造语法分析器
引用
CSDN
1.
https://blog.csdn.net/shuofxz/article/details/137476161
本文将详细介绍编译原理中语法分析器的构建方法,重点讲解递归下降算法和上下文无关文法,并通过具体的代码示例和AST树的生成过程,详细阐述如何处理左递归问题。
一、递归下降算法
还是这个例子:
int age = 45
我们给出这个语法的规则:
intDeclaration : Int Identifier ('=' additiveExpression)?;
如果翻译为程序的话,伪代码如下:
MatchIntDeclare(){
MatchToken(Int); // 匹配 Int 关键字
MatchIdentifier(); // 匹配标识符
MatchToken(equal); // 匹配等号
MatchExpression(); // 匹配表达式
}
输出的 AST 类似于:
Programm Calculator
IntDeclaration age
AssignmentExp =
IntLiteral 45
上面的过程,称为「递归下降算法」。从顶部开始不断向下生成节点,其中还会有递归调用的部分。
二、上下文无关文法
上面的例子比较简单,还可以用正则表达式文法来表示。但如果是个算数表达式呢?正则文法就很难表示了。
- 2+3*5
- 2*3+5
- 2*3
这时我们可以用递归的规则来表示:
additiveExpression
: multiplicativeExpression
| additiveExpression Plus multiplicativeExpression
;
multiplicativeExpression
: IntLiteral
| multiplicativeExpression Star IntLiteral
;
生成的 AST 为:
如果要计算表达式的值,只需要对根节点求值就可以了。这个就叫做「上下文无关文法」。
但你把上述规则翻译为代码逻辑时,会发现一个问题,无限递归。
我们先用个最简单的示例:
additiveExpression
: IntLiteral
| additiveExpression Plus IntLiteral
;
比如输入:
2+3
- 先判断其是不是
IntLiteral,发现不是 - 然后匹配
additiveExpression Plus IntLiteral,此时还没有消耗任何的 token - 先进入的是
additiveExpression,此时要处理的表达式还是2+3 - 又回到开始,无限循环
这里要注意的一个问题:
并不是觉得 2+3 符合 additiveExpression Plus IntLiteral 就能直接按照 + 拆分为两部分,然后两部分分别去匹配。这里是顺序匹配的,直到匹配到该语法规则的结束符为止。在 additiveExpression Plus IntLiteral 中 additiveExpression 的部分,也是在处理完整的 token 的(2+3)。
三、左递归解决方案
改为右递归
如何处理这个左递归问题呢?我们可以把表达式换个位置:
additiveExpression
: IntLiteral
| IntLiteral Plus additiveExpression
;
先匹配 IntLiteral 这样就能消耗掉一个 token,就不会无限循环了。
比如还是 2+3
2+3不是IntLiteral,跳到下面2+3的第一个字符是2被IntLiteral消耗掉,并结束IntLiteral匹配- 然后
+被Plus消耗掉 - 最后
3进入additiveExpression,匹配为第一条规则IntLiteral
这样就结束了,没有无限循环。
改写成算法是:
热门推荐
流感来袭,抗病毒药物如何守护健康?
草莓鼻怎么救?3分钟快速了解草莓鼻最佳对策
厦门城市骑行指南:4条特色路线带你领略海上花园之美
什么是财产管理
如何把握次新股的投资机会?这类股票的投资风险有哪些?
M5螺丝的规格有哪些,如何选择合适的M5螺丝
一键查询 ! 破产企业信息核查“一件事”落地见效
《原神》携手贵州非遗文化,探索游戏与传统文化融合新路径
医院战略规划:在变革的浪潮中寻找方向与持续优势
黑枸杞泡水喝的正确方法?如何通过黑枸杞水提升你的生活品质?
小米2025年BootLoader解锁新规亮相:答题正式开启,用户体验何去何从?
一代巨匠,因学历低被单位辞退三次,终成没有文凭的大师
日本十大美女演员大盘点,你心中的女神上榜了吗?
装备精良的意大利军队,为何被长矛短剑的埃塞俄比亚军队击败
2024中国天然气进口全名单:俄罗斯成为我国最大的天然气供应国!
太原旅游必去十大景点推荐
数说世界丨孟加拉国——投资机遇与挑战并存的新兴市场
人工智能时代下对人的价值反思?
PS怎么用钢笔工具画线:详解Photoshop钢笔线条绘制技巧
比太阳更热的恒星还能支持生命形成吗?
上海失业保险金,可以领取多少个月?
粤语亲属称谓的讲解
预约就诊、服务免费 全国首个“医保门诊”在闽开诊
元素周期表之歌谐音
重磅!2024年广州市低空经济产业链全景图谱
五台山的来历和传说,你真的了解吗?看完涨知识了!建议收藏
Excel分数比例处理完全指南:从基础到高级功能
河南职业技术学院:为发展新质生产力培育急需人才
计算机二级MS Office高级应用考试知识点
《狐妖小红娘》口碑争议折射漫改剧困境:如何打破"次元壁"?