Flex和Bison

Flex和Bison是Linux和Unix环境下两个非常强大的工具,分别用于生成词法分析器和语法分析器。它们在编译器设计、文本处理等领域有着广泛的应用。下面我将详细介绍Flex和Bison的基本概念、功能、用法以及它们之间的关系。

一、Flex

1. 基本概念

Flex(其前身是Lex)是一个词法分析器生成器。它接受一组正则表达式和对应的动作(通常是C语言代码),然后生成一个C程序(词法分析器),该程序能够识别和处理输入文本中的词法单元(如标识符、关键字、运算符等)。

2. 功能

  • 词法分析:将输入文本分割成一个个词法单元(token),每个单元都具有一定的意义。
  • 正则表达式匹配:使用正则表达式在输入文本中查找特定的字符模式。
  • 动作执行:当匹配到正则表达式时,执行相应的动作(如计数、打印等)。

3. 用法

Flex的使用通常包括以下几个步骤:

  • 编写Flex程序(.l文件),定义正则表达式和对应的动作。
  • 使用Flex工具编译Flex程序,生成C语言源代码(通常是lex.yy.c)。
  • 编译生成的C代码,并链接必要的库(如libfl),生成可执行文件。
  • 运行可执行文件,对输入文本进行词法分析。

4. Flex程序示例

%{  
#include <stdio.h>  
#include "y.tab.h" /* 假设与bison一起使用,包含由bison生成的头文件 */  void count() {  /* 这里可以添加一些用于调试或统计的代码 */  
}  
%}  %option noyywrap  %%  /* 关键字 */  
PROGRAM|VAR|VAR_INPUT|VAR_OUTPUT|VAR_IN_OUT|VAR_EXTERNAL|TEMP|TEMP_VAR|END_PROGRAM|  
BEGIN_PROGRAM|END_VAR|BEGIN_VAR|END_STRUCT|BEGIN_STRUCT|FUNCTION_BLOCK|FUNCTION|  
METHOD|INTERFACE|END_INTERFACE|END_FUNCTION_BLOCK|END_FUNCTION|END_METHOD|  
TRUE|FALSE|VAR_ACCESS|AT|RETAIN|CONSTANT|TYPE|ALIAS|ARRAY|STRUCT|OF|POINTER|  
REF_TO|MOD|DIV|AND|OR|XOR|NOT|SHL|SHR|ROL|ROR|ASGN|ADD|SUB|MUL|REAL|INT|BOOL|  
STRING|TIME|DATE|DURATION|LREAL|DINT|UINT|SINT|BYTE|WORD|DWORD|LWORD|USINT|  
S5TIME|TIME_OF_DAY|DATE_AND_TIME|TIMESTAMP|TOD|DT|TS { return yytext[0]; }  /* 标识符 */  
[a-zA-Z_][a-zA-Z0-9_]*   { yylval.str = strdup(yytext); return IDENTIFIER; }  /* 数字(整数和浮点数) */  
[0-9]+(\.[0-9]+)?([eE][-+]?[0-9]+)? { yylval.double_val = atof(yytext); return NUMBER; }  /* 字符串 */  
\"([^\\\"\n]|(\\.))*\"   { yylval.str = strdup(yytext+1); yylval.str[strlen(yylval.str)-1] = '\0'; return STRING; }  /* 注释(单行和多行) */  
//.*    { /* 忽略单行注释 */ }  
/* 和多行注释可能需要更复杂的规则来处理嵌套,但这里简化处理 */  
/\/*([^*]|\*+[^/*])*\*/ { /* 忽略多行注释 */ }  /* 空白字符 */  
[ \t\n]+   { /* 忽略 */ }  /* 操作符和分隔符 */  
[:=.,;(){}\[\]+-*/%<>^|&!~]   { return yytext[0]; }  /* 其他字符 */  
.           { fprintf(stderr, "Unknown character '%s'\n", yytext); return ERROR; }  %%  int yywrap(void) {  return 1;  
}  int main(void) {  yylex();  return 0;  
}  /* 注意:  
1. 关键字列表可能不完整,需要根据实际的ST语言规范进行扩展。  
2. 注释的处理可能需要更复杂的Flex规则来正确处理嵌套注释,但这里为了简化而省略了。  
3. 确保yylval的结构和类型与你的解析器(如bison生成的)兼容。  
4. 编译时可能需要链接到flex库和bison生成的解析器。  
*/

在这个Flex程序中,我定义了几个部分来匹配ST语言的关键元素:

  • 关键字:列出了ST语言中可能使用的一些关键字。注意,这里的关键字列表是不完整的,你需要根据实际的ST语言规范进行扩展。
  • 标识符:匹配以字母或下划线开头,后跟字母、数字或下划线的字符串。
  • 数字:匹配整数和浮点数。
  • 字符串:匹配被双引号包围的字符串,其中可以包含转义字符。
  • 注释:简化了单行和多行注释的处理。注意,多行注释的处理可能需要更复杂的规则来正确处理嵌套情况。
  • 空白字符:被忽略的空格、制表符和换行符。
  • 操作符和分隔符:匹配ST语言中常用的操作符和分隔符。
  • 其他字符:任何不匹配上述规则的字符都将被视为未知字符,并打印错误信息。

二、Bison

1. 基本概念

Bison(其前身是Yacc)是一个语法分析器生成器。它接受一个上下文无关文法(CFG)和对应的动作(也通常是C语言代码),然后生成一个C程序(语法分析器),该程序能够根据文法规则分析输入文本的结构,并生成相应的语法树或执行相应的动作。

2. 功能

  • 语法分析:确定输入文本中的词法单元是如何彼此关联的,即构建语法树。
  • 错误处理:在语法分析过程中检测并报告错误。
  • 代码生成:根据语法树生成目标代码(尽管这通常不是Bison的直接功能,但语法树可以用于此目的)。

3. 用法

Bison的使用也包括类似的步骤:

  • 编写Bison程序(.y文件),定义文法规则和对应的动作。
  • 使用Bison工具编译Bison程序,生成C语言源代码(通常是y.tab.c和y.tab.h)。
  • 编译生成的C代码,并链接必要的库(如libbison),生成可执行文件。
  • 运行可执行文件,对输入文本进行语法分析。

4. Bison程序示例

%{  
#include <stdio.h>  
#include <stdlib.h>  void yyerror(const char *s);  // 假设有一些用于存储解析结果的数据结构  
// 例如,一个全局的符号表或AST节点  %}  %token IDENTIFIER NUMBER STRING  
%token PROGRAM VAR VAR_INPUT VAR_OUTPUT VAR_IN_OUT VAR_EXTERNAL TEMP TEMP_VAR  
%token BEGIN_PROGRAM END_PROGRAM BEGIN_VAR END_VAR BEGIN_STRUCT END_STRUCT  
%token FUNCTION_BLOCK FUNCTION METHOD INTERFACE END_INTERFACE END_FUNCTION_BLOCK END_FUNCTION END_METHOD  
%token TRUE FALSE  
%token OPERATOR /* 假设我们有一个通用的OPERATOR token用于所有操作符 */  %start program  %%  program:  PROGRAM IDENTIFIER ';' block { printf("Parsed a program\n"); }  ;  block:  /* 这里可以添加更复杂的块结构,如BEGIN_VAR ... END_VAR, BEGIN_PROGRAM ... END_PROGRAM等 */  declarations  ;  declarations:  /* 变量声明 */  VAR declarations_list ';'  | /* 空声明列表 */  { 
$$= NULL; /* 假设我们有一个返回类型,这里用NULL表示空 */ }  ;  declarations_list:  IDENTIFIER ':' type  | declarations_list ',' IDENTIFIER ':' type  ;  type:  /* 这里可以添加对类型的解析,如INT, REAL, BOOL等 */  IDENTIFIER  ;  /* 更多的语法规则可以根据需要添加 */  %%  void yyerror(const char *s) {  fprintf(stderr, "%s\n", s);  
}  int main(void) {  yyparse();  return 0;  
}  // 注意:这个示例中的语法规则非常简化,并且没有处理ST语言的许多特性。  
// 你需要根据实际的ST语言规范来扩展这些规则。

重要说明

  1. Token定义:在Bison文件中,我们使用%token指令来定义由Flex生成的词法单元(tokens)。这些tokens应该与Flex文件中定义的tokens相匹配。

  2. 起始符号%start program指定了语法分析的起始符号。在这个例子中,我们期望输入以PROGRAM关键字开始。

  3. 语法规则:我们定义了几个简单的语法规则来解析程序、块和变量声明。这些规则可以根据需要进行扩展和修改。

  4. 错误处理yyerror函数用于处理解析过程中的错误。

  5. 主函数main函数调用yyparse()来启动解析过程。

注意

  • 这个Bison程序是一个非常简化的示例,它不会处理ST语言的全部特性。
  • 你需要根据实际的ST语言规范来扩展和修改语法规则。
  • 你可能还需要实现一些额外的功能,如符号表管理、抽象语法树(AST)构建等。
  • 编译Bison程序时,你需要使用Bison工具生成C代码,并将其与Flex生成的词法分析器代码以及任何额外的C代码一起编译。通常,这可以通过在Makefile中添加适当的规则来完成。

三、Flex和Bison的关系

Flex和Bison通常一起使用来构建编译器或解析器。Flex负责词法分析,将输入文本分割成词法单元;Bison则负责语法分析,确定这些词法单元是如何根据文法规则关联的。Flex生成的词法分析器可以作为Bison生成的语法分析器的输入源,从而实现完整的编译过程。

四、总结

Flex和Bison是Linux和Unix环境下强大的工具,分别用于生成词法分析器和语法分析器。它们在编译器设计、文本处理等领域有着广泛的应用。Flex通过正则表达式进行词法分析,而Bison则通过上下文无关文法进行语法分析。两者通常一起使用,以构建完整的编译或解析过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/48661.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript进阶之作用域解构箭头函数

目录 一、作用域1.1 局部作用域1.2 全局作用域1.3 作用域链1.4 垃圾回收机制1.5 闭包1.6 变量提升 二、函数进阶2.1 函数提升2.2 函数参数2.3 箭头函数&#xff08;重要&#xff09; 三、解构赋值3.1 数组解构3.2 对象解构&#xff08;重要重要&#xff09; 一、作用域 1.1 局…

【BUG】已解决:ModuleNotFoundError: No module named‘ pip‘

已解决&#xff1a;ModuleNotFoundError: No module named‘ pip‘ 目录 已解决&#xff1a;ModuleNotFoundError: No module named‘ pip‘ 【常见模块错误】 【解决方案】 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页&#xff0c;我是博主英杰…

揭开黑箱:目标检测中可解释性的重要性与实现

揭开黑箱&#xff1a;目标检测中可解释性的重要性与实现 在深度学习的目标检测任务中&#xff0c;模型的准确性虽然重要&#xff0c;但模型的决策过程是否透明也同样关键。可解释性&#xff08;Explainability&#xff09;是指模型能够为其预测结果提供清晰、可理解的解释。本…

SpringCloud--负载均衡

目录 前言 一.负载均衡的引入 1.1问题引入 1.2代码修改实现 二.负载均衡介绍 2.1实现负载均衡 2.2负载均衡策略 2.3LoadBalancer 原理 学习专栏&#xff1a;http://t.csdnimg.cn/tntwg 前言 在前面的Eureka当中&#xff0c;我们虽然实现了从注册中心中获取url&#xf…

桌面小宠物发布一周,第一次以独立开发者的身份赚到了100块

收入数据(AppStore一周收入统计) AppStore付费工具榜第七 应用简介 桌面新宠(NewPet)&#xff0c;是我耗时半年开发的一款桌面宠物。我是被 QQ 宠物影响的那批人&#xff0c;上学时天天给 QQ 宠物喂食&#xff0c;很可惜它现在不在了。所以&#xff0c;我开发的初衷是想要在电…

将SQL中的占位符替换成参数

将SQL中的占位符替换成参数 描述 描述 此方法是将SQL中的${}或#{}替换为直接拼接到SQL中或直接替换为?的形式。具体详情看下面代码。 import java.util.*; import java.util.regex.Matcher; import java.util.regex.Pattern;/*** author HuYu* date 2023-09-21* since 1.0**…

编码和解码

编码 编码的原理 编码是将信息&#xff08;如文本、图像、音频等&#xff09;转换成计算机可以处理和存储的二进制格式&#xff08;0和1&#xff09;的过程。不同的编码方案定义了不同的信息转换规则&#xff1a; 字符编码&#xff1a;用于将字符转换为数字。常见的有&#…

WPF 解决: DataGrid 已定义列,但是还是会显示模型的所有属性的问题

AutoGenerateColumns 属性 AutoGenerateColumns&#xff1a;这个属性决定 DataGrid 是否根据数据源中的属性自动生成列。如果设置为 true&#xff0c;DataGrid 会根据数据源中的属性自动生成列。如果设置为 false&#xff0c;则 DataGrid 不会自动生成列&#xff0c;开发者需要…

Mysql-查询

1.基本查询 //查询所有内容 select * from 表名;//查询指定字段 select 字段1&#xff0c;字段2&#xff0c;字段3.....from 表名;//查询时给字段起别名 select 字段1 as 别名1 , 字段2 as 别名2 ... from 表名&#xff1b;//去重查询 select distinct 字段列表 from 表名; …

假设我写了一段C++循环代码,我希望对这段代码做 profiling,计算出每次循环需要消耗的指令 cycle 数。我应该如何实现这种 profiling?

为了对你编写的C循环代码进行profile并计算每次循环消耗的指令周期数&#xff0c;可以采用以下步骤&#xff1a; 使用硬件性能计数器 使用 rdtsc 指令 rdtsc&#xff08;读时间戳计数器&#xff09;指令可以返回一个64位时间戳计数器的值&#xff0c;这个计数器从系统启动时开…

解决显存不足问题:深度学习中的 Batch Size 调整【模型训练】

解决显存不足问题&#xff1a;深度学习中的 Batch Size 调整 在深度学习训练中&#xff0c;显存不足是一个常见的问题&#xff0c;特别是在笔记本等显存有限的设备上。本文将解释什么是 Batch Size&#xff0c;为什么调整 Batch Size 可以缓解显存不足的问题&#xff0c;以及调…

杰发科技AC7840——SENT数据解析及软件Sent发送的实现

0. 测试环境 AC7840官方Demo板&#xff1b; 图莫斯0503 DSlogic U2Basic 使用引脚 输出脚&#xff1a;PB1 时钟&#xff1a;PB2&#xff0c;其他引脚可以不初始化&#xff0c;不接线 1. 数据解析 以下是SENT数据的格式&#xff08;1tick以3us为例&#xff09;&#…

watch和watchEffect的区别

废话不多说&#xff0c;先看两者代码&#xff1a; <template><div><h1>watchs</h1><div>{{ countRef }} - {{ name }} - {{ age }}</div></div> </template><script> import { ref, watch } from vue export default {…

数据库中的事务

一、理解事务 1、本质 事务由一组DML语句组成&#xff0c;这一组语句要么全部成功&#xff0c;要么全部失败。在逻辑上&#xff0c;事务就是一组sql语句&#xff0c;但在实际中&#xff0c;公共的数据库一定会高并发地接受各种事务的请求&#xff0c;所以一个事务要有4个属性…

WEB开发-HTTP认证

1 需求 2 接口 3 示例 HTTP Authentication&#xff08;HTTP认证&#xff09;是Web服务器用来验证客户端请求的一种机制。它通常用于保护需要用户凭据&#xff08;如用户名和密码&#xff09;才能访问的资源。HTTP认证有几种不同的分类或方法&#xff0c;以下是其中一些主要的分…

java 中stream.map()和stream.reduce()

stream.map 和 stream.reduce 是 Java Stream API 中的两个不同操作&#xff0c;用于对流中的元素进行转换和聚合。它们在功能和用途上有很大的区别。 stream.map map 方法用于将流中的每个元素应用一个函数&#xff0c;并返回一个包含应用该函数后的新元素的流。它通常用于将…

国内访问Docker Hub慢问题解决方法

在国内访问Docker Hub时可能会遇到一些困难&#xff0c;但幸运的是&#xff0c;有多种解决方案可以帮助你顺利下载Docker镜像。以下是一些有效的解决方案&#xff1a; 配置Docker镜像源&#xff1a;你可以通过配置Docker的daemon.json文件来使用国内镜像源&#xff0c;比如DaoC…

SpringCloud极限速通版

1.SpringCloud概述 1.1 什么是微服务 1.1.1 单体架构 业务所有功能都打包在一个war包或jar包&#xff0c;这种方式就是单体架构&#xff0c;单体架构的应用就是单体应用。这种架构开发简单&#xff0c;部署简单&#xff0c;一个项目包含所有功能&#xff1b;省去了多个项目之…

【学习笔记】无人机系统(UAS)的连接、识别和跟踪(七)-广播远程识别码(Broadcast Remote ID)

目录 引言 5.5 广播远程识别码&#xff08;Broadcast Remote ID&#xff09; 5.5.1 使用PC5的广播远程识别码 5.5.2 使用MBS的广播远程识别码 引言 3GPP TS 23.256 技术规范&#xff0c;主要定义了3GPP系统对无人机&#xff08;UAV&#xff09;的连接性、身份识别、跟踪及…

来自Transformers的双向编码器表示(BERT) 通俗解释

来自Transformers的双向编码器表示&#xff08;BERT&#xff09; 目录 1. 从上下文无关到上下文敏感2. 从特定于任务到不可知任务3. BERT&#xff1a;把两个最好的结合起来4. BERT的输入表示5. 掩蔽语言模型&#xff08;Masked Language Modeling&#xff09;6. 下一句预测&am…