简易C语言词法分析程序

更好的阅读体验 \huge{\color{red}{更好的阅读体验}} 更好的阅读体验

问题


词法规则

<标识符>::=<字母>
<标识符>::=<标识符><字母>
<标识符>::=<标识符><数字>
<常量>::=<无符号整数>
<无符号整数>::=<数字序列>
<数字序列>::=<数字序列><数字>
<数字序列>::=<数字>
<字母>::=a|b|c|……|x|y|z
<数字>::=0|1|2|3|4|5|6|7|8|9
<加法运算符>::=+|-
<乘法运算符>::=*|/
<关系运算符>::=<|>|!=|>=|<=|==
<分界符>::=,|;|(|)|{|}
<保留字>::=main|int|if|else|while|do

符号表

单词符号种类码单词符号种类码
标识符0整数24
main1>=10
int2<=11
if3==12
else4,13
while5;14
do6)15
<7(16
>8{17
!=9}18
+19-20
*21/22
=23

根据词法规则和符号表,制作词法分析器


思路


  • 利用两个 unordered_map 分别存储关键字和其他符号的映射规则
  • 对于原程序中的空格符需要忽略
  • 利用 std::ifstream 读入文件,std::istreambuf_iterator 来遍历
  • 将字符拼接识,判断即可

代码


#include <iostream>
#include <fstream>
#include <string>
#include <unordered_map>
#include <cctype>// 关键字和对应的种别码
std::unordered_map<std::string, int> keywords = {{"main", 1}, {"int", 2}, {"if", 3}, {"else", 4}, {"while", 5}, {"do", 6}
};// 运算符和界符及其种别码
std::unordered_map<std::string, int> symbols = {{"<", 7}, {">", 8}, {"!=", 9}, {">=", 10}, {"<=", 11}, {"==", 12}, {",", 13}, {";", 14}, {"(", 15}, {")", 16}, {"{", 17}, {"}", 18}, {"+", 19}, {"-", 20}, {"*", 21}, {"/", 22}, {"=", 23}
};// 检查是否是关键字或者符号,是的话返回种别码,否则返回0
int isKeywordOrSymbol(const std::string& str) {if (keywords.find(str) != keywords.end()) return keywords[str];if (symbols.find(str) != symbols.end()) return symbols[str];return 0;
}// 检查字符是否是字母或数字
bool isLetterOrDigit(char ch) {return isalpha(static_cast<unsigned char>(ch)) || isdigit(static_cast<unsigned char>(ch));
}void tokenize(const std::string& code, std::ostream &out) {std::string token;for (size_t i = 0; i < code.length(); ++i) {if (isspace(static_cast<unsigned char>(code[i]))) {continue; // 忽略空格} else if (isLetterOrDigit(code[i])) {// 处理标识符和关键字token.clear();while (i < code.length() && isLetterOrDigit(code[i])) {token += code[i++];}--i; // 回退到上一个字符int code = isKeywordOrSymbol(token);out << "(" << token << "," << (code ? code : 24) << ")" << std::endl;} else {// 处理符号token = code[i];if (i + 1 < code.length() && symbols.count(token + code[i + 1])) {token += code[++i];}out << "(" << token << "," << symbols[token] << ")" << std::endl;}}
}int main() {std::string inputPath = "C:\\Users\\LYS\\Downloads\\s.c"; // 输入文件路径std::string outputPath = "C:\\Users\\LYS\\Desktop\\result.txt";        // 输出文件路径std::ifstream fileIn(inputPath);std::ofstream fileOut(outputPath);if (!fileIn.is_open() || !fileOut.is_open()) {std::cerr << "文件位置或权限错误" << std::endl;return -1;}std::string content((std::istreambuf_iterator<char>(fileIn)), (std::istreambuf_iterator<char>()));// 执行词法分析,并将结果重定向输出到文件tokenize(content, fileOut);// 关闭文件流fileIn.close();fileOut.close();return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/759942.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【DP】第十三届蓝桥杯省赛C++ B组《李白打酒加强版》(C++)

【题目描述】 话说大诗人李白&#xff0c;一生好饮。 幸好他从不开车。 一天&#xff0c;他提着酒壶&#xff0c;从家里出来&#xff0c;酒壶中有酒 2 斗。 他边走边唱&#xff1a; 无事街上走&#xff0c;提壶去打酒。 逢店加一倍&#xff0c;遇花喝一斗。 这一路上&am…

如何准备2024年汉字小达人:历年考题练一练-18道选择题解析

距离2024年第11届汉字小达人比赛还有七个多月的时间&#xff0c;如何利用这段时间有条不紊地备考呢&#xff1f;我的建议是两手准备&#xff1a;①把小学1-5年级的语文课本上的知识点熟悉&#xff0c;重点是字、词、成语、古诗。阅读理解不需要。②把历年真题刷刷熟&#xff0c…

Mybatis之自定义映射resultMap

学习的最大理由是想摆脱平庸&#xff0c;早一天就多一份人生的精彩&#xff1b;迟一天就多一天平庸的困扰。各位小伙伴&#xff0c;如果您&#xff1a; 想系统/深入学习某技术知识点… 一个人摸索学习很难坚持&#xff0c;想组团高效学习… 想写博客但无从下手&#xff0c;急需…

基于springboot+vue的失物招领平台

博主主页&#xff1a;猫头鹰源码 博主简介&#xff1a;Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战&#xff0c;欢迎高校老师\讲师\同行交流合作 ​主要内容&#xff1a;毕业设计(Javaweb项目|小程序|Pyt…

更智能的广告素材生成!看A/B测试如何驱动AIGC素材调优

更多技术交流、求职机会&#xff0c;欢迎关注字节跳动数据平台微信公众号&#xff0c;回复【1】进入官方交流群 前言&#xff1a;AIGC 大爆发&#xff0c;引发广告营销行业变革 ChatGPT 等 AI 产品引发的 AIGC 大爆发引起了各行业的震动&#xff0c;其中以图片生成甚至视频生成…

操作系统:malloc与堆区内存管理

malloc是函数而不是系统调用&#xff0c;他的底层是同调调用brk和mmap这两个系统调用实现功能的&#xff0c;具体选择brk还是mmap要看申请的空间大小以及malloc中的阈值&#xff08;一般是128kb&#xff09; 注意申请的空间只有使用才会触发缺页中断映射到物理内存 不理解的话先…

现货黄金做对冲的具体方法

现货黄金做对冲的具体方法是运用金融衍生工具和策略&#xff0c;以减轻或消除持有现货黄金所面临的市场风险。具体而言&#xff0c;投资者可通过期货合约、期权、掉期等金融工具来实现对冲&#xff0c;保障其投资价值不受金价波动的负面影响。 &#xfeff; 期货合约在对冲中…

Ceres求解非线性优化问题步骤与示例

【版权声明】 本文为博主原创文章&#xff0c;未经博主允许严禁转载&#xff0c;我们会定期进行侵权检索。 在计算机视觉和机器人领域&#xff0c;经常需要解决非线性优化问题来估计相机姿态或运动模型。Ceres Solver是一个开源的C库&#xff0c;专门用于解决最小二乘问题&am…

HarmonyOS/OpenHarmony应用开发-HDC环境变量设置

hdc&#xff08;HarmonyOS Device Connector&#xff09;是 HarmonyOS 为开发人员提供的用于调试的命令行工具&#xff0c;通过该工具可以在 windows/linux/mac 系统上与真实设备或者模拟器进行交互。 hdc 工具通过 HarmonyOS SDK 获取&#xff0c;存放于 /Huawei/Sdk/openhar…

C++:指针 引用 普通变量适用场景

什么时候用指针 什么时候用引用 什么时候用普通变量 在C中&#xff0c;我们可以根据不同的需求选择使用指针、引用或普通变量。 使用指针的情况&#xff1a; 指针是一个变量&#xff0c;它存储了一个内存地址。我们可以使用指针来间接访问和修改内存中的数据。以下是一些使用…

sde的几个问题

数据库:aix6.1oracle11.2.0.1 sde数据为从原先oracle10.2.0.5中导入的。 环境&#xff1a;windows2008x64 安装sde10 for oracle11g x64oracle11.2.0.1x64客户端。 启动出现问题&#xff1a; ST_Geometry Schema Owner: (SDE) Type Release: 1007 Instance initialized fo…

5.1.7、【AI技术新纪元:Spring AI解码】Mistral AI Chat

Mistral AI 聊天 Spring AI 支持 Mistral AI 的各种 AI 语言模型。您可以与 Mistral AI 语言模型进行互动,并基于 Mistral 模型创建多语言对话助手。 先决条件 您需要创建一个与 MistralAI 的 API 以访问 Mistral AI 语言模型。在 MistralAI 注册页面创建账户并在 API Keys…

零基础学python:17、课后练习作业

课后练习 #1.写一个装饰器,传入一个函数,测量一下这个函数的运行时间 import time def wrapper(func):def run(*args,**kwargs):start = time.time()func(*args

HTTP协议初识

HTTP协议 HTTP协议简介与作用HTTP基本工作原理非持久连接与持久连接的区别HTTP请求与响应HTTP请求HTTP响应请求与响应的交互流程 HTTP方法实例GET 请求示例POST 请求示例HEAD 请求示例 使用场景 HTTP状态码HTTP消息结构与头字段头字段 HTTP的无状态性与状态管理初步了解安全性与…

C++(4): std::ofstream的使用

1. ofstream 之前讲到&#xff0c;ifstream具有将文件从硬盘中读进内存的功能。而ofstream则是执行反操作&#xff0c;它提供了将文件从内存写入磁盘的功能。 std::ofstream 是 C 标准库中用于文件输出的类&#xff0c;它提供了向文件写入数据的能力。std::ofstream 属于 <…

559: 字符串排序(python)

收藏 难度&#xff1a;一般 标签&#xff1a;暂无标签 题目描述 在对字符串的排序中&#xff0c;往往具有不同的规则来判断字符串的大小先后。这里有两种比较常见的规则&#xff1a; 1&#xff0e; 首先按字符串长度进行排序&#xff0c;对长度相同的字符串&#xff0c;按字…

力扣热门算法题 56. 合并区间,57. 插入区间,58. 最后一个单词的长度v

56. 合并区间&#xff0c;57. 插入区间&#xff0c;58. 最后一个单词的长度&#xff0c;每题做详细思路梳理&#xff0c;配套Python&Java双语代码&#xff0c; 2024.03.20 可通过leetcode所有测试用例。 目录 56. 合并区间 解题思路 完整代码 Python Java ​编辑 5…

MCU技术的创新浪潮与产业变革

MCU技术的创新浪潮与产业变革 一、MCU技术的创新发展 MCU&#xff0c;即微控制器&#xff0c;作为现代电子设备的核心部件&#xff0c;一直在不断地创新与发展。随着科技的进步&#xff0c;MCU的性能得到了极大的提升&#xff0c;功能也越来越丰富。从8位到32位&#xff0c;再…

G1和ZGC垃圾回收器学习

前言 ​ 随着JDK17的占有率不断升高和SpringBoot3最低支持JDk17&#xff0c;JDK17很大概率会成为大家后续升级的一个选择&#xff0c;而JDK17上最重要的垃圾回收器G1和ZGC&#xff0c;也就显得格外重要。大家提前了解或者学习一下肯定是有用的。 ​ 本篇文章也默认大家了解一…

C语言学习笔记

基础语法 注释 int main() {//这是单行注释 /** 多行注释*/ }变量 变量声明 格式&#xff1a;type name int main() {//变量的声明int num;//变量使用num1;//声明多个变量int num1,num2;//变量的初始化int num31;} int num&#xff1b; num10&#xff1b; 常量 const dou…