在C#中使用Irony实现SQL语句的解析

在上一篇博文 LogoSharp:Logo语言的C#实现中,我介绍了LOGO语言的C#实现,在该项目中,我使用了.NET下的语法解析框架:Irony。Irony框架最开始的时候是由Roman Ivantsov发布在codeplex上的一个开源项目,它使用MIT协议开源。由于2017年的时候,微软关闭了codeplex服务,为了让这个优秀的项目能够继续为人所用,我将其复制到了我的Github账号下,并将其移植到NET Standard 2.0,地址是:https://github.com/daxnet/irony。于是,Irony目前可以在.NET Core下使用了。事实上,Github中有很多Irony的版本,但大多数都不支持.NET Core。

不仅如此,我还在Azure DevOps上配置了持续集成,因此,你可以通过NuGet很方便地使用Irony。Irony相关的NuGet包有两个,你需要在你的项目中同时安装以下两个NuGet包:

1
2
Install-Package Irony.NetCore -Version 1.1.11
Install-Package Irony.Interpreter.NetCore -Version 1.1.11

接下来,我介绍一下如何用Irony实现一个语法解析器,我们以SQL语句为例进行介绍。

所有使用Irony框架的语法定义,都必须继承于Grammar类,并加上Language特性。以下就是我定义的一个SQL语句的语法,我称之为“Mini SQL”,因为它目前只支持SELECT语句,而且不支持WHERE子句。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
[Language("Mini SQL", "1.0", "A SQL Sample")]
public class MiniSqlGrammar : Grammar
{
    public MiniSqlGrammar()
        : base(false)
    {
        var identifier = new IdentifierTerminal("Identifier");
        var table = new NonTerminal("table");
        var fields = new NonTerminal("fields");
        var sql_statement = new NonTerminal("SQL");
        table.Rule = identifier;
        fields.Rule = "*" | MakePlusRule(fields, ToTerm(","), identifier);
        sql_statement.Rule = "SELECT" + fields + "FROM" + table;
        Root = sql_statement;
    }
}

代码非常简单,也很容易理解,它可以使用人类比较容易读懂的语法定义规则进行语法定义。这里简单介绍一下上面的代码:

  • Language特性用于描述我们自定义的语法

  • 语法类需要继承于Grammar类

  • 基类构造函数的false参数表示我们的语言是大小写不敏感的

  • 所有的程序语言标识符都可以用IdentifierTerminal进行定义,Irony已经自带了标识符的识别逻辑,非常简单

  • table是一个标识符

  • fields可以是*,也可以是由一些标识符通过逗号分隔的一个列表

  • SQL语句由四个部分组成:SELECT关键字、fields字段列表、FROM关键字以及table数据表名

  • Root=sql_statement表示语言的解析入口就是SQL语句

编译通过后,我们就可以使用这个语法进行SELECT语句的解析了。

Irony有一个非常不错的功能,就是它提供一个用户界面,用来测试我们定义的语法。这个用户界面是一个Windows Forms的应用程序,我也将其发布到我的Github账号下,地址是:https://github.com/daxnet/irony-explorer。下载以后编译执行GrammarExplorer项目,就可以打开这个测试界面。在测试界面中,打开包含有自定义语法的.NET DLL,就可以将其添加到Grammar Explorer中。例如,下图展示了我用Grammar Explorer测试上面的SQL语法的界面效果:

640?wx_fmt=png

在Grammar Explorer中,你可以看到我们自定义语法是否存在错误,还可以使用一个具有代码着色功能的编辑器进行测试,点击Parse按钮,即可生成语法解析树。

使用Irony进行语法解析的基本步骤是:

  1. 基于语法(Grammar)定义,创建语言数据(Language Data)

  2. 基于语言数据,产生解析器(Parser)

  3. 使用解析器,解析输入的字符串,生成语法树

  4. 遍历语法树,执行相应的程序逻辑

下面的代码展示了这一过程:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
sealed class SqlParser
{
    private static readonly LanguageData languageData = new LanguageData(new MiniSqlGrammar());
    private static readonly Parser parser = new Parser(languageData);
    private readonly List<string> parsedFields = new List<string>();
    public void Execute(string command)
    {
        var tree = parser.Parse(command);
        if (tree.HasErrors())
        {
            return;
        }
        ParseTree(tree.Root);
    }
    private void ParseTree(ParseTreeNode node)
    {
        switch (node.Term.Name)
        {
            case "SQL":
                foreach (var child in node.ChildNodes)
                {
                    ParseTree(child);
                }
                break;
            case "fields":
                foreach (var child in node.ChildNodes)
                {
                    parsedFields.Add(child.Token.Text);
                }
                break;
            case "table":
                ParsedTable = node.ChildNodes[0].Token.Text;
                break;
        }
    }
    public IEnumerable<string> ParsedFields => parsedFields;
    public string ParsedTable { get; private set; }
}

SqlParser会基于我们自定义的语法类,生成一个Irony的Parser对象,然后使用Parse方法来解析传入的SQL语句,并产生语法解析树。之后,就可以根据树状结构来解析语句中的每一个部分,并执行相应的操作。

最后,就是使用这个SqlParser类来解析SQL语句并得到结果。代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
static void Main(string[] args)
{
    var sqlParser = new SqlParser();
    sqlParser.Execute("SELECT firstName, LastName FROM tbl_students");
    Console.WriteLine($"获得的数据表: {sqlParser.ParsedTable}");
    Console.WriteLine("获得的字段:");
    foreach (var field in sqlParser.ParsedFields)
    {
        Console.WriteLine(field);
    }
}

代码很简单:调用SqlParser的Execute方法来解析给定的SQL语句,解析结果会分别保存在SqlParser的ParsedTable和ParsedFields两个属性中,上面的控制台程序只需要输出这两个结果就行了。在实际应用中,可以通过ParsedTable来获取某一种类型的对象列表,然后通过ParsedFields来投影列表中每个对象的属性,从而得到基于C#的一系列对象来执行SQL查询的效果。

本案例执行结果如下:

640?wx_fmt=png

本文简要介绍了.NET语法解析框架Irony的使用,并通过SQL语句解析的案例,介绍了Irony使用的一些技巧与步骤。就SQL语句而言,它的定义还是相对比较复杂的,不可能单靠一篇博客就能完全覆盖所有内容,也是因为这个原因,本文也没有涉及WHERE子句的设计,但Irony框架是完全可以做到这一点的。事实上,在Irony Explorer项目中,就有一个IronyExplorer.Samples的工程,其中包含了很多编程语言语法定义的案例代码,比如Java、C#、SQL等,有兴趣的可以参考。Irony框架本身已经帮我们做了很多工作,比如大小写敏感的特性,比如运算符优先级的定义,比如标识符、整数、小数、正负数的定义,再比如块注释与行注释的处理等等。在我用C#实现LOGO语言时,基本上也是按照上面所述步骤进行编写和测试,因此,我就不再另起篇幅来介绍LOGO语言的语法定义了。

原文地址:https://sunnycoding.cn/2019/07/11/sql-parser-with-irony-in-csharp/


.NET社区新闻,深度好文,欢迎访问公众号文章汇总 http://www.csharpkit.com 

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/314960.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【CF1045A】A Last chance【贪心】【线段树优化建图】【网络流构造方案】

题意&#xff1a;有nnn个武器和mmm个飞船&#xff0c;武器有下面三种 从给定的集合SSS中击破一个。在给定的区间[L,R][L,R][L,R]中击破一个。对于给定的a,b,ca,b,ca,b,c&#xff0c;选择000个或222个击破。特殊地&#xff0c;每个飞船最多被该操作的a,b,ca,b,ca,b,c指定一次。…

P4127 [AHOI2009]同类分布 数位dp + 对状态剪枝

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 思路&#xff1a; 比较套路的题&#xff0c;首先也有个明显的状态f[pos][num][sum]f[pos][num][sum]f[pos][num][sum]表示到了pospospos位&#xff0c;当前数为numnumnum&#xff0c;各位数字之和为sumsumsu…

.NET开发框架(六)-架构设计之IIS负载均衡(视频)

前面有关注我们公众号文章的朋友应该都知道&#xff0c;我们的分布式应用服务可以通过Ocelot网关进行负载均衡&#xff0c;这种方式属于应用级别的实现。而今天我们给大家介绍的是平台级别的实现&#xff0c;并且我们首次使用视频方式进行讲解。本文通过视频方式为大家演示&…

【NOI2019】斗主地【期望】【组合数学】【下降幂】【插值】

题意&#xff1a; 有nnn张牌&#xff0c;从上往下的第iii张牌权值是f(i)itypef(i)i^{type}f(i)itype。 进行mmm次洗牌操作&#xff0c;每次操作给定aia_iai​&#xff0c;将从上往下的前aia_iai​张牌分成一堆&#xff0c;后面bib_ibi​张牌分成第二堆。如果两堆的牌数分别为…

架构杂谈《二》

服务化到微服务1、微服务的产生随着互联网企业的不断发展&#xff0c;海量用户发起的大规模、高并发请求是企业不得不面对的&#xff0c;上一篇 架构杂谈《一》杂谈的SOA服务化系统能够分解任务&#xff0c;让每个服务更简单、职责单一、更易于扩展。但无论是Web Service 还是E…

Good Bye 2017 G. New Year and Original Order 数位dp + 按数贡献

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 定义S(k)S(k)S(k)为将kkk的每一位拿出来从小到大排序后构成的数&#xff0c;比如S(3421)1234S(3421)1234S(3421)1234&#xff0c;求S(k)1≤k≤nS(k)_{1\le k\le n }S(k)1≤k≤n​。 1≤n≤107001\le n\le 10…

【NOI2019】 机器人 【区间dp】【插值】【下降幂多项式】【分段函数】

题意&#xff1a;有个长度为nnn的序列aaa&#xff0c;ai∈[Li,Ri]a_i\in [L_i,R_i]ai​∈[Li​,Ri​]。从一个位置sss可以往左直到≥as\geq a_s≥as​,往右直到>as> a_s>as​。求有多少种可能的序列满足从任意位置向左或向右的最大步数的差的绝对值不超过222。 n≤300…

上海理工大学第二届“联想杯”全国程序设计邀请赛 Identical Day 思维 + 暴力

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 给你一个010101序列&#xff0c;假设有一段长为lll连续的全111子串&#xff0c;定义这段字串不高兴值为l∗(l1)2\frac{l*(l1)}{2}2l∗(l1)​&#xff0c;整个串的所有不高兴值相加为总的不高兴值。现在你可以…

简化 Pod 故障诊断:kubectl-debug 介绍

背景容器技术的一个最佳实践是构建尽可能精简的容器镜像。但这一实践却会给排查问题带来麻烦&#xff1a;精简后的容器中普遍缺失常用的排障工具&#xff0c;部分容器里甚至没有 shell (比如 FROM scratch &#xff09;。在这种状况下&#xff0c;我们只能通过日志或者到宿主机…

dotnet 新项目格式与对应框架预定义的宏

在 sdk style 的项目格式支持使用多框架开发&#xff0c;此时需要在代码里面通过宏判断&#xff0c;在编译的时候执行不同的代码。本文告诉大家在框架里面对应的预定义的条件编译符有哪些在让一个 csproj 项目指定多个开发框架 - walterlv告诉大家如何在 sdk style 项目格式如何…

【UOJ549】序列妙妙值【异或】【根号分治】

题意&#xff1a;给一个长度为nnn的序列aaa&#xff0c;将其分成kkk段&#xff0c;不能为空&#xff0c;求所有段的异或和之和的最小值。 n≤6104,ai<216,k≤8n\leq 6\times 10^4,a_i <2^{16},k\leq 8n≤6104,ai​<216,k≤8 先求个前缀异或和&#xff0c;显然有个 dp…

Educational Codeforces Round 76 (Rated for Div. 2) E. The Contest 思维 + 差分

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 给你三个长度分别为k1,k2,k3k1,k2,k3k1,k2,k3的数组a,b,ca,b,ca,b,c&#xff0c;其中k1k2k3nk1k2k3nk1k2k3n&#xff0c;这三个数组中的元素拼接起来是一个nnn的排列&#xff0c;每次可以将某个数组中的某个…

TPL Dataflow .Net 数据流组件,了解一下?

作为单体程序&#xff0c;依赖的第三方服务虽不多&#xff0c;但是2C的程序还是有不少内容可讲&#xff1b;作为一个常规互联网系统&#xff0c;无外乎就是接受请求、处理请求&#xff0c;输出响应。由于业务渐渐增长&#xff0c;数据处理的过程会越来越复杂和冗长&#xff0c;…

【CF1394B】Boboniu Walks on Graph【图论】【集合哈希】

题意&#xff1a;给定nnn个点mmm张图的有向图&#xff0c;有1∼m1\sim m1∼m互不相同每个点出度不超过kkk。对于一个 kkk元组cic_ici​&#xff0c;图中的每个点uuu只保留第cdeguc_{deg_u}cdegu​​小的边。求有多少种ccc使得在保留下来的图中每个点沿着出边一直往下走可以走回…

Educational Codeforces Round 76 (Rated for Div. 2) F. Make Them Similar 折半搜索

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 思路&#xff1a; 一个显然的思路就是2302^{30}230枚举所有的xxx&#xff0c;让后再检查&#xff0c;这个复杂度显然不能接受。 又发现对于每个位置它取多少不受其他位置限制&#xff0c;满足可拼接性&#…

windows container 踩坑记

windows container 踩坑记Intro我们有一些服务是 dotnet framework 的&#xff0c;不能直接跑在 docker linux container 下面&#xff0c;最近一直在折腾把它部署在 windows container 下&#xff0c;折腾的有点恶心&#xff0c;记录一下。Windows Container 介绍Windows Cont…

生成函数Euler变换学习笔记(无标号有根树计数)

众所周知&#xff0c;对于有标号计数的指数型生成函数 f(x)f(x)f(x)&#xff0c;将其任意地进行无顺序的组合&#xff0c;得到的生成函数是exp(f(x))exp(f(x))exp(f(x))。 而对于无标号计数的这样的组合&#xff0c;我们就需要引入一个叫 Eular\text{Eular}Eular 变换的东西 E…

Codeforces Round #602 (Div. 2) D2. Optimal Subsequences stl 黑科技

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 思路&#xff1a; 比较明显的是我们需要将序列从大到小排序&#xff0c;让后取前kkk个数&#xff0c;再从中选择第pospospos小的位置输出当前位置的数即可。 一开始想用setsetset维护&#xff0c;但是setse…

小白开学Asp.Net Core 《七》

小白开学Asp.Net Core 《七》— — 探究中间件&#xff08;MiddleWare&#xff09;1、何为中间件&#xff1f;中间件是组装到应用程序管道中以处理请求和响应的家伙&#xff0c;管道中的每个组件都要满足以下两个条件选择是否将请求传递给管道中的下一个组件可以在调用管道中的…

【SHOI2017】相逢是问候【扩展欧拉定理】【复杂度分析】【线段树】

题意&#xff1a;给定一个长度为 nnn 的序列 aia_iai​&#xff0c;维护 mmm 次操作&#xff1a; 区间执行 ai←caia_i \leftarrow c^{a_i}ai​←cai​&#xff1b;区间求和 模 ppp。 其中 p,cp,cp,c 对所有操作相同。 n,m≤5104,p≤108n,m\leq 5\times 10^4,p\leq 10^8n,m≤…