antlr 语言库_关于ANTLR的通用库的需求：使用反射来构建元模型

antlr 语言库

我是一名语言工程师：我使用多种工具来定义和处理语言。在其他工具中，我使用ANTLR：它简单，灵活，可以围绕它进行构建。

但是我发现自己围绕ANTLR为不同的项目重建了类似的工具。我看到两个问题：

ANTLR是一个非常好的构建基块，但是仅使用ANTLR并不能做很多事情：价值在于我们可以在AST上进行的处理，而且我看不到ANTLR周围的图书馆生态系统
ANTLR不会产生语法的元模型：如果没有，就很难围绕ANTLR构建通用工具

让我解释一下：

对于具有EMF经验的人：对于每个语法，我们基本上都需要一个等效的Ecore。
对于其他：请阅读下一段

为什么我们需要一个元模型

假设我想构建一个通用库，以根据ANTLR生成的AST生成XML文件或JSON文档。我该怎么办？

好吧，给定一个ParseRuleContext，我可以获取规则索引并找到名称。我为Python语法生成了解析器，并提供了一些示例，因此，让我们看一下如何使用实际的类：

Python3Parser.Single_inputContext astRoot = pythonParse(...my code...);
String ruleName = Python3Parser.ruleNames[astRoot.getRuleIndex()];

让我们看一下类Single_inputContext：

public static class Single_inputContext extends ParserRuleContext {public TerminalNode NEWLINE() { return getToken(Python3Parser.NEWLINE, 0); }public Simple_stmtContext simple_stmt() {return getRuleContext(Simple_stmtContext.class,0);}public Compound_stmtContext compound_stmt() {return getRuleContext(Compound_stmtContext.class,0);}public Single_inputContext(ParserRuleContext parent, int invokingState) {super(parent, invokingState);}@Override public int getRuleIndex() { return RULE_single_input; }@Overridepublic void enterRule(ParseTreeListener listener) {if ( listener instanceof Python3Listener ) ((Python3Listener)listener).enterSingle_input(this);}@Overridepublic void exitRule(ParseTreeListener listener) {if ( listener instanceof Python3Listener ) ((Python3Listener)listener).exitSingle_input(this);}
}

使用NEWLINE作为属性
将simple_stmt和compound_stmt用作子项

我应该得到这样的东西：

<Single_input NEWLINES="..."><Simple_stmt>...</Simple_stmt><Compund_stmt>...</Compunt_stmt>
</root>

好。对我来说，看课并识别这些元素非常容易，但是我如何自动做到这一点呢？

反思，显然，您会思考。

是。那行得通。但是，如果我们有多个元素怎么办？参加本课：

public static class File_inputContext extends ParserRuleContext {public TerminalNode EOF() { return getToken(Python3Parser.EOF, 0); }public List NEWLINE() { return getTokens(Python3Parser.NEWLINE); }public TerminalNode NEWLINE(int i) {return getToken(Python3Parser.NEWLINE, i);}public List stmt() {return getRuleContexts(StmtContext.class);}public StmtContext stmt(int i) {return getRuleContext(StmtContext.class,i);}public File_inputContext(ParserRuleContext parent, int invokingState) {super(parent, invokingState);}@Override public int getRuleIndex() { return RULE_file_input; }@Overridepublic void enterRule(ParseTreeListener listener) {if ( listener instanceof Python3Listener ) ((Python3Listener)listener).enterFile_input(this);}@Overridepublic void exitRule(ParseTreeListener listener) {if ( listener instanceof Python3Listener ) ((Python3Listener)listener).exitFile_input(this);}
}

现在，方法NEWLINE和stmt返回列表。您可能还记得，一般而言，泛型在Java中不能很好地与反射结合使用。在这种情况下，我们很幸运，因为有一个解决方案：

Class clazz = Python3Parser.File_inputContext.class;
Method method = clazz.getMethod("stmt");
Type listType = method.getGenericReturnType();
if (listType instanceof ParameterizedType) {Type elementType = ((ParameterizedType) listType).getActualTypeArguments()[0];System.out.println("ELEMENT TYPE "+elementType);
}

这将打印：

元素类型类me.tomassetti.antlrplus.python.Python3Parser $ StmtContext

因此，我们也可以介绍泛型。好的，使用反射并不理想，但是我们可以从中提取一些信息。

我不是100％肯定会足够，但是我们可以开始。