在大语言模型没有出现之前,人们更倾向使用图形化工具或者基于窗口的软件来构建信息模型,图形化工具能够直观地表达信息模型中各元素之间的相互关系。但是图形化工具也有缺点,当描述一个复杂的信息模型时,图形会变得非常复杂和庞大。而且图形通常难以修改,复制和重用。基于CAD软件设计工程模型是非常耗费精力的“体力活”,加班熬夜的工作都是在CAD 软件的界面前渡过的。
但是,如果使用形式化语言来描述信息模型也并不轻松。形式化语言的语法有严格的规则,文档编排的主要精力都耗费在语法的检查和排错,而模型的构建只是极少的一部分。
以chatGPT为代表的大语言模型(LLM)出现,给构建信息模型提供了新的高效率方式,使用自然语言描述信息模型描述信息模型,如同AI 生成程序设计语言一样令人向往。
在传统计算机信息系统中,形式语言通过形式化方式描述语法,例如计算机语言使用BNF范式(巴科斯范式)描述语言,XML 使用了Schema 描述格式,而JSON 模型使用模板描述模型。
目前chatGPT 还没有直接理解BNF 范式的能力,它通过模板来学习和生成语言的。因此,为了让chatGPT 大模型生成形式化信息模型,需要为chatGPT 提供各种模板。
另一方面,形式化信息模型是为机器设计的,是一种相对底层的语言,为了能够使用自然语言描述模型,设计一种“高级"的中间语言更加方便。
利用大语言模型生成OPC UA 信息模型
中间语言的选择
- JSON
- XML
模型的规范
OPC UA 信息模型的描述语言是XML语言。格式为NodeSet2.xml。NodeSet.2.xml 文件能够直接导入OPC UA 服务器。
NodeSet2 文档十分繁琐,不适合人阅读和程序生成,为此,OPC UA 基金会开发了一个UAModelCompiler 程序,该程序使用一种DesignModel.xml 文档格式,UAModelCompiler 软件能够将DesignModel 文档转换成为NodeSet.xml 文档和C#的类定义。
例子:对象类型的定义。
<opc:ObjectType SymbolicName="GenericControllerType" BaseType="ua:BaseObjectType"><opc:Description>A generic PID controller</opc:Description><opc:Children><opc:Property SymbolicName="Measurement" DataType="ua:Double" /><opc:Property SymbolicName="SetPoint" DataType="ua:Double" AccessLevel="ReadWrite" MinimumSamplingInterval="1" /><opc:Property SymbolicName="ControlOut" DataType="ua:Double" /></opc:Children></opc:ObjectType>
我们在实验中选择了DesignModel 的规范来定义OPCUA 的模型。
基于ModelDesign的模型生成
模板的构建
为了让chatGPT 能够理解模型的规范,需要提供模型的模板(templates),而不是schema。模板的格式是有一些讲究的。
- 添加注释
- 模板中的内容也是提示
我们 曾经尝试将UAModelCompiler 项目中的SampleDesign.xml (一个ModelDesign 的例子)上传给kimi,但是kimi无法构建模型。
模板的例子
实验中构建了一个基于ModelDesign格式的XML模板。
<! Object template -->
<Object SymbolicName="Name" TypeDefinition="TypeDefinition"><Children>
<! elements of The Object --> <Children><! Property template --><Property SymbolicName="Value"><DefaultValue><! the 'Float' is DataType ,'0' is DefaultValue ,should replaceed By DataType and DefaultValue Of the Property --><uax:Float>0</uax:Float></DefaultValue></Property>
<! Variable template -->
<Variable SymbolicName="Name" DataType="DataType" TypeDefinition="TypeDefinition"></Variable><! Method template -->
<Method SymbolicName="Name of Method "><Description>Description of the Method</Description><InputArguments><Argument Name="Name" DataType="DataType"><Description>Description of the Argument</Description></Argument></InputArguments><OutputArguments><Argument Name="Name" DataType="DataType"><Description>Description of the Argument</Description></Argument></OutputArguments></Method>
<! Refernses template --><References><Reference><ReferenceType>Reference Type</ReferenceType><TargetId>Target of The reference </TargetId></Reference></References>
<! ObjectType Template --><ObjectType SymbolicName="Name Of The Type" BaseType="BaseType Of The Type"><Children><! elements of The ObjectType --> </Children></ObjectType> <! VariableType template --><opc:VariableType SymbolicName="Name of The Type" BaseType="BaseType of The Type" DataType="DataType Of The Type"><opc:Description>Description of The VariableType</opc:Description></opc:VariableType>
自然语言描述的模型
第一个模型:类型:对象名称:传感器类型定义:BaseObject对象成员温度传感器类型:对象类型定义:SensorType名称:温度传感器Property:名称:Temperature初始值:12.23数据类型:DoubleMethod:Name:InvertDescription: Result=-Arg1InputArguments:ArgumentName:"Arg1",DataType:DoubleOutputArguments:ArgumentName:"Result",DataType:DoubleReferences:Reference:type:ConnectedTarget:Humidity湿度传感器类型:对象类型定义:SensorType名称:湿度传感器对象成员:类型:Variable 名称: Humidity数据类型 Float初始值:90第二个模型: 名称:控制器类型类型:对象类型基类型:BaseObjectType描述:一个控制器类型Property:名称:Voltage初始值:0数据类型:Double
kimi 的提示
你是一个模型构建师,请根据提供的模板,构建信息模型
kimi的回答
<!-- 第一个模型:传感器 -->
<Object SymbolicName="Sensors" TypeDefinition="BaseObject"><Children><!-- 温度传感器 --><Object SymbolicName="TemperatureSensor" TypeDefinition="SensorType"><Children><Property SymbolicName="Temperature" DataType="Double" ValueRank="Scalar"><DefaultValue><uax:Double>12.23</uax:Double></DefaultValue></Property><Method SymbolicName="Invert"><Description>Result=-Arg1</Description><InputArguments><Argument Name="Arg1" DataType="Double"><Description>Input argument for the Invert method.</Description></Argument></InputArguments><OutputArguments><Argument Name="Result" DataType="Double"><Description>Output argument for the Invert method.</Description></Argument></OutputArguments></Method><References><Reference ReferenceType="Connected"><TargetId>Humidity</TargetId></Reference></References></Children></Object><!-- 湿度传感器 --><Object SymbolicName="HumiditySensor" TypeDefinition="SensorType"><Children><Variable SymbolicName="Humidity" DataType="Float" ValueRank="Scalar"><DefaultValue><uax:Float>90</uax:Float></DefaultValue></Variable></Children></Object></Children>
</Object><!-- 第二个模型:控制器类型 -->
<ObjectType SymbolicName="ControllerType" BaseType="BaseObjectType" IsAbstract="false"><Children><Property SymbolicName="Voltage" DataType="Double" ValueRank="Scalar"><DefaultValue><uax:Double>0</uax:Double></DefaultValue></Property></Children>
</ObjectType>
使用JSON 模板
我们也实验了使用JSON 模板构建信息模型。
模板
// Object template
{"Name": "The Name Of The Object","Type": "Object","Description": "Description of The Object","Children": [//The Elements of the Object]
}
// Property template
{"Name": "The Name of Property","DataType": "DataType of Property",
}
//Variable Template
{"Name": "The Name of Variable","Type": "Variable","Description": "Description of The Variable","DataType": "The DataType of Variable","Value": "The Default Value of The Variable"
}
//Method Template
{"Name": "The Name of The Method","Type": "Method","Arguments": {"InputArgument": [{"Name": "The Name Of the Argument","DataType": "DataType of The Argument",}],"OutputArgument": [{"Name": "The Name Of the Argument","DataType": "DataType of The Argument",}],}
}
//References Template
{"Type": "References","Reference": [{"Type": "Type Of the Reference","Target": " Name of Element referenced"}]
}
自然语言的信息
第一个模型:类型:对象名称:Sensor类型定义:BaseObject对象成员温度传感器类型:对象类型定义:SensorType名称:TemperatureSensor对象的成员:1 属性名称:Temperature类型:Property初始值:12.23数据类型:Double2 方法名称:InvertDescription: Result=-Arg1InputArguments:ArgumentName:"Arg1",DataType:Double,OutputArguments:ArgumentName:"Result",DataType:Double3 References:type:ConnectedTarget:Humidity湿度传感器类型:对象类型定义:SensorType名称:湿度传感器对象成员:类型:Variable 名称: Humidity数据类型 Float初始值:90第二个模型: 名称:控制器类型类型:对象类型基类型:BaseObjectType描述:一个控制器类型Property:名称:Voltage初始值:0数据类型:Double
kimi 的提示
根据JSON 模板,根据提供的信息构建信息模型
kimi 的回答
//第一个模型:Sensor对象
{"Name": "Sensor","Type": "Object","Description": "BaseObject","Children": [{"Name": "TemperatureSensor","Type": "Object","Description": "SensorType","Children": [{"Name": "Temperature","Type": "Property","DataType": "Double","Value": "12.23"},{"Name": "Invert","Type": "Method","Arguments": {"InputArgument": [{"Name": "Arg1","DataType": "Double"}],"OutputArgument": [{"Name": "Result","DataType": "Double"}]},"Description": "Result=-Arg1"},{"Type": "References","Reference": [{"Type": "Connected","Target": "Humidity"}]}]},{"Name": "Humidity","Type": "Variable","Description": "Humidity Sensor","DataType": "Float","Value": "90"}]
}
//第二个模型:控制器类型
{"Name": "ControllerType","Type": "ObjectType","BaseType": "BaseObjectType","Description": "A controller type","Children": [{"Name": "Voltage","Type": "Property","InitialValue": "0","DataType": "Double"}]
}
结果是正确的
结论
自然语言生成形式化语言是令人兴奋的课题,具体实现过程中,设计模板是关键。模板中应该包含描述和提示信息。设计模板的工作需要对OPC UA 的信息模型有十分详细的了解。
实验表明,XML 的模板看来要比JSON 模板更好一点。