RIP RETE时间获得PHREAKY

我刚刚完成了我称为PHREAK的新规则算法的一些高级文档,这是混合推理中的一个文字游戏。 它仍然有点粗糙和高水平,但希望仍然很有趣。 它建立在ReteOO之上,非常好阅读。

ReteOO算法

ReteOO是在3、4和5系列发行版中开发的。 它采用RETE算法并应用了众所周知的增强功能,现有的学术文献都涵盖了所有这些增强功能:

  • 节点共享
    共享同时应用于Alpha和Beta网络。 Beta网络共享始终来自根模式。
  • 字母索引
    具有许多子级的Alpha节点使用哈希查找机制,以避免测试每个结果。
  • Beta索引连接,不存在节点和存在节点使用哈希索引它们的内存。 这减少了相等检查的联接尝试。 最近,范围索引已添加到“不存在”中。
  • 基于树的图
    联接匹配不包含对其父项或子项匹配的任何引用。 删除将不得不再次重新计算所有联接匹配,这涉及到重新创建所有那些联接匹配对象,以便能够找到应删除元组的网络部分。 这称为对称传播。 树形图提供了父级和子级引用,因此删除仅需遵循这些引用即可。 这是不对称传播。 结果更快,对GC的影响更小,并且更可靠,因为值的更改不会在不通知引擎的情况下导致内存泄漏。
  • 就地修改
    传统的RETE将修改实现为删除+插入。 这将导致所有联接元组都经过GC处理,其中许多作为插入的一部分再次被重新创建。 相反,就地修改传播为单遍,检查每个节点
  • 反应性
    也称为“新触发条件”。 允许更精细的反应性来更新。 模式可以对特定属性的更改做出反应,而忽略其他属性。 这样可以减轻递归问题,并有助于提高性能。
  • 子网
    否,“存在”和“累积”可以各自具有嵌套的条件元素,这些条件元素构成了子网。
  • 向后链接
    支持用于反向链接的Prolog样式派生树。 该实现是基于堆栈的,因此对于大型图不存在方法递归问题。
  • 懒惰真相维护
    真相维护会产生运行时成本,无论是否使用TMS,都会产生运行时成本。 惰性TMS仅在首次使用时将其打开。 此外,它仅针对该对象类型启用,因此其他对象类型不会产生运行时成本。
  • 基于堆的议程
    议程使用二进制堆队列按显着性对规则匹配进行排序,而不是使用任何线性搜索或维护方法。
  • 动态规则
    可以在运行时添加和删除规则,而引擎仍将填充数据。

PHREAK算法

Drools 6引入了一种新算法,试图解决RETE的一些核心问题。 该算法不是从头开始重写的方法,它结合了ReteOO的所有现有代码及其所有增强功能。 尽管PHREAK是RETE算法的改进,但它不再被归类为RETE实现。 就像动物进化超过特定点并改变关键特征一样,该动物也被归类为新物种。 无论优化如何,有两个关键的RETE特征可强烈识别任何衍生菌株。 这是一个渴望的,面向数据的算法。 在插入,更新或删除操作期间完成所有工作的位置; 急于产生所有规则的所有部分匹配。 相比之下,PHREAK被描述为一种懒惰的,面向目标的算法。 其中部分匹配会被严重延迟。

RETE的这种渴望会导致大型系统中的大量用户流失,并浪费大量工作。 浪费的工作归类为不会导致解雇的匹配工作。

PHREAK受到许多算法的启发。 包括(但不限于)LEAPS,RETE / UL和面向集合的匹配。 PHREAK具有ReteOO部分中列出的所有增强功能。 此外,它还添加了以下增强功能集,将在以下各段中进行详细说明。

  • 三层上下文记忆; 节点,段和规则存储器。
  • 基于规则,分段和节点的链接。
  • 懒惰(延迟)规则评估。
  • 孤立的规则评估。
  • 面向集合的传播。
  • 基于堆栈的评估,包括暂停和继续。

当PHREAK引擎启动时,所有规则都被认为是未链接的,因此,当规则未链接时,将不会进行任何规则评估。 进入Beta网络之前,插入,更新和删除操作已排队。 根据最有可能导致解雇的规则,使用一种简单的启发式方法来选择下一个评估规则; 这会延迟评估和触发其他规则。 尽管尚未完成任何工作,但只有在规则中填充了所有正确输入后,该规则才被视为已链接。 而是创建一个代表规则的目标,并将其放入优先级队列中。 这是由显着性命令的。 每个队列本身都与AngendaGroup相关联。 只有活动的AgendaGroup会检查其队列,以最高显着性弹出规则的目标,并将其提交评估。 因此,完成的工作从插入,更新,删除阶段转移到fireAllRules阶段。 仅评估为其创建目标的规则,而根据这些事实进行的其他潜在规则评估将被延迟。 在评估各个规则时,仍然可以通过分段过程来实现节点共享,这将在后面说明。

RETE中每次成功的加入尝试都会生成一个元组(或令牌,或部分匹配),该元组将传播到子节点。 因此,它被描述为面向元组的算法。 对于到达的每个子节点,它将尝试与该节点的另一侧进行联接,再次,每次成功的联接尝试都将立即传播。 这将产生下降递归效果。 当节点网络从进入beta网络的点到所有可到达的叶节点上下左右波动时,对节点网络进行处理。

PHREAK传播是面向集合(或面向集合)的,而不是面向元组的。 对于正在评估的规则,它将访问第一个节点并处理所有排队的插入,更新和删除。 将结果添加到集合中,并将该集合传播到子节点。 在子节点中,所有排队的插入,更新和删除都将被处理,并将结果添加到同一集合中。 完成后,该集合将传播到下一个子节点,依此类推,直到到达终端节点。 这将创建一个单一的管道类型效果,该效果与当前正在评估的规则隔离。 这将创建批处理效果,可以为某些规则构造提供性能优势。 例如具有累积作用的子网。 将来,它将依靠多种方式来利用多核计算机。

链接和取消链接使用基于网络分段的分层位掩码系统。 构建规则网络后,将为由同一组规则共享的节点创建分段。 规则本身是由段的路径组成的,尽管如果没有共享,则将是一个段。 将位掩码偏移量分配给段中的每个节点。 另外,将另一个位掩码(分层)分配给规则路径中的每个段。 当至少有一个输入(数据传播)时,节点的位设置为on。 每个节点的位设置为on时,段的位也设置为on。 相反,如果任何节点的位设置为关闭,则该段也将设置为关闭。 如果将规则路径中的每个细分均设置为启用,则将规则链接到该规则中,并创建一个目标来计划该规则以进行评估。 相同的位掩码技术还用于跟踪脏节点,段和规则。 如果自上次评估以来认为已变脏的规则,则可以安排已链接的规则进行评估。

这样可以确保没有规则会评估部分匹配,如果由于其中一个联接没有数据而导致它无法导致规则实例的情况,则不会评估。 这在RETE中是可能的,并且即使最后一个连接为空,也会为所有节点产生混乱的匹配尝试。

虽然增量规则评估始终从根节点开始,但脏位掩码用于允许跳过不脏的节点和段。

使用每个节点至少存在一项数据是一种相当基本的启发式方法。 未来的工作将试图进一步延迟链接; 使用诸如弧一致性的技术来确定匹配是否会导致规则实例触发。

由于RETE仅具有一个单一的存储器单元(节点存储器),因此PHREAK具有3个级别的存储器。 这样可以在评估规则期间获得更多的上下文理解。

PHREAK 3分层存储系统

分层内存

示例1显示了具有三种模式的一条规则; A,B和C。它形成单个段,节点的位1、2和4。

示例1:单一规则,不共享

段1

示例2演示了添加另一个共享模式A的规则时会发生的情况。A放置在其自己的细分中,每个规则导致两个细分。 这两段构成了各自规则的路径。 第一条路段由两条路径共享。 当链接A时,该段将被链接,然后迭代该段共享的每个路径,将位1设置为on。 如果稍后打开B和C,则链接到路径R1的第二段; 这将导致R1的位2被打开。 将R1的位1和位2设置为打开后,现在将链接该规则,并创建一个目标以计划该规则以供以后评估和触发。

评估规则时,正是可以共享匹配结果的细分。 每个段都有一个临时存储器,用于将该段的所有插入,更新和删除排队。 如果要评估R1,它将处理A并得到一组元组。 该算法检测到有分段分割,并将为集合中的每个插入,更新和删除创建对等元组,并将它们添加到R2的暂存中。 这些元组将与任何现有的暂存元组合并,并等待R2最终被评估。

示例2:共享的两个规则

段2

示例3添加了第三条规则,并演示了共享A和B时发生的情况。 这次仅显示段的位。 证明R4具有3个段,R3具有3个段,R1具有2个段。 A和B由R1,R3和R4共享。 而D由R3和R4共享。

示例3:共享的三个规则

段3

当“不存在,存在或累积”节点包含多个元素时,形成子网。 在示例4中,“ B not(C)”形成子网,请注意,“ not(C)”是单个元素,不需要子网,并且在Not节点内部合并。

子网拥有自己的网段。 R1仍具有两个段的路径。 子网形成了另一个“内部”路径。 链接子网时,它将链接到外部网段。

示例4:单规则,具有子网且不共享

段4

示例5显示了可以通过不具有子网的规则对子网节点进行分片。 这导致子网段被分成两个部分。

示例5:两条规则,一条与子网共享

段5
并非具有约束的节点和累积节点都具有特殊的行为,并且永远无法取消链接段,并且始终将其视为打开状态。

所有规则评估都是递增的,不会浪费已经重新产生的工作重新计算匹配项。

评估算法基于堆栈,而不是方法递归。 通过使用StackEntry表示要评估的当前节点,可以随时暂停和恢复评估。

当规则评估到达子网时,将为外部路径段和子网段创建StackEntry。 首先评估子网段,当集合到达子网路径的末尾时,将其合并到其馈入的外部节点的暂存列表中。 然后恢复先前的StackEntry,在其中可以处理子网的结果。 这样做的另一个好处是,所有工作在传播到子节点之前都将被成批处理; 这对于累积节点效率更高。

相同的堆栈系统可用于有效的反向链接。 当规则评估到达查询节点时,它会通过将其放在堆栈上来再次暂停当前评估。 然后对查询进行评估,生成结果集,该结果集保存在内存位置中,以供恢复的StackEntry拾取并传播到子节点。 如果查询本身调用了其他查询,则该过程将重复,暂停当前查询,并为当前查询节点设置新的评估。

关于性能的最后一点。 通常,使用PHREAK的单个规则不会比使用RETE更快。 对于使用根上下文对象启用和禁用匹配的给定规则和相同数据集,它们都尝试相同数量的匹配并产生相同数量的规则实例,并且花费的时间大致相同。 除了带有子网的用例和积累。

但是,对于规则编写得不好的规则库,PHREAK可以认为比RETE更宽容,并且随着规则数量和复杂性的增加,性能会更适度地下降。

RETE还将为不包含所有联接的数据的规则生产部分机器。 PHREAK会避免这种情况。

因此,并不是说PHREAK比RETE快,它不会随系统的增长而变慢。

AgendaGroups对RETE的性能没有帮助,因为所有规则都在任何时候进行评估,而与组别无关。 显着性也是如此。 这就是为什么经常使用根上下文对象来限制匹配尝试的原因。 PHREAK仅评估活动议程组的规则,并且在该组内将尝试避免评估(通过显着性)不会导致规则实例触发的规则。

通过PHREAK AgendaGroups和显着性现在已成为有用的绩效工具。 根上下文对象不再需要,并且有可能对性能产生反作用,因为它们会强制刷新和重新生成规则的匹配项。

参考:在Drools&jBPM博客上,可以从我们的JCG合作伙伴 Geoffrey De Smet 获得PHREAKY的RIP RETE时间 。

翻译自: https://www.javacodegeeks.com/2013/11/r-i-p-rete-time-to-get-phreaky.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/366716.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Hadoop自学笔记(三)MapReduce简单介绍

1. MapReduce Architecture MapReduce是一套可编程的框架,大部分MapReduce的工作都能够用Pig或者Hive完毕。可是还是要了解MapReduce本身是怎样工作的,由于这才是Hadoop的核心,而且能够为以后优化和自己写做准备。 Job Client, 就是用户 Job …

VirtualDOM与diff(Vue实现)

写在前面 因为对Vue.js很感兴趣,而且平时工作的技术栈也是Vue.js,这几个月花了些时间研究学习了一下Vue.js源码,并做了总结与输出。文章的原地址:https://github.com/answershuto/learnVue。在学习过程中,为Vue加上了…

使用Java的RESTful Web服务

REST代表“代表性状态转移”,由Roy Fielding于2000年在其论文“建筑风格和基于网络的软件体系结构设计”中首次提出。 REST是一种建筑风格。 HTTP是一种协议,其中包含一组REST体系结构约束。 REST基础 REST中的所有内容都被视为资源。 每个资源都由UR…

windows npm安装webpack

Webpack: Webpack 是一个前端资源加载/打包工具。 它将根据模块的依赖关系进行静态分析,然后将这些模块按照指定的规则生成对应的静态资源。 参考下图: 安装Webpack: 1.首先需要安装node.js(npm) 下载地址:node.js dow…

JavaFX中的塔防

我想长时间使用我的游戏引擎来编写《塔防》游戏,但是由于另一个小组努力创建JavaFX《塔防》游戏,所以我认为我宁愿创建另一款游戏。 从邮件列表中,我了解到不再开发其他游戏。 因此,我决定尝试一下。 塔防是一款非常适合基于图块…

CSS pointer-events属性的使用

楔子 在前端的开发中,我们都是直接与用户接触,应该尽量让用户感到操作畅快愉悦,获得类似native的感觉。其中动画是最常用的方法。 这里的需求是,弹层的设计,这个弹层希望可以像 native 上的弹层一样,点击…

深入理解JavaScript之Event Loop

前言 最近阅读《高性能JavaScript》时,第六章谈到“通过定时器将JavaScript执行代码的控制权先让给浏览器用于更新UI状态,然后再将控制权交回给JavaScript代码,这样就可以使得页面更为流畅”,就联想到了之前理解的事件循环。 这…

使用EasyPoi导出Excel

Excel模板来自自己写死的一个excel模板,相当于是用户查询数据,数据填充到一个模板的Excel里,再导出Excel /*创建模板*/String a request.getSession().getServletContext().getRealPath("/resource/河南能源化工集团安全监控系统联网系统…

Hazelcast入门

7月,我写了一个博客向Java开发人员介绍erlang,重点介绍了这两种语言之间的一些异同。 erlang虚拟机具有许多令人印象深刻的内置功能,其中之一是它们独立于位置并且可以互相通信。 这意味着可以通过编写很少的代码行在VM之间同步数据。 如果您…

android手机最低内存,原神手机端需要哪些配置 手机端最低配置要求介绍

原神是一款由米哈游自主研发的全新开放世界冒险游戏,游戏最近迎来了pc端的首次测试,而且在不久之后就会开启原神手机端的公测版本,那么手机端需要什么配置呢?小编带来了详细的介绍。移动端预下载:9月25日下午16&#x…

AnswerOpenCV一周佳作欣赏(0615-0622)

一、How to make auto-adjustments(brightness and contrast) for image Android Opencv Image Correctionim using OpenCV for Android. I would like to know,how to make image correction(auto adjustments of brightness/contrast) for image(bitmap) in android via Open…

所有其他指标均无用

对于队列,无论是实现为JMS ,数据库表(即Ruby的Delayed :: Job用于队列的什么),甚至是Amazon的SQS ,用于评估队列状态的最常见指标是其长度。 从本质上讲,可以基于在任何给定时间队列中驻留多少消…

类似苹果数据线的android,除了常见的安卓、苹果、Type-c,还有哪些你不知道的手机数据线?...

随着智能手机日益发展,辅助智能手机的数据线配件也越来越多样。现在我们最常见的无非就是标准Micro usb口、正反随便插的Type-c接口、还有苹果Lightning数据线,那么除了这些类型数据线,你知道如今市面上还有哪些更方便好用的手机数据线吗&…

canvas入门实战--邀请卡生成与下载

1.前言 写了很多的javascript和css3的文章,是时候写一篇canvas的了。canvas是html5提供的一个新的功能!至于作用,就是一个画布。然后画笔就是javascript。canvas的用途非常的广,特别是html5游戏以及数据可视化这两个方面。现在can…

Apache ActiveMQ 5.9发布

Apache ActiveMQ团队刚刚发布了新的ActiveMQ 5.9版本 。 Apache ActiveMQ 5.9发布 自从先前的5.8版本以来,此版本是8个月的辛苦工作。 在此发行版中,我们将像往常一样对代理进行增强,并使用最新的协议(例如AMQP和MQTT&#xff…

android 美颜录像,Android 关于美颜/滤镜 利用PBO从OpenGL录制视频

前言上次我写了一遍文章《Android 关于美颜/滤镜 从OpenGl录制视频的一种方案》,里面利用ImageReader来从获取Surface上获取数据,但是经过熊皮皮的提醒,我发现多PBO的确可以实现跟ImageReader一样的效果,并且版本要求仅为Android4…

Java对象到对象映射器

我在该项目上使用了Dozer一段时间。 但是,最近我遇到了一个非常有趣的错误,它促使我环顾四周,并尝试使用其他“对象到对象”映射器。 这是我找到的工具列表: 推土机:推土机是Java Bean到Java Bean的映射器&#xff…

android媒体播放框架,Android 使用超简单的多媒体播放器JiaoZiVideoPlayer

在之前的项目中用到了视频播放的功能,在网上看了看使用了大家用的比较多的一个开源项目JiaoZiVideo可以迅速的实现视频播放的相关功能。JiaoZiVideo的简单使用集成了JiaoZiVideo后仅需这几行代码就可以实现播放视频JZVideoPlayerStandard jzVideoPlayerStandard (J…

送福利:ROKID 语音开发板免费送,开启你的物联网之旅

都让一让,我说个事情:掘金联合 Rokid 开发者社区给大家发福利啦! 掘金联合 Rokid 开发者社区为大家准备了一些福利,只要秀出你的 skill 和技术栈,就有可能获得 Rokid 全栈语音智能开发套件。 ? Rokid开箱试用活动 活…

如何使用JavaScript控制台改进工作流程

作为Web开发人员,很有必要了解如何调试代码。后台开发我们经常使用外部库来记录日志,并在某些情况下格式化显示日志,前端我们会使用断点和控制台,但是我们浏览器的控制台比我们想象的要强大得多。 当我们考虑控制台时&#xff0c…