论文学习_Getafix: learning to fix bugs automatically

1. 引言

研究背景:现代生产代码库极其复杂并且不断更新。静态分析器可以帮助开发人员发现代码中的潜在问题(在本文的其余部分中称为错误),这对于在这些大型代码库中保持高代码质量是必要的。虽然通过静态分析尽早发现错误是有帮助的,但修复这些错误的问题在实践中仍然主要是手动任务,阻碍了静态分析工具的采用。

现存问题:大多数静态分析器都会查找常见错误类别的实例,例如潜在的空取消引用、流行 API 的错误使用或特定语言结构的误用。研究团队观察到,针对特定错误类别的修复通常彼此相似:它们有一个模式。也就是说,过去人类对同一错误类别的修复可能会提供有关如何修复该错误类别的未来实例的见解。鉴于这一观察,是否可以通过学习过去的修复来自动修复发现的错误?

研究内容:论文通过学习过去的修复来解决自动修复常见错误类别实例的问题。论文假设两个输入:(1)修复特定类型错误的一组更改,例如来自代码库的版本历史记录。这些变化可以作为训练数据来学习修复模式。(2) 一段带有我们要修复的静态分析警告的代码。仅给出这两个输入,问题是预测解决方案,以类似于或等于人类开发人员所做的方式解决静态分析警告。通过自动生成修复程序并仅将是否应用修复程序的最终决定留给人类,可以大大减少解决静态分析器指出的错误所花费的总体工作量。

论文专注于那些具有不平凡但重复性修复的错误。一方面,有些错误类别通常意味着特定的修复。例如,对于建议某个字段为最终结果的警告,实施自动修复建议非常简单。这种自动修复可以由该规则的作者在静态分析器中定义,而不需要知道应用该规则的特定上下文;事实上,有些容易出错规则带有自动修复功能。另一方面,一些错误需要复杂的、特定于应用程序的修复,例如用户进行一系列特定交互后 UI 选项卡不显示的问题。在这里,论文的目标是介于这两个极端之间的错误类别,其中找到修复程序并非易事,但典型的修复程序属于一组重复出现的修复模式。对于此类错误类别,通常存在不止一种方法来解决问题,并且解决错误类别的特定实例的正确方法取决于上下文,例如,静态分析警告周围的代码。

作为本工作中针对的错误类别的一个示例,请考虑 NullPointerExceptions 仍然是 Java 和其他语言中最普遍的错误之一。如果静态分析器警告潜在的空取消引用,开发人员可以通过各种方式解决该问题。上图显示了空取消引用错误修复的三个匿名示例,这些示例分别向现有 if 条件添加了一个连接、用三元运算替换了调用以及添加了提前返回。虽然所有这些修复都引入了某种空检查,但确切的修复在很大程度上取决于现有的代码。除了这些示例之外,还有更多方法可以修复空取消引用错误,例如,通过添加新的 if 语句或以分离方式扩展现有的 if 条件。学习所有这些修复模式并决定将哪一种模式应用于给定的错误代码是一个不小的问题。论文的工作旨在自动修复大规模工业软件开发中的错误。 这种设置会带来一些有趣的挑战:

  • 为了减少修复错误所花费的人力时间,该方法可能只提出少量潜在的修复方案,最好只提出一个修复方案。
  • 为了使此修复为开发人员所接受,建议的修复应该类似于人类:与人类开发人员将实现的修复非常相似或完全相同。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/43301.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ZP-UHZ系列顶装式磁翻板液位计

一、用途及特点 ZP-UHZ系列磁浮子液位计是一种能就地指示或远传显示与控制的物位仪表,它广泛用于石油、化工、轻工、电力、核工业以及食品、医药等工业中,对各种塔、罐、槽、箱等容器中介质的液位进行指示和控制。 ZP-UHZ系列磁浮子液位计的指示部分及发…

jmeter-beanshell学习7-props获取全局变量和设置全局变量

继续写点不痛不痒的小东西。第一篇写了vars设置变量,但是vars只能作用在同一个线程组。跨线程组情况比较少,要是用到跨线程组,有个pros,用法和vars一样。 在setup线程组设置变量a,执行的时候,jmeter会先执行…

第二证券:转股溢价率是什么意思?高好还是低好?

转股溢价率是指可转债在商场上的交易价格相对于其转股价值的溢价份额,能够用来衡量投资者为取得将债券转换为股票权力而付出的额定金额,是可转债的重要指标。 转股溢价率的核算公式为:溢价率=(转债价格-转股价值&…

MySql性能调优01-[数据结构和索引]

数据结构和索引 什么是索引索引的种类常见索引数据结构和区别二叉树 红黑树 什么是索引 索引的种类 在Mysql中索引是在存储引擎层实现的,而不是在服务层实现的 按数据结构分:Btree索引、Hash索引、Full-text索引按存储结构分:聚簇索引、非聚…

【Python百日进阶-Web开发-Peewee】Day296 - 查询示例(五)聚合2、递归

文章目录 14.6.13 列出每个指定设施的预订总小时数 List the total hours booked per named facility14.6.14 列出每位会员在 2012 年 9 月 1 日之后的首次预订 List each member’s first booking after September 1st 201214.6.15 生成成员名称列表,每行包含成员总数 Produc…

闲话银行家舍入法,以及在程序中如何实现

前言 相信对于四舍五入的舍入法,大家都耳熟能详,但对于银行家舍入法,可能就会比较少接触了! 可是在金融界,银行家舍入法可是大名鼎鼎的主角之一,主要应用于金融领域和涉及货币计算的场合。 那么&#xf…

异步轮询 Web API 的实现与 C# 示例

在现代软件开发中,异步轮询 Web API 是一种常见的做法,尤其是在需要定期从服务器获取数据更新的场景下。C# 作为一种功能强大的编程语言,提供了丰富的异步编程支持,使得实现异步轮询变得相对简单。本文将介绍如何使用 C# 快速实现…

Google Guava Cache简介

目录 简介和Redis的区别 简介 Google Guava 是一个开源的 Java 库,其中提供了一系列强大的工具来简化 Java 开发工作。其中,Guava Cache 组件提供了一个内存缓存的实现,可以显著提高应用程序的性能。这是一个高效且灵活的缓存解决方案&#…

conda 创建新的虚拟环境报错

conda 创建新的虚拟环境报错 CorruptedEnvironmentError: The target environment has been corrupted. Corrupted environments most commonly occur when the conda process is force-terminated while in an unlink-link transaction. 把错误的文件删除如A.json 再重新运行…

JavaWeb-js(4)

js事件 在前端页面中,js程序大多数是由事件来驱动的,当触发某些事件的时候,可以使用js负责响应。 js事件由三部分组成: 事件源——》指的是被触发的对象; 事件类型——》如何触发的事件,如:鼠标单击、双击、键盘操作等;…

钓鱼网站制作-克隆163企业邮箱

这里克隆163企业邮箱比较费劲,和之前的还不一样,这个克隆的目录比较多,发现好多工具都克隆不全,要不就是缺少图片要不就是缺少功能 首先效果 可以看到成功记录账户密码,接下来再来伪装到域名 这里克隆网站使用神器 …

stm32使用单通道规则组ADC

Driver_ADC.c 如果需要关闭adc转换,只需要设置CNT,将其置为0,后面再转换一次就停止了。 #include "Driver_ADC.h"void Driver_ADC1_Init(void) {/* 1. 时钟配置 *//* 1.1 adc时钟 */RCC->APB2ENR | RCC_APB2ENR_ADC1EN;RCC-&g…

bev 之 fastBEV

前面我们提到bev 之 LSS, 知道视觉的BEV方案的主要痛点在于: 1、depth 的预测 2、图像特征到BEV特征之间的视图变换消耗大量计算 LSS 为什么需要D维深度 占据大量消耗的原因是LSS 对每个图像特征点引入深度D,即假设每个像素上存在可能的D维深度。也就是假设不同像…

ubuntu18虚拟机克隆后不能上网和磁盘损坏问题

小学期直接给学弟学妹们自己配好的克隆的虚拟机,结果出现了这两种问题,参考了网上好多资料,太多了忘了存了,花了好久的时间才解决,这里记录一下。 磁盘损坏问题: 网络无法连同问题,ip addr发现…

特征融合篇 | YOLOv10改进之在Neck网络中添加加权双向特征金字塔BiFPN

前言:Hello大家好,我是小哥谈。在计算机视觉任务中,特征金字塔网络(FPN)是一种常用的方法,它通过构建不同尺度的特征图来捕获不同尺度的目标。然而,传统的FPN存在一些缺点,如特征融合…

解锁Postman的API参数化:动态请求的秘诀

🔑 解锁Postman的API参数化:动态请求的秘诀 在API测试的世界里,参数化是构建灵活、可重用请求的关键。Postman作为API开发和测试的领军工具,提供了强大的参数化功能,允许用户创建动态、个性化的API请求。本文将深入探…

计算机网络--tcpdump和iptable设置、内核参数优化策略

tcpdump工具 tcpdump命令: 选项字段: 过滤表达式: 实用命令: TCP三次握手抓包命令: #客户端执行tcpdump 抓取数据包 tcpdump -i etho tcp and host 192.168.12.36 and port 80 -W timeout.pcapnetstat命令 netst…

7.10飞书一面面经

问题描述 Redis为什么快? 这个问题我遇到过,但是没有好好总结,导致答得很乱。 答:Redis基于内存操作: 传统的磁盘文件操作相比减少了IO,提高了操作的速度。 Redis高效的数据结构:Redis专门设计…

java算法day11

二叉树的递归遍历二叉树的非递归遍历写法层序遍历 递归怎么写? 按照三要素可以保证写出正确的递归算法: 1.确定递归函数的参数和返回值: 确定哪些参数是递归的过程中需要处理的,那么就在递归函数里加上这个参数, 并且…

第二证券:销量暴跌95%,这一巨头市值蒸发超3000亿元!

在多重要素刺激下,PCB工作站上风口。 波音销量堕入停滞 6月仅售出3架客机 据央视财经,在一系列丑闻的影响下,波音公司本年出售遭到明显冲击。当地时间9日,波音发布的数据闪现,在以前一个月,该公司仅卖出…