Java文件合并变得语义化

与任何程序员交谈,并询问他应该如何进行合并:“它应该理解代码,对其进行解析,然后根据结构进行合并” –他很可能会说。

而这恰恰是SemanticMerge for Java所做的:它解析要合并的文件(加上祖先或“文件在更改之前的状态”)并根据该信息进行操作。

为什么所有关于合并的嗡嗡声?

开发软件是一个协作过程。 如果您在团队中工作,迟早会有两个开发人员修改同一个文件。 每当发生这种情况
您将不得不合并。 实际上,合并并不局限于创建分支(正如许多人会说的那样),而是绑定到在相同文件上工作的开发人员,即使他们在同一个分支上进行合并(如果两个人在同一个分支上,在同一个文件上工作,他们将必须在签到时合并-或在Git行话中“提交”。

在合并方面,新一代的分布式版本控制系统(DVCS)比上一代做得更好。 这就是为什么许多人从SVN,CVS和较旧的替代产品跳到Git的原因。

下一步不仅是在如何处理文件方面的更好算法,下一步是创建一种更好的机制来合并“文件内部”,这正是SemanticMerge的全部意义所在。

SemanticMerge旨在降低保持代码干净的成本

在开发合并工具时,我们始终牢记两个图形:1981年的Barry Bohem的更改成本和20年后的Kent Beck的相同图形:

时间贝克

一代又一代的开发人员被教导“波西姆原理”:“进行生产变更,与分析阶段引入的相同变更相比,这将花费您一笔巨款”。

然后,贝克提出了类似的内容:“保持代码干净,更改成本将保持不变”,这是敏捷方法背后的基石。

而这恰恰是SemanticMerge背后的口头禅:保持代码干净。 为什么? 因为它有回报。

通常,您会看到需要重新布置的类:“放下这两个私有方法,将公共构造函数上移,将私有字段移至底部……”但是您不这样做的原因是,也许有人触摸该文件,合并将变得地狱。 这正是SemanticMerge所解决的问题:它“知道”您移动了一个方法,因此不会被它所愚弄。

语义合并

现在让我们研究一个典型的语义合并情况。 假设您有一个带有几种方法的类。 第一个开发人员将其中一个方法移动到类中的其他位置,并且还修改了该方法。 同时,第二个开发人员在原始位置修改了该方法。

查看下图:

语义合并

常规的基于文本的合并工具将无法处理这种情况,但是SemanticMerge能够识别该方法发生了什么并提出以下合并情况:

语义合并无为

如您所见,它标识方法“ onBuildHeaders”已被并行修改(检查打印方法名称的栏两侧的“ c”图标),并且已移至其中一个贡献者(选中“ m”图标)。

现在,进行合并的开发人员可以在“ onBuildHeaders”方法上运行“合并”,该方法将仅合并冲突的方法,并保留新位置。

SemanticMerge如何工作?

您可能会猜到,SemanticMerge首先解析所涉及的3个文件的代码(原始文件加上两个贡献者),然后计算每个文件的结构:它是代码的树状表示。

完成此操作后,SemanticMerge开始使用3棵树:首先,它计算出一个贡献者和原始版本之间的差异,然后与另一个贡献者重复该过程。

第三步是合并计算本身:它将遍历两对差异,并检查它们是否碰撞。 如果它们这样做,则存在合并冲突。 如果同一方法已被移动或修改两次,以此类推,则可能发生这种情况。 计算会稍微复杂一点,因为不仅必须在冲突相同方法时计算冲突,而且还必须在容器中存在冲突时计算冲突(例如在父类之间进行“有区别的”重命名等)。

还值得补充的是,为了在重命名方法(或字段,属性等)时跟踪它们,SemanticMerge计算“相似性索引”以查看方法主体之间的接近程度以及匹配度何时良好,它假定它是相同的元素。

一些数字

我们重新运行了约4万个合并,下载了将近500个开源项目。 这意味着我们提取存储库,找到所有合并,然后通过SemanticMerge工具再次运行它们。

这样做,我们发现了以下数字:

  • 当前的合并中有23%是“语义”的-这意味着它们具有的内容不是“变-变”冲突。 它可以是代码移动,在同一位置添加多个方法,移动和更改方法等等。
  • 在这4万次合并中,我们发现1.54%的合并从手动变为全自动。 这不是一个很大的数字,这意味着一旦团队开始使用SemanticMerge,它就会增长。 (这些数字是使用与当前语言无关的合并工具重新运行合并的结果,因此开发人员倾向于避免对文件进行复杂的更改)。
  • 当我们通过SemanticMerge和传统的基于文本的合并工具运行代码时,我们计算了合并冲突中涉及的行数,我们发现,使用SemanticMerge,冲突中涉及的代码行减少了97%……这意味着工作量减少了去做!!

数字语义

免费开源

在测试SemanticMerge时,我们提取了大约500个长期运行,狂热的开放源代码存储库,然后“重放”了所有合并。 在列表中,有诸如hibernate,openjdk,apache-lucene,jbos,monodevelop,mono,monomac,monogame,nhibernate之类的存储库,这确实很有帮助。

因此,我们决定免费为对开源项目做出贡献的开发人员免费使用SemanticMerge,因为我们相信可以回馈。 您可以在这里查看 !

参考: SemanticMerge博客上的JCG合作伙伴 Pablo Santos的Java文件合并变得语义化

翻译自: https://www.javacodegeeks.com/2013/06/java-file-merging-goes-semantic.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/368202.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

eval函数

#! /usr/bin/env python# -*- coding: utf-8 -*-# __author__ "Deakin"# Email: 469792427qq.com# Date: 2018/1/14#1. 运行程序输出第一级菜单#2. 选择一级菜单某项,输出二级菜单,同理输出三级菜单#3. 菜单数据保存在文件中#4. 让用户选择是…

KnockoutJS-快速入门

虽然在WPF中接触过MVVM模式,可是刚开始在Web中接触到Knockout.JS让我大吃一惊,简化了好多工作量,原来可能需要一大堆的JS脚本完成的工作量,被释放许多。接触KnockoutJS一年多了,在好多个项目中也用到过,虽然…

几道web前端练习题目

在 HTML 语言中&#xff0c;以下哪个属性不是通用属性&#xff1f;A]<class>B]<title>C]<href>D]<style> 在线练习&#xff1a;http://hovertree.com/tiku/bjaf/qi1g37nf.htm 在 CSS 样式定义中&#xff0c;以下哪种 RGB 颜色值是 Web 安全色&#xf…

php如何导入数据,““php中如何将execl的数据导入到数据库中

php中如何将execl的数据导入到数据库中1.使用PHPExcel Parser Pro&#xff0c;但是这个软件为收费软件&#xff1b;2.可EXCEL表保存为CSV&#xff0c;然后通过phpmyadmin或者SQLyog导入&#xff0c;SQLyog导入的方法为&#xff1a;将EXCEL表另存为CSV形式&#xff1b;打开SQLyo…

Spring MVC错误处理流程

使用Spring MVC可以通过三种方式处理异常流&#xff0c;其目的是拦截任何应用程序异常&#xff0c;并向用户提供友好而信息丰富的视图。 1.在web.xml文件中使用error-page标记&#xff1a; 这是servlet规范驱动的方法&#xff0c;其中基于HTTP响应代码或异常类型来拦截从应用程…

Busybox下tftp命令使用详解

参数说明&#xff1a;-l 是local的缩写&#xff0c;后跟存在于Client的源文件名&#xff0c;或下载Client后 重命名的文件名。 -r 是remote的缩写&#xff0c;后跟Server即PC机tftp服务器根目录中的源文 件名&#xff0c;或上传Se…

php 获取sql字段名,php – 使用DISTINCT和UNION在SQL查询中获取字段名称

我有以下查询&#xff1a;SELECT DISTINCT(uniq)FROM(SELECT sex AS uniq FROM type4UNIONSELECT fason AS uniq FROM type4UNIONSELECT color AS uniq FROM type4UNIONSELECT size AS uniq FROM type4) AS Temp它运作得很好,它返回&#xff1a;[uniq] > some unique value是…

OC学习笔记——基础控件篇

因为之前做iOS开发用的都是swift语言&#xff0c;没有用过oc&#xff0c;本篇博客整理一下UIKIt中组件基于oc的使用&#xff0c;顺便把每个组件在秋招中遇到的问题整理一下。 UIView的使用 UIView继承链&#xff1a;NSObject->UIResponder->UIView UIView生命周期&…

大数据开源安全

在安全性方面从未有&#xff08;恕我直言&#xff09;已经足够了开源解决方案和布鲁斯已经撰写了有关这几个 时间在过去 &#xff0c;而且也没有必要再次改写参数。 现在&#xff0c;随着市场上“ NoSQL”和“大数据”开源趋势的发展&#xff0c;安全终于有了交集……如果我愿…

如何在一个页面添加多个不同的kindeditor编辑器

kindeditor官方下载地址&#xff1a;http://kindeditor.net/down.php &#xff08;入门必看&#xff09;kindeditor官方文档&#xff1a;http://kindeditor.net/doc.php &#xff08;入门必看&#xff09;Kindeditor编辑器初始化参数文档&#xff1a;http://kindeditor.net/doc…

JSONArray.fromObject不执行且不报错问题的解决

今天在写javaweb工程的时候需要向前台传json格式的数据&#xff0c;用到了json-lib-2.4-jdk15.jar等一系列包&#xff0c;然而却出现如下状况&#xff1a; CityBean是一个javaBean&#xff0c;我们看到&#xff0c;控制台只打印出了list的内容&#xff0c;而下面的两个却没能打…

爬虫-scrapy

阅读目录 一 介绍二 安装三 命令行工具四 项目结构以及爬虫应用简介 五 Spiders六 Selectors七 Items八 Item Pipeline九 Dowloader Middeware十 Spider Middleware十一 settings.py十二 爬取亚马逊商品信息一 介绍 Scrapy一个开源和协作的框架&#xff0c;其最初是为了页面抓取…

swagge php token,swagger在thinkphp6的使用方式

/*** OA\Get(path"/api/article",* tags{"文章管理"},* summary"文章列表",* OA\Parameter(name"token", in"header", description"token", OA\Schema(type"string", default"123456")),* OA…

Java垃圾回收(4)

G1&#xff1a;垃圾优先 G1收集器是热点JVM中要实现的最新收集器。 自Java 7 Update 4以来&#xff0c;它一直是受支持的收集器。OracleGC团队也公开表示&#xff0c;他们对低暂停GC的希望是完全实现的G1。 这篇文章来自我之前的垃圾收集博客文章&#xff1a; 热点GC概述 。 …

Html5 冒泡排序演示

本文通过一个简单的小例子&#xff0c;简述冒泡算法在B/S中的简单使用&#xff0c;仅供学习分享使用&#xff0c;如有不足之处&#xff0c;还请指正。 概述 冒泡排序&#xff08;Bubble Sort&#xff09;&#xff0c;是一种计算机科学领域的较简单的排序算法。 它重复地走访…

Codeforces 765F. Souvenirs

Description 给出长度为 \(n\) 的序列,有 \(Q\) 组询问,问 \(|a_i-a_j|\),\(l<i,j<r\)的最小值是多少?题面 Solution 无删莫队. 把询问按照左端点分块,同一块内按右端点递增排序,类似于莫队 问题在于回溯: 直接删除的话无法更新最小值,但是可以一边插入一边删除 这样我们…

学习六 - Python 函数

Python 学习 - 函数 1.创建和调用函数 创建函数 def function_name(): #无参数函数xxxdef function_name(par1, par2, ...): #带参数函数xxx记住三个关键的东西&#xff1a;def, (), : 调用 function_name() #无参数函数调用function_name(arg1, arg2, ...) #带参数函数…

一种编写测试的好方法

测试。 最近我一直在考虑进行测试。 作为我对各种项目所做的代码审查的一部分&#xff0c;我已经看到了数千行未经测试的代码。 这不仅是测试覆盖率统计数据指出这一点的情况&#xff0c;还更多是该项目中根本没有任何测试的情况 。 我一直听到这种悲惨状况的两个原因&#xff…

rem、px、em之间的区别以及网页响应式设计写法

个人收藏用&#xff0c;转载自&#xff1a;http://www.w3cplus.com/css3/define-font-size-with-css3-rem 在Web中使用什么单位来定义页面的字体大小&#xff0c;至今天为止都还在激烈的争论着&#xff0c;有人说PX做为单位好&#xff0c;有人说EM优点多&#xff0c;还有人在说…

游戏服务器架构图

1&#xff1a;ARPG类型游戏 2:MMORPG 3:MOBA 4:卡牌类 5&#xff1a;棋盘类 转载于:https://www.cnblogs.com/like-minded/p/8297718.html