最近在学习机器学习的相关算法,写到DbScan算法发现在簇扩展时用到两个邻域中的点会重合,于是尝试了合并两个链表的两个算法。
最初用到这个方法,认为它简单易用。思路是定义一个链表存放合并后的链表list,首先往该链表中加入a链表,再去掉b链表,这样list中就剩下只有a链表有而b链表没有的节点,最后加上b链表,就不会存在重复元素。
设aList[a,b,c,d,e]bList[b,c,d,f]
public ArrayList<PointTest> expandCluster(ArrayList<PointTest> aList,ArrayList<PointTest> bList) {ArrayList<PointTest> list = new ArrayList<PointTest>();list.addAll(aList);list.removeAll(bList);list.addAll(bList);return list;}
验证算法过程中发现上述方法合并后得到的链表为list[a,e,b,c,d,f],而我在DbScan中想要的效果是list[a,b,c,d,e,f],于是改变了一下思路,如下:
public ArrayList<PointTest> expandCluster(ArrayList<PointTest> aList,ArrayList<PointTest> bList) {for (int i = 0; i < bList.size(); i++) {if (aList.contains(bList.get(i)))bList.remove(i);}aList.addAll(bList);return aList;}