软件架构师何志丹
说明
旧文新发,改了错别字,死链等。尽量保持“原汁原味”。
难点
如何测试。我的解决方式是:a,三种解法,看结果是否一致。b,小数据(100个点),人工排查。第一种方法,暴力法适合小数据。第二种方法:我的改进型。第三种方法:经典方法(分治法)。实验证明1000万数据时,我的算法有优势。
改进
暴力算法,O(n2)。我的改进型要点:先对所有数据按Y排序。只比较y距离小于等于已知最小距离的点对。经典方法:按Y排序,分成两部分,递归调用。合并时只比较距离分界线不超过已知最小距离的点对。
实际证明500万数据以下,我的改进算法明显优于经典算法;1000万数据时,略强于经典算法。
核心源码节选:
double Dis(const CPT& pt1,const CPT& pt2)
{return sqrt((double) (pt1.x-pt2.x)*(pt1.x-pt2.x)+(pt1.y-pt2.y)*(pt1.y-pt2.y)+(pt1.z-pt2.z)*(pt1.z-pt2.z) );
}void InitData(CPT* pts,int iNum)
{srand(time(NULL));for( int i = 0 ; i < iNum ; i++){pts[i].x = rand()%10000;pts[i].y = rand()%10000;pts[i].z = rand()%10000;}
}double Fun1(CPT* pts,const int iNum)
{double dMinDis = 10000*10000 ;for(int i = 0 ; i < iNum ; i++ )for( int j = i+1 ; j < iNum ; j++ ){const double d = Dis(pts[i] , pts[j]);if( d < dMinDis){dMinDis = d ;}}return dMinDis;
}class CCmpY
{
public:bool operator()(const CPT& pt1,const CPT& pt2){return pt1.y < pt2.y ;}
};double Fun2(CPT* pts,const int iNum)
{std::sort(pts,pts+iNum,CCmpY() );double dMinDis = 10000*10000 ;for(int i = 0 ; i < iNum ; i++ )for( int j = i+1 ; j < iNum ; j++ ){const double d = Dis(pts[i] , pts[j]);if( d < dMinDis){dMinDis = d ;}if( abs(pts[i].y - pts[j].y )> dMinDis ){break;}}return dMinDis;
}double Fun3(CPT* pts,const int iNum)
{std::sort(pts,pts+iNum,CCmpY() );if( iNum < 100 ){return Fun1(pts,iNum);}const int iMid = iNum/2 ;const double dMin1 = Fun3(pts,iMid);const double dMin2 = Fun3(pts+iMid,iNum-iMid);double dMinDis = min(dMin1,dMin2) ;for(int i = iMid-1 ; i >= 0 ; i-- )//左集合{if( abs(pts[i].y - pts[iMid].y ) > dMinDis ){break;}for( int j = iMid ; j < iNum ; j++ )//右集合{const double d = Dis(pts[i] , pts[j]);if( d < dMinDis){dMinDis = d ;}if( abs(pts[i].y - pts[j].y )> dMinDis ){break;}}}return dMinDis;
}
测试环境
似乎是WinXP VS2005(VC8)
下载
可通过以下链接下载测试数据,exe,源码(VS2005,VC8)
https://download.csdn.net/download/he_zhidan/10887801