1、算法原理
统计滤波算法是一种利用统计学原理对点云数据进行处理的方法。它主要通过计算点云中每个点的统计特性,如均值、方差等,来决定是否保留该点。算法首先会设定一个统计阈值,然后对点云中的每个点进行分析。如果一个点的统计特性与周围点的统计特性相差不大,即认为该点是可靠的,并将其保留;反之,如果一个点的统计特性与周围点相比差异较大,那么这个点可能是一个异常点或噪声点,算法会将其移除。通过这种方式,统计滤波算法能够有效地减少数据中的噪声和异常值,提高点云数据的质量。这种算法特别适用于需要对数据进行精细处理的场合,例如在高精度建模和测量中。由于其能够提供较为精确的数据处理结果,统计滤波算法在点云数据处理领域中也占有一席之地。算法的实现步骤如下:
第1步:创建点云数据的拓扑结构,如KDtree或Octree。
第2步:计算每一个点的K邻域集合。
第3步:计算每个点与其K邻域的距离dij的均值,其中i=[1,....,m] 表示点云数目,j=[1,....,k] 点的K邻域点。
第4步:计算点云数据高斯分布模型参数d~N(u,α),距离的均值u,距离的标准差α,具体公式内容如下:
第5步:计算统计滤波的阈值。
dt= u+ S*α ;
第6步:遍历所有点,如果其距离的均值大于指定置阈值,则为外点,将会被移除。
2、主要成员函数和变量
1.主要的成员变量
1)、 构建点云空间拓扑的方法,如KDtree和Octree
SearcherPtr searcher_;
2)、搜索点K邻域的个数,用于计算点的平均距离信息
int mean_k_;
3)、标准差修正因子
double std_mul_;
2.主要的成员函数
1)、设置搜索点K邻域的个数,用于计算点的平均距离,可以根据直接点云数据分布情况设置一般值15、30、50等。
inline void setMeanK (int nr_k);
2)、标准差修正因子 ,如0.1、0.3和0.5等。
inline void setStddevMulThresh (double stddev_mult)
3、主要实现代码注解
template <typename PointT> void
pcl::StatisticalOutlierRemoval<PointT>::applyFilterIndices (std::vector<int> &indices)
{// 初始化构建点云拓扑关系方法if (!searcher_){if (input_->isOrganized ())//有序点云searcher_.reset (new pcl::search::OrganizedNeighbor<PointT> ());else //无序点云数据用KD树方法searcher_.reset (new pcl::search::KdTree<PointT> (false));}searcher_->setInputCloud (input_);// 初始化需要的参数,K个邻域的索引集、距离集;所有点云数据的距离集std::vector<int> nn_indices (mean_k_);std::vector<float> nn_dists (mean_k_);std::vector<float> distances (indices_->size ());//内点、外点索引集初始化indices.resize (indices_->size ());removed_indices_->resize (indices_->size ());int oii = 0, rii = 0; // oii = output indices iterator, rii = removed indices iterator//第一步:计算所有点相对于k个最近邻域点的平均距离int valid_distances = 0;for (int iii = 0; iii < static_cast<int> (indices_->size ()); ++iii) // iii = input indices iterator{//无效点判断if (!std::isfinite (input_->points[(*indices_)[iii]].x) ||!std::isfinite (input_->points[(*indices_)[iii]].y) ||!std::isfinite (input_->points[(*indices_)[iii]].z)){//无序点的距离为0distances[iii] = 0.0;continue;}// P执行K个邻域点搜索if (searcher_->nearestKSearch ((*indices_)[iii], mean_k_ + 1, nn_indices, nn_dists) == 0){distances[iii] = 0.0;PCL_WARN ("[pcl::%s::applyFilter] Searching for the closest %d neighbors failed.\n", getClassName ().c_str (), mean_k_);continue;}// 计算点与K个邻域点之间距离的平均值double dist_sum = 0.0;for (int k = 1; k < mean_k_ + 1; ++k) // k = 0 is the query pointdist_sum += sqrt (nn_dists[k]);//将距离均值信息保存到对应索引值中 distances[iii] = static_cast<float> (dist_sum / mean_k_);valid_distances++;}// 估计距离的均值和标准差(u,a)double sum = 0, sq_sum = 0;for (const float &distance : distances){sum += distance;sq_sum += distance * distance;}//均值double mean = sum / static_cast<double>(valid_distances);//方差---》前半部分为母体方差,double variance = (sq_sum - sum * sum / static_cast<double>(valid_distances)) / (static_cast<double>(valid_distances) - 1);//标准差double stddev = sqrt (variance);//getMeanStd (distances, mean, stddev);// 计算外点阈值 ,等于=均值+标准差的修正系数double distance_threshold = mean + std_mul_ * stddev;// 第二步:根据计算的距离阈值和每个点的距离值(分辨率)对点进行分类(内点和外点)for (int iii = 0; iii < static_cast<int> (indices_->size ()); ++iii) // iii = input indices iterator{//平均距离太高的点是离群值,传递给移除的索引if ((!negative_ && distances[iii] > distance_threshold) || (negative_ && distances[iii] <= distance_threshold)){if (extract_removed_indices_)(*removed_indices_)[rii++] = (*indices_)[iii];continue;}// Otherwise it was a normal point for output (inlier)indices[oii++] = (*indices_)[iii];}// Resize the output arraysindices.resize (oii);removed_indices_->resize (rii);
}
4、代码示例
/*****************************************************************//**
* \file PCLPCLRadiusOutliermain.cpp
* \brief
*
* \author YZS
* \date January 2025
*********************************************************************/
#include<iostream>
#include <vector>
#include <ctime>
#include <pcl/point_types.h>
#include <pcl/point_cloud.h>
#include <pcl/io/auto_io.h>
#include <pcl/visualization/pcl_visualizer.h>
#include <pcl/filters/statistical_outlier_removal.h>
using namespace std;void PCLStatisticalOutlier()
{pcl::PointCloud<pcl::PointXYZ>::Ptr cloud(new pcl::PointCloud<pcl::PointXYZ>());std::string fileName = "E:/PCLlearnData/11/table.pcd";pcl::io::load(fileName, *cloud);std::cout << "Cloud Size:" << cloud->points.size() << std::endl;//保存滤波后的结果点云pcl::PointCloud<pcl::PointXYZ>::Ptr cloudFilter(new pcl::PointCloud<pcl::PointXYZ>());//统计滤波算法pcl::StatisticalOutlierRemoval<pcl::PointXYZ> sorFilter;// 统计滤波器对象sorFilter.setInputCloud(cloud);sorFilter.setMeanK(30);//设置搜索点K邻域的个数sorFilter.setStddevMulThresh(0.3);//设置标准差修正因子 ,如0.1、0.3和0.5等sorFilter.filter(*cloudFilter); // 执行滤波,并且保存结果到cloudFilter中std::cout << "filter Cloud Size:" << cloudFilter->points.size() << std::endl;//结果可视化
// PCLVisualizer对象pcl::visualization::PCLVisualizer viewer("FilterVIS");//创建左右窗口的ID v1和v2int v1(0);int v2(1);//设置V1窗口尺寸和背景颜色viewer.createViewPort(0.0, 0.0, 0.5, 1, v1);viewer.setBackgroundColor(0, 0, 0, v1);//设置V2窗口尺寸和背景颜色viewer.createViewPort(0.5, 0.0, 1, 1, v2);viewer.setBackgroundColor(0.1, 0.1, 0.1, v2);// 添加2d文字标签viewer.addText("v1", 10, 10, 20, 1, 0, 0, "Txtv1", v1);viewer.addText("v2", 10, 10, 20, 0, 1, 0, "Txtv2", v2);//设置cloud1的渲染属性,点云的ID和指定可视化窗口v1viewer.addPointCloud(cloud, "cloud1", v1);viewer.setPointCloudRenderingProperties(pcl::visualization::PCL_VISUALIZER_POINT_SIZE, 2, "cloud1");//设置cloud2的渲染属性,点云的ID和指定可视化窗口v2viewer.addPointCloud(cloudFilter, "cloud2", v2);viewer.setPointCloudRenderingProperties(pcl::visualization::PCL_VISUALIZER_POINT_SIZE, 2, "cloud2");// 可视化循环主体while (!viewer.wasStopped()){viewer.spinOnce();}
}
int main(int argc, char* argv[])
{PCLStatisticalOutlier();std::cout << "Hello World!" << std::endl;std::system("pause");return 0;
}
结果:
5、统计滤波算法缺点
1)、计算每一个点的邻域集合时,可能会因为数据集的复杂性导致邻域集合的计算不准确,从而影响后续的距离计算和滤波效果。
2)、在计算每个点与其邻域的距离dij时,如果点云数据中存在噪声或异常值,这些异常值可能会扭曲距离的计算,导致滤波结果不理想。
3)、高斯分布模型参数的计算依赖于距离的均值u和标准差α,如果数据集中的离群值较多,可能会使得均值和标准差的估计不准确,进而影响到离群值的识别和删除。
4)、遍历所有点并移除外点的过程中,如果设定的置信度阈值过高或过低,可能会导致过多的正常点被错误地识别为离群点而被移除,或者真正的离群点没有被有效识别,从而影响数据集的质量。
至此完成第十二节PCL库点云滤波算法之统计滤波(StatisticalOutlierRemoval)学习,下一节我们将进入《PCL库中点云特征》的学习。