华南理工大学程序设计竞赛 - A-KNN算法（二分）

二分距离

期末考试在即，紧张预习数据挖掘的 Capps 对如下问题十分感兴趣：

在一维空间中有点集 $S$ 包含 $n$ 个点，用什么算法能快速回答如下 $q$ 次查询：
第 $i$ 次查询给出点 $p_i$ 和整数 $k_i$ ，要求输出 $S$ 中与点 $p_i$ 距离第 $k_i$ 近的点和 $p_i$ 的距离。

距离：若点 $u_i$ 坐标为 $x_i$ ， $v_i$ 坐标为 $y_i$ ，则定义点 $u_i$ 与点 $v_i$ 的距离为 $x_i −y_i∣$ 。

输入描述:
第一行两个整数 , $n,q (1≤n,q≤2×10^5 )$ 表示点集 S 的大小和查询次数。

第二行 $n$ 个整数，第 $i$ 个整数 $a_i(−10^{9}$ $a_i ≤10^{9} )$ 描述点集 S 里第 $i$ 个点的坐标。

保证对于 $i,j (1≤i<j≤n) 有 ≠a_i =a_j$ 。接下来 $q$ 行，第 $i$ 行两个整数 , $x_i$ , $k_i$ $10^9 ≤x_i ≤10^9 ,$

$1≤k_i ≤n)$ ，表示 $p_i$ 的坐标和需要查询距离 $p_i$ 第 $k_i$ 近的结果。

输出描述:
输出 $q$ 行，第 $i$ 行一个整数，表示第 $i$ 次查询的答案。

这里可以有很多种想法，比如说取差值，二分找点，定义排序规则，但是本题给出的数据范围只允许 $q$ 询问内不超过 $O (N)$ 的时间复杂度。

补充：lower_bound( arr.begin , arr.end , aim )返回数组中大于等于 $aim$ 的第一个元素的地址
upper_bound( arr.begin , arr.end , aim )返回数组中大于 $aim$ 的第一个元素的地址

对于lower_bound( arr.begin , arr.end , aim ) - arr，就代表了返回大于等于 $aim$ 的第一个元素的下标，upper_bound()同理。

那么可以二分距离

在排序之后，首先在外层二分取距离( $mi d$ )，也就是枚举距离给出 $x$ 的距离，然后使用lower_bound和upper_bound去找到大于等于 $x - mi d$ 的第一个数对应的下标和大于 $x + mi d$ 的第一个数对应的下标，然后检查他们（下标）的差值是否是大于等于k的，如果是，就去二分更小的距离，直到确定最终的第k个数和x相差的距离。

这里二分的意义是找到满足 $x - mi d$ 到 $x + mi d$ 中间满足有 $k$ 个数的最小的距离

把那些数都反映成数轴上的数，距离也是以 $x$ 为中心向两边扩散，如果这个范围能够涵盖到 $k$ 个点，那么就说明离 $x$ 第 $k$ 近的点一定就在他们其中。

在距离区间内的数的个数大于等于 $k$ 的时候，就去搜更小的距离，也就是r = mid，如果距离区间内的数的个数小于 $k$ 了，那么就要从大于 $mi d$ 的点开始继续二分，即l = mid + 1，直到最后就会搜到一个最小的距离，使得其满足区间内有 $k$ 个点。

搜到的这个距离一定保证是x距离某一个点的距离：因为如果你确定出来的是最小的包含 $k$ 个数的距离，那么这个距离一定是刚刚好包含了 $k$ 个数的，即第k近的数是在这个距离的边界上的。

#include<bits/stdc++.h>
using namespace std;
const int N = 2e5+10;
const int mod = 1e9+7;
#define ll long longint a[N];
ll x,k;
int n,q;bool check(int mid){int LL = lower_bound(a+1,a+1+n,x - mid) - a;int RR = upper_bound(a+1,a+1+n,(ll)x + mid) - a;if(RR - LL >= k)return 1;else return 0;
}int main(){cin >> n >> q;for(int i = 1;i <= n;i++)cin >> a[i];sort(a+1,a+1+n);while(q--){cin >> x >> k;int l = 0,r = 2e9;while(l < r){int mid = (ll)l +r >> 1;if(check(mid))r = mid;else l = mid + 1;}cout << r << endl;}
}

题解部分已经结束，但是如果跳出这道题，我们想要找到数组中距离某一个数第k近的数还可以有以下的办法。

定义排序规则

如果我们有一个数组a[]，并且我们想要找到给定任意一个 $x$ 值的第 $k$ 近的数，那么我们可以定义一个按照数组中每个元素按照其与 $x$ 的差值的大小进行排序的办法。此方法主要适用于sort()函数

bool cmp(int a,int b){return abs(a - x) < abs(b - x);
}

双重二分+双指针

可以通过二分来找到距离 $x$ 点最近的两个元素，之后取这两个元素中更接近于 $x$ 的值为起点，使用双指针来向两边扩展。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/817412.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！