题目
https://leetcode.cn/problems/binary-search/description/
给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1。
示例 1:
输入: nums = [-1,0,3,5,9,12], target = 9
输出: 4
解释: 9 出现在 nums 中并且下标为 4
示例 2:
输入: nums = [-1,0,3,5,9,12], target = 2
输出: -1
解释: 2 不存在 nums 中因此返回 -1
提示:
- 你可以假设 nums 中的所有元素是不重复的。
- n 将在 [1, 10000]之间。
- nums 的每个元素都将在 [-9999, 9999]之间。
思路
这道题前提是数组为有序数组,同时题目还强调数组中无重复元素,因为一旦有重复元素,使用二分查找法返回的元素下标可能不是唯一的,这些都是使用二分法的前提条件,当大家看到题目描述满足如上条件的时候,可要想一想是不是可以用二分法了。
二分查找涉及的很多的边界条件,逻辑比较简单,但就是写不好。例如到底是 while(left < right)
还是 while(left <= right)
,到底是right = middle
呢,还是要right = middle - 1
呢?
大家写二分法经常写乱,主要是因为对区间的定义没有想清楚,区间的定义就是不变量。要在二分查找的过程中,保持不变量,就是在while寻找中每一次边界的处理都要坚持根据区间的定义来操作,这就是循环不变量规则。
写二分法,区间的定义一般为两种,左闭右闭即[left, right],或者左闭右开即[left, right)。
下面我用这两种区间的定义分别讲解两种不同的二分写法。
二分法 第一种写法
第一种写法,我们定义 target 是在一个在左闭右闭的区间里,也就是[left, right] (这个很重要非常重要)。
区间的定义这就决定了二分法的代码应该如何写,因为定义target在[left, right]区间,所以有如下两点:
- while (left <= right) 要使用 <= ,因为left == right是有意义的,所以使用 <=
- if (nums[middle] > target) right 要赋值为 middle - 1,因为当前这个nums[middle]一定不是target,那么接下来要查找的左区间结束下标位置就是 middle - 1
例如在数组:1,2,3,4,7,9,10中查找元素2,如图所示:
代码如下:(详细注释)(C++)
// 版本一
class Solution {
public:int search(vector<int>& nums, int target) {int left = 0;int right = nums.size() - 1; // 定义target在左闭右闭的区间里,[left, right]while (left <= right) { // 当left==right,区间[left, right]依然有效,所以用 <=int middle = left + ((right - left) / 2);// 防止溢出 等同于(left + right)/2if (nums[middle] > target) {right = middle - 1; // target 在左区间,所以[left, middle - 1]} else if (nums[middle] < target) {left = middle + 1; // target 在右区间,所以[middle + 1, right]} else { // nums[middle] == targetreturn middle; // 数组中找到目标值,直接返回下标}}// 未找到目标值return -1;}
};
- 时间复杂度:O(log n)
- 空间复杂度:O(1)
二分法第二种写法
如果说定义 target 是在一个在左闭右开的区间里,也就是[left, right) ,那么二分法的边界处理方式则截然不同。
有如下两点:
- while (left < right),这里使用 < ,因为left == right在区间[left, right)是没有意义的
- if (nums[middle] > target) right 更新为 middle,因为当前nums[middle]不等于target,去左区间继续寻找,而寻找区间是左闭右开区间,所以right更新为middle,即:下一个查询区间不会去比较nums[middle]
在数组:1,2,3,4,7,9,10中查找元素2,如图所示:(注意和方法一的区别)
代码如下:(详细注释)(C++)
// 版本二
class Solution {
public:int search(vector<int>& nums, int target) {int left = 0;int right = nums.size(); // 定义target在左闭右开的区间里,即:[left, right)while (left < right) { // 因为left == right的时候,在[left, right)是无效的空间,所以使用 <int middle = left + ((right - left) >> 1);if (nums[middle] > target) {right = middle; // target 在左区间,在[left, middle)中} else if (nums[middle] < target) {left = middle + 1; // target 在右区间,在[middle + 1, right)中} else { // nums[middle] == targetreturn middle; // 数组中找到目标值,直接返回下标}}// 未找到目标值return -1;}
};
- 时间复杂度:O(log n)
- 空间复杂度:O(1)
总结
二分法是非常重要的基础算法,为什么很多同学对于二分法都是一看就会,一写就废?
其实主要就是对区间的定义没有理解清楚,在循环中没有始终坚持根据查找区间的定义来做边界处理。
区间的定义就是不变量,那么在循环中坚持根据查找区间的定义来做边界处理,就是循环不变量规则。
本篇根据两种常见的区间定义,给出了两种二分法的写法,每一个边界为什么这么处理,都根据区间的定义做了详细介绍。
相信看完本篇应该对二分法有更深刻的理解了。
注意
在下面的代码中,使用 middle = left + (right - left) / 2
而不是 middle = (left + right) / 2
的主要原因是为了防止整数溢出。
当 left
和 right
都很大且接近 int
类型的最大值时,它们的和可能会超出 int
类型能够表示的范围,从而导致溢出。溢出后的结果再除以2,可能会导致一个不正确的中间索引值。
为了避免这种溢出情况,我们计算 right - left
,这个差值一定小于或等于 right
,然后再加到 left
上。这样即使 right
很大,right - left
仍然是一个可以安全处理的整数,再与 left
相加,并进行整数除法,就可以得到一个正确的中间索引,而不会导致溢出。
因此,虽然 middle = (left + right) / 2
在很多情况下也能正常工作,但在处理非常大的整数时,使用 middle = left + (right - left) / 2
更为稳妥和安全。这是一种常见的二分查找算法中的优化技巧,用于确保代码在极端情况下也能正确运行。
小提示
对于 middle = left + (right - left) / 2
,这个表达式中的操作包括加法、减法和整数除法。在这个特定的表达式中,减法和加法具有相同的优先级,并且都是左结合的,所以它们会按照从左到右的顺序进行。整数除法 /
在这个表达式中的优先级低于加法和减法,所以加法和减法会首先进行。
其他语言版本
Java
(版本一)左闭右闭区间
class Solution {public int search(int[] nums, int target) {// 避免当 target 小于nums[0] nums[nums.length - 1]时多次循环运算if (target < nums[0] || target > nums[nums.length - 1]) {return -1;}int left = 0, right = nums.length - 1;while (left <= right) {int mid = left + ((right - left) >> 1);if (nums[mid] == target)return mid;else if (nums[mid] < target)left = mid + 1;else if (nums[mid] > target)right = mid - 1;}return -1;}
}
(版本二)左闭右开区间
class Solution {public int search(int[] nums, int target) {int left = 0, right = nums.length;while (left < right) {int mid = left + ((right - left) >> 1);if (nums[mid] == target)return mid;else if (nums[mid] < target)left = mid + 1;else if (nums[mid] > target)right = mid;}return -1;}
}
Python
(版本一)左闭右闭区间
class Solution:def search(self, nums: List[int], target: int) -> int:left, right = 0, len(nums) - 1 # 定义target在左闭右闭的区间里,[left, right]while left <= right:middle = left + (right - left) // 2if nums[middle] > target:right = middle - 1 # target在左区间,所以[left, middle - 1]elif nums[middle] < target:left = middle + 1 # target在右区间,所以[middle + 1, right]else:return middle # 数组中找到目标值,直接返回下标return -1 # 未找到目标值
(版本二)左闭右开区间
class Solution:def search(self, nums: List[int], target: int) -> int:left, right = 0, len(nums) # 定义target在左闭右开的区间里,即:[left, right)while left < right: # 因为left == right的时候,在[left, right)是无效的空间,所以使用 <middle = left + (right - left) // 2if nums[middle] > target:right = middle # target 在左区间,在[left, middle)中elif nums[middle] < target:left = middle + 1 # target 在右区间,在[middle + 1, right)中else:return middle # 数组中找到目标值,直接返回下标return -1 # 未找到目标值
C
(版本一)左闭右闭区间
// (版本一) 左闭右闭区间 [left, right]
int search(int* nums, int numsSize, int target){int left = 0;int right = numsSize-1;int middle = 0;//若left小于等于right,说明区间中元素不为0while(left<=right) {//更新查找下标middle的值middle = (left+right)/2;//此时target可能会在[left,middle-1]区间中if(nums[middle] > target) {right = middle-1;} //此时target可能会在[middle+1,right]区间中else if(nums[middle] < target) {left = middle+1;} //当前下标元素等于target值时,返回middleelse if(nums[middle] == target){return middle;}}//若未找到target元素,返回-1return -1;
}
(版本二)左闭右开区间
// (版本二) 左闭右开区间 [left, right)
int search(int* nums, int numsSize, int target){int length = numsSize;int left = 0;int right = length; //定义target在左闭右开的区间里,即:[left, right)int middle = 0;while(left < right){ // left == right时,区间[left, right)属于空集,所以用 < 避免该情况int middle = left + (right - left) / 2;if(nums[middle] < target){//target位于(middle , right) 中为保证集合区间的左闭右开性,可等价为[middle + 1,right)left = middle + 1;}else if(nums[middle] > target){//target位于[left, middle)中right = middle ;}else{ // nums[middle] == target ,找到目标值targetreturn middle;}}//未找到目标值,返回-1return -1;
}