字节青训Marscode——8:找出整形数组中超过一半的数

问题描述

小R从班级中抽取了一些同学,每位同学都会给出一个数字。已知在这些数字中,某个数字的出现次数超过了数字总数的一半。现在需要你帮助小R找到这个数字。


测试样例

样例1:

输入:array = [1, 3, 8, 2, 3, 1, 3, 3, 3]
输出:3

样例2:

输入:array = [5, 5, 5, 1, 2, 5, 5]
输出:5

样例3:

输入:array = [9, 9, 9, 9, 8, 9, 8, 8]
输出:9

步骤1:问题定义与分析

题目要求:

从一个整数数组 array 中找出某个出现次数超过数组长度一半的数字,保证这样的数字一定存在。

输入与输出:
  • 输入:一个整数数组 array,长度为 n
  • 输出:数组中某个出现次数超过 n / 2 的数字。
限制与边界条件:
  1. 数组中保证一定存在满足条件的数字。
  2. 数组长度 n 的范围未明确给出,但假设为合理范围(如 1 <= n <= 10^6)。
  3. 只需要输出符合条件的任意一个数字,不需要处理无解的情况。
问题性质:
  • 根据题意,某个数字的出现次数超过总数的一半,称为 多数元素
  • 这种问题可以通过经典的算法(如摩尔投票法)高效解决,而不需要使用暴力计数法。

步骤2:算法设计与分析

方法1:哈希表计数
  • 使用哈希表统计每个数字的出现次数。
  • 遍历数组,当某个数字的出现次数超过 n / 2 时返回该数字。
时间复杂度与空间复杂度:
  • 时间复杂度:O(n),需要遍历数组。
  • 空间复杂度:O(n),存储哈希表。
适用场景

适用于小规模数据,且有足够的内存空间支持额外的哈希表存储。


方法2:摩尔投票法(最佳选择)

摩尔投票法是一种高效的线性时间算法,专门用于解决多数元素问题。

算法步骤:
  1. 初始化一个候选值 candidate 和计数器 count 为 0。
  2. 遍历数组:
    • 如果当前计数为 0,将当前数字设置为候选值 candidate,并将计数器设置为 1。
    • 如果当前数字等于 candidate,计数器加 1。
    • 如果当前数字不等于 candidate,计数器减 1。
  3. 遍历结束时,candidate 即为多数元素。
时间复杂度与空间复杂度:
  • 时间复杂度:O(n),只需遍历数组一次。
  • 空间复杂度:O(1),不需要额外的存储空间。
适用场景

适用于任何规模的数据,且是本问题的最佳解决方案。

摩尔投票法原理解释

摩尔投票法(Boyer-Moore Voting Algorithm)是一种高效的算法,用于在一个数组中找到出现次数超过一半的元素(即 多数元素)。它的核心思想是通过一种计数机制,利用元素的多数性来进行筛选,最终在 O(n) 的时间复杂度内找到目标元素,并且空间复杂度为 O(1)。

问题背景

在一个大小为 n 的数组中,假设存在一个数字的出现次数超过 n / 2,也就是说这个数字是多数元素。摩尔投票法的目标是找出这个元素。通过遍历数组一次并利用投票机制,我们能够在常数空间内找到这个元素。

摩尔投票法的基本原理
  1. 计数器: 摩尔投票法通过维护一个计数器来识别出现次数最多的元素。这个计数器会随着遍历数组而动态调整。

  2. 选举过程

    • 候选人:首先,我们假设某个元素是候选人(candidate),并初始化计数器为 0。
    • 投票规则
      • 如果当前计数器为 0,选择当前元素作为新的候选人,并将计数器设置为 1。
      • 如果当前元素与候选人相同,计数器加 1。
      • 如果当前元素与候选人不同,计数器减 1。

    这种“投票”方式能够抵消一些非多数元素的干扰,并最终得到一个可能是多数元素的候选值。

  3. 计数的终结: 当整个数组遍历完成后,candidate 就是候选的多数元素。由于多数元素的出现次数超过了数组长度的一半,这个候选元素一定就是多数元素。

详细步骤
  1. 初始化

    • candidate(候选元素)初始化为一个任意值。
    • count(计数器)初始化为 0。
  2. 遍历数组

    • 对于数组中的每个元素:
      • 如果 count == 0,选择当前元素作为新的候选元素,并将计数器设为 1。
      • 如果当前元素等于 candidate,则增加计数器。
      • 如果当前元素与 candidate 不同,则减少计数器。
  3. 返回结果

    • 遍历结束后,candidate 即为数组中出现次数最多的元素。
直观解释

假设数组中的多数元素出现次数超过了数组总长度的一半(n/2)。在摩尔投票法中,元素的“投票”机制确保了最多的元素最终会“胜出”。具体来说:

  • 当遇到与当前候选人不同的元素时,我们会减去一个计数,导致非多数元素的出现机会被“削弱”。
  • 只有当某个元素的出现次数非常高时,才可能在整个数组中最终成为唯一的候选人。
举例说明

假设我们有数组:[3, 3, 4, 2, 4, 4, 2, 4, 4]

  • 第一步:candidate = 3, count = 0
    • 看到第一个元素 3count = 1candidate = 3
    • 看到第二个元素 3count = 2candidate = 3
    • 看到第三个元素 4count = 1candidate = 3count--)。
    • 看到第四个元素 2count = 0candidate = 2count = 1)。
    • 看到第五个元素 4count = 2candidate = 4
    • ...
    • 遍历完成后,candidate = 4 是多数元素。
为什么摩尔投票法有效?
  • 由于题目保证了多数元素一定存在,并且它的出现次数超过数组的一半,因此,在摩尔投票法中,不同的元素相互“抵消”掉的次数是对等的,最终剩下的就是多数元素。
  • 当计数器归零时,说明当前候选元素被其他元素“抵消”了,我们就将候选元素换成新的元素,从而不断减少非多数元素的影响,直到最后剩下的候选元素必然是多数元素。

摩尔投票法的优势

  1. 时间复杂度 O(n)

    • 只需要遍历数组一次,因此时间复杂度是 O(n),其中 n 是数组的长度。
  2. 空间复杂度 O(1)

    • 只使用了两个变量:candidatecount,因此空间复杂度是 O(1),不需要额外的空间。
  3. 适用于大规模数据

    • 在大规模数据中,摩尔投票法具有很高的效率,特别是在内存和空间限制较大的情况下,能够以最优的时间和空间复杂度完成任务。

步骤3:C++ 代码实现

使用摩尔投票法解决问题:

#include <iostream>
#include <vector>using namespace std;int solution(vector<int> array) {// 摩尔投票法int candidate = 0; // 候选元素int count = 0;      // 计数器// 第一次遍历,确定候选元素for (int num : array) {if (count == 0) {candidate = num; // 重置候选元素count = 1;       // 初始化计数器} else if (num == candidate) {count++; // 当前数字等于候选元素,计数器加1} else {count--; // 当前数字不等于候选元素,计数器减1}}// 此时candidate即为超过一半的数字,直接返回return candidate;
}int main() {// 测试用例cout << (solution({1, 3, 8, 2, 3, 1, 3, 3, 3}) == 3) << endl; // 输出 1 (True)cout << (solution({5, 5, 5, 1, 2, 5, 5}) == 5) << endl;       // 输出 1 (True)cout << (solution({9, 9, 9, 9, 8, 9, 8, 8}) == 9) << endl;   // 输出 1 (True)return 0;
}
代码解释:
  1. candidate:记录当前的候选多数元素。
  2. count:记录候选元素的计数。
  3. 第一遍遍历:通过计数器逻辑,找出候选元素。
  4. 时间复杂度:O(n),遍历数组一次。
  5. 空间复杂度:O(1),无额外空间开销。

步骤4:通过解决这个问题获得的启发

  1. 算法设计的重要性:摩尔投票法以 O(n) 的时间和 O(1) 的空间高效解决了问题,体现了精妙的算法设计对效率的提升。
  2. 多数性质的利用:当一个元素出现次数超过数组长度的一半时,不需要完全统计,利用其多数性质即可快速筛选。
  3. 扩展应用:摩尔投票法不仅适用于确定多数元素,还可扩展到寻找多于 n/3 次出现的元素(需要两轮计数)。

步骤5:实际应用分析

实际场景:
  1. 舆情分析

    • 在一个讨论群中,找出被提及最多的关键词。例如,在一个由用户输入的评论数据中,快速筛选出出现频率超过一半的品牌名称或产品关键词。
    • 实现方法
      • 将评论数据转化为数组形式,使用摩尔投票法筛选出最多的品牌关键词。
  2. 传感器数据监测

    • 在实时监测数据中,找出传感器的主流输出值,用于检测异常值。例如,某个值的输出频率异常高,可能表示系统进入了稳定状态。
  3. 选举系统

    • 在电子投票中,快速统计获胜的候选人(多数原则)。
实现示例:

在一个评论数据分析系统中,利用哈希表结合摩尔投票法,可以在多个评论字段中高效找出讨论最多的关键词。配合数据库或大数据平台,还可以实时生成分析报告,提升业务决策效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/62929.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WPF从本地文件加载界面

在前面的文章中&#xff0c;我介绍过一种报告模板的实现思路。就是用的XAML本地加载。 WPF使用XAML实现报表的一种思路&#xff08;支持外部加载&#xff09; - zhaotianff - 博客园 在另外一篇文章中&#xff0c;介绍了XAML是如何被转换成对象的。 WPF中的XAML是如何转换成对…

Microi吾码产品深度测评:轻量级企业管理应用的全方位剖析

开源低代码平台-Microi吾码-平台简介 技术框架&#xff1a;.NET8 Redis MySql/SqlServer/Oracle Vue2/3 Element-UI/Element-Plus 平台始于2014年&#xff08;基于Avalon.js&#xff09;&#xff0c;2018年使用Vue重构&#xff0c;于2024年10月29日开源 Vue3试用地址&am…

AI后端工程师面试题的内容

AI后端工程师面试题主要包括以下几个方面的内容‌&#xff1a; ‌一、技术基础和项目经验‌&#xff1a; ‌1. 微服务架构的理解和应用‌&#xff1a;请描述你对微服务架构的理解&#xff0c;并举例说明一个你参与过的微服务项目&#xff0c;阐述你在该项目中扮演的角色和所承…

ArrayList如何深究?最简单的数组~

目录 数组 Array 为什么数组索引从0开始呢&#xff1f;为什么不从1开始&#xff1f; ArrayList 成员变量 构造方法 添加和扩容 ArrayList底层的实现原理是什么&#xff1f; 数组和List转换 ArrayList 和 LinkedList区别 底层数据结构 操作数据效率 内存占用 线程安…

前端开发入门指南Day 14 :数据交互(从Ajax到Axios)和工具进阶(JSON、代理、正则表达式)

今天&#xff0c;我们将探索前端开发中最重要的几个实用工具和概念。这些工具就像是前端开发者的瑞士军刀&#xff0c;帮助我们更好地处理数据和实现各种功能。 一、HTTP请求&#xff1a;前后端通信的桥梁 &#x1f309; 为什么需要HTTP请求&#xff1f; 想象你在餐厅点餐&a…

三十一:HTTP多种重定向跳转方式的差异

在现代网站开发中,HTTP 重定向是一种常见的技术,用于将用户的请求从一个 URL 跳转到另一个 URL。重定向机制广泛应用于网站迁移、SEO 优化、以及内容管理系统中。不同的 HTTP 状态码代表不同的重定向方式,每种方式的行为和适用场景各有不同。本文将深入探讨 HTTP 重定向的几…

C++ 分治

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 目录 1.分治法 2.二分搜索 函数传参——数组 3.棋盘覆盖 4.合并排序 5.快速排序 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 1.分治法 基…

anaconda环境下安装第三方库

在 Anaconda 环境中使用 pip install 安装某些包时&#xff0c;可能会出现依赖或环境相关的问题。针对 fastdtw 的安装问题&#xff0c;你可以尝试以下解决方案&#xff1a; 1. 使用 Conda 安装 fastdtw Anaconda 的 conda 包管理器可以更好地处理依赖问题&#xff0c;尤其是…

用函数实现模块化程序设计(七)--数组作为函数参数(排序算法)

调用有参函数时&#xff0c;需要实参&#xff0c;实参可以是常量&#xff0c;变量&#xff0c;表达式&#xff0c;数组元素的作用与变量相当&#xff0c;凡是变量出现的地方都可用数组代替&#xff0c;数组元素可以用作函数实参&#xff0c;数组名可以作实参和形参&#xff0c;…

嵌入式Linux无窗口系统下搭建 Qt 开发环境

嵌入式Linux无窗口系统下搭建 Qt 开发环境 本文将介绍如何在树莓派的嵌入式 Linux 环境下&#xff0c;搭建 Qt 开发环境&#xff0c;实现无窗口系统模式&#xff08;framebuffer&#xff09;下的图形程序开发。 1. 安装 Qt 环境 接下来&#xff0c;安装核心 Qt 开发库以及与 …

基于STM32设计的智能宠物喂养系统(华为云IOT)_273

文章目录 一、前言1.1 项目介绍【1】项目开发背景【2】设计实现的功能【3】项目硬件模块组成【4】设计意义【5】国内外研究现状【6】摘要1.2 设计思路1.3 系统功能总结1.4 开发工具的选择【1】设备端开发【2】上位机开发1.5 参考文献1.6 系统框架图1.7 系统原理图1.8 实物图1.9…

C++【PCL】利用矩阵对点云进行刚体变换

/** 功能&#xff1a; 点云刚体变换* 头文件&#xff1a; #include <pcl/common/transforms.h>* 功能函数&#xff1a; pcl::transformPointCloud(*pPointCloudIn, *pPointCloudOut, transform_1);*/#include <pcl/io/ply_io.h>#include <iostream>// pcl #i…

Java项目实战II基于微信小程序的文章管理系统的设计与实现 (开发文档+数据库+源码)

目录 一、前言 二、技术介绍 三、系统实现 四、核心代码 五、源码获取 全栈码农以及毕业设计实战开发&#xff0c;CSDN平台Java领域新星创作者&#xff0c;专注于大学生项目实战开发、讲解和毕业答疑辅导。 一、前言 在信息爆炸的时代&#xff0c;内容创作与管理已成为众…

Conda 管理python开发环境

同步发布于我的网站 &#x1f680; 故事起因: 在公司使用Requests多任务并行开发时遇到了问题&#xff0c;使用 ProcessPoolExecutor 时不能正常发出网络请求&#xff0c;会卡在网络请求发不出去&#xff0c;但是善于用 ThreadPoolExecutor 时是可以的,纠结了很久&#xff0c;一…

【学习Go编程】

了解Go语言的基本概念&#xff1a; 学习Go的基本语法、数据类型、控制结构等。可以参考官方文档或基础教程来入门。 安装Go环境&#xff1a; 访问Go语言的官方网站&#xff0c;下载并安装适合你操作系统的Go编程环境。配置好环境变量&#xff0c;确保可以在命令行中使用go命令…

LLaMA-Factory 上手即用教程

LLaMA-Factory 是一个高效的大型语言模型微调工具&#xff0c;支持多种模型和训练方法&#xff0c;包括预训练、监督微调、强化学习等&#xff0c;同时提供量化技术和实验监控&#xff0c;旨在提高训练速度和模型性能。 官方开源地址&#xff1a;https://github.com/hiyouga/L…

PGSQL:联合唯一索引的创建和删除

创建联合唯一索引 假设有一个表 your_table&#xff0c;它有多个列&#xff0c;你想在其中的几列上创建一个联合唯一索引。以下是创建联合唯一索引的 SQL 语句&#xff1a; CREATE UNIQUE INDEX idx_unique_columns ON your_table(column1, column2, ...);注意&#xff1a; …

抓包之查看websocket内容

写在前面 本文看下websocket抓包相关内容。 1&#xff1a;正文 websocket基础环境搭建参考这篇文章。 启动后&#xff0c;先看chrome的network抓包&#xff0c;这里我们直接使用is:running来过滤出websocket的请求&#xff1a; 可以清晰的看到发送的内容以及响应的内容。在…

项目介绍和游戏搭建(拼图小游戏)

1. &#xff08;1&#xff09; import javax.swing.*;public class GameJFrame extends JFrame {//游戏主界面&#xff0c;游戏的所有逻辑public GameJFrame(){this.setSize(603,680);this.setVisible(true);//true是展示&#xff0c;flase是隐藏} } &#xff08;2&#xff…

Flask项目入门—会话技术Cookie和Session

Session和Cookie都是用于跟踪用户会话的技术、它们可以存储用户信息&#xff0c;以便在用户与网站进行交互时提供个性化的体验。然而&#xff0c;这两者在存储位置、使用方式、安全性等方面存在显著的差异。 工作原理/流程 Cookie 1、用户第一次访问时候服务器生成 Cookie&a…