多数问题求解之蒙特卡洛与分治法

多数问题(Majority Problem)是一个有多种求解方法的经典问题,其问题定义如下:

给定一个大小为 n n n的数组,找出其中出现次数超过 n / 2 n/2 n/2的元素

例如:当输入数组为 [ 5 , 3 , 5 , 2 , 3 , 5 , 5 ] [5, 3, 5, 2, 3, 5, 5] [5,3,5,2,3,5,5],则 5 5 5是多数(majority)。

本文将介绍该问题的多种求解方法,重点介绍蒙特卡洛与分治法2种。

1. 解决思路

面对一个未知的算法问题,我们最开始很自然地会使用简单粗暴的方法。

1.1 暴力解法

暴力解法就是遍历整个数组,依次判断每个元素是否是多数。其伪代码如下:

Majority(A[1, n])
for(i = 1 to n)cnt = 1for(j = 1 to n)if (i != j and A[i]==A[j])cnt++endif (cnt > n/2) return "A[i] is the majortiy"endreturn "No majority"

暴力算法的缺点就是费时间,时间复杂度为 O ( n 2 ) O(n^2) O(n2)。那有什么办法能少一些遍历的时间代价呢?哈希表就是一种用空间换时间的方法。

1.2 哈希表

上面的暴力解法中,我们在循环遍历中更新元素出现的次数,然后再判断是否是多数。可以改为只遍历数组一次,用哈希表记录每个元素出现的次数,然后再遍历哈希表找到出现次数最大的元素,判断其出现次数是否超过 n / 2 n/2 n/2

这样时间复杂度降为了 O ( n ) O(n) O(n),空间复杂度为 O ( n ) O(n) O(n)。时间复杂度还能更优化一点吗?下面让我们来看下分治法的求解思路。

1.3 分治法

我们把原始数组分为两半:在前一半子数组中,找到多数 A A A;在后一半子数组中,找到多数 B B B。那么原始数组的多数一定在 A A A B B B之间,当二者相等时,原始数组的多数就已经找到了;当二者不等时,比较 A A A B B B出现的次数哪个大于 n / 2 n/2 n/2即可。

算法的时间复杂度 T ( n ) = T ( n / 2 ) + 2 n = O ( n log ⁡ n ) T(n)=T(n/2)+2n=O(n\log{n}) T(n)=T(n/2)+2n=O(nlogn)。具体的C语言代码实现可参见第2节。

1.4 蒙特卡洛法

蒙特卡罗(Monte Carlo)算法是一种随机算法,在一般情况下可以保证对问题的所有实例都以高概率给出正确解,但是通常无法判定一个具体解是否正确。

在多数问题中,蒙特卡洛法的思想是随机从数组中选择一个元素,判断是否是多数。如果不是多数的话,再随机选择一个。在存在多数的情况下,因为随机选择到多数的概率超过 1 2 \frac{1}{2} 21,算法找不到多数的概率小于 1 2 \frac{1}{2} 21

该算法的平均时间复杂度为 O ( n ) O(n) O(n)

2. 代码

以下C语言代码依次实现了Monte Carlo以及分治法求解多数问题,并比较了两种算法的运行时间。

  1. 首先用户需输入测试数据的文件路径,按下回车键。
  2. 然后进入Monte Carlo模式需输入重复的次数。
  3. 待用户输入完成,按下回车键后,对Monte Carlo算法求解多数问题计时开始,直至输出多数问题的结果计时结束,打印输出运行时间(ms)。
  4. Monte Carlo结束后直接进入分治法求解,开始计时,直至分治法输出多数问题的结果计时结束,打印输出运行时间(ms)。
#include <iostream>
#include <cstdlib>
#include <ctime>
#include <windows.h> using namespace std;const int N = 2000000;        //定义数组的最大长度 int a[N];bool majorityMC_once(int a[], int len, int *result) { //对长度为len的数组a[]进行一次蒙特卡洛寻找多数 int rnd = rand() % len;  //生成[0, len-1)的一个随机下标 int x = a[rnd];int count = 0;           //记录 x 在数组a[]中出现的次数 for (int i = 0; i < len; i++) { if (a[i] == x) {count++;}}if (count > (len / 2)) { //若 x 出现次数超过数组长度的一半,则一次蒙特卡洛找到多数,返回true *result = x;         //将找到的多数的值传给result return true;} else {                   //否则,一次蒙特卡洛未找到多数,返回false return false;}
}bool majorityMC_k_times(int a[], int len, int *result, int k) { //k次蒙特卡洛 for (int i = 1; i <= k; i++) {if(majorityMC_once(a, len, result)) { //只要有一次蒙特卡洛找到多数,则返回true              return true;}} return false;                             //k次蒙特卡洛均未找到多数,则返回false 
}bool majorityDC(int a[], int start, int end, int *result) { //分治法求解多数问题,数组下标区间为[start, end] if (start == end) {*result = a[end];return true;}else {int m1, m2;majorityDC(a, start, (start + end) / 2, &m1);    //m1为前半区间[start, (start + end) / 2]的多数 majorityDC(a, (start + end) / 2 + 1, end, &m2);  //m2为后半区间[(start + end) / 2 + 1, end]的多数 int count1 = 0, count2 = 0;for (int i = start; i <= end; i++) {if (a[i] == m1) {     //count1记录m1在数组a[]中出现的次数 count1++;}if (a[i] == m2) {     //count2记录m2在数组a[]中出现的次数 count2++;}}if (count1 > ((end - start + 1) / 2)) { //m1在数组a[]中出现的次数大于数组长度的一半,则m1为多数 *result = m1;return true;} else if (count2 > ((end - start + 1) / 2)) { //m2在数组a[]中出现的次数大于数组长度的一半,则m2为多数 *result = m2;return true;}else {  return false;         //m1, m2均不是多数,则数组a[]的多数不存在}}
}int main() {srand(time(NULL));  //设置时间函数time(NULL)为随机数种子 char s[100];cout << "请输入测试数据文件路径:" << endl;cin >> s; FILE *fp;fp = fopen(s, "r");if (fp == NULL) {cout << "Can not open the file!" << endl;exit(0);}int i = 0;while (fscanf(fp, "%d\n", &a[i]) != EOF) {  //读取文件中的数据到数组a[]中 i++;}fclose(fp); cout << "********************** Monte Carlo *********************" << endl;int k;cout << "请输入 Monte Carlo 重复的次数: ";cin >> k;LARGE_INTEGER nFreq;LARGE_INTEGER nBeginTime;LARGE_INTEGER nEndTime;QueryPerformanceFrequency(&nFreq);QueryPerformanceCounter(&nBeginTime);  //Monte Carlo计时开始 int resultMC;if (majorityMC_k_times(a, i, &resultMC, k)) {cout << resultMC << " is the majority" << endl;} else {cout << "Can not find the majority!" << endl;}QueryPerformanceCounter(&nEndTime);  //Monte Carlo计时结束 double time = (double)(nEndTime.QuadPart - nBeginTime.QuadPart) / nFreq.QuadPart * 1000;cout << "Running time: " << time << "ms" << endl;cout << endl;cout << "****************** Divide and Conquer ******************" << endl;QueryPerformanceFrequency(&nFreq);QueryPerformanceCounter(&nBeginTime);  //分治法计时开始 int resultDC;if (majorityDC(a, 0, i - 1, &resultDC)) {cout << resultDC << " is the majority" << endl;} else {cout << "Can not find the majority!" << endl;}QueryPerformanceCounter(&nEndTime);    //分治法计时结束 time = (double)(nEndTime.QuadPart - nBeginTime.QuadPart) / nFreq.QuadPart * 1000;cout << "Running time: " << time << "ms" << endl;return 0;
}

3. 运行结果

基于测试数据,求解得到如下结果:

  • dataset1.txt:none
  • dataset2.txt:991
  • data_1015.txt:none
  • data_1015l.txt:none

多次运行程序发现,在多数问题有解时,采用Monte Carlo算法求解效率普遍比分治法高,但是在Monte Carlo算法重复次数较少时,它在实际中并不总是返回正确结果。如测试数据为dataset2.txt,Monte Carlo重复1次时,可能会找不到多数问题的解,如下图。

在这里插入图片描述

其他运行示例:

(1)dataset1.txt,Monte Carlo重复次数1000:

在这里插入图片描述

(2)dataset2.txt,Monte Carlo重复次数20:

在这里插入图片描述

(3)data_1015.txt,Monte Carlo重复次数1000:

在这里插入图片描述

(4)data_1015l.txt,重复次数1000:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/742429.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【WPS】压缩图片

第一步&#xff1a; 点击插入&#xff0c;点击图片 第二步&#xff1a; 点击图片工具&#xff0c;点击压缩图片 第三步&#xff1a;

Vue3 前端生成随机id( 生成 UUID )

效果展示 封装工具&#xff08;代码展示&#xff09; 重新创建一个文件**/utils/someTools.js**&#xff0c;并在里面写入如下代码。 function Tools() {}Tools.prototype.guid function () {return xxxxxxxx-xxxx-4xxx-yxxx-xxxxxxxxxxxx.replace(/[xy]/g, function (c) {v…

jQuery模态框弹窗提示代码

jQuery模态框弹窗提示代码 下载地址 jQuery模态框弹窗提示代码

Requests教程-17-请求代理设置

上一小节我们学习了requests解决乱码的方法&#xff0c;本小节我们讲解一下requests设置代理的方法。 代理基本原理 代理实际上指的就是代理服务器&#xff0c; 英文叫作proxy server &#xff0c;它的功能是代理网络用户去取得网络信息。形象地说&#xff0c;它是网络信息的中…

【阿里云系列】-基于云效构建部署Springboot项目到ACK

介绍 为了提高项目迭代的速度加速交付产品给客户&#xff0c;我们通常会选择CICD工具来减少人力投入产生的成本&#xff0c;开源的工具比如有成熟的Jenkins&#xff0c;但是本文讲的是阿里云提高的解决方案云效平台&#xff0c;通过配置流水线的形式实现项目的快速部署到服务器…

【数据结构】双向链表及LRU缓存的实现

目录 前言 1. 在原有的自定义链表类 Linked 的基础上&#xff0c;添加新的 “节点添加”方法 addNode(Node node) 测试用例 测试结果 2. 在自定义链表类的基础上&#xff0c;使用双重循环“强力” 判断两个节点是否发生相交 测试用例 测试结果 3. 在自定义链表类的基础上…

基于opencv的手势识别

当然可以&#xff0c;下面是一个使用OpenCV实现简单手势识别&#xff0c;并在摄像头捕捉的视频中描绘出手部轮廓为线条的示例。该代码会读取摄像头流&#xff0c;然后检测出手部&#xff0c;并用线条描绘出手的轮廓。 首先&#xff0c;你需要安装OpenCV库。如果你还没有安装&am…

Vulnhub靶机:Kioptrix_Level1.1

一、介绍 运行环境&#xff1a;Virtualbox 攻击机&#xff1a;kali&#xff08;192.168.56.101&#xff09; 靶机&#xff1a;Kioptrix_Level1.1&#xff08;192.168.56.104&#xff09; 目标&#xff1a;获取靶机root权限和flag 靶机下载地址&#xff1a;https://www.vul…

C语言例2-3:从键盘输入一个正整数(位数小于或等于10),判断其是否是回文数

回文数是将自然数n的各位数字反向排列得到自然数n1&#xff0c;若n1与n相等&#xff0c;则称为回文数&#xff0c;例如12321 //从键盘输入一个正整数&#xff08;位数小于或等于10&#xff09;&#xff0c;判断其是否是回文数 //回文数是将自然数n的各位数字反向排列得到自然数…

(BAT向)Java岗常问高频面试汇总:MyBatis 微服务 Spring 分布式 MySQL等

看面试题可以是为了面试&#xff0c;也可以是对自己学到的东西的一种查漏补缺&#xff0c;更加深刻的去了解一些核心知识点 Spring面试高频问题 问题一&#xff1a;谈 需要zi料 绿色徽【vip1024b】 谈你对spring IOC 和 DI 的理解&#xff0c;它们有什么区别&#xff1f; **问题…

Xterminal:未来的终端体验

✅作者简介&#xff1a;大家好&#xff0c;我是Leo&#xff0c;热爱Java后端开发者&#xff0c;一个想要与大家共同进步的男人&#x1f609;&#x1f609; &#x1f34e;个人主页&#xff1a;Leo的博客 &#x1f49e;当前专栏&#xff1a; 开发环境篇 ✨特色专栏&#xff1a; M…

CTR之行为序列建模用户兴趣:DIEN

前言 在上一篇文章中 CTR之行为序列建模用户兴趣&#xff1a;DIN&#xff0c;开启了用户行为序列建模用户兴趣的篇章。DIN引入了Attention机制&#xff0c;对于不同的候选item&#xff0c;可以根据用户的历史行为序列&#xff0c;动态地学习用户的兴趣表征向量。但是&#xff…

Mybatis-Plus实现Service封装

文章目录 5.1 MP封装Service介绍5.1.1 说明5.1.2 实现流程5.1.3 核心API介绍 5.2 MP封装Service快速入门5.2.1 定义服务扩展接口5.2.2 定义服务实现5.2.3 测试测试 5.3 MP封装Service实现CRUD操作 5.1 MP封装Service介绍 5.1.1 说明 MybatisPlus为了开发更加快捷&#xff0c;…

前端去除网页水印

按F12&#xff0c;打开开发者工具面板&#xff0c;然后直接在样式搜索backgroud 然后直接取消backgroud 的复选框即可。

【Linux】-Linux下的软件商店yum工具介绍(linux和windows互传文件仅仅一个拖拽搞定!!!!)

目录 1.Linux 软件包管理器yum 1.1快速认识yum 1.2 yumz下载方式&#xff08;如何使用yum进行下载&#xff0c;注意下载一定要是root用户或者白名单用户&#xff08;可提权&#xff09;&#xff09; 1.2.1下载小工具rzsz 1.2.2 rzsz使用 1.2.2查看软件包 1.3软件的卸载 2.yum生…

UE5 局域网联机,寻找会话失败。

目录 参考资料&#xff1a; 尝试解决办法 1.1在【项目名.Build.cs】脚本中添加该行&#xff0c;添加后关闭编辑器&#xff0c;重新生成解决方案。​编辑 2.检查是否在同一个C类子网 参考资料&#xff1a; 1.Cant find session in LAN - Programming & Scripting / Mul…

【C语言】字符串函数上

&#x1f451;个人主页&#xff1a;啊Q闻 &#x1f387;收录专栏&#xff1a;《C语言》 &#x1f389;道阻且长&#xff0c;行则将至 前言 这篇博客是字符串函数上篇&#xff0c;主要是关于长度不受限制的字符串函数&#xff08;strlen,strcpy,strcat,strcm…

“我快无聊死了”用英语怎么说?柯桥英语口语学习,成人零基础学外语

每日一句 Im bored to death. 我快无聊死了。 单词解析&#xff1a; bored / bɔːd / adj.无聊的&#xff0c;厌倦的 bored to d15857575376eath&#xff1a;指非常无聊或厌烦&#xff0c;达到了极点的程度。 "bored" 和 "boring" 都与无聊相关&#…

漏洞发现-漏扫项目篇武装BURP浏览器插件信息收集分析辅助

知识点 1、插件类-武装BurpSuite-漏洞检测&分析辅助 2、插件类-武装谷歌浏览器-信息收集&情报辅助 章节点&#xff1a; 漏洞发现-Web&框架组件&中间件&APP&小程序&系统 扫描项目-综合漏扫&特征漏扫&被动漏扫&联动漏扫 Poc开发-Ymal语…

产品测试方案:视频接入平台并发性能测试方案和报告(即150路视频并发流媒体服务器模块的性能测试方案和报告)

目 录 一、测试目的&#xff1a; 二、测试方案&#xff1a; 2.1、测试思路 2.2、拓扑图 三、测试环境 3.1 服务器配置 3.2 网络摄像机列表 3.3 测试软件 四、测试流程 4.1 H.264并发测试&#xff1a; 4.1.1老版本srsout3.10并发测试 4.1.2 新版本srsout…