大数据计算基础真题回忆

转载学长20 21的真题

转载链接
注:每年的课件可能会有更改,内容不一样,所以读者复习的时候以所在年份的课件为准

2020

在这里插入图片描述

2021

在这里插入图片描述

笔者2023秋

2023

都是大题,没有选择题。

  1. 改进的近似算法中,结合具体的例子说明,“多次运行取平均”和"多次运行取中间值"的两个思想是怎么体现的。(10分)
  2. 为什么要在哈希分片的过程中引入虚拟桶,虚拟桶工作的流程。(6分)
  3. 一共两个问,卷子前面会给期望和方差的公式以及切比雪夫和切尔诺夫不等式(10分)
  • 简要说明Morris算法的主要思想
  • 最后估算的结果是f̃i, 期望是fi,方差是fi的平方,分析估算的误差
  1. B+树,键值最多是3, 给下面的表,回答三个问题(15分)
    在这里插入图片描述
  • 请从不同的节点说明为什么指针的个数要比键值的个数多1
  • 将<1,2,3,4,5,8>组成一个合理的B+树
  • 在上一问的B+树插入6,7画出每一次插入二叉树的状态

​5. 课件上的哈希查找算法,请你给出一个具体的例子并说明这个算法(看课件上的就行)(12分)
在这里插入图片描述
在这里插入图片描述

  1. 一共两个问 主要是文件系统和数据的复制(10分)
  • gfs采用主从式数据库和其他方法的优缺点,请举出一个其他的结构并和主从式相对比写出他们的优缺点。
  • HDFS namenode、datanode、secondary namenode一起协同的工作流程
  1. 给三个例子,一大堆话,问是属于什么什么资源调度模型,我当时写的下面这个。(20分)
    在这里插入图片描述

第一个是单机模型 第二个是spark的executer 第三个是google borgmaster和scheduler

  1. 输入是<编号,黑色或者白色> 每个机器能看到数据的个数为L,机器的个数是k,解决一个问题:黑色的数目多还是白色的数目多,利用mapreduce的编程思想回答下列问题。(15分)
  • 写出map和reduce的伪代码
  • 分析通信代价和空间代价
  • 在此基础上的算法上进行改进,对任意位置上的x 原来的数据A[1到x]黑的个数不小于白色的个数,请设计算法并简要说明他的正确性。

在这里插入图片描述
总结:显敏老师的算法一定上课跟着算,要不然考试真的会吃亏,王老师上课讲的比较浅的东西一定要下课多查资料学习,没展开也不一定不需要掌握。

我的笔记

因为时间匆忙,有些东西不是很全,仅供参考。
大数据计算基础笔记

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/606845.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】Linux系统编程——Linux命令解析器

【Linux】Linux系统编程——Linux命令解析器 什么是Linux 命令解析器&#xff1f; Linux 命令解析器&#xff0c;通常被称为 shell&#xff0c;是 Linux 操作系统中的一个关键组件。它充当用户和系统内核之间的接口&#xff0c;允许用户通过输入命令来控制和管理操作系统和应…

计算机丢失mfc140.dll怎么办?解决mfc140.dll缺失的3种方法分享

计算机丢失mfc140.dll怎么办&#xff1f;在使用微软办公软件的时候&#xff0c;可能会弹出一个错误提示框说“找不到mfc140.dll&#xff0c;无法继续执行代码”。为了不影响工作效率&#xff0c;我们可能需要亲自动手尝试修复这一问题。以下是一些mfc140.dll缺失的3种方法相关介…

LED显示屏控制卡常见问题详解

LED显示屏控制卡是LED图文显示屏的关键组件&#xff0c;主要负责接收来自计算机串行口的图像显示信息&#xff0c;将其放入帧存储器&#xff0c;并按照分区驱动方式生成LED显示屏所需的串行显示数据和扫描控制时序。带你5分钟了解LED显示屏控制系统。本文将针对LED显示屏控制卡…

2024最新外贸建站:ChemiCloud主机购买使用及自建外贸独立站教程

随着电商平台竞争的加剧&#xff0c;许多外贸从业者意识到减少对平台依赖的重要性&#xff0c;并选择搭建自己的外贸独立站来获得更多的控制权和灵活性。即使是没有建站基础的新手&#xff0c;也可以通过学习建站来实现这一目标。下面是一个适用于新手的外贸建站教程&#xff0…

Spring AOP概念

什么是 AOP &#xff1f; AOP 为 Aspect Oriented Programming 的缩写&#xff0c;意为&#xff1a;面向切面编程&#xff0c;通过预编译方式和运行期动态代理实现程序功能的统一维护的一种技术。AOP 是 OOP 的延续&#xff0c;是软件开发中的一个热点&#xff0c;也是 Spring …

请问下大家PMP证书值得考嘛?

做项目的去考&#xff0c;项目经理、产品经理这些&#xff0c;或者有往项目管理领域发展的去考。其他行业有空可以学习下 不一定要考证了。 PMP证书更多的是“敲门砖”作用&#xff0c;大部分公司招聘的门槛都要去了这个证书。 当然现在PMP管理模式也很热门&#xff0c;各大企…

数字IC芯片设计实现 | 时序Timing Signoff check_timing检查解析

今天分享在数字IC芯片设计实现做timing signoff阶段必须要看的report。check_timing的报告必须是clean的&#xff0c;否则芯片回来大概率是废片&#xff01;&#xff01;&#xff01;实际上一堆公司的芯片败在不看这个report了。 我们知道primetime(简称PT)做时序检查是基于我…

深入PostgreSQL:高级函数用法探索

写在开头 在 PostgreSQL 中,函数是数据库开发和管理中强大而灵活的工具。通过深入了解高级函数用法,我们可以更有效地利用 PostgreSQL 的功能。在本文中,我们将探讨一些看起来比较高级的 PostgreSQL 函数用法,包括窗口函数、自定义聚合函数、JSONB 类型函数、全文搜索、PL…

YACS(上海计算机学会竞赛平台)2022年12月月赛——星号三角阵(二)

题目描述 给定一个整数 n&#xff0c;输出一个 n 行 n 列的星号三角阵&#xff0c;直角位于图形的左上角。例如当 n4 时&#xff0c;输出 **** *** ** *输入格式 单个整数表示 n。 输出格式 共 n 行&#xff1a;表示一个星号三角阵。 数据范围 1≤n≤100 样例数据 输入…

数据库参数 PGA_AGGREGATE_LIMIT 限制进程大小

在自动化 PGA 内存管理模式下&#xff0c;Oracle 数据库通过动态控制分配到工作区的 PGA 内存量来尝试遵从 PGA_AGGREGATE_TARGET 值。但是&#xff0c;有时因为以下原因&#xff0c;PGA 内存使用量可能会超过 PGA_AGGREGATE_TARGET 设置&#xff1a; PGA_AGGREGATE_TARGET 设置…

localhost和127.0.0.1的区别是什么

今天在网上逛的时候看到一个问题&#xff0c;没想到大家讨论的很热烈&#xff0c;就是标题中这个&#xff1a; localhost和127.0.0.1的区别是什么&#xff1f; 前端同学本地调试的时候&#xff0c;应该没少和localhost打交道吧&#xff0c;只需要执行 npm run 就能在浏览器中打…

用python实现旭日图

旭日图&#xff08;Sunburst Chart&#xff09;是一种可视化数据的方式&#xff0c;它展示了层次结构和嵌套关系。在旭日图中&#xff0c;中心点代表最高级别&#xff0c;然后向外展开&#xff0c;表示数据中的层次结构。 Python中有一个名为pyecharts的库&#xff0c;可以用来…

MySql数据库备份和恢复

windows下操作 备份exp.bat内容如下 echo offcd C:\Program Files\MySQL\MySQL Server 8.0\binmysqldump -uroot -p12345678 -R dayreport > D:\bk\20230420\dayreport_20230420.sqlmysqldump -uroot -p12345678 -R ddm_am > D:\bk\20230420\ddm_am_20230420.sqlmysqld…

Python 常用数据类型

Python 常用数据类型有以下这些&#xff1a; 数据类型中文解析例子int整数&#xff0c;表示整数值1、2float浮点数&#xff0c;表示带有小数点的数值3.14、2.718complex复数&#xff0c;表示实部和虚部组成的复数12j、3-4jstr字符串&#xff0c;表示文本数据&#xff0c;用引号…

Python input()函数:获取用户输入的字符串

input() 函数用于向用户生成一条提示&#xff0c;然后获取用户输入的内容。由于 input() 函数总会将用户输入的内容放入字符串中&#xff0c;因此用户可以输入任何内容&#xff0c;input() 函数总是返回一个字符串。 例如如下程序&#xff1a; msg &#xff1d; input("请…

Python在智能手机芯片研发

Python在智能手机芯片研发中扮演着重要的角色。以下是几个方面的重要性&#xff1a; 快速原型设计&#xff1a;Python具有简洁易读的语法和丰富的第三方库&#xff0c;使工程师能够快速构建原型和进行快速迭代。这对于芯片研发来说&#xff0c;可以加快开发速度&#xff0c;减少…

2024.1.8

今天主要学习的是#define宏的定义、程序的预处理、编译、链接和字符串函数的运用&#xff0c;总的来说不算是特别难&#xff08;和前面的指针这些相比的话&#xff09;&#xff0c;所以说理解起来相对轻松&#xff0c;但其内容还是十分丰富的&#xff0c;所以说需要大量的练习来…

【HarmonyOS开发】ArkUI-X 跨平台框架(使用ArkTs开发AndroidIOS)

ArkUI-X 跨平台框架进一步将 ArkUI 开发框架扩展到了多个OS平台&#xff0c;目前支持OpenHarmony、HarmonyOS、Android、 iOS&#xff0c;后续会逐步增加更多平台支持。开发者基于一套主代码&#xff0c;就可以构建支持多平台的精美、高性能应用。 一、跨平台框架有哪些? 1、…

猫头虎分享已解决Bug || 解决Vue.js not detected的问题 ️

博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; 《面试题大全》 — 面试准备的宝典&#xff01;《IDEA开发秘籍》 — 提升你的IDEA技能&#xff01;《100天精通Golang》…

SM4加密算法例程(新增CTR模式)

说明 SM4和AES只是加密算法不同&#xff0c;使用起来几乎没有区别&#xff0c;AES相关的例程可以参考&#xff1a; 基于mbedtls的AES加密(C/C) 基于OpenSSL的AES加密(C/C) 本文主要介绍SM4加密算法&#xff0c;并提供库里没有的CTR模式模式 加密模式介绍 ECB模式&#xff…