【大数据技术原理与应用(概念、存储、处理、分析与应用)】第1章-大数据概述习题与知识点回顾

文章目录

    • 单选题
    • 多选题
    • 知识点回顾
      • 几次信息化浪潮主要解决什么问题?
      • 信息科技为大数据时代提供哪些技术支撑?
      • 数据产生方式有哪些变革?
      • 大数据的发展历程
      • 大数据的四个特点(4V)
      • 大数据对思维方式的影响
      • 大数据有哪些关键技术?
      • 大数据的常见四种计算模式
      • 大数据产业有哪些产业链环节?
      • 云计算有哪些关键技术?
      • 云计算的三种服务模式分别是什么意思?
      • 什么是云计算数据中心?
      • 物联网有哪些组成部分?
      • 物联网有哪些关键技术?

单选题

  • 1、第一次信息化浪潮主要解决什么问题?

    • A、信息传输
    • B、信息处理 ☑️
    • C、信息爆炸
    • D、信息转换
  • 2、下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?

    • A、利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理。 ☑️
    • B、利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
    • C、构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
    • D、把实时采集的数据作为流计算系统的输入,进行实时处理分析
  • 3、在大数据的计算模式中,流计算解决的是什么问题?

    • A、针对大规模数据的批量处理
    • B、针对大规模图结构数据的处理
    • C、大规模数据的存储管理和查询分析
    • D、针对流数据的实时计算 ☑️
  • 4、大数据产业指什么?

    • A、一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合 ☑️
    • B、提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业
    • C、提供数据分享平台、数据分析平台、数据租售平台等服务的企业
    • D、提供分布式计算、数据挖掘、统计分析等服务的各类企业
  • 5、下列哪一个不属于大数据产业的产业链环节?

    • A、数据循环层 ☑️
    • B、数据源层
    • C、数据分析层
    • D、数据应用层
  • 6、下列哪一个不属于第三次信息化浪潮中新兴的技术?

    • A、互联网 ☑️
    • B、云计算
    • C、大数据
    • D、物联网
  • 7、云计算平台层(PaaS)指的是什么?

    • A、操作系统和围绕特定应用的必需的服务 ☑️
    • B、将基础设施(计算资源和存储)作为服务出租
    • C、从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个模型
    • D、提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务
  • 8、下面关于云计算数据中心的描述正确的是:

    • A、数据中心是云计算的重要载体,为各种平台和应用提供运行支撑环境 ☑️
    • B、数据中心就是放在企业内部的一台中心服务器
    • C、每个企业都需要建设一个云计算数据中心
    • D、数据中心不需要网络带宽的支撑
  • 9、下列哪个不属于物联网的应用?

    • A、智能物流
    • B、智能安防
    • C、环保监测
    • D、数据清洗 ☑️
  • 10、下列哪项不属于大数据的发展历程?

    • A、成熟期
    • B、萌芽期
    • C、大规模应用期
    • D、迷茫期 ☑️

多选题

  • 1、第三次信息化浪潮的标志是哪些技术的兴起?

    • A、个人计算机
    • B、物联网 ☑️
    • C、云计算 ☑️
    • D、大数据 ☑️
  • 2、 信息科技为大数据时代提供哪些技术支撑?

    • A、存储设备容量不断增加 ☑️
    • B、网络带宽不断增加 ☑️
    • C、CPU 处理能力大幅提升 ☑️
    • D、数据量不断增大
  • 3、 大数据具有哪些特点?

    • A、数据的“大量化” ☑️
    • B、数据的“快速化” ☑️
    • C、数据的“多样化” ☑️
    • D、数据的“价值密度比较低” ☑️
  • 4、 下面哪个属于大数据的应用领域?

    • A、智能医疗研发 ☑️
    • B、监控身体情况 ☑️
    • C、实时掌握交通状况 ☑️
    • D、金融交易 ☑️
  • 5、 大数据的两个核心技术是什么?

    • A、分布式存储 ☑️
    • B、分布式应用
    • C、分布式处理 ☑️
    • D、集中式存储
  • 6、 云计算关键技术包括什么?

    • A、分布式存储 ☑️
    • B、虚拟化 ☑️
    • C、分布式计算 ☑️
    • D、多租户 ☑️
  • 7、 云计算的服务模式和类型主要包括哪三类?

    • A、软件即服务(SaaS) ☑️
    • B、平台即服务(PaaS) ☑️
    • C、基础设施即服务(IaaS) ☑️
    • D、数据采集即服务(DaaS)
  • 8、 物联网主要由下列哪些部分组成的?

    • A、应用层 ☑️
    • B、处理层 ☑️
    • C、感知层 ☑️
    • D、网络层 ☑️
  • 9、 物联网的关键技术包括哪些?

    • A、识别和感知技术 ☑️
    • B、网络与通信技术 ☑️
    • C、数据挖掘与融合技术 ☑️
    • D、信息处理一体化技术
  • 10、 大数据对社会发展的影响有哪些?

    • A、大数据成为一种新的决策方式 ☑️
    • B、大数据应用促进信息技术与各行业的深度融合 ☑️
    • C、大数据开发推动新技术和新应用的不断涌现 ☑️
    • D、大数据对社会发展没有产生积极影响

知识点回顾

几次信息化浪潮主要解决什么问题?

浪潮发生时间标志解决问题代表企业
第一次浪潮1980年前后个人计算机信息处理Intel、AMD、IBM、苹果、微软、联想、戴尔、惠普等
第二次浪潮1995年前后互联网信息传输雅虎、谷歌、阿里巴巴、百度、腾讯等
第三次浪潮2010年前后物联网、云计算和大数据信息爆炸阿里云、华为云、亚马逊AWS、微软Azure、思科、高通等

信息科技为大数据时代提供哪些技术支撑?

  • 存储设备容量不断增加
  • CPU处理能力大幅提升
  • 网络带宽不断增加

数据产生方式有哪些变革?

  • 运营式系统阶段:主要来自企业和机构的内部运营系统
  • 用户原创内容阶段:互联网用户生成的大量内容
  • 感知式系统阶段:物联网(IoT)设备和传感器生成的数据

大数据的发展历程

萌芽期->成熟期->大规模应用期:

阶段时间内容
萌芽期上世纪90年代至本世纪初数据挖掘理论和数据库技术成熟,商业智能工具和知识管理技术开始应用,如数据仓库、专家系统、知识管理系统等。
成熟期本世纪前十年Web2.0应用迅猛发展,非结构化数据大量产生,传统处理方法难以应对,带动大数据技术快速突破,形成并行计算与分布式系统两大核心技术,谷歌的GFS和MapReduce技术受到追捧,Hadoop平台普及。
大规模应用期2010年以后大数据应用渗透各行各业,数据驱动决策,信息社会智能化程度大幅提高。

大数据的四个特点(4V)

  • Volume(数据量大)
    • 概念:大数据的显著特点之一是数据量巨大。传统的数据处理技术难以处理如此庞大的数据量,需要采用分布式存储和计算技术。
    • 实例:社交媒体平台每天产生数以亿计的帖子、图片和视频,传感器网络每秒生成海量数据等。
  • Variety(数据类型繁多)
    • 概念:大数据不仅包括结构化数据,还包括大量的非结构化和半结构化数据,如文本、图像、视频、日志文件等。
    • 实例:企业数据不仅包括传统的财务数据、销售记录,还包括社交媒体评论、客户反馈、视频监控等多种形式的数据。
  • Velocity(处理速度快)
    • 概念:大数据需要快速处理和分析,以便及时提取有用信息并做出决策。实时处理和流数据处理技术在大数据处理中非常重要。
    • 实例:金融市场的实时交易数据、物联网传感器的实时监控数据、在线广告的实时点击流数据等。
  • Value(价值密度低)
    • 概念:大数据的价值密度低,即从海量数据中提取有价值的信息和知识的难度较大,数据的整体价值相对于其数量来说是较低的。
    • 实例:从社交媒体上的海量用户生成内容中提取出有用的市场趋势和消费者行为数据。

大数据对思维方式的影响

  • 全样而非抽样:在大数据时代,我们不再依赖于少量的数据样本,而是分析与某事物相关的所有数据。这种全面的数据分析使得研究结果更加全面和准确。
  • 效率而非精确:大数据的处理强调速度和效率,而不是追求绝对的精确性。在面对复杂和海量的数据时,迅速得到一个大致准确的结果往往比耗费大量时间去得到一个精确的结果更有实际价值。
  • 相关而非因果:我们逐渐转变了传统的因果关系思维,转而关注事物之间的相关关系。虽然相关关系不能直接证明因果关系,但在很多实际应用中,找到相关性已经足够帮助我们做出有效的决策。

大数据有哪些关键技术?

  • 数据采集与预处理:大数据处理的第一步,它涉及到从各种不同的源头获取数据。这些源头可能包括数据库、文件、API、网络爬虫等。
  • 数据存储和管理:如何有效地存储和管理大量的、各种结构类型的数据。
  • 数据处理和分析:对海量数据的计算和挖掘。
  • 数据隐私和安全:确保个人隐私不被泄露,防止数据泄露和未授权访问。

大数据的常见四种计算模式

  • 批处理计算:针对大规模数据的批量处理模式,适用于处理静态数据集,进行复杂的计算任务。
  • 流计算:针对流数据的实时计算模式,适用于处理持续产生的数据流,进行实时分析和处理。
  • 图计算:针对大规模图结构数据的计算模式,适用于处理图形结构的数据,如社交网络分析、路径计算等。
  • 查询分析计算:一种针对大规模数据的存储管理和查询分析模式,适用于大规模数据的快速查询和分析。

大数据产业有哪些产业链环节?

有6个环节,分别是:

  • IT基础设施层:提供大数据处理所需的硬件、软件和网络基础设施,以及相关的咨询、规划和系统集成服务。
  • 数据源层:提供大数据的基础数据来源,涵盖各种领域的数据。
  • 数据管理层:负责数据的抽取、转换、存储和管理,为数据分析提供基础。
  • 数据分析层:提供分布式计算、数据挖掘、统计分析等服务,对大数据进行深入分析和挖掘。
  • 数据平台层:提供数据分享、分析、租售等平台服务,支持大数据的广泛应用。
  • 数据应用层:提供基于大数据的各种智能应用,涵盖多个行业领域。

云计算有哪些关键技术?

  1. 虚拟化:通过虚拟化技术,将物理资源抽象为多个虚拟资源,提高资源利用率和灵活性。
  2. 分布式存储:将数据分布存储在多个节点上,提供高可用性和数据冗余。
  3. 分布式计算:通过分布式计算技术,支持大规模数据处理和计算任务。
  4. 多租户:在同一物理基础设施上支持多个用户和应用的隔离和管理。

云计算的三种服务模式分别是什么意思?

  • IaaS(基础设施即服务):将计算资源和存储作为服务出租,用户可以按需使用底层基础设施。
  • **PaaS(平台即服务):**提供一个完整的开发和部署环境,包括操作系统和围绕特定应用的必要服务。
  • SaaS(软件即服务):把软件作为服务出租,用户通过互联网访问应用软件,而无需管理或控制底层基础设施。

什么是云计算数据中心?

云计算数据中心是一整套复杂的设施,包括刀片服务器、宽带网络连接、环境控制设备、监控设备以及各种安全装置等。数据中心是云计算的重要载体,为云计算提供计算、存储、带宽等各种硬件资源,为各种平台和应用提供运行支撑环境。

物联网有哪些组成部分?

物联网(IoT,Internet of Things)是指通过局部网络或互联网等通信技术,将传感器、控制器、机器、人员和物等连接在一起,形成一个人与物、物与物相联的网络。物联网利用这种连接方式,实现信息化和远程管理控制,是互联网的延伸和扩展。

物联网体系架构图如下所示:

物联网体系架构图

物联网有哪些关键技术?

  • 识别和感知技术
  • 网络与通信技术
  • 数据挖掘与融合技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/35456.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软考《信息系统运行管理员》-1.2信息系统运维

1.2信息系统运维 传统运维模式(软件) 泛化:软件交付后围绕其所做的任何工作纠错:软件运行中错误的发现和改正适应:为适应环境做出的改变用户支持:为软件用户提供的支持 新的不同视角下的运维 “管理”的…

Java 面试指南合集

线程篇 springBoot篇 待更新 黑夜无论怎样悠长,白昼总会到来。 此文会一直更新哈 如果你希望成功,当以恒心为良友,以经验为参谋,以当心为兄弟,以希望为哨兵。

拉普拉斯变换与卷积

前面描述 卷积,本文由卷积引入拉普拉斯变换。 拉普拉斯变换就是给傅里叶变换的 iωt 加了个实部,也可以反着理解,原函数乘以 e − β t e^{-\beta t} e−βt 再做傅里叶变换,本质上都是傅里叶变换的扩展。 加入实部的拉普拉斯变…

【建设方案】智慧园区大数据云平台建设方案(DOC原件)

大数据云平台建设技术要点主要包括以下几个方面: 云计算平台选择:选择安全性高、效率性强、成本可控的云计算平台,如阿里云、腾讯云等,确保大数据处理的基础环境稳定可靠。 数据存储与管理:利用Hadoop、HBase等分布式…

一年Java转GO|19K|腾讯 CSIG 一二面经

面经哥只做互联网社招面试经历分享,关注我,每日推送精选面经,面试前,先找面经哥 背景 学历:本科工作经验:一年(不算实习)当前语言:Javabase:武汉部门\岗位:腾讯云‍ 一…

5000天后的世界:科技引领的未来之路

**你是否想过,5000天后的世界会是什么样子?** 科技日新月异,改变着我们的生活方式,也引领着人类文明的进程。著名科技思想家凯文凯利在他的著作《5000天后的世界》中,对未来进行了大胆的预测。 **这本书中&#xff0c…

基于微信小程序的在线点餐系统【前后台+附源码+LW】

摘 要 随着社会的发展,社会的各行各业都在利用信息化时代的优势。计算机的优势和普及使得各种信息系统的开发成为必需。 点餐小程序,主要的模块包括实现管理员;管理员用户,可以对整个系统进行基本的增删改查,系统的日…

Opencv+python模板匹配

我们经常玩匹配图像或者找相似,opencv可以很好实现这个简单的小功能。 模板是被查找目标的图像,查找模板在原始图像中的哪个位置的过程就叫模板匹配。OpenCV提供的matchTemplate()方法就是模板匹配方法,其语法如下: result cv2.…

使用go语言来完成复杂excel表的导出导入

使用go语言来完成复杂excel表的导出导入(一) 1.复杂表的导入 开发需求是需要在功能页面上开发一个excel文件的导入导出功能,这里的复杂指定是表内数据夹杂着一对多,多对一的形式,如下图所示。数据杂乱而且对应不统一。…

中国90米分辨率可蚀性因子K数据

土壤可蚀性因子(K)数据,基于多种土壤属性数据计算,所用数据包括土壤黏粒含量(%)、粉粒含量(%)、砂粒含量(%)、土壤有机碳含量(g/kg)、…

[DALL·E 2] Hierarchical Text-Conditional Image Generation with CLIP Latents

1、目的 CLIP DDPM进行text-to-image生成 2、数据 (x, y),x为图像,y为相应的captions;设定和为CLIP的image和text embeddings 3、方法 1)CLIP 学习图像和文本的embedding;在训练prior和decoder时固定该部分参数 2&a…

开放式耳机什么牌子好一点?亲检的几款开放式蓝牙耳机推荐

不入耳的开放式耳机更好一些,不入耳式耳机佩戴更舒适,适合长时间佩戴,不会引起强烈的压迫感或耳部不适。不入耳式的设计不需要接触耳朵,比入耳式耳机更加卫生且不挑耳型,因此备受运动爱好者和音乐爱好者的喜爱。这里给…

周转车配料拣货方案

根据周转车安装的电子标签,被悬挂的扫码器扫到墨水屏显示的二维码,投屏发送配料拣货的数据。 方便快捷分拣物料

20240625(周二)欧美股市总结:标普纳指止步三日连跌,英伟达反弹6.8%,谷歌微软新高,油价跌1%

美联储理事鲍曼鹰派发声,若通胀没有持续改善将支持加息,加拿大5月CPI重新加速,对加拿大央行7月降息构成阻碍。美股走势分化,道指收跌近300点且六日里首跌,英伟达市值重上3.10万亿美元,芯片股指显著反弹1.8%…

想要用tween实现相机的移动,three.js渲染的canvas画布上相机位置一点没动,如何解决??

🏆本文收录于「Bug调优」专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&…

第1章 物联网模式简介---独特要求和体系结构原则

物联网用例的独特要求 物联网用例往往在功耗、带宽、分析等方面具有非常独特的要求。此外,物联网实施的固有复杂性(一端的现场设备在计算上受到挑战,另一端的云容量几乎无限)迫使架构师做出艰难的架构决策和实施选择。可用实现技…

【自动调参】年化29.3%,最大回撤18.5%​:lightGBM的参数优化

原创文章第570篇,专注“AI量化投资、世界运行的规律、个人成长与财富自由"。 研报复现继续:【研报复现】年化27.1%,人工智能多因子大类资产配置策略之benchmark 昨天调了一版参数,主要是lambda_l1, lambda_l2,防…

Vmvare12安装CentOS7.6

Vmvare12安装 注意事项 安装完成以后有这两个虚拟网卡。 CentOS官网镜像地址 https://www.centos.org/download/mirrors/Vmvare安装CentOS7.6 创建虚拟机 安装CentOS7.6 选择桌面版 磁盘分区 上述是确认使用自动分区。 设置密码 设置license information 欢迎页面 CentOS7…

宝兰德受邀出席华为开发者大会2024,携手共绘基础软件新篇章

6月21日-23日,华为开发者大会(HDC 2024)在东莞松山湖举行,作为全球开发者的年度盛会,本次大会汇聚了众多业界精英与前沿技术。华为分享了HarmonyOS、盘古大模型、昇腾AI云服务、GaussDB数据库、自研仓颉编程语言等最新…

【IM即时通信 功能介绍】客户端用户在线状态订阅

本文档旨在介绍客户端用户在线状态订阅功能,该功能允许开发者通过 SDK 接口实时监控和接收指定用户的在线或离线状态变更通知。这一功能对于需要实时交流、状态同步或用户活动监控的应用场景至关重要。 功能特点 实时状态通知 跨平台通知:订阅成功后&…