大数据技术原理与应用-概述

一.大数据概述

(一)大数据概念

1.技术支撑:存储、计算、网络。
2.数据产生方式

  • 第一阶段:运营式系统阶段
  • 第二阶段:用户原创内容阶段
  • 第三阶段:感知式系统阶段(物联网的实现普及)

3.大数据的特性(4V)

  • 快速化(variety)
    处理速度非常快(秒级决策)。
  • 大量化(volume)
    大数据摩尔定律:每两年数据增长一倍。
    大数据是由结构化和非结构化(占比大)数据组成。
  • 多样化(velocity)
  • 价值密度低(value)
    价值密度低,商业价值高。

5.影响

1)几种科学研究范式:

  • 实验范式
  • 理论范式
  • 计算范式
  • 数据范式:大数据带来了第四种科学研究范式,以数据为驱动去发现问题。

2)影响

  • 全样而非抽样。传统思维上,数据太多,无法保存和分析,统计学采用抽样。
  • 效率而非精确。追求高效率,全样不会放大误差,数据时效性高。
  • 相关而非因果

(三)关键技术

  • 数据采集
  • 数据存储于管理
  • 数据处理与分析
  • 数据隐私与安全

1.两大关键技术

  • 分布式存储
  • 分布式处理

2.典型计算模式

  • 批处理,MapReduce和Spark就是典型的批处理计算模式的典型代表,不能满足时效性要求。Spark时效性比MapReduce要好,Spark可以高效的做迭代计算。
  • 流计算,需要实时处理,实时响应。
  • 图计算
  • 查询分析计算,如Hive,实时性高。
    在这里插入图片描述

(五)大数据与云数据、物联网的关系

1.云计算:通过网络以服务的方式为用户提供非常廉价的IT资源。

1)解决两大核心问题。

  • 分布式存储
  • 分布式处理

2)典型特征:虚拟化、多租户。
3)云计算的三种模式

  • 共有云
  • 私有云
  • 混合云

4)三种云服务

  • SaaS:软件即服务,提供云软件服务,面向用户。
  • PaaS:平台即服务,面向应用开发者。
  • IaaS:即基础设施即服务,将基础设施(计算资源和存储)作为服务出租。面向网络架构师。

2.物联网

物联网(IoT):万物相连的互联网,是互联网的延伸。
1)层次架构:

  • 应用层
  • 处理层
  • 网络层
  • 感知层

2)关键技术

  • 识别和感知技术

3.关系:大数据继承自云计算,大数据的飞速发展,使得云计算中的分布式存储和分布式处理有了用武之地,大数据技术为物联网数据分析提供了支撑。

4.云计算、大数据和物联网推动了第三次信息化浪潮。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484249.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

突破性进展!上海光机所成果登上《Nature》封面!

来源:中国科学院上海光学精密机械研究所中国科学院上海光学精密机械研究所强场激光物理国家重点实验室,利用自行研制的具有国际领先综合性能的超强超短激光装置,在基于激光加速器的小型化自由电子激光研究方面取得突破性进展。研究团队通过显…

爬取今日头条财经版块新闻

使用jupyter编辑, etree爬取 进入头条财经新闻网页,无法获取原网页内容,在查看各个请求中发现一个url里包含新闻信息.信息都在data里 import requests from lxml import etree import json url "https://www.toutiao.com/api/pc/feed/?categorystock&utm_sourcetout…

计算机网络(九)-物理层(补充)-傅里叶变换-信道复用

一.几个术语 1.码元------在使用时间域(时域)的波形表示数字信号时,代表不同离散数值的基本波形。 2.调制------把数字信号转换为模拟信号的过程。 3.解调------把模拟信号转换为数字信号的过程。 4.双绞线水晶头:从左到右分别为橙白橙(发送)、绿白蓝、蓝白绿、…

硅光芯片:突破“摩尔定律”曙光初现

来源:中国军网讲叙人:江天,国防科技大学前沿交叉学科学院研究员作者:王握文、任永存、朱晰然它是在硅基平台上将光电子和微电子融合起来的一种新技术它显示出的优异性能,为芯片研发“换道超车”带来希望它发展方兴未艾…

计算机网络(十)-数据链路层-差错控制

一.差错控制 1.1 差错: 噪声引起 全局性:由于线路本身电气特性所产生的随机噪声(热噪声),是信道固有的,随机存在。解决办法:提高信噪比来减小或避免干扰。局部性:外界特定的短暂原因所造成的的冲击噪声,是产生的差错…

第八篇!95后天才少年曹原再发Nature!

来源:自科在线编辑:nhyilin2021年7月21日,“石墨烯驾驭者“曹原作为第一作者和通讯作者在国际顶尖学术期刊 Nature 发表了题为:Pauli-limit violation and re-entrant superconductivity in moir graphene 的研究论文。这是这位95…

计算机网络(十一)-数据链路层-流量控制

一.流量控制 1.1 较高的发送速度和较低的接收能力的不匹配,因此流量控制也是数据链路层的一项重要工作。 1.2 数据链路层的流量控制是点对点的,而传输层的流量控制是端到端的。 1.3 数据链路层流量控制手段:接收方收不下就不回复确认。 传…

加强原始创新和基础研究的前提:三项破解之策

来源:国家智库 作者:刘益东,系中国科学院自然科学史研究所研究员世界科技史证明,谁拥有了一流创新人才、拥有了一流科学家,谁就能在科技创新中占据优势。当前,我国科技发展正进入以原始创新、基础研究为主…

计算机网络(十二)-信道划分介质访问控制-信道复用

一.传输数据的两种链路 点对点链路:两个相邻节点通过一个链路相连,没有第三者。应用PPP协议,常用于广域网。广播式链路:所有主机共享通信介质。早期的总线以太网、无线局域网、常用于局域网。典型的拓扑结构:总线型、星型(逻辑总…

深度学习领域有哪些瓶颈?

来源:知乎 编辑:深度学习与计算机视觉深度学习近年来成为计算机领域最耀眼的明星,衍生出许多实际的应用,主要是在推理与决策等方面取得了突破。然而深度学习如何在超越图像、语音及自然语言处理方面做出更多成绩,比如…

Codeforces Round #462 (Div. 2), problem: (C) A Twisty Movement (求可以转一次区间的不递增子序列元素只有1,2)...

题目意思&#xff1a; 给长度为n&#xff08;n<2000&#xff09;的数字串&#xff0c;数字只能为1或者2&#xff0c;可以将其中一段区间[l,r]翻转&#xff0c;求翻转后的最长非递减子序列长度。 题解&#xff1a;求出1的前缀和&#xff0c;2的后缀和&#xff0c;以及区间[i,…

计算机网络(十三)-数据链路层-动态分配信道

一.动态分配信道 也称动态媒体接入控制/多点接入&#xff0c;特点是信道并在用户通信时固定分配给用户。 轮询访问介质访问控制: -令牌传递协议随机访问介质访问控制:所用用户可随机发送信息&#xff0c;发送信息时占全部宽带。 -ALOHA协议 -CSMA协议 -CSMA/CD协议 -CSMA/CA协…

元宇宙大热后将陷低潮, 虚实互联网更准确, 2030前后才可能全面热启

作者&#xff1a;DCCI*未来智库、未来实验室专家胡延平来源&#xff1a;今日头条3个判断、3个野心、技术要件6个瓶颈&#xff1b;虚实互联网这个概念元宇宙信徒听起来有些扎心但真实恰当......扎克伯格称Facebook要从社交转型为一家元宇宙公司的专访瞬间刷屏&#xff0c;将去年…

python28 excel读取模块xlrd

安装&#xff1a; pip install xlrd 简单使用&#xff1a; import xlrdbook xlrd.open_workbook(rC:\Users\dinghanhua\Desktop\yqqapi.xlsx) # 打开excel print("the number of sheets:",book.nsheets) # sheet数量 print("sheet_names:",book.sheet_nam…

计算机网络(十四)-CSMA/CD协议

一.CSMA/CD协议 载波监听多点接入/碰撞检测CSMA/CD。 1.1 CS&#xff1a;载波侦听/监听&#xff0c;每一个站在发送数据之前以及发送数据时都要检测一下总线上是否有其他计算机在发送数据。 1.2 MA&#xff1a;多点接入&#xff0c;表示多计算机以多点接入的方式连接在一根总…

机器人流程自动化(RPA)系统原理及特点

来源&#xff1a;OFweek机器人编者按机器人流程自动化&#xff08;RPA&#xff09;系统是一种应用程序&#xff0c;它通过模仿最终用户在电脑的手动操作方式&#xff0c;提供了另一种方式来使最终用户手动操作流程自动化。可迅速实现业务提效&#xff0c;将重复性劳动进行自动化…

计算机网络(十五)-数据链路层-CSMA/CA协议

一.CSMA/CA协议 载波监听多点接入/碰撞避免CSMA/CA 主要在无线局域网中使用。 1.1 工作原理 发送数据前&#xff0c;先检测信道是否空闲。空闲则发出RTS&#xff0c;RTS包括发送端的地址、接收端的地址、下一份数据将持续发送的时间等信息&#xff1b;信道忙则等待。接收端收…

自动驾驶中的机器学习

出品&#xff1a;CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;作者&#xff1a;Denis Chikurtev译者&#xff1a;马超 责编&#xff1a;晋兆雨以下为译文&#xff1a;近年来&#xff0c;自动驾驶技术技术的发展速度非常快。预计达到完全自动驾驶L5的程度是指日可待的…

计算机网络(十六)-轮询访问介质访问控制

介质访问控制 1.几种协议 信道划分介质访问控制(MAC)协议&#xff1a; 基于多路复用技术划分资源。网络负载重&#xff1a;共享信道效率高&#xff0c;且公平。网络负载轻&#xff1a;共享信道效率低。 随机访问MAC协议&#xff1a; 用户根据意愿随机发送信息&#xff0c;…

区分真实模式的两个标准

来源&#xff1a;混沌巡洋舰人类作为模式发现者&#xff0c;处于一触即发的状态&#xff0c;我们可以倾向于在一个系统找到模式&#xff0c;而这个系统可能并不真实存在。由此&#xff0c;问题出现了&#xff0c;宇宙究竟是按照模式运行的&#xff0c;还是人类只是在我们看到的…