一幅长文细学华为MRS大数据开发(一)——大数据时代的挑战和机遇

文章目录

  • 1 大数据时代的挑战和机遇
    • 1.1 大数据基础概念
      • 大数据时代的发展
      • 大数据定义
      • 大数据的4V
      • 大数据处理和传统数据处理的差异
      • 并行计算相关知识
    • 1.2 大数据应用领域
        • 大数据金融应用
        • 大数据教育应用
        • 大数据公共安全应用
        • 大数据交通规划应用
    • 1.3 大数据计算
        • 计算任务的分类
        • 大数据应用的主要计算模式
        • Hadoop大数据生态圈
    • 1.4 企业面临的挑战和机遇
        • 挑战
        • 机遇
    • 1.5 华为鲲鹏解决方案
      • 新时代的需求
      • 鲲鹏计算产业优势
      • 鲲鹏计算产业整体架构
      • 鲲鹏大数据解决方案
      • BIgData Pro大数据解决方案
      • 华为大数据解决方案优势
      • 华为云大数据服务
      • 华为云MRS服务
      • 华为云MRS服务的优势

1 大数据时代的挑战和机遇

1.1 大数据基础概念

大数据时代的发展

蒸汽时代——电气时代——信息时代——智能时代


大数据定义

大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集


大数据的4V

  • 体量巨大Volume
  • 处理速度快Velocity
  • 类型繁多Variety
  • 价值密度低Value

大数据处理和传统数据处理的差异

大数据处理传统数据处理
数据规模
数据类型繁多单一
模式和数据的关系先有数据后有模式,模式随数据增多不断演变先有模式后有数据
处理工具No size fits allOne size fits all

并行计算相关知识

节点:指的就是某一个服务器,或者是某一台计算机,或者是某一台主机

机架:存放服务器的架子。一般来说全1U设备部署数量一般不超过16台,全2U设备一般不超过12台,全4U设备一般4到7台。也就是说,一台机架上有多个服务器。


1.2 大数据应用领域

image-20220808131727936


大数据金融应用

image-20220808131851336


大数据教育应用

image-20220808132004819


大数据公共安全应用

image-20220808132053314


大数据交通规划应用

image-20220808132137734


1.3 大数据计算

计算任务的分类

IO密集型任务

计算密集型任务

数据密集型任务

大数据应用的主要计算模式

批处理计算:针对大规模数据的批量处理,如MapReduce、Spark等

流计算:针对流数据的实时计算处理,如Spark、Storm、Flink、Flume、Dstream等

图计算:针对大规模图结构数据的处理,如GraphX、Gelly、Giraph、PowerGraph等

查询分析计算:大规模数据的存储管理和查询分析,如Hive、Impala、Dremel等


Hadoop大数据生态圈

image-20220808133822526


1.4 企业面临的挑战和机遇

挑战

  • 业务部门无清晰的大数据需求
  • 企业内部数据孤岛严重
  • 数据可用性低、质量差
  • 数据相关管理技术和架构
  • 数据安全问题
  • 大数据人才缺乏
  • 数据开放和隐私的权衡

机遇

大数据挖掘成为商业分析的核心

大数据成为信息技术应用的支撑点

大数据成为信息产业持续增长的新引擎


1.5 华为鲲鹏解决方案

新时代的需求

万物互联——海量数据产生需要更高算力

应用和数据的多样性需要新的计算架构

超万亿规模的计算产业空间


鲲鹏计算产业优势

以中国市场孵化和完善行业应用,与全球产业形成良性循环

和ARM共享优势生态,协同加速发展


鲲鹏计算产业整体架构

鲲鹏计算产业是基于Kunpeng处理器构建的全栈IT基础设施、行业应用及服务,包括PC、服务器、存储、操作系统、中间件、虚拟化、数据库、云服务、行业应用以及咨询管理服务等。


鲲鹏大数据解决方案

华为安全可控大数据解决方案,提供一站式高性能大数据计算及数据安全解决方案,解决公共安全行业大数据智能化建设的数据安全、效率、能耗等基础性难题。


BIgData Pro大数据解决方案

该方案采用基于公有云的存储和计算分离架构,以可无限弹性扩容的鲲鹏算力作为计算资源,以支持原生多协议的OBS对象存储服务为统一的存储数据湖。

提供了“存算分离、极致弹性、极致高效”的全新公有云大数据解决方案,大幅提高了大数据集群的资源利用率。


华为大数据解决方案优势

  • 高安全
  • 高性能
  • 高开放

华为云大数据服务

image-20220808171408971


华为云MRS服务

image-20220808171536141


华为云MRS服务的优势

  • 高性能
  • 易运维
  • 高安全
  • 低成本

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/398469.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一幅长文细学华为MRS大数据开发(二)——HDFS分布式文件系统和ZooKeeper

文章目录2 HDFS分布式文件系统和ZooKeeper2.1 HDFS概述以及应用场景HDFS概述HDFS应用场景HDFS不适合的场景2.2 HDFS相关概念计算机集群结构基本系统架构块NameNode和DataNodes2.3 HDFS体系架构HDFS体系架构概述HDFS命名空间管理通信协议客户端HDFS单名称节点体系结构的局限性心…

BOS12——多对多添加方法,多对多页面需要字段问题(不多的话直接提供get方法),修改Realm中授权方法(查询数据库),缓存Java对象的方法,加载左侧菜单(ztree提供pId)...

1、多对多添加方法 Override public void add(Role model, String functionIds) {// 1.先将角色保存到数据库roleDao.save(model);// 2.为角色添加权限(一定要坚持映射文件中是否inverse)if (StringUtils.isNotBlank(functionIds)){String[] functionIdL…

一幅长文细学JavaScript(七)——Ajax

文章目录7 Ajax7.1 概述7.1.1 基本概念7.1.2 网络通信开发者工具7.1.3 网页请求数据的方式7.1.4 资源的请求方式7.2 JQuery中的Ajax7.2.1 基本知识7.2.2 了解jQuery的Ajax7.2.3 $.get()7.2.4 $.post()7.2.5 $.ajax()7.3 接口7.3.1 接口概念7.3.2 接口测试工具7.4 form表单7.4.1…

Linux系统检查查看桌面环境

Linux的桌面系统系统多达十几种,像gnome、kde、mate、cinnamon、lxde、xfce、jwm等。比较常用的一般是gnome、kde、xfce等。那么如何判断Linux系统安装了哪种桌面环境组件呢?下面总结了一些检查桌面环境的方法: 方法1:env | grep…

一幅长文细学JavaScript(二)——ECMAScript

2 基本程序设计结构 摘要 ​ 对于学习JS的程序员来说,一定是具备了一定的编程功底的,故在下面的概述中,我们不再提及一些简单的概念。 声明:在使用本文的代码时,为了避免文章冗长,我只附上了script标签内的…

HashMap源码剖析

无论是在平时的练习还是项目当中,HashMap用的是非常的广,真可谓无处不在。平时用的时候只知道HashMap是用来存储键值对的,却不知道它的底层是如何实现的。 一、HashMap概述 HashMap基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作…

Android成长日记-Android监听事件的方法

1. Button鼠标点击的监听事件 --setOnClickListener 2. CheckBox, ToggleButton , RadioGroup的改变事件 --setOnCheckedChangeListener Eg: 3. onPageChangeListener() ----用来监控ViewPager滑到第几页转载于:https://www.cnblogs.com/boy1025/p/4301956.html

XSS攻击(出现的原因、预防措施......)

验证XSS攻击重点不是去查找可输入哪些内容会出现什么样的bug就是测试XSS攻击,重点是了解它出现的原理,为什么会出现XSS攻击,导致一些问题出现?如何防御与解决XSS攻击?以下我将简单介绍以上提出的问题。 如何判定没有被…

一幅长文细学JavaScript(三)——DOM

文章目录3 JavaScript DOM3.1 DOM基本术语DOM模型及其作用文档对象模型节点节点的属性文档对象3.2 DOM文档操作3.2.1 查找网页元素3.2.2 获取元素内容新的策略——修改样式更好的策略——修改样式3.2.3 改变元素内容3.2.4 操作网页元素3.2.5 获取元素偏移offset和style的区别3.…

2016国内移动广告平台排行榜

为什么80%的码农都做不了架构师?>>> 移动营销的发展可追溯至第一台便携式手机的诞生,并随着移动终端的更新迭代和广告技术的发展创新;随着移动互联网的技术与商业模式的迅速发展,移动营销领域面临着种种创新与改革&am…

Planning Strategy 和Requirement type的思考

Planning Strategy 和 requirement type的联系 1. 当需要对一个material进行计划的时候 ,我们会自然的考虑到plant的 production方式 ( MTO production or MTS production) ,如果能确定下来是MTO 还是MTS 的方式 , 那就可以确定了计划策略的选择 。 而计…

【摄影】田子坊

图片发自简书App图片发自简书App图片发自简书App图片发自简书App图片发自简书App图片发自简书App图片发自简书App图片发自简书App转载于:https://www.cnblogs.com/wangting888/p/9701627.html

selenium RC 环境配置

在网上搜索了许久,没找到有具体的配置,只是简单了写了几个步骤,自己琢磨了一下,于是,就想整理一篇文章,便于以后温习。 本文是参照官网的步骤进行了,当然了,也不完成相同。在这里我要…

一幅长文细学GaussDB(二)——数据库基础知识

文章目录2 数据库基础知识2.1 数据库管理简介数据库管理数据库管理工作范围对象管理制定数据库对象命名规范备份和恢复灾难恢复备份方式数据库安装数据库卸载数据库迁移数据库扩容例行维护工作2.2 数据库重要概念数据库和数据库实例数据库连接和会话数据库连接池模式表空间表数…

hive如何处理not in和in的问题

2019独角兽企业重金招聘Python工程师标准>>> 首先我们先创建两个表和测试数据。建表语句如下: create table table1(uid STRING, dayTimes BIGINT) PARTITIONED BY (dt STRING); create table table2(uid STRING, monTimes BIGINT) PARTITIONED BY (dt S…

一幅长文细学GaussDB(三)——SQL语法

文章目录3 SQL语法3.1 SQL语句概述SQL语句介绍SQL语句分类3.2 数据类型常用数据类型非常用数据类型3.3 系统函数概述数值计算函数字符处理函数时间日期函数类型转换函数系统信息函数3.4 操作符概述逻辑操作符比较操作符算术操作符测试操作符其他操作符3 SQL语法 华为GaussDB(f…

从网络获取数据显示到TableViewCell容易犯的错

2019独角兽企业重金招聘Python工程师标准>>> 昨晚第一次做用网络接口获取的数据,显示到自己的cell上,犯了很多的错, 总结如下; 1.数据源数组必须首先初始化,一般使用的是懒加载; 2.异步获取网络…

第二学期-第一次作业

1-1. 计算两数的和与差 1.设计思路 第一步:设出被调用函数 op1, op2, *psum, *pdiff ,利用被调函数计算*psum的值和*pdiff的值; 第二步:代入到主函数就是计算a、b的和与差; 第三部:对所得到数值进行输出&a…

一幅长文细学华为MRS大数据开发(三)——Hive

文章目录3 HIVE3.1 Hive概述Hive简介Hive应用场景Hive与传统数据仓库比较Hive优点3.2 Hive功能及架构Hive运行流程Hive数据存储模型Hive数据存储模型-分区和分桶Hive数据存储模型-托管表和外部表Hive支持的函数3.3 Hive基本操作Hive使用DDL操作DML操作DQL操作3 HIVE Apache Hi…

Huffman树进行编码和译码

//编码 #include<iostream> #include<cstdio> #include<cstring> #include<cstdlib> #include<algorithm> #include<queue> #include<fstream> #include<map> using namespace std;typedef struct HuffmanNode{int w;//节点…