使用大数据闪存打造融合数据平台

随着企业、服务提供商和超大型数据中心从描述性分析向预测性和规范性分析演进,结合了融合运营和分析数据管道的融合数据平台变得日益重要。大数据闪存可让数据处理平台快速访问历史数据和实时数据流,从而以较低成本创建有效的预测模型。

随着大数据从描述性分析(批量)向预测性(交互)和规范性(实时)分析演进,企业正在越来越多地使用串流数据源和历史批量数据,以提高机器的学习能力并建立预测模型。简而言之,描述性分析是为了了解事态,预测性分析是为了建立一个假设场景模型,而规范性分析是为了通过采取数据驱动型行动来影响结果。新型分析应用能够在交易发生时实时捕获它,并能影响其结果,从而带来直接的商业效益。这方面的用例包括:
反洗钱欺诈分析定向营销工业互联网(IoT/IoE)实时生产制造医疗领域的患者数据情报SanDisk闪迪利用新型分析应用对半导体制造数据进行实时分析。从Lambda架构到SMACK

Lambda架构因其融合实时分析和批量分析的能力而深受喜爱。Lambda架构使用HDFS、Scalding和HBASE作为融合实时分析和批量数据管道的构建模块。但是,该架构带来的多管道复制代码和数据的开销,使得其难以大规模部署。

为了克服Lambda架构的局限性,必需配备一个能够有效处理批量和实时串流的大数据管道。全新的SMACK堆栈——Scala及其Spark、Mesos、Akka、Cassandra和Kafka生态系统便旨在实现这一点。SMACK串流已成为一个用于处理批量和串流数据的有效大型平台。

Meosphere的Infinity堆栈或MapR新近发布的Converged Data Platform等解决方案都是Lambda架构的实例。

配备SMACK(Spark、Mesos、Akka、Cassandra和Kafka)堆栈的串流架构

以下是SMARK堆栈的简要介绍:
Spark:一个快速、通用的分布式大型数据处理引擎。Mesos:一个集群资源管理系统,在各个分布式应用之间提供高效的资源隔离和共享功能。Akka:一个工具包和运行环境,用于在JVM上创建高并发、分布式、弹性消息驱动型应用。Cassandra:一个分布式、高度可用的数据库,旨在处理多个数据中心的大量数据。Kafka:一个高吞吐量、低时延的分布式消息系统,旨在处理实时数据流。面向融合数据平台的大数据闪存

为了创建有效的预测模型,融合堆栈系统需要快速访问历史数据和实时数据流。基于闪存的数据网格可为这些新的数据驱动型架构带来巨大效益。

2015年3月,SanDisk闪迪设立了 “大数据闪存”市场类别,推出了InfiniFlash系统,它拥有极高的容量以及卓越的性能和经济性(源于低成本晶圆和全新的闪存尺寸规格)。

事实上,InfiniFlash系统之所以能成为融合数据平台架构的构建模块,其架构和性能起着至关重要的作用:
数据捕获每秒可捕获数百万个事件,且无事件丢失更快的批量摄取便于扩展使用Avro或Protobuf格式存储数据,无需ETL(提取、转换、加载)过程通过支持Kafka等分布式消息系统消除负载数据处理能够有效处理实时事件和批量数据输入存储处理,以秒和亚秒级实现时延交付数据存储面向数据密集型工作负载的软件定义数据构造,提供敏捷性和可扩展性可长时间存储数个TB的数据支持高吞吐量的批量数据存储,且满足低时延实时查询可处理分离的数据源和“突发性”工作负载采用无模式方式存储数据支持HDFS和NoSQL数据库(如Cassandra、CouchDB、MemSQL、HBase等)可借助Rackscale架构扩展至PB级极低的年故障率(AFR)可使用解聚/共享存储提供企业就绪度、沿袭(审计日志)、合规(依法保留等)和版本控制(维护不同的时间点副本)专为来自HDFS/S3的故障、备份和补丁而设计最为经济高效,低于/GB[1]数据查询支持亚秒级时延的实时查询支持批量/聚集查询支持针对HDFS和NoSQL的查询

使用InfiniFlash“大数据闪存”打造数据密集型融合数据平台的三大原因

无论您是企业还是服务提供商,以下是您应该考虑使用InfiniFlash打造融合数据平台的三大原因:

  1. 满足捕获、处理、存储和查询数据管道的所有要求

传统的直接附加型存储解决方案和纯HDD解决方案无法提供融合数据平台所需的大规模性能和吞吐量。此外,它们也不具备可扩展性所带来的资本支出和运营支出效益,也不具备这些平台所要求的敏捷性和企业就绪程度。

与传统硬盘相比,InfiniFlash系统的性能是它们的50倍,密度是它们的5倍,可靠性是它们的4倍,而且便于向上和向外扩展,以满足大数据应用的苛刻要求[2]。基于闪存的软件定义数据构造可让用户根据需要灵活选用多种文件系统,其中包括HDFS、Spectrum Scale、Lustre和Ceph。

  1. 全球支持

InfiniFlash在全球各地得到了SanDisk闪迪及其合作伙伴的支持。InfiniFlash是TSA Net Support Community的一部分,可确保满足严格的SLA协议要求。与此同时,我们的FlashStart 功能可确保其安装顺利,并提供卓越的客户体验。

  1. 同类最佳的生态系统

SanDisk闪迪与众多业内领先的软件开发者和硬件合作伙伴开展合作,通过同类最佳的生态系统获得更多的选择和灵活性。我们的合作伙伴包括: RedhatCeph、Nexenta、ICloudbyte以及思科、联想、戴尔、Supermicro、Quanta等厂商。同时,我们也正与开源社区开展密切合作,并通过我们的各项事业成为贡献者和思想领袖。(欲了解SanDisk闪迪对于开源SCST企业级特性所做出的贡献,请点击此处。)

结语

搭建融合数据平台是为了满足融合运营和分析管道的要求,以及随后的捕获、处理、存储和查询阶段的存储要求,一个基于大数据闪存的数据构造是融合平台理想的存储层构建模块,可让数据管道的每个阶段都受益。

本文转自d1net(转载)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/541039.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

stl min函数_std :: min()函数以及C ++ STL中的示例

stl min函数C STL std :: min()函数 (C STL std::min() function) min() function is a library function of algorithm header, it is used to find the smallest value from given two values, it accepts two values and returns the smallest value and if both the value…

c# uri.host_C#| Uri.FromHex()方法与示例

c# uri.hostUri.FromHex()方法 (Uri.FromHex() Method) Uri.FromHex() method is a static method that returns an integer that represents a decimal digit of specified hex char. Uri.FromHex()方法是一个静态方法,该方法返回一个整数,该整数表示指…

中国制造2025变革,背后的大数据来龙去脉

大数据的成长路径一定是个长期成长过程,实用分析工具与先进分析理念,真正释放数字化分析的力量,由人类轨迹产生的数据,与机器自动产生的数据得出洞见,从管理决策推导运营方案,最终实现数据价值提升。无论是…

java 文件下载 jsp文件_jsp文件 Java实现文件上传与下载

通过前台选择文件,然后将资源上传到(即新建一个文件)到发布的资源文件下面,下载就是url 到发布的资源文件,触发即可自动下载。服务器已经封装了如何下载的底层实现。(此处用的是tomcat)JSP上传文件方法:关于在HTTP request 中通过…

ruby hash方法_Ruby中带有示例的Hash.flatten方法

ruby hash方法哈希平化方法 (Hash.flatten Method) In this article, we will study about Hash.flatten Method. The working of this method can be predicted with the help of its name but it is not as simple as it seems. Well, we will understand this method with t…

浙江嘉兴“网事”再添国字招牌 领跑城市智慧转型

16日,举世瞩目的第三届世界互联网大会如期而至。世界目光再次聚焦“乌镇时间”,人们不禁发现,流淌千年的水网已与迅猛发展的互联网交相辉映,1300多年的古镇释放出强烈的互联网信号。更令人惊喜的是,互联网形成的冲击波…

java list过滤重复的数据_List 去除重复数据的 5 种正确姿势!

以下介绍五种-不同的方法去除 Java 中ArrayList中的重复数据1.使用LinkedHashSet删除arraylist中的重复数据LinkedHashSet是在一个ArrayList删除重复数据的最佳方法。LinkedHashSet在内部完成两件事:删除重复数据保持添加到其中的数据的顺序Java示例使用LinkedHashS…

打击侵犯公民个人信息罪的司法困境

当前,公民个人信息泄露并屡遭侵犯已成为社会关注焦点。泄露的信息轻则给被害人生活造成困扰,重则使被害人陷入电信诈骗、敲诈勒索等犯罪漩涡,造成重大人身、财产损失。一些民众认为,对侵犯公民个人信息行为的刑事打击很不给力&…

ruby中、.reject_Ruby中带有示例的Array.reject方法

ruby中、.rejectRuby Array.reject方法 (Ruby Array.reject Method) In the last article, we have seen how we can make use of the Array.select method in order to print the Array elements based on certain conditions provided inside the block? In this article, w…

java获取主机mac_Java 如何获取主机的MAC地址

获取MAC地址首先要理解当前的操作系统,由于在不同的操作系统中CMD命令所在的位置不同,因此首先使用System类中的getProperty("os.name")方法获取当前的操作系统,getProperty()方法可以确定当前系统属性,它的参数是一些固…

微软免费软件项目DreamSpark更名为Microsoft Imagine

9月10日消息,微软免费软件项目DreamSpark近日正式更名为Microsoft Imagine,将与一年一度的微软“创新杯(Imagine Cup)”齐名。微软免费软件项目DreamSpark更名为Microsoft Imagine  2008年2月19日,微软公司董事长比尔盖茨在斯坦福大学发布了…

java jpa_Java JPA 语法知识

前提操作创建一个可持久化的实体类dao层继承JpaRepositoryT:实体类ID:实体类的主键类型例:public interface SysUserRespository extends JpaRepository {}JPA中支持的关键词And --- 等价于 SQL 中的 and 关键字,比如 findByUsern…

array.slice_Ruby中带有示例的Array.slice()方法

array.sliceArray.slice()方法 (Array.slice() Method) In this article, we will study about Array.slice() method. You all must be thinking the method must be doing something which is related to the slicing of elements or objects in the Array instance. It is n…

阿特斯携手EDF启动建设巴西191.5MW光伏项目

2016年10月11日,阿特斯太阳能(安大略省,圭尔夫)和EDF Energies Nouvelles(法国,巴黎)共同宣布,将阿特斯巴西Pirapora I太阳能项目80%的股权出售给EDF的巴西本地子公司EDF…

apachejmeter_java源码_自定义编写jmeter的Java测试代码

我们在做性能测试时,有时需要自己编写测试脚本,很多测试工具都支持自定义编写测试脚本,比如LoadRunner就有很多自定义脚本的协议,比如"C Vuser","JavaVuser"等协议.同样,Jmeter也支持自定义编写的测试代码,不过与LoadRunner不同的是,Jmeter没有自带编译器,…

julia fit 函数_带有Julia中示例的flipsign()函数

julia fit 函数Julia| flipsign()函数 (Julia | flipsign() function) flipsign() function is a library function in Julia programming language, it accepts two values as parameters and returns a value with the magnitude of first value and sign of the first value…

优化Android应用内存的若干方法

https://my.oschina.net/chaselinfo/blog/198172摘要: 在app开发的各个阶段中要考虑RAM的限制问题, 包括在设计阶段(正式开发之前). 使用下面的不同的方法可以达到很好的效果. 当您在设计和开发Android应用时用下面的方法可以使内存运用最高效.使用保守的Service 如果你的应用需…

一? ilkkn.n_IL&FS的完整形式是什么?

一? il&kkn.nIL&FS:基础设施租赁和金融服务 (IL& FS: Infrastructure Leasing & Financial Services) IL&FS is an abbreviation of Infrastructure Leasing & Financial Services. It is the largest infrastructure development …

java notify唤醒原理_Java wait和notify虚假唤醒原理

自己在此记录一下,方便日后复习。虚假唤醒的概念jdk官方文档解释:所以说在wait和notify一块使用时,如果使用if作为条件时,会有虚假唤醒的情况发生,所以必须使用while作为循环条件。下面来举例实验:首先&…

C#里面的三种定时计时器:Timer

在.NET中有三种计时器:1、System.Windows.Forms命名空间下的Timer控件,它直接继承自Componet。Timer控件只有绑定了Tick事件和设置EnabledTrue后才会自动计时,停止计时可以用Stop()方法控制,通过Stop()停止之后,如果想…