kafka spark_您在2016年会做什么? Apache Spark,Kafka,Drill等

kafka spark

让我们玩得开心。

这是新的一年的开始-我们正处于新事物的门槛上-因此让我们期待您在2016年可能会做的事情。现在我知道做出预测的风险,尤其是有记录的预测,但是我很高兴您能在一年后回访,看看我对2016年的预测是如何完成的。

您在2016年会做什么?

在我做出2016年预测之前,首先要更普遍(有趣地)思考推测未来的挑战。 我们是否根据数据和模型进行工作? 从观察和预感? 请记住,描述未来的准确性部分取决于目标的未来时间。

传统上遥远地预测人们的生活将会是未来。 有时它们是准确的,更经常是滑稽的错误。 回顾未来应该是一种娱乐,我称之为“记住未来”。

例如,2000年引起了人们多年的想像力。 我偶然发现了1900年发表在《 女士之家杂志》上的一篇文章,其中对我们2000年的生活做出了预测。在大致正确的预测中,有汽车将大量涌现的情况,照片可以从遥远的国家电报,它们可以在一小时内在报纸上印制出来,包括领土在内的美国人口将超过3.5亿(2000年人口普查使美国人口为2.82亿,有点短)。 预测不会有更多的苍蝇或蚊子,城市中的交通将在地下或高架上,因此城市将“没有噪音”,而我们将不再使用字母C,X或Q 。

未来并没有如前所述,部分原因是我们经常以与预期不同的方式解决相同的问题:今天,高速公路上的城市交通被分流了,但是-不能消除噪音。 而且,我们不是依靠“发射”某些辅音来规范拼写,而是依靠自动拼写纠正系统(有时会产生可笑的结果)。

返回大数据

Ted Dunning在那个城市的Strata Hadoop World会议的一周期间,在新加坡大数据聚会上关于当前和未来大数据趋势的生动演讲中提出了“记住未来”的主题。 另一位演讲者,Hadoop创始人道格·切特(Doug Cutting)也提出了关于大数据系统在不久的将来走向何处的想法。

apachespark-kafka-blog-img1

Doug谈到了Hadoop生态系统的发展,特别是在分析方面。 在许多情况下,基于批处理的计算已被内存中的微批处理计算能力所取代,因此对Apache Spark的兴趣日益广泛。

泰德(Ted)最初以文化趋势招待人们,但并未像预期的那样成功,然后他描述了一个成功的,具有前瞻性的大数据项目-这是19世纪的开源项目,该项目很好地利用了海洋和风的数据来构建航行航海图。 跳到了今天,Ted解释了当前大数据趋向于简化机器学习项目以使其具有实用价值的趋势。 Ted还谈到了需要更简化的方式来处理复杂数据以避免必须建立数百个表的情况(传统关系系统就是如此),他展示了在这种情况下利用SQL引擎Apache Drill的灵活性的优势。

2016年的六大预测

受描述大数据趋势的其他人的启发,现在,我伸出我的脖子,对自己在2016年的工作做出自己的预测(纯观点)。毕竟,这只是未来一年的事情……

流数据

我有信心在整个2016年对流数据和流分析产生爆炸性的兴趣。 流数据将以比以前更多的方式和新的方式被更多的组织使用。 物联网传感器数据量的增加只是流数据的来源之一。 一系列事件(例如来自Web流量的点击流数据或机器日志文件)将越来越多地使用Apache Spark的近实时处理或使用更新的工具Apache Flink进行的实时分析来作为流进行分析。

重大转变之一将是以不同的方式来考虑最能支持这些应用程序的体系结构: 消息队列将成为设计这些系统的中心焦点。 消息传递层将不仅仅是流分析程序的工作流中的安全缓冲区。 正确完成后,消息队列将成为可重播,不变的持久日志,为多个主服务器(例如实时分析应用程序,数据库或搜索文档)提供服务。 基于这些原因,我预计将大大增加使用已经流行的消息传递工具Apache Kafka,并对新的MapR Streams产生浓厚的兴趣, MapR Streams是一种支持Kafka API的集成消息传递技术。

缩短实现价值的时间

企业需要实用的方法来更快地实现价值,因此,如果您的企业需要SQL ,我相信您可能会在2016年尝试Apache Drill 。 随着发布次数的增加,Drill的功能不断扩展,但它已经是使用标准SQL的高性能,高可伸缩性和极其灵活的查询引擎。 这对于来自传统背景的大数据用户以及Hadoop和NoSQL世界的资深人士来说同样具有吸引力,他们希望查询引擎能够轻松处理各种各样的非结构化和嵌套数据类型,例如JSON和Parquet。

Drill的特性也许最有可能让您尝试使用它,而它几乎不需要准备就可以查询数据,这可以减少从数据获取见解所需的时间或数天。 在开始查询之前,只需花费较少的时间,借助Drill,您就可以根据从第一个查询中学到的知识快速构建第二个查询。 更快的开发,更快的洞察力,更短的价值实现时间。

apacespark-kafka-blog-img2

集权

人们越来越多地将大数据平台视为他们整个组织的中心部分,而不是一个特殊目的的项目。 大数据平台(例如基于Hadoop和NoSQL的系统)将需要轻松地连接到传统技术,例如企业数据仓库,关系数据库或BI工具。

对于全球组织而言,集中化的一个矛盾的方面是需要在全球范围内分发数据。 您组织的不同部门需要访问统一的数据集。 在分解地理位置不同的中心内或中心之间不必要的孤岛时,您将要避免传播延迟。 可能存在法律问题,需要对数据进行本地化。 由于这些原因,我预测许多组织将希望使用一种具有安全可靠方法的系统来维护可以快速同步的多个数据中心。

专题:医疗保健

我认为医疗保健行业中大数据的使用有望在2016年实现快速扩展。人们认识到使用数据来减少欺诈并通过使用电子病历,机器的长期维护记录来改善医疗保健的力量。 ,以及传感器信息流。 对于这些用例而言,出色的数据安全性和治理当然很重要。

专题:电信

电信将在2016年在大数据领域中脱颖而出的另一个领域。 电信公司已经有很好的大数据用例:将ETL的压力转移到Hadoop,同时维持企业仓库的复杂账单; 对进出基站的数据进行异常检测以发现并快速响应突然的使用变化,并在通话中断后采用实时分析来快速响应用户,以改善体验并减少用户流失。

流数据架构和技术(如上所述)的扩展将使电信受益。 但是,即使您自己不使用电信,这种特殊情况也可能会影响您。 越来越多的非电话应用正在利用电信网络。 例如,汽车中的传感器经常通过电信网络发送数据。 综上所述,我预计您可能会在2016年将高级电信与大数据结合起来。

最好的预测:你会让我惊讶

我对2016年的最佳预测是,您将想出一些创新的方法来使用尚未发生的大数据。 也许它将以新颖的方式解决我已经知道的问题。 也许这将是全新的东西。 无论哪种方式,到2017年1月,我都会“记住未来”,即使我的其他五个预测都是准确的,我也会为新事物感到惊讶。

其他资源

对于作者的相关内容,请参见以下免费资源:

  • 实用机器学习:异常检测的新视角
  • 真实世界的Hadoop
  • O'Reilly Radar博客上有关Apache Drill的文章

翻译自: https://www.javacodegeeks.com/2016/01/will-2016-apache-spark-kafka-drill.html

kafka spark

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/336736.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android ini文件格式,ini是什么格式的文件?ini文件怎么操作?

类型:Android平台大小:622KB语言:中文 评分:5.0标签:立即下载ini文件主要存放用户所做的选择以及系统的各种参数。用户可以通过修改INI文件,来改变应用程序和系统的很多配置。自定义一个文件,会成一个deskt…

华为p6电信版 android 4.5,华为P6电信版系统应用apk补全教程 完整EMUI

现在要说的是华为P6电信版的系统应用apk补全教程,给你一个非阉割版的完整EMUI系统。大家应该都知道,电信定制版由于华为系统服务与电信的定制APP功能重叠,语音助手、云同步、云端备份、手机找回等系统应用apk全被“阉割”掉了,这几…

黑马ee在职进阶视频_进阶– Java EE 7前端5强

黑马ee在职进阶视频系列继续。 在初步概述和Arjan关于最重要的后端功能的文章之后 ,我现在非常高兴让Ed Burns( edburns )使用他最喜欢的Java EE 7前端功能完成本系列。 感谢Markus Eisele让我有机会在他非常受欢迎的博客上发表帖子。 我和M…

如何构建股票ChatGPT查询全球股票市场以及常用Prompt

Blog:4 ways to use ChatGPT Stock Chatbot for stock analysis of Global Stock Markets NASDAQ NYSE LSE HKEX TSE NSE HANGHAI SHENZHEN 地址:http://deepnlp.org/blog/chatgpt-stock-global-market 全球股票市场:NASDAQ 纳斯达克, NYSE…

jvm高并发_JVM上的高并发HTTP客户端

jvm高并发HTTP可能是最流行的应用程序级别协议,并且有许多库在网络I / O之上实现它,这是常规I / O的一种特殊(面向流)情况。 由于所有I / O都有很多共同点1 ,所以让我们开始对其进行一些讨论。 我将集中讨论具有大量并…

jmeter 采样器作用_实施自定义JMeter采样器

jmeter 采样器作用随着我们采用不同的体系结构和实现方式,对通用压力测试工具的需求不断增长。 关于负载测试, Apache Jmeter是最知名的工具之一。 它支持许多协议,例如ftp http tcp,并且可以轻松地用于分布式测试。 Jmeter还为…

xp系统 javafx_使用JavaFX构建React系统

xp系统 javafxJavaFX是用于在Java中构建图形应用程序的新标准库,但是许多程序员仍然对Swing甚至(高音)AWT感到困惑。 在Java诞生20年来,发生了很多事情。 两年前,当我开始研究Speedment UI的JavaFX库时,我发…

html手机端图片点击放大缩小快捷键,PS放大缩小图片的快捷键是什么?PS放大缩小图片的操作技巧...

PS放大缩小图片的快捷键是什么?PS怎么放大缩小图片?使用PS处理图片可是个精细的活儿,为了让图片处理得更加完美,我们经常需要将图片放大来处理,修改好之后又要缩小图片看下整体效果,这样来回切换其实挺麻烦…

webstorm html代码提示设置,Webstorm设置代码提示

下载路径: https://github.com/virtoolswebplayer/ReactNative-LiveTemplate本插件可以配合Webstorm设置代码提示。Mac下安装Webstorm2016.1为例安装路径在终端:$ cd ~/Library/Preferences/$ ls找到Webstorm版本$ open WebStorm2016.1先将ReactNative.x…

arcgis adf数据_使用ADF列表视图的主从数据

arcgis adf数据从UI角度来看,最近ADF Faces 表组件不再被认为很酷。 对于显示数据集合, 列表视图今天应该很酷。 这并不意味着我们根本不应该使用af:table 。 在某些情况下(经常是:)),表比列表视图更适合。…

javafx 内存占用_JavaFX:TouchGesture内存泄漏?

javafx 内存占用在我的一个项目中,最近几天我在与内存泄漏作斗争(是……“耦合”),我得出的结论是可能存在与触摸/滚动手势有关的问题。 在下面的示例中,我有两个按钮。 第一个创建具有一千行的列表视图,第…

cucumber jvm_用Cucumber JVM编写BDD测试

cucumber jvmCucumber JVM是编写BDD测试的出色工具。在本文中,我想对Cucumber JVM的BDD进行介绍。 让我们开始吧… 什么是BDD? 简而言之,BDD试图解决“通过示例理解需求”的问题 BDD工具 有许多可用于BDD的工具,有趣的是&#…

模拟模型学习 几何布朗运动_Java的几何布朗运动

模拟模型学习 几何布朗运动维纳过程是一个连续时间的随机过程,以纪念诺伯特维纳。 通常用于用随机成分表示噪音或财务状况。 可以计算几何布朗运动以可视化某些界限(以分位数表示)以暗示绝对范围。 为了进行计算,需要以下参数&am…

动态调整线程池_调整线程池的重要性

动态调整线程池无论您是否知道,您的Java Web应用程序很可能都使用线程池来处理传入的请求。 这是许多人忽略的实现细节,但是迟早您需要了解如何使用该池以及如何为您的应用程序正确调整池。 本文旨在说明线程模型,线程池是什么以及正确配置线…

java系统架构师有的特质_Java中特质模式的定义

java系统架构师有的特质在本文中,我将介绍特征的概念,并为您提供一个具体示例,说明如何在Java中使用它们以减少对象设计中的冗余。 我将首先提出一个虚构的案例,其中可以使用特征来减少重复,然后以使用Java 8的特征模式…

tdd java_Java TDD简介–第2部分

tdd java再次问好! 在上一篇博客文章中,我在没有紧密引用Java的情况下总体上解释了TDD理论 ,但是在这一部分中,我们开始进行TDD实践。 我们的目标是遍历TDD的所有阶段:从需求分析到测试代码的重构。 我们将在具有Java&…

计算机怎么没有桌面文件夹名称大全,你的电脑文件总是找不到?是时候学习文件夹分类整理了...

我们常常说做好办公整理,我们工作起来才更有效率;此处的办公整理不单单是对办公桌整理整齐,电脑里面的文件也需要定期整理,你有没有发现常常找一个文件的时候却总是找不到?那么此时就应该学习文件夹分类整理了&#xf…

selenide_使用Selenide进行有效的UI测试

selenide等待奇迹 圣诞节是奇迹的时刻。 在新的一年的前夕,我们都会制定下一个计划。 我们希望所有问题都将在最后一年消失,在来年出现奇迹。 每个Java开发人员都梦想着奇迹,使他成为世界上最有效的Java开发人员。 我想向你展示这样的奇迹…

win10无法更改计算机设置,Win10“无法保存ip设置,请检查一个或多个设置并重试”的解决方法...

近期有网友想要在Win10系统中手动设置本机IP地址,但是填写完毕之后却提示了“无法保存ip设置,请检查一个或多个设置并重试”,那么遇到这个问题,我们要如何解决呢?下面装机之家分享一下Win10“无法保存ip设置,请检查一个或多个设置…

24段魔尺拼图指南_拼图项目动手指南

24段魔尺拼图指南Jigsaw项目将把模块化引入Java平台,根据原始计划,它将在12月10日完成功能。 所以我们在这里,但拼图在哪里? 在过去的六个月中肯定发生了很多事情: 原型问世 ,内部API的迫在眉睫的删除引起…