20个顶级大数据软件应用程序

  • 目录
    • 1. Domo
    • 2. Teradata Database
    • 3. Hitachi Vantara
    • 4. TIBCO公司的Statistica
    • 5. Panoply
    • 6. IBM Watson Analytics
    • 7. SAS Visual Analytics
    • 8. Sisense商业智能软件
    • 9. Talend的大数据工作室
    • 10. Cloudera
    • 11. MongoDB
    • 12. Vertica Analytics Platform
    • 13. SAP Vora
    • 14. Oracle Big Data suite
    • 15. Apache Cassandra
    • 16. Plotly
    • 17. Wolfram Alpha
    • 18. Tibco Spotfire
    • 19. AnswerRocket
    • 20. Tableau

目录

转自:https://www.toutiao.com/i6537465076444561934/
最近看到的一篇不错的文章,分享给大家。(可以看下对于以下的应用各位知道几个)

如今,大数据技术对企业来说不再是一种尝试和体验,它已成为企业开展业务的一个重要组成部分。根据调研机构IDC公司的调查,2017年全球大数据和业务分析(BDA)的市场收入将达到1508亿美元,和2016年相比增长12.4%。到2020年,其收入将超过2100亿美元。

这些大部分来自硬件和服务。对于大数据软件而言,在某些情况下,每家公司的需求都是基于垂直行业的独特需求。即使在同一行业,如零售行业或制造行业,每个公司的需求也会有所不同,因此开发一种套装软件很难为所有行业的潜在客户提供服务。

这里写图片描述
对于大数据软件而言,成功的关键是为企业提供基础应用程序和工具来构建自定义应用程序。人们可以了解什么是真正的大数据应用软件。这些提供应用程序的公司有很多是行业知名厂商,然而,也有一些令人关注的初创公司的产品也包括在内。

以下是20家专门从事大数据构建或相关业务的企业所提供的应用程序。这个清单并没有什么特别的顺序。

1. Domo

Omniture公司前首席执行官Josh James于2010年创立了Domo公司,为企业提供了一种方法,可以从不同来源、不同的孤岛中查看数据。它自动从电子表格、社交媒体、内部存储、数据库,基于云的应用程序,以及数据仓库中提取数据,并在可定制仪表板上显示信息。它以其易用性以及几乎任何人都可以建立和使用它而闻名,而不仅仅是数据科学家采用。它配备了许多预加载的图表和数据源设计,可以快速移动。

2. Teradata Database

从Teradata Database 15开始,该公司增加了Teradata统一数据架构等新的大数据功能,使企业能够跨多个系统访问和处理分析查询,其中包括从Hadoop导入和导出双向数据。它还添加了地理空间数据的3D显示和处理,以及增强的工作负载管理和系统可用性。支持AWS和Azure的基于云计算的版本称为Teradata Everywhere,它在基于公共云的数据和本地部署的数据之间提供了大规模的并行处理分析。

3. Hitachi Vantara

Hitachi Vantara的大数据产品是建立一些流行的开源工具基础上。Hitachi Vantara成立于2017年,是日立数据系统公司的存储和数据中心基础设施业务部门,是由Hitachi Insight集团物联网业务和日立Pentaho大数据业务组合成的一家合资公司。 Pentaho基于Apache Spark内存计算框架和Apache Kafka消息系统。Pentaho 8.0还增加了对Apache Knox Gateway的支持,以对用户进行身份验证,并强制访问大数据存储库的访问规则。它还增加了对通过Docker容器构建分析应用程序的支持。

4. TIBCO公司的Statistica

TIBCO公司的Statistica是针对各种规模企业的预测分析软件,使用Hadoop技术对结构化和非结构化数据执行数据挖掘,解决物联网数据,能够在全球任何地方的设备和网关上部署分析,并支持数据库内分析来自Apache Hive、MySQL、Oracle、Teradata等平台的功能。它使用模板来设计完整的分析,因此只有较少的技术用户可以进行自己的分析,并且可以将模型从电脑导出到其他设备。

5. Panoply

Panoply公司通过使用人工智能来销售所谓的智能云数据仓库,以消除转换、集成和管理数据所需的开发和编码。该公司声称,其智能云数据仓库实质上提供了数据管理即服务,能够在无需任何干预的情况下消费和处理高达1PB的数据。其机器学习算法可以检查来自任何数据源的数据,并对该数据执行查询和可视化。

6. IBM Watson Analytics

Watson Analytics是IBM公司的基于云计算的分析服务。当用户将数据上传到Watson时,它会根据数据分析向用户提供可帮助回答的问题,并立即提供关键数据可视化。它还可以进行简单分析、预测分析、智能数据发现,并提供各种自助服务仪表板。IBM公司还有另一种分析产品SPSS,可用于从数据中发现模式,并查找数据点之间的关联。

7. SAS Visual Analytics

Statistical Analysis System (SAS)创建于1976年,比大数据的创建还要早,就是为了处理大量数据。它可以从各种来源中挖掘、更改、管理和检索数据,并对所述数据执行统计分析,然后将其呈现在一系列方法中,如统计数据、图表等,或将数据写入其他文件。它支持所有类型的数据预测和分析要点,并附带预测工具来分析和预测流程。

8. Sisense商业智能软件

Sisense公司声称其提供了唯一的商业智能软件,使用户可以通过从商品服务器硬件上的多个源进行来准备、分析和可视化复杂数据。Sisense的片上高性能数据引擎可以在一秒钟内完成对TB级数据的查询,并且为不同行业提供了一批模板。

9. Talend的大数据工作室

Talend一直专注于为Hadoop生成干净的原生代码,无需手动编写所有代码。它为各种大数据存储库提供接口,如Cloudera,MapR,Hortonworks和Amazon EMR。它最近添加了一个数据准备应用程序,可以让客户创建一个通用字典,并使用机器学习,自动执行数据清理过程,以便在更短的时间内为数据处理准备好数据。

10. Cloudera

Apache Hadoop公司是最受欢迎的提供商和支持者,它与戴尔、英特尔、甲骨文、SAS、德勤和凯捷等公司都有合作关系。它由五个主要应用程序组成:核心数据管理平台Cloudera Essentials,数据管理平台Cloudera Enterprise Data Hub,用于商业智能和基于SQL的分析的Cloudera Analytic DB; 高度可扩展的NoSQL数据库Cloudera Operational DB,以及Cloudera Data Science and Engineering,在Core Essentials平台上运行的数据处理、数据科学和机器学习。

11. MongoDB

MongoDB已成为各行业大数据项目的首选数据库。它的NoSQL支持适合大数据经常使用的非结构化数据。其灵活性、对JSON和JavaScript的支持、灵活的框架、丰富的查询语言,以及广泛的行业支持使其成为数据库的标准。

12. Vertica Analytics Platform

大数据的数据库传统上是非结构化的,意味着可以在其中存储任何类型的数据。Micro Focus的Vertica分析平台采用传统的面向列的关系数据库格式,但专门设计用于处理来自Hadoop集群的现代分析工作负载。该平台使用集群方式存储数据,并全面支持SQL、JDBC和ODBC。它使用列式存储而不是行式存储,因为访问列可以更轻松地分组数据。

13. SAP Vora

SAP HANA本身并不适用于大数据。这是一个内存中的RDBMS系统。但是当用户添加HANA Vora这个大数据接口时,它变得更加可行。Vora允许HANA连接到Hadoop存储库,并扩展Apache Spark执行框架,以实现企业和Hadoop数据的交互式分析。所以数据科学家可以通过支持大数据存储来获得HANA的力量。

14. Oracle Big Data suite

Oracle公司这个数据库巨头拥有全套大数据集成产品,如支持实时数据流、批量数据处理、企业数据质量和数据治理功能的数据集成平台云、流分析、物联网支持,以及通过Oracle Event Hub云服务支持Apache Kafka。

15. Apache Cassandra

虽然MongoDB是领先的数据库,但Cassandra在可扩展性方面具有优势。这是由Facebook公司前员工所编写,它跨越了大量的商品服务器,确保没有故障点和高级容错能力。

16. Plotly

Plotly或Plot.ly专注于数据可视化,而不需要编程或数据科学技能。它的GUI设计用于导入和分析数据,并为其所有图形使用D3.js JavaScript库。它的仪表板可以实时生成,也可以从现有数据池生成,并支持导出到各种可视化工具,其中包括Excel,SQL数据库,Python,R和MATLAB。

17. Wolfram Alpha

想要计算或了解有关事物的新内容?Wolfram Alpha是一款用于查找关于所有内容的信息非常棒的工具。Proessaywriting公司的Doug Smith表示,他的公司使用这个平台进行金融、历史、社交和其他专业领域的高级研究。例如,如果输入“Microsoft”,就会收到输入解释、基本面和财务信息、最新交易、价格历史记录、绩效比较、数据回报分析、相关矩阵,以及许多其他信息。

18. Tibco Spotfire

Spotfire是一款内存分析平台,升级后包含对大数据存储库的支持并执行预测分析。它为Apache Hadoop提供了一个连接器,它可以让用户在大数据上执行数据混搭,数据发现和分析任务,就像他们对Oracle,SAP和其他传统数据源所做的那样。它还支持实时数据驱动的事件可视化,并具有人工智能驱动的推荐引擎,可缩短数据发现时间。

19. AnswerRocket

AnswerRocket专注于自然语言搜索数据发现,使其成为商业用户的工具,而不是数据科学家的神秘工具。它可以在几分钟内提供答案,而不是等待几天才能形成查询。

AnswerRocket用户可以使用日常语言提问,并在几秒钟内获得可视化效果,然后他们可以在特定的图表或图表上进行深入查看以获得进一步的洞察。

20. Tableau

Tableau专门从多个数据孤岛中进行绘图,并将其集成到一个仪表板中,只需点击几下鼠标,即可使用自定义过滤器和拖动和连接来创建交互式灵活的仪表板。Tableau还使用自然语言查询,因此用户可以询问业务问题,而不是技术问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/456680.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MapTask、ReduceTask并行度决定机制

目录前言:1、mapTask并行度的决定机制2、ReduceTask并行度的决定总结: 目录 前言: MapTask的并行度决定map阶段的任务处理并发度,进而影响到整个job的处理速度。那么,MapTask并行实例是否越多越好呢?其并行度又是如何决定呢&am…

6大主流开源SQL引擎总结,遥遥领先的是谁?

根据 O’Reilly 2016年数据科学薪资调查显示,SQL 是数据科学领域使用最广泛的语言。大部分项目都需要一些SQL 操作,甚至有一些只需要SQL。本文就带你来了解这些主流的开源SQL引擎!背景介绍 本文涵盖了6个开源领导者:Hive、Impala、…

Yarn在MapReduce中的工作机制

目录前言:1、YARN概述2、mapreduce&yarn的工作机制总结: 目录 前言: 在了解Yarn在MR中的作用的时候需要先了解Yarn是什么。 1、YARN概述 Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台&…

长连接心跳机制理解

近期使用go 开发聊天室,使用到websocket常链接。 if err websocket.JSON.Receive(ws,&reply); err ! nil {log.Println(err)return } 我发现当连接断开的时候会走if里面,输出eof 这样就知道,客户端断开了连接。 但在之前使用workerman …

Hive的基本操作总结

文章目录目录前言:1、Hive基本操作1.1、DDL操作1.2、DML操作1.3、Hive Join总结:目录 前言: 对于Hive来说最重要的一点就是能够用Hql来进行数据分析。而Hql来处理数据比MapReduce方便很多(原理是一样的,Hql底层转化为MapReduce来…

Hbase读写数据的原理解析

目录1、体系图写数据的流程(参考上图):读数据的流程(参考下图): 目录 1、体系图 针对上图的一些解释: 这里面数据分区(region)存储是为了查询方便(即因为是…

Zookeeper的简介及命令行操作

目录前言1、Zookeeper简介2、Zookeeper结构3、Zookeeper常用的命令行操作 总结: 目录 前言 作为一款第三方的协调服务框架,ZK被应用在许多地方,如:Hbase中用于存储-ROOT表的位置信息;Storm中用于保存任务分配的信息、…

【python】pycharm启动 一直index,无法运行

花了几个小时找相关资料,按网上提供答案操作,依然没有解决, 最后让它自动更新完才好(大概更新了十分钟 有固态情况) 参考链接 pycharm启动后总是不停的updating indices...indexing? pycharm 启动后一直更新index的问题

Zookeeper集群角色分配原理

ZK内部存在Leader和Follower两个角色,那么这两种角色是怎样划分呢?或者说是怎么样被选举出来呢?以下将详细介绍ZK内部的选举机制。 ZK是通过内部的选举算法来选出Leader。(服务器需要配置对应的ID和文件)如下图所示&a…

2016大数据发展7大趋势

1.算法(Algorithms)的崛起 大数据已过时,算法正当道。数据已经成为一种商品,每个组织都能够收集和存储大量的数据。分析大数据也不再那么引人注目了。每个组织都可以聘用或培训大数据分析人员来了解数据模式。 2016年,…

MySQL数据库重点概要总结

目录前言:1、结构化查询语言(Structured Query Language)简称SQL。2、基本SELECT语句语法3、多表链接4、笛卡尔积5、ANSI SQL ANSI SQL:1999标准的连接语法6、单行函数和分组函数的区别:7、分组函数8、SQL语句的执行顺序:9、子查询…

《MySQL排错指南》——1.9 许可问题

本节书摘来自异步社区出版社《MySQL排错指南》一书中的第1章,第1.9节,作者:【美】Sveta Smirnova(斯维特 斯米尔诺娃),更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.9 许可问题 MySQL有复杂的…

毕业半年,码过5个城市

时间飞逝,半年前我还在想我的毕业设计要怎么做,还在担心自己的答辩能够拿多少分,而此刻我正在成都写我喜欢的代码,过着我想过的生活。毕业半年,码过5个城市,从厦门->太原-》合肥-》北京-》成都。2016是我…

《Pro/ENGINEER野火版5.0从入门到精通》——2.5 设置零件单位

本节书摘来自异步社区《Pro/ENGINEER野火版5.0从入门到精通》一书中的第2章,第2.5节,作者 暴风创新科技,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.5 设置零件单位 由于不同国家单位制的不相同,在企业间合作或沟通…

机器学习之必知开源数据集

之前看到的不错的文章,玩机器学习数据是关键,有了这些东西,你就不必再为没有数据而苦恼。 转自:https://www.toutiao.com/i6432197108580745730/ 目录UCIGoogleTrendsKaggleAWS公用数据集ImagenetMINIST/r/数据集其他数据集 目录…

《计算机科学概论》—第3章3.3节文本表示法

本节书摘来自华章出版社《计算机科学概论》一书中的第3章,第3.3节文本表示法,作者[美]内尔黛尔(Nell Dale)约翰路易斯(John Lewis),更多章节内容可以访问云栖社区“华章计算机”公众…

经典技术面试指南

目录计算机基础知识数据结构算法操作系统计算机网络数据库海量数据处理C语言基础Java基础Java高级Java Web设计模式知识的综合能力工具使用项目相关技术热情表达能力思考方式其他推荐阅读 目录 最近看到一份不错的面试总结,也是每位程序猿都应该掌握的基础&#x…

Linux 共享内存详解一

共享内存段被多个进程附加的时候,如果不是所有进程都已经调用shmdt,那么删除该共享内存段时,会出现一个临时的不完整的共享内存段(key值是0),无法彻底删除。只有当所有进程都调用shmdt,这个临时…

Storm编程模型总结

目录前言:1、Storm编程模型2、对应的的WordCount案例总结: 目录 前言: 对于Storm的编程模型有必要做一个详细的介绍(配合WC案例来介绍) 1、Storm编程模型 上图中组件的解释: DataSource:外…

13_观察者模式

【观察者模式】 也叫作发布/订阅模式,使用较为频繁。 定义了对象间一种一对多的依赖关系,当一个对象改变状态时,则所有依赖于它的对象都会得到通知并被自动更新。 观察者模式由以下几个角色组成: * Subject 被观察者 定义被观察者…