大数据分析|大数据分析的三类核心技术

文献来源:Saggi M K, Jain S. A survey towards an integration of big data analytics to big insights for value-creation[J]. Information Processing & Management, 2018, 54(5): 758-790.

下载链接:链接:https://pan.baidu.com/s/14IGaCOc-plxAiaVhwOgUvA 
提取码:4w8k

大数据分析的主要技术是什么?

        高级大数据分析过程是指运用各种预测算法、语义分析、统计分析方法和技术,对异构数据进行分析,通过未知的模式挖掘出深刻的信息。大数据的收集和传输有一个共同的目标:分析数据以获得见解和更好的应用指导。

        Fahad描述了一些有效的算法,如采样、数据凝聚方法、基于密度的方法、基于网格的方法、分而治之、增量学习和分布式计算。Fayyad提出了数据库过程中知识发现的组成步骤。他们定义了重要的迭代,如数据的选择、数据的预处理、数据的转换、应用于枚举模式的数据挖掘算法,以正确解释结果,并确保从数据中发现有用的知识。

        Tsai, Lai, Chao和&Vasilakos(2015)提出了各种基础设施的大数据分析,这些基础设施按以下方式分类:

        (i)处理或计算:Hadoop, Nvidia CUDA或Twitter storm,

        (ii)存储:Titan或HDFS,以及(iii)分析:MLPACK或mahout。还有一些其他工具,如白板,R, MATLAB, octave参考(千字节到低兆字节);Numpy, Scipy, Weka, Blas表示(兆字节到低千兆字节);Hive, Mahout, Harna, Giraph表示(千兆字节到太字节)。

        近年来技术和技术的进步使许多企业能够有效地处理大数据。数据分析技术包括机器学习、数据挖掘、统计学、人工神经网络、极限机器学习、自然语言处理和深度学习等。图11显示了BDA技术的起源。BDA导致了许多执行分析的技术。机器学习工具的描述见附录A。

(一)先进的机器学习

        高级机器学习(ML)分析是一个伞形动作,它定义了分析技术的选择,以建立一个评估有效结果的模型。传统上,机器学习研究分为两类:逻辑表示和统计表示。最初,它选择一种输入数据技术来构建预测模型并生成模型输出或验证。图8(b)显示了活动迭代过程的预测模型,包括构建、探索、规模、报告和行动。

        最常用的预测分析技术用于高级数据分析,如分类、聚类、回归、关联分析、图分析和决策树。预测数据分析的应用包括有监督机器学习和无监督机器学习算法。有监督的机器学习方法是基于历史示例的一组描述性特征和目标特征之间的关系的自学习模型。然而,在监督机器学习中,第一类是回归,包括线性回归,广义线性模型,集成方法,决策树,神经网络。图10显示了不同分析数据技术的分类。

分类:预测输入数据的类别,例如天气属性是晴天、刮风、下雨等。

回归:预测数值,例如股票价格。

聚类:将类似的项目组织到不同的组中,例如将一个公司分为老年人、成年人和青少年。

关联分析:寻找变量集之间有趣的关系。

图形分析:使用图形结构来查找实体之间的联系。

决策树:通过学习从数据特征推断出的简单决策规则来预测客观变量的建模见解。

        此外,它还包括支持向量机、判别分析、朴素贝叶斯和最近邻等分类算法。无监督机器学习使用聚类技术,包括各种模型,如k-means聚类、kmedoids、模糊c-means、分层、高斯混合、神经网络和隐马尔可夫模型。有各种实时应用,如医疗诊断,股票交易,能源负荷预测,天气预报等。

(二)先进的统计数据

        高级统计分析主要基于各种工具和技术来收集、分析和可视化大规模数据的结果。它包括从统计和执行统计算法的数据驱动分析中派生技术的不同分析领域。统计技术是指聚类分析、数据挖掘和预测建模方法。

(三)高级数据挖掘

        与传统的数据挖掘(如模式发现和提取)相比,BD挖掘是最具挑战性的技术。

        数据挖掘依赖于数据统计、机器学习方法和模式识别等技术。多元线性回归和逻辑回归也常用于数据挖掘,其中包括各种算法,如k均值聚类,关联分析和决策树。大数据分析技术概述及其应用领域如表6所示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/665274.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024.2.3 寒假训练记录(17)

补一下牛客,菜得发昏了,F搞了两个小时都没搞出来,不如去开H了 还没补完 剩下的打了atc再来 文章目录 牛客 寒假集训1A DFS搜索牛客 寒假集训1B 关鸡牛客 寒假集训1C 按闹分配牛客 寒假集训1D 数组成鸡牛客 寒假集训1E 本题又主要考察了贪心牛…

java设计模式:策略模式

在平常的开发工作中,经常会用到不同的设计模式,合理的使用设计模式,可以提高开发效率,提高代码质量,提高代码的可拓展性和维护性。今天来聊聊策略模式。 策略模式是一种行为型设计模式,运行时可以根据需求动…

(2024|ICLR reviewing,IGN,EBGAN,重建、幂等和流形紧致目标)幂等生成网络

Idempotent Generative Network 公和众和号:EDPJ(进 Q 交流群:922230617 或加 VX:CV_EDPJ 进 V 交流群) 目录 0. 摘要 2. 方法 2.1 优化目标 2.2 训练 2.3 架构和优化 4. 实验 5. 相关工作 6. 局限性 0. 摘要…

PyTorch基础-Tensors属性、Tensor的运算

PyTorch的基本概念 Tensor的基本概念 张量高于标量、向量、矩阵 标量说零维的张量,向量是一维的张量,矩阵是二维的张量 Tensor与机器学习的关系 Tensor的创建 函数功能Tensor(*size)基础构造函数Tensor(data)类似np.arrayones(*size)全1Tensorzeros(…

029 命令行传递参数

1.循环输出args字符串数组 public class D001 {public static void main(String[] args) {for (String arg : args) {System.out.println(arg);}} } 2.找打这个类的路径,打开cmd cmd C:\Users\Admin\IdeaProjects\JavaSE学习之路\scanner\src\com\yxm\demo 3. 编译…

C++ 之LeetCode刷题记录(二十七)

😄😊😆😃😄😊😆😃 开始cpp刷题之旅。 目标:执行用时击败90%以上使用 C 的用户。 136. 只出现一次的数字 给你一个 非空 整数数组 nums ,除了某个元素只出现…

【Web前端笔记06】CSS常用属性

目录 一、字体属性 1、color 字体颜色 2、font-size 字体大小(默认16px) 3、font-weight 文本粗细 4、font-style 字体样式 5、font-family 指定一个元素的字体 二、背景属性 1、background-color 背景颜色 2、background-image: url("img/do.png"); 背景…

某站平台的签名算法分享

先charles抓包,api.xxxxxx.com域名的包 分析包 看到路径参数如下 appkey1d8b6e7d45233436&build5531000&channeldw056&mobi_appandroid&mode0&oid326052200&plat2&platformandroid&ps20&statistics%7B%22appId%22%3A1%2C%22p…

异步编程Completablefuture使用详解----进阶篇

JDK版本:jdk17 IDEA版本:IntelliJ IDEA 2022.1.3 文章目录 前言一、异步任务的交互1.1 applyToEither1.2 acceptEither1.3 runAfterEither 二、get() 和 join() 区别三、ParallelStream VS CompletableFuture3.1 使用串行流执行并统计总耗时3.2 使用并行…

前端JavaScript篇之map和Object的区别、map和weakMap的区别

目录 map和Object的区别map和weakMap的区别 map和Object的区别 Object是JavaScript的内置对象,用于存储键值对。Object的键必须是字符串或符号,值可以是任意类型。Map是ES6引入的新数据结构,用于存储键值对。Map的键可以是任意类型&#xff…

C++ 日期类的实现

目录 前言 日期类中的成员函数和成员变量 日期类中成员函数的详解和实现 1.天数前后的判断 2.天数加减的实现 3.前置 && 后置 4.计算天数差值 前言 日期类的实现将综合前面所学的(类的6个默认成员函数),进一步理解和掌握类的…

COX预测模型过程中,我踩过的那些雷

R语言做!初学者先进来看看!!! SCI冲 COX分析:做临床信息与预后相关的COX分析大致都会分为两个步骤,先做单因素COX回归分析,再根据P值挑选有意义的变量,最终纳入COX多因素回归模型中&…

20240202在WIN10下部署faster-whisper

20240202在WIN10下部署faster-whisper 2024/2/2 12:15 前提条件,可以通过技术手段上外网!^_ 首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥ 2、请正确安装好NVIDIA最…

SpringBoot实战项目第一天

环境搭建 后端部分需要准备: sql数据库 创建SpringBoot工程,引入对应的依赖(web\mybatis\mysql驱动) 配置文件application.yml中引入mybatis的配置信息 创建包结构,并准备实体类 完成今日开发后项目部分内容如下图示 用户注册于登录部分…

[BUUCTF]-PWN:mrctf2020_easy_equation解析

查看保护 再看ida 很明了,题目就是让我们用格式化字符串漏洞修改judge的值(可以用python脚本进行计算,最终算出来得2)使等式成立,然后getshell。 虽然操作比较简单,但我还是列出了几种方法 解法一&#x…

uni-app移动端图片预览组件 movable-area 、movable-view (支持缩放,拖动效果、替换部分代码图片可直接使用)

UniApp图片预览组件 利用uni-app官方<movable-area>、<movable-view>内置视图组件 配合 uView 组件的u-popup 弹框组件共同实现封装的图片预览组件&#xff0c;支持手指缩放、拖动效果&#xff0c;替换代码中部分图片后 可以直接使用。 效果图&#xff1a; 组件代码…

【数据结构与算法】——单链表的原理及C语言实现

数据结构与算法——链表原理及C语言实现 链表的原理链表的基本属性设计创建一个空链表链表的遍历&#xff08;显示数据&#xff09;释放链表内存空间 链表的基本操作设计&#xff08;增删改查&#xff09;链表插入节点链表删除节点链表查找节点增删改查测试程序 链表的复杂操作…

Vulnhub billu b0x

0x01 环境搭建 1. 从官方下载靶机环境&#xff0c;解压到本地&#xff0c;双击OVF文件直接导入到vmware虚拟机里面。2. 将虚拟机的网络适配器调成NAT模式&#xff0c;然后开机即可进行操作了。 0x02 主机发现 nmap -sn 192.168.2.0/24 成功获取靶机IP为192.168.2.129。 0x0…

本次安装Visual Studio 所用的安装程序不完整。请重新运行VisualStudio安装程序以解决此问题

今天点开VS的时候遇到了这个问题 因为昨天升级到一半电脑关机了&#xff0c;今天打开软件遇到如下错误&#xff0c; 解决办法很简单&#xff0c;找到安装目录进入Installer文件夹 我的目录在C:\Program Files (x86)\Microsoft Visual Studio\Installer 找到vs_installer.exe…

【python】python爱心代码

一、实现效果&#xff1a; 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 二、准备工作 &#xff08;1)、导入必要的模块&#xff1a; 代码首先导入了需要使用的模块&#xff1a;requests、lxml和csv。 import requests from lxml import etree import csv 如果出现…