机器学习简介及学习思维导图

news/2025/4/27 17:15:57/文章来源:https://zhzhx.blog.csdn.net/article/details/79482940

什么是机器学习

机器学习是人工智能的一个分支。人工智能的研究是从以“推理”为重点到以“知识”为重点，再到以“学习”为重点，一条自然、清晰的脉络。机器学习是实现人工智能的一个途径，即以机器学习为手段解决人工智能中的问题。机器学习算法是一类从数据中自动分析获得规律（模型），并利用规律对未知数据进行预测的算法

为什么需要机器学习

21世纪机器学习又一次被人们关注，而这些关注的背后是因为整个环境的改变，我们的数据量越来越多，硬件越来越强悍。急需要解放人的生产力，自动去寻找数据的规律。解决更多专业领域的问题。机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等领域.

开发机器学习应用程序的步骤

（1）收集数据

我们可以使用很多方法收集样本护具，如：制作网络爬虫从网站上抽取数据、从RSS反馈或者API中得到信息、设备发送过来的实测数据。

（2）准备输入数据

得到数据之后，还必须确保数据格式符合要求。

（3）分析输入数据

这一步的主要作用是确保数据集中没有垃圾数据。如果是使用信任的数据来源，那么可以直接跳过这个步骤

（4）训练算法

机器学习算法从这一步才真正开始学习。如果使用无监督学习算法，由于不存在目标变量值，故而也不需要训练算法，所有与算法相关的内容在第（5）步

（5）测试算法

这一步将实际使用第（4）步机器学习得到的知识信息。当然在这也需要评估结果的准确率，然后根据需要重新训练你的算法

（6）使用算法

转化为应用程序，执行实际任务。以检验上述步骤是否可以在实际环境中正常工作。如果碰到新的数据问题，同样需要重复执行上述的步骤

环境准备

我们本次机器学习的课程使用的python程序库：

Numpy、Scikit-learn

在ubuntu或者mac操作系统中，在虚拟环境中安装:

pip3 install Numpy
pip3 install Scikit-learn

Numpy是一个强大的高级数学运算的工具库，还具备非常搞笑的向量和矩阵运算功能。Scikit-learn是一个基于python的机器学习库，封装了大量经典以及最新的机器学习模型。

我们应该怎么做

互联网公司机器学习工作、数据挖掘工程师们工作内容是什么?

研究各种算法，设计高大上模型?
深度学习的应用，N层神经网络?
...

大部分复杂模型的算法精进都是数据科学家在做

大多数程序员

跑数据，各种map-reduce，hive SQL，数据仓库搬砖
数据清洗，数据清洗，数据清洗
分析业务，分析case，找特征
常用算法跑模型

机器学习思维导图：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/473505.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

LeetCode 1658. 将 x 减到 0 的最小操作数（哈希）

LeetCode 1658. 将 x 减到 0 的最小操作数（哈希）

文章目录1. 题目2. 解题1. 题目给你一个整数数组 nums 和一个整数 x 。每一次操作时，你应当移除数组 nums 最左边或最右边的元素，然后从 x 中减去该元素的值。请注意，需要修改数组以供接下来的操作使用。如果可以将 x 恰好减到 0 &…

阅读更多...

1057: [ZJOI2007]棋盘制作 - BZOJ

1057: [ZJOI2007]棋盘制作 - BZOJ

Description国际象棋是世界上最古老的博弈游戏之一，和中国的围棋、象棋以及日本的将棋同享盛名。据说国际象棋起源于易经的思想，棋盘是一个8*8大小的黑白相间的方阵，对应八八六十四卦，黑白对应阴阳。而我们的主人公小Q&#xff0c…

阅读更多...

机器学习：Scikit-learn与特征工程

机器学习：Scikit-learn与特征工程

“数据决定了机器学习的上限，而算法只是尽可能逼近这个上限”，这句话很好的阐述了数据在机器学习中的重要性。大部分直接拿过来的数据都是特征不明显的、没有经过处理的或者说是存在很多无用的数据，那么需要进行一些特征处理，特征…

阅读更多...

Mvc系统学习9——Areas学习

Mvc系统学习9——Areas学习

在Mvc2.0中，新增加了一个特性就是Areas。在没有有使用Areas的情况下，我们的Mvc项目组织是下面这样的。当项目庞大的时候，Controllers,Model,View文件下下面势必会有很多文件。项目将难以管理。通过使用Areas使我们可以很好的组织项目&#x…

阅读更多...

天池在线编程数组游戏

天池在线编程数组游戏

文章目录1. 题目2. 解题1. 题目样例 1 输入: [3, 4, 6, 6, 3] 输出: 7 说明: [3, 4, 6, 6, 3] -> [4, 5, 7, 6, 4] -> [5, 6, 7, 7, 5] -> [6, 7, 8, 7, 6] -> [7, 8, 8, 8, 7] -> [8, 9, 9, 8, 8] -> [9, 9, 10, 9, 9] -> [10, 10, 10, 10, 10] 来源&a…

阅读更多...

机器学习：sklearn数据集与机器学习组成

机器学习：sklearn数据集与机器学习组成

机器学习组成：模型、策略、优化《统计机器学习》中指出：机器学习模型策略算法。其实机器学习可以表示为：Learning RepresentationEvalutionOptimization。我们就可以将这样的表示和李航老师的说法对应起来。机器学习主要是由三部分组成&…

阅读更多...

天池在线编程分割数组

天池在线编程分割数组

文章目录1. 题目2. 解题1. 题目来源：https://tianchi.aliyun.com/oj/164426199705086870/193936950952137407 2. 解题 class Solution { public:/*** param arr: an inter array * return: return the min sum*/int splitArray(vector<int> &arr) {// …

阅读更多...

Scikit-learn的分类器算法：k-近邻及案例

Scikit-learn的分类器算法：k-近邻及案例

k-近邻算法采用测量不同特征值之间的距离来进行分类优点：精度高、对异常值不敏感、无数据输入假定缺点：计算复杂度高、空间复杂度高使用数据范围：数值型和标称型一个例子弄懂k-近邻电影可以按照题材分类，每个题材又是如何定义的呢…

阅读更多...

C++ 添加程序图标到我的电脑

C++ 添加程序图标到我的电脑

Ｃ＋＋　像我的电脑中　百度网盘的　那图标快捷方式。如何生成的呢？设置程序图标到我的电脑请看下边代码就ok了(*^__^*) 嘻嘻…… 类似下图： 大家如果看我下边的不是很清楚，可以下载这个具体工程&#xff1b…

阅读更多...

struts-tiles学习笔记

struts-tiles学习笔记

网上搜了一些，稀里糊涂的，要么是代码不全，要么是版本不对，还是去struts官网大概学习了一下 http://struts.apache.org/development/1.x/struts-tiles/examples.html转载于:https://www.cnblogs.com/qrlozte/p/3625254.html

阅读更多...

Python随机数生成方法

Python随机数生成方法

1. random.seed(int) 给随机数对象一个种子值，用于产生随机序列。对于同一个种子值的输入，之后产生的随机数序列也一样。通常是把时间秒数等变化值作为种子值，达到每次运行产生的随机系列都不一样seed() 省略参数，意味着使用当前系…

阅读更多...

LeetCode 1663. 具有给定数值的最小字符串（贪心）

LeetCode 1663. 具有给定数值的最小字符串（贪心）

文章目录1. 题目2. 解题1. 题目小写字符的数值是它在字母表中的位置（从 1 开始），因此 a 的数值为 1 ，b 的数值为 2 ，c 的数值为 3 ，以此类推。字符串由若干小写字符组成，字符串的数值为…

阅读更多...

Python算法题----在列表中找到和为s的两个数字

Python算法题----在列表中找到和为s的两个数字

列表data的值为[1, 3, 4, 5, 8, 9, 11]，找出这个列表中和为13的两个数字的所有组合。这个好找，上过幼儿园大班的，估计都能找出来。4913, 5813。如何用python写一个函数来实现呢。解法一： 超级大循环最容易想到的就是遍历啊。嵌套…

阅读更多...

LeetCode 1664. 生成平衡数组的方案数（前缀和+后缀和）

LeetCode 1664. 生成平衡数组的方案数（前缀和+后缀和）

文章目录1. 题目2. 解题1. 题目给你一个整数数组 nums 。你需要选择恰好一个下标（下标从 0 开始）并删除对应的元素。请注意剩下元素的下标可能会因为删除操作而发生改变。比方说，如果 nums [6,1,7,4,1] ， 那么： …

阅读更多...

sklearn分类器：朴素贝叶斯

sklearn分类器：朴素贝叶斯

朴素贝叶斯朴素贝叶斯（Naive Bayes）是一个非常简单，但是实用性很强的分类模型。朴素贝叶斯分类器的构造基础是贝叶斯理论。概率论基础概率定义为一件事情发生的可能性。事情发生的概率可以通过观测数据中的事件发生次数来计算，事…

阅读更多...

迪美特TVZ8双核智能高清播放器在电视上编程不是梦

迪美特TVZ8双核智能高清播放器在电视上编程不是梦

迪美特TVZ8双核智能高清播放器两步让普通电视变云电视独家VST： 全网聚合，极致体验：独家自主设计，炫丽生动的Win8风格UI界面： 新版VST全聚合是华人用户数最多的聚合平台软件，集合视频点播、网络直播…

阅读更多...

LeetCode 1665. 完成所有任务的最少初始能量（贪心）

LeetCode 1665. 完成所有任务的最少初始能量（贪心）

文章目录1. 题目2. 解题1. 题目给你一个任务数组 tasks ，其中 tasks[i] [actuali, minimumi] ： actuali 是完成第 i 个任务需要耗费的实际能量。minimumi 是开始第 i 个任务前需要达到的最低能量。比方说，如果任务为 [10, 12] 且你当…

阅读更多...

sklearn分类器算法：逻辑回归及案例分析

sklearn分类器算法：逻辑回归及案例分析

分类算法之逻辑回归逻辑回归（Logistic Regression），简称LR。它的特点是能够是我们的特征输入集合转化为0和1这两类的概率。一般来说，回归不用在分类问题上，因为回归是连续型模型，而且受噪声影响比较大。如果…

阅读更多...

词云（WordCloud）制作

词云（WordCloud）制作

以《神雕侠侣》为例，我们制作词云，看看有哪些高频词汇。 1. 导入一些包 # -*- coding:utf-8 -*- # Python Version: 3.7 # Time: 2020/11/27 19:32 # Author: Michael Ming # Website: https://michael.blog.csdn.net/ # File: word_cloud.py # Refere…

阅读更多...

sklearn分类器性能评估

sklearn分类器性能评估

分类器性能评估在许多实际问题中，衡量分类器任务的成功程度是通过固定的性能指标来获取。一般最常见使用的是准确率，即预测结果正确的百分比。然而有时候，我们关注的是负样本是否被正确诊断出来。例如，关于肿瘤的的判定&#xff0…

阅读更多...

最新文章