【分享】我想上手机器学习

目录

前言

一、理解机器学习

1.1 机器学习的目的

1.2 机器学习的模型

1.3 机器学习的数据

二、学习机器学习要学什么

2.1 学习机器学习的核心内容

2.2 怎么选择模型

2.3 怎么获取训练数据

2.4 怎么训练模型

三、机器学习的门槛

3.1 机器学习的第一道门槛

3.2 机器学习的第二道门槛

3.3 机器学习的第三道门槛


前言

对于新人来说,开始学习机器学习可能会感到有些困难。例如一般会给出海一样阔的学习清单,然后还需要掌握基础数学知识、学习Python编程语言、学习机器学习基础理论、实践项目、参与社区和持续学习等方面的努力等等等等等等等等等等等一大堆的“刚性要求”及“说与不说都一样的建议”。

与其说这些是学习建议或者学习指引,还不如说是“机器学习劝退书”。如果不抓住主干,而是繁枝杂叶,那么养猪都要买上十本书,看完隔壁家猪都下崽了。

下面结合实际的经验,和一些真正上手人的经历,今天我来分享一下机器学习上手要怎么搞。

一、理解机器学习

1.1 机器学习的目的

机器学习的目的就是通过X来预测Y,

1.2 机器学习的模型

但X与Y的关系往往不知,所以需要假设X与Y符合某个模型。而模型并非完全是死的,它预留了一些参数,例如线性模型y = wx,就预留了w作为参数,模型是固定的(它必然是线性的),但模型不是死的,可以通过参数w来调整线性关系的斜率。

1.3 机器学习的数据

模型中预留的参数如何确定?这时候就依靠历史数据了,求解一个参数,使得模型在历史数据中预测最准确,以此来确定模型的参数。

二、学习机器学习要学什么

2.1 学习机器学习的核心内容

由上而知,机器学习就是选择一个模型,然后再用数据训练模型,以达到我们的目的---用X预测Y。因此,重心就只有两个:

(1)怎么选择模型

(2)怎么获取训练数据

(3)怎么训练

2.2 怎么选择模型

要知道怎么选择模型,就必须了解模型,了解更多的模型。只有桔子梨子桃子李子都吃过了,才能知道现在想吃什么。所以这是一个很简单的问题, 多学几个模型,玩几个模型,多玩玩,就知道了。但是不是所有模型都要知道呢?当然不是,也是不可能的!就像梨子桃子桔子李子柚子柿子椰子梨子橙子车厘子都未必样样吃齐,一般先学着五六个常用模型,就算入门了。

机器学习基本的模型,包括线性回归、逻辑回归、支持向量机(SVM)、决策树、随机森林、聚类分析、降维等。这些模型可用于分类和回归问题,如房价预测、股票走势或测试成绩等连续变化的案例。其中,线性回归和逻辑回归是处理回归任务最常用的算法之一,而SVM、决策树和随机森林则是处理分类任务常用的算法。

在机器学习入门阶段,建议先学习一些基础模型,如线性回归和逻辑回归,以及一些基本的聚类方法和降维方法。然后,可以根据实际问题和数据集的特点,选择适合的模型进行学习和应用。同时,还需要了解各种模型的应用场景、优缺点、参数设置等,以便更好地应用它们解决实际问题。

2.3 怎么获取训练数据

这里的获取训练数据,并非指获取最原始的数据,而是指怎么获取喂给模型的数据。这就涉及到数据清洗了,这里不铺开讲述,只要学习了模型,再看一两个案例,就自然知道要把数据处理成什么样来喂给模型了。因为不同的模型,所要求的数据也有个别的出入,实践一两下就自然知道要求了。实践出真知!

知道模型要求什么数据,接下来就是数据的处理了,这就是实打实打编程苦力工,对于有编程基础的同学来说,完全是肝的问题,而不是懂不懂的问题,不学自通。而对于没有编程基础的,也可以根据这些数据处理要求,作为编程的练习题,既可以学习数据清洗,又可以学习编程,一举两得,何乐而不为!

2.4 怎么训练模型

训练模型是最简单不过的事情,根据机器学习包(例如python中的sklearn)的API说明,依样画葫芦就行,根本不需要学习。属于动手试试就知的那种,完全不会成为门槛。

API说明在哪里找?官网、百度、CSDN、知乎,满大街都是,随便搜一下拿来就用。

三、机器学习的门槛

3.1 机器学习的第一道门槛

机器学习的第一道门槛,在模型(算法)的学习上,但基本学过就行。这就是个吃梨子桃子桔子李子柚子柿子椰子梨子橙子车厘子的过程,吃过就知道味道了。

这个中可能会涉及到一些数学知识,其实不必介怀,一知半解也是没关系的,不是人人都是美食家,也不是人人都是水果专家,一吃就知道这桃子是哪个品种,有没有施药,雨水有没有充足,吃过就行了,大概知道个味道,也不影响我下次去买水果时选择哪个水果。

3.2 机器学习的第二道门槛

机器学习的第二道门槛在于实践,做一个模型,肯定是希望有效果的,如果总是训练效果不好,这不免会打击信心,这时候就需要耐心与信心加持了。相信数据,相信会有效果,耐心去分析问题,这里必须说明,很多时候都是出现在数据问题上,所以需要很仔细的去了解数据,分析数据,清洗数据。

3.3 机器学习的第三道门槛

相信有许多迈过了第一道,第二道,已经入门的同学,却没有继续在机器学习上走下去。为什么?因为没有实践的机会!对!第三道门槛就是实践的机会! 一份工作也好,一份自己的项目也好,“被需要”是很重要的! 在获得实践机会后,将机器学习融入生活,才算真正开启了机器学习之路!

其实也没写几个字,却敲到手累了,有机会再细说。

最后,列出一些可以参考与学习的网站:

《1》人工智能学习路线图2023版-黑马程序员人工智能技术路线

《2》老饼|机器学习

《3》机器学习相关电子书_天赋好书(cnToFu.com)

《4》1. 监督学习 - sklearn中文教程 | 编程字典


如果觉得本文有帮助,点个赞吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/207453.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最新版IDEA专业版大学生申请免费许可证教学(无需学校教育邮箱+官方途径+非破解手段)

文章目录 前言1. 申请学籍在线验证报告2. 进入IDEA官网进行认证3. 申请 JB (IDEA) 账号4. 打开 IDEA 专业版总结 前言 当你进入本篇文章时, 你应该是已经遇到了 IDEA 社区版无法解决的问题, 或是想进一步体验 IDEA 专业版的强大. 本文是一篇学生申请IDEA免费许可证的教学, 在学…

unity 2d 入门 飞翔小鸟 小鸟碰撞 及死亡(九)

1、给地面,柱体这种添加2d盒装碰撞器,小鸟移动碰到就不会动了 2、修改小鸟的脚本(脚本命名不规范,不要在意) using System.Collections; using System.Collections.Generic; using UnityEngine;public class Fly : Mo…

kafka高吞吐、低延时、高性能的实现原理

作者:源码时代-Raymon老师 Kafka的高吞吐、低延时、高性能的实现原理 Kafka是大数据领域无处不在的消息中间件,目前广泛使用在企业内部的实时数据管道,并帮助企业构建自己的流计算应用程序。Kafka虽然是基于磁盘做的数据存储,但…

可信固件-M (TF-M)

概述: 参考: Trusted Firmware-M Documentation — Trusted Firmware-M v2.0.0 documentation 开源代码托管: trusted-firmware-m.git - Trusted Firmware for M profile Arm CPUs STM32 U5支持TF-M : STM32U5 — Trusted Firmware-M v2.0.0 document…

Meta Platforms推出Imagine:基于Emu的免费AI文本到图像生成器服务

Meta Platform是Facebook、Instagram 和 WhatsApp 的母公司,也是领先的开源AI人工智能大语言模型 Llama 2的创建者。Meta Platforms 推出了一个名为 Imagine 的独立文本到图像 AI 生成器服务。Imagine 是基于 Meta 自己的 AI 模型 Emu 构建的,Emu 是在11…

循环结构中 break、continue、return 和exit() 的区别

循环结构中 break、continue、return 和exit() 的区别 文章目录 循环结构中 break、continue、return 和exit() 的区别一、break语句二、continue语句三、return 语句四、exit() 函数 说明:本文内容参考牟海军 著《C语言进阶: 重点、难点与疑点解析》&a…

选自《洛谷深入浅出进阶篇》——欧拉函数+欧拉定理+扩展欧拉定理

欧拉函数: 欧拉函数定义: 1~n中与n互质的数的个数。 比如 欧拉函数是积性函数:(也就是)当 n与m互质的时候: 由算术基本定理,我们可以设n,那么我们只要计算出的取值就能求出的取…

5组10个共50个音频可视化效果PR音乐视频制作模板

我们常常看到的图形跟着音乐跳动,非常有节奏感,那这个是怎么做到的呢?5组10个共50个音频可视化效果PR音乐视频制作模板满足你的制作需求。 PR音乐模板|10个音频可视化视频制作模板05 https://prmuban.com/36704.html 10个音频可视化视频制作…

设计师福利!免费实用的7款Figma插件,让你的工作事半功倍!

如今,Figma已经成为主流的原型和数字设计软件之一,许多UI设计师和设计团队开始选择使用Figma。随着Figma的快速更新和迭代,Figma插件库变得越来越丰富。如果使用得当,将有助于提高您的设计效率。本文将介绍7个工作中非常实用的Fig…

微软发布Orca2,“调教式”教会小规模大语言模型如何推理!

我们都知道在大多数情况下,语言模型的体量和其推理能力之间存在着正相关的关系:模型越大,其处理复杂任务的能力往往越强。 然而,这并不意味着小型模型就永远无法展现出色的推理性能。最近,奶茶发现了微软的Orca2公开了…

xxl-job详解

目录 1、xxl-job介绍1.1 xxl-job的原理1.1.1 执行器的注册和发现1.1.2 调度中心调用执行器 1.2 quartz和xxl-job对比 2、快速入门2.1 下载并启动2.2 在调度中心新增定时任务2.3 任务运行模式(BEAN、GLUE)2.4 xxl-job的总结 3、后端专属技术群 1、xxl-job介绍 ​ xxl-job是一个…

Python源码30:海龟画图turtle画紫色的小熊

turtle模块是一个Python的标准库之一,它提供了一个基于Turtle graphics的绘图库。Turtle graphics是一种流行的绘图方式,它通过控制一个小海龟在屏幕上移动来绘制图形。 turtle模块可以让您轻松地创建和控制海龟图形,从而帮助您学习Python编…

Qt12.8

使用手动连接,将登录框中的取消按钮使用qt4版本的连接到自定义的槽函数中,在自定义的槽函数中调用关闭函数 将登录按钮使用qt5版本的连接到自定义的槽函数中,在槽函数中判断ui界面上输入的账号是否为"admin",密码是否为…

lv11 嵌入式开发 中断控制器14

目录 1 中断控制器 ​编辑 2 Exynos4412下的中断控制器 2.1 概述 2.2 特征 ​编辑 2.3 中断状态 2.4 中断类型 2.5 中断控制器GIC中断表 3 中断控制器寄存器详解 3.1 ICDDCR(Interrupt Controller Distributor Control Register) 3.2 ICDISER…

当你还在纠结用什么技术时,这位独立开发者用PHP和JavaScript实现财务自由了

大家好,我是风筝,微信搜「古时的风筝」,更多干货 一个个人产品卖了5400万,这大概就是最成功的独立开发者了吧 这位独立开发者是 levelsio,他的真名是 Pieter Levels,是一位荷兰的独立开发者。看看人家的工…

【Java基础系列】Cron表达式入门

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

优秀案例 | 元宇宙双语财经科技主播“舒望”主持首届粤港澳大湾区元宇宙国际传播论坛

12月6日,由南方财经全媒体集团指导、大湾区元宇宙国际传播实验室(GBA MIC Lab)主办、南财国际传播中心和21世纪经济报道共同承办,以“多元共创开放共享”为主题的首届粤港澳大湾区元宇宙国际传播论坛在广州隆重开幕。 “立足湾区,…

一文详解Java单元测试Junit

文章目录 概述、Junit框架快速入门单元测试概述main方法测试的问题junit单元测试框架优点:使用步骤: 使用案例包结构 Junit框架的常见注解测试 概述、Junit框架快速入门 单元测试概述 就是针对最小的功能单元(方法),…

ROS rosbag

在ROS中的rosbag是一个命令行工具,主要用于记录、回放和分析rostopic中的数据。它可以将指定rostopic中的数据记录到.bag后缀的数据包中,以便于进行离线分析和处理。 在ROS系统中,rosbag可以通过命令行工具或ROS节点来使用。 通过rosbag命令…

数字图像处理(实践篇)十九 漫水填充

目录 一 漫水填充算法--FloodFill 二 涉及的函数 三 实践 一 漫水填充算法--FloodFill FloodFill漫水填充算法就是选中与种子点相连接的区域,利用指定颜色进行区域颜色填充。可以通过设置连通方式或像素的范围控制填充的效果。通常是用来标记或者分离图像的一部…