机器学习入门介绍

各位大佬好 ,这里是阿川的博客 , 祝您变得更强

在这里插入图片描述 个人主页:在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

阿川水平有限,如有错误,欢迎大佬指正 在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

目录

  • 三大方向
  • 机器学习产生的原因
  • 机器如何学习
  • 模型评价
  • 应用层
  • 适用条件
  • 学习要弄清楚
    • 数据什么样
    • 研究哪些问题
    • 如何分门别类
    • 常见误区与局限
  • 工具栏
    • 四大必备工具
      • Anaconda
      • [Jupyter notebook](https://jupyter.org/)
      • Numpy(重点)
      • Matplotlib

机器学习

  • 计算机 从数据中学习规律并改善自身进行预测的过程

三大方向

在这里插入图片描述
其中深度学习为重点

机器学习产生的原因

  • 人与计算机理解方式不同
  • 规律系统不够用
  • 逻辑判断专家参与耗时耗力

机器如何学习

在这里插入图片描述
注意:我们期望机器在没有见过的数据集表现良好,所以在训练中会采用28原则

  • 80%的历史数据用来训练
  • 20%的数据用来测试

在这里插入图片描述

模型评价

模型要进行模型评价

在这里插入图片描述

应用层

  • 商品画像
  • 用户画像
  • 商品推荐
  • 搜索算法
  • 以画搜画
  • 商品排序
  • 人脸检测
  • 活体检测
  • 人脸识别

适用条件

  • 问题存在某种模式
    • 一般是人能够解决的,若人解决不了的,作为强人工智能领域
  • 难以人工总结定义
  • 足够样本数据
    • 小数据下会失效

学习要弄清楚

学习机器学习要弄清楚

在这里插入图片描述

数据什么样

  • 常用的公开数据集
  • 典型实例
  • 如何使用数据
  • 高维特征空间
  • 结构化与非结构化数据

研究哪些问题

  • 任务地图

在这里插入图片描述

  • 分类任务(重点)

    • 特征

      • 已知样本特征
      • 判断样本类别
      • 二分类,多分类,多标签分类
    • 二分类

    • 多分类

    • 多标签分类

      • 标签间不互斥
      • 概率和不为1
    • 更多实例

  • 回归任务(重点)

    • 特征

      • 用于预测
    • 线性回归

    • 多项式回归

      • 一个因变量
      • 一个或多个自变量
      • 任何函数都可以用多项式逼近
    • 逻辑回归

      • 实际上是分类
      • 细节很多,求法不同,导致在回归类

不管是分类还是回归,都属于监督学习

  • 类别标记
  • 直接反馈

无监督学习

  • 无标准答案,去探索某种规律或结构

强化学习

  • 研究环境与行动之间的互动,以获取最大化结果

如何分门别类

划分依据

  • 监督学习

    • 训练数据有标记
    • 基础而重要
  • 无监督学习

    • 训练数据未有标记
    • 聚类
    • 降维
      • 主成分分析
        • K均值算法
        • 密度聚类
        • 最大期望算法
      • 核方法
  • 半监督学习

    • 少量标记,大量无标记
  • 强化学习

    • 观测环境
    • 估计状态
    • 执行操作
    • 获得回报或惩罚
  • 批量学习

    • 先训练再使用
    • 需要大量的时间和计算资源
    • 通常都是高线完成
  • 在线学习

    • 循序渐进
    • 边学边用
  • 基于实例的学习

  • 基于模型的学习

常见误区与局限

  • 数据越多越好吗

    • 数据质量是关键
    • 多不意味着准确
    • 传统方法依然有用
  • 模型真的可信吗

    • 可解释性难题
    • 深度学习是个黑盒子
    • 深层学习有具优势
  • 随机和确定性哪个更好

    • 机器学习本质上是统计
    • 确定性依然十分重要
    • 随机与确定性间的平衡
  • 小样本集怎么办

    • 机器学习适合大数据
    • 很多问题是天然小数据
    • 小样本学习是机器学习的挑战
  • 推理而不只是判断

    • 机器学习尚在判断阶段
    • 抽象思维和逻辑思维推理远未实现
    • 数学依旧是汪洋大海
  • 机器学习是机会

    • 深度学习局限性凸显
    • 本质上是几何空间变换
    • 具体问题应具体分析

工具栏

四大必备工具

在这里插入图片描述

Anaconda

在这里插入图片描述

Jupyter notebook

  • 基础使用
    • 基础操作
      • 快捷键
      • markdown
  • 高级使用
    • %%writefile
    • %pycat
    • %run
    • %timeit
    • %time
    • %%timeit
    • %%time
    • %whos
    • %lsmagic
    • %magic

Numpy(重点)

  • 基础知识

    • 性能对比
  • 数组创建

    • 常用属性
      • ndim\shape\size
  • 创建数组

    • np.array()
    • ones/ones_alike
    • zeros/zeros_like
    • full/full_like 指定数值
    • empty/empty_like 实数组
    • arange/linspace 等量数组
    • random/rand/randint/randn/nomal/uniform/seed 随机数组
    • reshape 改变形状
    • help/? 查看文档
  • 基础索引

  • 数据合并与拆分

    • 合并
      • concatnade/vstack/hstack
    • 拆分
      • split/vsplit/hsplit
  • 矩阵运算

    • 一元运算
      • abs/sqrt/square/exp/log/ceil/floot/round/sincostan
    • 二元运算
      • dot/加速乘除/取余/幂运算
    • 矩阵运算
      • 加速乘除/dot/转查/逆矩阵/行列式
  • 统计运算

    • min/max
    • sum/mean/median/std/var
    • ptp/percentile/cumsum/diff/prod
  • arg运算

    • argmin/argmax/argsort/argpartition
  • 补齐索引和布尔索引

Matplotlib

  • 数据可视化基础
    • 拆线
    • 散点
    • 绘制设置

好的,到此为止啦,祝您变得更强

在这里插入图片描述

道阻且长 行则将至

个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/12927.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于springboot+vue+Mysql的大学生社团活动平台

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

图文成片剪辑软件,分享3个专业的工具!

在数字化时代,图文成片剪辑软件成为了我们创作与表达的重要工具。无论是想要制作一段引人入胜的短视频,还是打造一幅精美的图文海报,这些软件都能助你一臂之力。那么,图文成片剪辑软件的方法有哪些?又有哪些值得一试的…

PHP开发中的不安全反序列化

序列化是开发语言中将某个对象转换为一串字节流的过程,转换后的字节流可以方便存储在数据库中,也可以方便在网络中进行传输。而反序列化则是将数据库取出的字节流或从网络上接收到的字节流反向转换为对象的过程。概念虽如此,但不同的开发语言…

ASP.NET在线二手交易系统的设计与实现

摘 要 随着当今社会信息技术的进步,基于互联网的各种应用日益受到了人们的重视,二手商品的重新利用也逐渐被人们关注,二手交易系统就在这种形势下产生了,它利用网络,改变了人们的购物方式。 本文是基于现代二手交易…

AC/DC电源模块的故障诊断与维修技巧

BOSHIDA AC/DC电源模块的故障诊断与维修技巧 AC/DC电源模块是一种常用的电力转换设备,用于将交流电转换为直流电供给电子设备。然而,由于使用环境和操作不当等原因,电源模块可能会出现故障。本文将介绍AC/DC电源模块的故障诊断与维修技巧。…

什么?你设计接口什么都不考虑?

如果让你设计一个接口,你会考虑哪些问题? 1.接口参数校验 接口的入参和返回值都需要进行校验。 入参是否不能为空,入参的长度限制是多少,入参的格式限制,如邮箱格式限制 返回值是否为空,如果为空的时候是…

不相交集合的数据结构

一、不相交集合的操作 不相交集合的数据结构维护了一组不相交动态集的集合 ,用集合中的某个成员作为代表标识集合。 集合在没有修改的情况下每次访问代表得到的答案是相同的,此外在其它一些应用中,可能按照规定选择集合的代表,例如…

WebSocket or SSE?即时通讯的应用策略【送源码】

最近在研究H5推送,发现除了我们常用的WebSocket以外,其实还有一种协议也能实现H5推送,那就是SSE协议。 而且,当前主流的大模型平台,比如ChatGPT、通义千问、文心一言,对话时采用的就是SSE。 什么是SSE协议…

100m/s高速轧制钢材 八轴测径仪检测毫无压力

关键词:八轴测径仪,在线测径仪,钢材测径仪,高速轧制 随着技术的提升,钢材的生产速度越来越快,一些高速生产的钢材,生产速度甚至达到了100m/s,这是一个非常快的速度。 如果汽车以120公里/小时的速度行驶,那么…

Unity WebGL全屏显示

一、删除footer节点 二、删除最下面点击事件绑定 修改Canvas宽高 canvas.style.width "960px"; canvas.style.height "600px"; 改成 canvas.style.width document.documentElement.clientWidth"px"; canvas.style.height document.document…

行为驱动开源免费接口测试框架:karate

什么是行为驱动测试: 行为驱动测试(Behavior-Driven Testing,简称 BDT)是一种测试方法,旨在通过描述系统行为和功能来编写测试用例。BDT的重点是从用户的角度出发,描述系统应该如何行为,而不是专…

DiskANN数据布局

_mem.index.data:和sift_base.fbin一模一样。0-3字节是总向量数,4-7是每个向量的特征数。后面就是依次放置的每个向量。 _disk.index:是存储的图,但是不光包含图也包含原始向量。前4KB不知道存的是啥。从第0x1000开始存放的是原始…

国内企业更喜欢私有化部署的 6 大原因

今天在 V 站看到一篇题为《为什么国内企业会更倾向于接受私有部署而不是 SaaS?》的帖子,觉得很有启发,这里把网友的观点稍作整理和总结,分享给大家参考。 在技术日益发展的今天,国内企业的软件部署方式似乎呈现出与欧…

【机器学习】机器学习:人工智能中实现自动化决策与精细优化的核心驱动力

🔒文章目录: 💥1.概述 ❤️2.机器学习基本原理 🛤️2.1定义与关键概念 🛣️2.2 机器学习算法 ☔3.自动化决策中的机器学习应用 🚲4.精细优化与机器学习的结合 👊5.挑战与前景 💥1.概述 …

基于微信小程序+JAVA Springboot 实现的【房屋租赁管理系统】app+后台管理系统 (内附设计LW + PPT+ 源码+ 演示视频 下载)

项目名称 项目名称: 基于微信小程序的房屋租赁管理系统 在本次项目开发中,我们成功构建了一款基于微信小程序的房屋租赁管理系统,旨在通过现代化信息技术提升房屋租赁服务的效率和质量。以下是对本项目的全面总结: 项目背景与目…

js之选项卡制作实例

大家好&#xff0c;今天给大家书写选项卡实例&#xff0c;话不多说&#xff0c;直接上干货 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, in…

Redis-分片集群存储及读取数据详解

文章目录 Redis分片集群是什么&#xff1f;Redis分片集群的存储及读取数据&#xff1f; 更多相关内容可查看 Redis分片集群是什么&#xff1f; Redis分片集群是一种分布式部署方式&#xff0c;通过将数据分散存储在多个Redis节点上&#xff0c;从而提高了系统的性能、扩展性和…

19个测试⽤例⽣成的AI⼯具!卷起来!

在不断发展的软件开发领域中&#xff0c;确保应⽤程序的可靠性和功能性⾄关重要。 随着软件系统复杂性的增加&#xff0c;有效测试⽅法的需求也在上升。 传统的测试⽤例⽣成⽅法通常⽆法满⾜快速开发周期和复杂代码库的需求。 随着进⼊⼈⼯智能&#xff08;AI&#xff09;时…

爬虫入门经典(七) | 采集淘宝电场相关信息

大家好&#xff0c;我是不温卜火&#xff0c;昵称来源于成语—不温不火&#xff0c;本意是希望自己性情温和。 PS&#xff1a;由于现在越来越多的人未经本人同意直接爬取博主本人文章&#xff0c;博主在此特别声明&#xff1a;未经本人允许&#xff0c;禁止转载&#xff01;&a…

Galxe已投资Pencils Protocol,投资者阵营正不断扩大

近日&#xff0c;Scroll 生态项目 Penpad 将品牌进一步升级为 Pencils Protocol&#xff0c;全新升级后其不仅对 LaunchPad 平台进行了功能上的升级&#xff0c;同时其也进一步引入了 Staking、Vault 以及 Shop 等玩法&#xff0c;这也让 Pencils Protocol 的叙事方向不再仅限于…