机器学习和深度学习--李宏毅 (笔记与个人理解)Day7

Day7 Regression Case study (预测宝可梦的cp)

Regression 可以做什么? 股票预测 自动驾驶 推荐 预测宝可梦的cp(能力类似这样的属性把)

这里突然想到,是不是可以用洛克王国和赛尔号做事情哈哈

注意: 用下标来表示某一个完整的物体的某一个部分,例如:x 表示妙蛙种子;那么 xhp 就表示它的生命值,xcp 就表示我们要预测的战斗力等等

review 做机器学习的三个步骤:

  1. 找一个model(function set 关于函数的集合)
  2. 制定评价函数好坏的指标
  3. 找一个最好的function

Example:预测宝可梦

Step1 Model

image-20240406132011823

注意这里的做法看似简单, 但是这种思想却是贯穿机器学习始末的:用简单的抽象的函数来表示我需要解决的问题

image-20240406132238667 image-20240406132408363

Step2 Goodness of function

抓取一部分的training Data 来训练我的参数

注意:这里用上标来表示一个完整的个体的编号; 在本课程中使用 y(head) y ∧ y\wedge y来表示正确的值

Loss Function : 一个函数的函数

input: a function ,output :how bad it is

image-20240406135959271

因为f 是由w 和b 来决定的

Step 3 Best Function (Gradient Descent )

找到最好的function, 也就是使得 L 最小 image-20240406140244502

这里用线性代数的方法可以直接求 ,最速下降法(Gradient Descent)更有普遍性和计算机领域的意义image-20240406140724864

how can we do better ?

select another model

image-20240406141021761 image-20240406141141038 image-20240406141204152 image-20240406141246266

个人感觉这里用多项式进行复杂函数的逼近,有一点像泰勒展开(泰勒级数)不同的点在于,这里的w 是彼此无关的,然而泰勒级数的展开式和展开点相关性极强

image-20240406141754339 image-20240406141848487

从这里可以嗅到过拟合(Overfitting)的味道啦~

Let’s collect more data

image-20240406142316561

what are the hidden factors ?

image-20240406142424125

improve the model (consider the category )

Redesign the Model

image-20240406142728924

这样的变形还是 linear model 吗?分段?

image-20240406142915546 image-20240406143046976

这里蓝色的部分就是我的feature ,本质上还是 linear model

Are there any other hidden factors?

image-20240406145137511

使用了一个比较复杂的function ,发现过拟合了

两种方案:去掉不重要的因素feature

or Regularzation (正则化)

image-20240406145503445

更加平滑; 减少 输入xi 对输出的影响; 红色的框框就是 Regularization的项

why we like the smooth ? (哎嘿~ 哈哈 🚗 )

减少noises 的干扰(尤其是我们并不知道 noises 是什么的情况下, 如果知道的话 直接剪掉不就好了哈哈)

image-20240406150427785

λ \lambda λ 太小,过拟合, 太大 欠拟合

how smooth ? (如何选择 合适的 λ \lambda λ) 这里老师简单跳过了,直接看图选

为什么不加b?

b 的大小和平滑程度无关,

Conclusion

  • cp is determined b the before cp and the species
  • Gradient Descent(我这里没有过多花时间,因为之前学过几遍了, 感兴趣的同学可以去看看吴恩达的Gradient Descent)
  • Over fitting and Regularization (正则化) (这里加深了对正则化的理解,注意区分 正则化和 归一化这类预处理)
  • image-20240406151440145

提问:好吧 不知道,感觉有高有低没有依据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/806813.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

6种xinput1_3.dll丢失的解决办法,并探讨xinput1_3.dll丢失的原因及其属性。

xinput1_3.dll扮演着Visual C运行时库中不可或缺的角色,众多电脑软件都需依赖它以确保正常运行。 当您启动软件时,若遇到xinput1_3.dll无法执行代码的提示,可能会导致软件无法如常启动或运行。本文将向您介绍6种解决方案,并探讨xi…

Java基于微信小程序的乐室预约系统(V2.0),附源码

博主介绍:✌IT徐师兄、7年大厂程序员经历。全网粉丝15W、csdn博客专家、掘金/华为云//InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇&#x1f3…

global.d.ts 无效问题解决

问题描述 和 src 同级目录有一个 types目录,其中包含 global.d.ts,如下 declare global {interface Window {config: {url: string;};} }在组件中访问 window.config x;ts显示此错误 Error:(10, 22) TS2339: Property config does not exist on typ…

WEB前端-倒计时练习

<body><div>距离2024年7月3日还有&#xff1a;<br><span id"d">0</span>天<span id"h">0</span>小时<span id"m">0</span>分钟<span id"s">0</span>秒</div>…

jQuery 数字金额转化为英文大写

示例&#xff1a;100转化为SAY ONE HUNDRED AND POINT ONLY //数字金额转换英文大写&#xff08;金额上线不能超过10亿&#xff09; var arr1new Array(""," THOUSAND"," MILLION"," BILLION") var arr2new Array("ZERO",&…

文章解读与仿真程序复现思路——电力系统自动化EI\CSCD\北大核心《新型电力系统多阶段输-储协同分布鲁棒规划》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

【PHP系统学习】——Laravel框架数据库的连接以及数据库的增删改查的详细教程

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;开发者-曼亿点 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 曼亿点 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a…

蓝桥杯——考勤刷卡

题目 小蓝负责一个公司的考勤系统,他每天都需要根据员工刷卡的情况来确定 每个员工是否到岗。 当员工刷卡时,会在后台留下一条记录,包括刷卡的时间和员工编号,只 要在一天中员工刷过一次卡,就认为他到岗了。 现在小蓝导出了一天中所有员工的刷卡记录,请将所有到岗员工的员工编…

创建网络名称空间后的Linux幕后工作解析

Linux网络名称空间&#xff08;Network Namespace&#xff09;是一种强大的虚拟化技术&#x1f310;&#xff0c;允许用户隔离网络设备、IP地址、路由表等网络资源。这项技术在容器化和虚拟化领域发挥着关键作用&#xff0c;是构建现代云基础设施的基石之一⛅。当你创建一个新的…

ubuntu常用指令(1)

ls&#xff1a;列出当前目录中的文件和子目录pwd&#xff1a;显示当前工作路径cd /*&#xff1a;切换到指定目录mkdir file_name&#xff1a;创建新目录rmdir file_name&#xff1a;删除文件或目录cp file_name&#xff1a;复制文件或目录mv old_name new_name&#xff1a;重命…

无人机炸机后还能修复吗?

无人机炸机后是否还能修复&#xff0c;取决于炸机的具体情况和损坏程度。 一般来说&#xff0c;如果无人机的损坏比较严重&#xff0c;例如主要结构部件断裂或严重变形&#xff0c;电机、电池、电子设备等核心部件损坏&#xff0c;那么修复的难度和费用会比较高&#xff0c;可…

2024年华为OD机试真题-最大N个数与最小N个数的和-Python-OD统一考试(C卷)

题目描述: 给定一个数组,编写一个函数来计算它的最大N个数与最小N个数的和。你需要对数组进行去重。 说明: 数组中数字范围[0, 1000] 最大N个数与最小N个数不能有重叠,如有重叠,输入非法返回-1 输入非法返回-1 输入描述: 第一行输入M, M标识数组大小\n第二行输入M个数,标…

Threadlocal什么情况下会造成内存泄露?怎么避免?

ThreadLocal 在某些情况下可能会导致内存泄露&#xff0c;主要是由于线程的生命周期超过了预期而导致的。以下是一些可能导致 ThreadLocal 内存泄露的情况&#xff1a; 线程池的使用&#xff1a;如果在使用线程池的情况下&#xff0c;没有正确清理 ThreadLocal 变量&#xff0c…

Quanto: PyTorch 量化工具包

量化技术通过用低精度数据类型 (如 8 位整型 (int8)) 来表示深度学习模型的权重和激活&#xff0c;以减少传统深度学习模型使用 32 位浮点 (float32) 表示权重和激活所带来的计算和内存开销。 减少位宽意味着模型的内存占用更低&#xff0c;这对在消费设备上部署大语言模型至关…

nginx配置证书和私钥进行SSL通信验证

文章目录 一、背景1.1 秘钥和证书是两个东西吗&#xff1f;1.2 介绍下nginx配置文件中参数ssl_certificate和ssl_certificate_key1.3介绍下nginx支持的证书类型1.4 目前nginx支持哪种证书格式&#xff1f;1.5 nginx修改配置文件目前方式也会有所不同1.6 介绍下不通格式的证书哪…

[opencv]VideoWriter写出fourcc格式

fourcc支持的格式 fourcc全名Four-Character Codes&#xff0c;四字符代码&#xff0c;该编码由四个字符组成 cv2.VideoWriter_fourcc(O,O,O,O) cv2.VideoWriter_fourcc(*OOOO) 通常写法有上述两种形式&#xff0c;O代表一个字符&#xff0c;通常有 支持avi格式的有&#…

【leetcode面试经典150题】42. 有效的字母异位词(C++)

【leetcode面试经典150题】专栏系列将为准备暑期实习生以及秋招的同学们提高在面试时的经典面试算法题的思路和想法。本专栏将以一题多解和精简算法思路为主&#xff0c;题解使用C语言。&#xff08;若有使用其他语言的同学也可了解题解思路&#xff0c;本质上语法内容一致&…

使数组连续的最少操作数(Lc2009)——排序+去重+二分查找、排序+去重+双指针

给你一个整数数组 nums 。每一次操作中&#xff0c;你可以将 nums 中 任意 一个元素替换成 任意 整数。 如果 nums 满足以下条件&#xff0c;那么它是 连续的 &#xff1a; nums 中所有元素都是 互不相同 的。nums 中 最大 元素与 最小 元素的差等于 nums.length - 1 。 比方…

力扣爆刷第116天之CodeTop100五连刷66-70

力扣爆刷第116天之CodeTop100五连刷66-70 文章目录 力扣爆刷第116天之CodeTop100五连刷66-70一、144. 二叉树的前序遍历二、543. 二叉树的直径三、98. 验证二叉搜索树四、470. 用 Rand7() 实现 Rand10()五、64. 最小路径和 一、144. 二叉树的前序遍历 题目链接&#xff1a;htt…

输入输出系统的组成以及i/o设备与主机的联系

输入输出系统的组成 1.i/o软件&#xff1a; i/o指令是机器指令的一类&#xff0c;包含操作码&#xff0c;命令码&#xff0c;设备码&#xff0c;操作码可作为i/o指令与其他指令的判别代码&#xff0c;命令码体现i/o设备的具体操作&#xff0c;设备码是多台i/o设备的选择码。 通…