李宏毅深度学习01——基本概念简介

视频链接

基本概念

Regression(回归):
类似于填空

Classification(分类):
类似于选择

Structure Learning(机器学习):
??

机器学习找对应函数的步骤

1、写出一个带有未知参数的函数

Model(模型):一个函数,比如y = b + w * x1(y是要预测的,x1是已知的)

weight(权重):上述中的w就是权重

bias(偏移):上述中的b就是偏移

2、定义训练数据的损失函数

loss(损失函数):一个函数,输入是模型中的参数 L(b, w),输出的值代表这组b,w好还是不好,值越大,代表b,w越不好

MAE(mean absolute error): 均值绝对误差

MSE(mean square error): 均值方差

Cross-entropy:如果预测值和实际值都是随机分布的,则使用这种方式查看损失值
在这里插入图片描述

label(真实值):真实的值,类似于训练数据

Error surface(误差面):等高线图
在这里插入图片描述

3、Optimization(优化)

找一个w和b,使得Loss结果最小

Gradient Descent(梯度下降)

在这里插入图片描述
在这里插入图片描述

Learning rate:学习速率 n
hyper parameters:超参数 自己设定
在这里插入图片描述

local minima局部最优

global minima全局最优

梯度下降有个问题就是容易导致局部最优?其实局部最优是一个假问题!
在这里插入图片描述
上述说的只是一个参数的情况,实际上多个参数也是一样的做法
在这里插入图片描述
在这里插入图片描述

由线性模型推广至非线性模型

前面的步骤统称训练,实际上都是基于已知数据进行的,我们的目的是要通过这个式子预测新的数据

在这里插入图片描述
在这里插入图片描述
为此,我们应该修改模型,以7天为一个周期来预测

linear models:线性模型,下面如图,就是考虑不同周期对应的线性模型
在这里插入图片描述
model bias:模型偏移
与之前说的bias不一样,这里说的是模型本身的限制导致没办法模拟真实的情况
在这里插入图片描述
所以我们需要一个更复杂的有未知参数的函数来替代线性模型

piecewise linear curves:分段线性曲线
在这里插入图片描述
这里面哪怕红色线不是线性的,而是曲线的,我们也可以通过微分的方式,选取足够多的点将其看成是线性的

在这里插入图片描述
那蓝色线的函数该怎么写出来呢,有一个很出名的函数叫做sigmoid,虽然是曲线,但是很接近蓝色线

sigmoid:S型线段对应的函数

在这里插入图片描述
而蓝色线的函数我们一般将其称作hard sigmoid

通过调整c、b、w这三个值,我们可以得到不同的sigmoid函数,从而逼近不同的蓝色线
在这里插入图片描述
所以上述的红色线可以通过以下公式逼近:
在这里插入图片描述

单个特征推广至多个特征

在这里插入图片描述

改写机器学习的每一步

1、函数式子转矩阵

上述多个特征的式子可以转成用矩阵的方式表示

在这里插入图片描述

在这里插入图片描述
上述已经知道r表示什么,再用a表示sigmoid®
在这里插入图片描述
所以最终式子y可以转成向量的表示方式如下所示
在这里插入图片描述

总结:
transpose:矩阵转置

在这里插入图片描述

在这里插入图片描述
重新定义一下未知参数
在这里插入图片描述

2、重定义Loss函数

在这里插入图片描述

在这里插入图片描述

3、优化

在这里插入图片描述

优化步骤没什么区别,还是用梯度下降,唯一就是参数变了,本质上还是前面w,b两个参数的时候情况是一样的

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
为什么要分一个个Batch?
下次课解释

数据、BatchSize、epoch、update之间的关系如下:
在这里插入图片描述

拓展——模型变型

模型不一定是要用sigmoid,也可以用其他的模型,比如ReLu

在这里插入图片描述
在这里插入图片描述
上述函数统称为激活函数(activation function)

神经网络 OR 深度学习

Neuron:神经元
Neuron Network:神经网络在这里插入图片描述

由于这个名字被搞臭了,所以换了个名字
layer:层
Deep Learning:深度学习
本质上是一个东西
在这里插入图片描述
为什么不把network变胖,而是将其变深???

过拟合

over fitting
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/26641.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CVE-2020-1472域渗透 NetLogon 权限提升漏洞

文章目录 一、漏洞描述二、影响版本三、漏洞编号四、漏洞环境0x01、漏洞利用(CVE-2020-1472)0x02、上线CS0x03、补充:配置代理过程0x04、远程域控免责声明一、漏洞描述 在2020年8月份微软发布的安全公告中,有一个十分紧急的漏洞CVE-2020-1472 NetLogon 权限提升漏洞。通过该漏…

Python基础教程(十六):正则表达式

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快! 💝&#x1f49…

查分易老师怎么用?

老师们想知道怎么样创建一个查分易成绩查询系统吗?" 这是许多老师在学期结束时关心的问题。别担心,查分易小程序让查询发布工作变得省事又高效。 首先成绩Excel表格格式要设置正确。第一行必须是表头,包含学生的"姓名"、"…

kotlin 语法糖

Use of “when” Expression Instead of “switch” fun getDayOfWeek(day: Int): String {return when (day) {1 -> "Monday"2 -> "Tuesday"3 -> "Wednesday"4 -> "Thursday"5 -> "Friday"6 -> "Sa…

C++中的结构体——结构体中const的使用场景

作用:用const来防止误操作 示例 运行结果

2024酒店IPTV云桌面系统建设方案

Hello大家好,我是点量小芹,这一年多的时间一直在分享实时云渲染像素流相关的内容,今天和大家聊聊酒店IPTV云桌面电视系统解决方案,或者有的朋友也会称之为IPTV服务器。熟悉小芹的朋友知道,IPTV软件系统是我们一直在推的…

MySQL之高级特性(三)

高级特性 分布式(XA)事务 存储引擎的事务特性能够保证在存储引擎级别实现ACID,而分布式事务则让存储引擎级别的ACID可以扩展到数据库层面,甚至可以扩展到多个数据库之间——这需要通过两阶段提交实现。MySQL5.0和更新版本的数据库已经开始支持XA事务了。XA事务中需…

架构设计 - nginx 的核心机制与主要应用场景

一、nginx 的核心机制: 1. 事件驱动模型(epoll 多路复用) 事件循环: Nginx的核心组件是一个事件循环,它不断地监听事件(如新连接的到来、请求数据的可读性等)。 当有事件发生时,事…

构建LangChain应用程序的示例代码:32、如何为任何工具添加人工验证教程

本演示展示了如何为任何工具添加人工验证。我们将使用HumanApprovalCallbackHandler来实现这一功能。 假设我们需要使用ShellTool。将此工具添加到自动化流程中存在明显的风险。让我们看看如何强制人工手动批准输入到此工具的输入。 注意:我们通常建议不要使用She…

软设之需求分析的工具

1.应用的工具 数据流图 数据字典 判定表 判定树 2.数据流图基本概念 数据流:由一组固定成分的数据组成,表示数据的流向。每个数据流通常有一个合适的名词,反映数据流的含义 加工:加工描述了输入数据流到输出数据流之间的变换,也就是输…

道可云元宇宙每日资讯|上海科委:围绕元宇宙布局全产业链技术

道可云元宇宙每日简报(2024年6月13日)讯,今日元宇宙新鲜事有: 上海科委:围绕元宇宙布局全产业链技术 6月12日,上海市科学技术委员会印发《上海市颠覆性技术创新项目管理暂行办法》,其中提出&a…

放弃Venn-Upset-花瓣图,拥抱二分网络

写在前面 让点随机排布在一个区域,保证点之间不重叠,并且将点的图层放到最上层,保证节点最清晰,然后边可以进行透明化,更加突出节点的位置。这里我新构建了布局函数 PolyRdmNotdCirG 来做这个随机排布。调用的是packcircles包的算…

商家转账到零钱最全面攻略:申请、使用、注意事项等详解

一、微信商家转账到零钱功能概述 微信支付作为国内最大社交软件的增值服务,在商业活动中广泛使用。其开发的营销功能“商家转账到零钱”则允许商家直接将资金转入用户的微信钱包,操作简便快捷。本文将详细探讨此功能的使用条件、操作步骤以及解答一些常…

深入理解java设计模式之单例模式

目录 概述单例模式是什么单例模式的使用场景单例模式的优缺点单例模式的几种实现方式饿汉式懒汉式双重检查锁定机制静态内部类枚举使用容器几种可能破坏单例类的方法多线程环境下的竞争条件使用反射机制使用序列化多个类加载器概述 单例模式是什么 定义:单例模式确保一个类在…

Java中Transactional在不同方法间的穿透性,rollbackFor参数含义

哈喽,大家好,我是木头左! 在Java开发中,经常会遇到需要在一个事务中执行多个操作的场景。为了确保这些操作的原子性,可以使用Spring框架提供的Transactional注解来实现事务管理。然而,在实际开发过程中&…

LeetCode刷题之HOT100之验证二叉搜索树

1、题目描述 2、逻辑分析 要求给定的根节点是否是有效的二叉树。有效的二叉搜索树定义如上。那么如何求解呢?题解给出了两张求解方法:递归、中序遍历。这边倾向于中序遍历,中序遍历后的二叉树是升序排序的,以这个性质即可解题。 …

Prometheus——部署详解

目录 一、Prometheus Server端安装和相关配置 1.上传安装包并解压 2.配置系统启动文件 3.启动 二、部署Node Exporters监控系统指标 三、监控Mysql配置示例 1.Mysql服务器操作 2.Prometheus服务器操作 四、监控Nginx配置示例 1.在Nginx服务器操作 2.Prometheus服务器…

HTML列表和表格标签

目录 1.列表标签 1.1无序列表 1.2有序列表 1.3定义列表 2. 表格标签、 2.1表格标签的属性 2.2合并单元格 1.列表标签 1.1无序列表 <ul>: [type 属性&#xff1a; disc( 实心圆点 )( 默认 ) 、 circle( 空心圆圈 ) 、 square( 实心方块 )] <li>: 列表中…

vue+java实现简易AI问答组件(基于百度文心大模型)

一、需求 公司想要在页面中加入AI智能对话功能&#xff0c;故查找免费gpt接口&#xff0c;最终决定百度千帆大模型&#xff08;进入官网、官方文档中心&#xff09;&#xff1b; 二、主要功能列举 AI智能对话&#xff1b;记录上下文回答环境&#xff1b;折叠/展开窗口&#…

用Qt 中的QPainter类画时钟

在Qt中&#xff0c;我们可以通过QPainter类来绘制各种图形&#xff0c;包括时钟指针。以下是一个简单的例子&#xff0c;展示了如何在Qt中绘制一个简单的时钟指针。 #include <QPainter> #include <QWidget> #include <QTimer> #include <QTime>class…