2023年12月25日学习总结——MLP

💡我准备每一天都写一个学习总结,周末再把每日的学习总结汇总成专门的文章
🔆我的学习总结主要是为了自己的个人学习,没有商业用途,侵删
okkk开始今日学习
hao玩

目录

  • 1、今日计划学习内容
  • 2、今日学习内容
    • 深入学习MLP
      • (1)why deep learning is game changing?
      • (2)it all started with a neuron
      • (3)Perceptron
      • (4)Perceptron for Binary Classification
      • (5)put it all together
      • (6)multilayer Perceptron
      • (7)backpropagation
      • (8)实战演练-使用感知机用于感情识别
        • 1. 数据集划分
        • 2. 将文本转成vector
        • 3.对数据集进行预处理fit/transform/fit_transform
        • 4.创建模型并训练
        • 5、评估模型
      • (9)使用MLP来提升性能
    • 声纹识别项目
      • (1)配置环境
      • (2)下载数据集
  • 3、实际完成任务and思考总结

1、今日计划学习内容

  • 对昨天的流量预测的内容进行一些理论知识的学习(补充学习)
  • 使用更多的网络模型进行流量预测进行性能比较
  • 运行声纹识别的项目
  • 学习时不玩手机

presonal feelings should be put aside when studying📚
Let’s be emotionless learning machine😄

2、今日学习内容

深入学习MLP

link:https://towardsdatascience.com/multilayer-perceptron-explained-with-a-real-life-example-and-python-code-sentiment-analysis-cb408ee93141

(1)why deep learning is game changing?

传统的机器学习太依赖于模型,一般都需要有很多经验的专家来构建模型,而且机器学习的质量也很大程度上取决于数据集的质量和how well features encode the patterns in the data
深度学习算法使用人工神经网络作为主要的模型,好处就是不再需要专家来设计特征,神经网络自己学习数据中的characteristics
深度学习算法读入数据后,学习数据的patterns,学习如何用自己提取的特征来代表数据。之后组合数据集的特征,形成一个更加具体、更加高级的数据集表达形式。
深度学习侧重于使系统能够学习multiple levels of partern composition(组合)

(2)it all started with a neuron

1940 Warren McCulloch teamd up with Walter Pitts created neuron model
a piece of cake:
在这里插入图片描述
神经网络的首次应用是复制(replicated)了一个logic gate:
在这里插入图片描述
但是此时的神经网络没有办法像大脑一样学习,因为获得期望输出的前提是,魔性的参数要提前设置好
only a decade later, Frank Rosenblatt 创建了一个可以学习权重的模型:💥Perceptron💥

(3)Perceptron

Perception 最初是为了图像识别创造的,为了让模型具有人类的perception(感知),seeing and recognizing 图片的能力。
Perception模型核心就是neuron,主要不同就是输入被组合成一个加权和,如果这个加权和超过一个预设的阈值(threshold),神经网络就会被触发,得到一个输出。
在这里插入图片描述

(4)Perceptron for Binary Classification

Perceptron 用于二元分类问题的主要假设是数据是:linearly separable(线性可分):
在这里插入图片描述
神经网络的预测值:
f ( x ; w ) = s i g n ( ∑ i w i x i − T ) ∀ i = 1 , . . . , n f(x;w)=sign(\sum_i w_ix_i-T) \forall i=1,...,n f(x;w)=sign(iwixiT)i=1,...,n
神经网络的真实值(label): y i y_i yi
如果预测正确率的话: y i ⋅ f ( x ; w ) > 0 y_i \cdot f(x;w)>0 yif(x;w)>0
所以目标函数被设计为:
在这里插入图片描述
优化目标就是 min ⁡ D ( w , c ) \min D(w,c) minD(w,c)
和其他算法不同,这个目标函数不能求导,所以Perceptron使用 Stochastic Gradient Descent(随机梯度下降法)来最小化目标函数(如果数据集是线性可分的,就可以使用这个方法,并且在有限的steps内converge收敛)
在这里插入图片描述
对于足够小的正数 r r r,我们就能保证 L ( w 1 ) < L ( w ) L(w_1)<L(w) L(w1)<L(w)

Perceptron使用的激活函数是sigmoid function,这个函数把数值映射成一个0~1值:
在这里插入图片描述
之前总结过的sigmoid图:
在这里插入图片描述

  • 非线性函数
  • 值在0到1之间
  • 它有助于网络更新或忘记数据。如果相乘结果为0,则认为该信息已被遗忘。类似地,如果值为1,则信息保持不变。
    但是用的更多的是 Rectified Linear Unit (ReLU):
    在这里插入图片描述
    为什么更多使用ReLU?因为它可以使用随机梯度下降进行更好的优化,并且是尺度不变的,这意味着它的特征不受输入规模的影响。(没大搞懂)

(5)put it all together

神经网络输入数据,最初先随机设置权重,然后计算加权和,在通过激活函数ReLU,得到输出:
在这里插入图片描述
之后Perceptron使用随机梯度下降法,learn 权重,来最小化错误分类的点和决策边界(decision boundary)的距离,一旦收敛,数据集就会被线性超平面(linear hyperplane)分成两个区域
❌感知机不能表示XOR门(只有输入不同,返回1)
Minsky and Papert, in 1969 证明了这种只有一个神经元的Proceptron不能处理非线性数据,只能处理线性可分的数据

(6)multilayer Perceptron

多层感知器就是为了处理非线性可分问题的
多层感知器含有输入层、输出层、一个或者多个隐藏层
在这里插入图片描述
多层感知器和单层的一样将输入由最初随机的权重进行加权和再经过激活函数得到输出,但是不同的是,每个线性组合会传递给下一层:前向传播
但是只有秦香传播,就不能学习到能使得目标函数最小的权重,所以之后引入反向传播

(7)backpropagation

反向传播以最小化目标函数为goal,是的MLP能够迭代的调整神经网络的权重
⚡️反向传播的必要条件: 神经网络输入的加权和( ∑ i w i ⋅ x i \sum_i w_i \cdot x_i iwixi)、激活函数(ReLU)必须是可微分的
在这里插入图片描述
在每次迭代iteration,当所有层的加权和都被前向传播之后,计算所有输入和输出对的Mean Squared Error(均方差) 的梯度,之后让第一个隐藏层的权重更新为这个梯度,这个过程将抑制持续,直到所有的输入输出对都收敛,意味着新的梯度不能改变收敛阈值。
其实还是有点没搞懂这个过程,我记得陈木头?这个博主讲的害挺清晰的,之后再看看

(8)实战演练-使用感知机用于感情识别

识别一句话到底是“好话”还是“坏话”
在这里插入图片描述

1. 数据集划分

使用train_test_split 函数

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=42)
  • X和y:表示输入数据和对应的标签
  • test_size:表示测试集所占的比例,这里设置为 0.1,表示测试集占原始数据集的 10%。
  • random_state:表示随机数种子
    • 数据集划分为什么要用到随机数:数据集的划分方式可能会影响到算法的性能和稳定性。如果数据集的划分方式不够随机,那么算法可能会偏向于某些特定的数据集,从而影响算法的准确性和泛化能力。
    • 设置固定的随机数的好处:设置了随机数种子后,每次运行程序时都能得到相同的数据集划分,是因为函数使用了指定的随机数种子来生成随机数。这样,每次运行程序时生成的随机数都是相同的,从而保证了数据集的划分结果相同。如果我们将 random_state 设置为 None,那么每次运行程序时都会得到不同的数据集划分。
2. 将文本转成vector

使用Term Frequency — Inverse Document Frequency (TF-IDF):该方法将任何类型的文本编码为每个单词或术语在每个句子和整个文档中出现频率的统计数据。

from sklearn.feature_extraction.text import TfidfVectorizer
TfidfVectorizer(stop_words='english', lowercase=True, norm='l1')
# 删除英语停顿词,应用L1规范化

sklearn 是 Python 中一个流行的机器学习库,全名 scikit-learn。它提供了大量的分类、回归、聚类、降维和数据处理等算法,可以用于处理和分析数据,以帮助用户进行数据建模、预测和分类等任务。sklearn 基于 NumPy、SciPy 和 matplotlib,使用这些库的功能来提供高效的算法实现。

3.对数据集进行预处理fit/transform/fit_transform

参考链接:fit_transform,fit,transform区别和作用详解!!!!!!
TfidfTransformer举例
在较低的文本语料库中,一些词非常常见(例如,英文中的“the”,“a”,“is”),因此很少带有文档实际内容的有用信息。如果我们将单纯的计数数据直接喂给分类器,那些频繁出现的词会掩盖那些很少出现但是更有意义的词的频率。

  • fit:求得训练集X的均值,方差,最大值,最小值,这些训练集X固有的属性。
    • fit(raw_documents, y=None):根据训练集生成词典和逆文档词频 由fit方法计算的每个特征的权重存储在model的idf_属性中。
  • transform:在fit的基础上,进行标准化,降维,归一化等操作(看具体用的是哪个工具,如PCA,StandardScaler等)。
    • transform(raw_documents, copy=True):使用fit(或fit_transform)学习的词汇和文档频率(df),将文档转换为文档 - 词矩阵。返回稀疏矩阵,[n_samples, n_features],即,Tf-idf加权文档矩阵(Tf-idf-weighted document-term matrix)。
  • fit_transform:fit_transform是fit和transform的组合,既包括了训练又包含了转换。fit_transform(trainData)对部分数据先拟合fit,找到该part的整体指标,如均值、方差、最大值最小值等等(根据具体转换的目的),然后对该trainData进行转换transform,从而实现数据的标准化、归一化等等。
    • 必须先用fit_transform(trainData),之后再transform(testData)
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
sc.fit_tranform(X_train)
sc.tranform(X_test)
# 根据对之前部分trainData进行fit的整体指标,对剩余的数据(testData)使用同样的均值、方差、最大最小值等指标进行转换transform(testData),从而保证train、test处理方式相同。
4.创建模型并训练
from sklearn.linear_model import Perceptron
classifier = Perceptron(random_state=457)
classifier.fit(train_features, train_targets)
  • sklearn.linear_model.Perceptron:感知机模型

    • class sklearn.linear_model.Perceptron(*, penalty=None, alpha=0.0001, l1_ratio=0.15, fit_intercept=True, max_iter=1000, tol=0.001, shuffle=True, verbose=0, eta0=1.0, n_jobs=None, random_state=0, early_stopping=False, validation_fraction=0.1, n_iter_no_change=5, class_weight=None, warm_start=False
    • 在这里插入图片描述
  • model.fit函数:训练模型,返回loss和测量指标(history)

    • model.fit(x, y, batch_size, epochs, verbose, validation_split, validation_data, validation_freq)
      在这里插入图片描述
    • callback=callbacks.EarlyStopping(monitor=‘loss’,min_delta=0.002,patience=0,mode=‘auto’,restore_best_weights=False)
      • monitor:监视量,一般是loss。
      • min_delta:监视量改变的最小值,如果监视量的改变绝对值比min_delta小,这次就不算监视量改善,具体是增大还是减小看mode
      • patience:如发现监视量loss相比上一个epoch训练没有下降,则经过patience个epoch后停止训
      • mode:在min模式训练,如果监视量停止下降则终止训练;在max模式下,如果监视量停止上升则停止训练。监视量使用acc时就要用max,使用loss时就要用min。
      • restore_best_weights:是否把模型权重设为训练效果最好的epoch。如果为False,最终模型权重是最后一次训练的权重
    • model.fit( )函数返回一个History的对象,即记录了loss和其他指标的数值随epoch变化的情况。
5、评估模型
predictions = classifier.predict(test_features)
score = np.round(metrics.accuarry_score(test_labels, predictions), 2)
  • model.predict(X_test, batch_size=32,verbose=1)
    • X_test:为即将要预测的测试集
    • batch_size:为一次性输入多少张图片给网络进行训练,最后输入图片的总数为测试集的个数
    • verbose:1代表显示进度条,0不显示进度条,默认为0
    • 返回值:每个测试集的所预测的各个类别的概率
    • 例子:
      # 各个类别评估(X_test为10000个数据集)
      print("[INFO] evaluating network...")
      predictions = model.predict(X_test, batch_size=32) #显示每一个测试集各个类别的概率,这个值的shape为(10000,10)
      print(predictions)
      print(predictions.shape)
      
    • 在这里插入图片描述
    • model.predict(X_test, batch_size=32)的返回值为每个测试集预测的10个类别的概率
  • metrics.accuarry_score:计算分类的准确率
    • sklearn.metrics.accuracy_score(y_true, y_pred, normalize=True, sample_weight=None)
    • normalize:默认值为True,返回正确分类的比例;如果为False,返回正确分类的样本数
    • true: 在这里插入图片描述
    • false:TP+TN
    >>>import numpy as np  
    >>>from sklearn.metrics import accuracy_score  
    >>>y_pred = [0, 2, 1, 3]  
    >>>y_true = [0, 1, 2, 3]  
    >>>accuracy_score(y_true, y_pred)  
    0.5  
    >>>accuracy_score(y_true, y_pred, normalize=False)  
    2

在这里插入图片描述
完整代码:

在这里插入图片描述

(9)使用MLP来提升性能

  • 激活函数:参数activation=’relu’
  • 使用随机梯度下降算法:solver=’sgd’
  • 学习率:learning_rate=’invscaling’这是啥啊
  • 迭代次数:max_iter=20
    代码:
    在这里插入图片描述
    使用的MLP是有3个隐藏层,每个隐藏层有两个节点
    此时的性能并不好
    当把num_neurons=5之后,性能就变好了
    这就是调参!

声纹识别项目

我现在就想探究一下给的90dB下声纹识别到底合不合适
我先运行一下github上的这个项目看看:click here

(1)配置环境

  • Anaconda 3
  • Python 3.8
  • Pytorch 1.13.1(GPU)可以看我之前写的博客:window配置GPU_pytorch_cuda
  • Windows 10 or Ubuntu 18.04
  • 安装ppvector库

(2)下载数据集

CN-Celeb:这个数据集一共有约3000个人的语音数据,有65W+条语音数据,下载之后要解压数据集到dataset目录
数据集有20G,我下载着呢,我现在不想训练模型,直接用大大给的模型看一下加上噪声的效果
呜呜呜,竟然要50块钱,对贫穷的我来说还是算了吧,明天问问老师能不能报销,今天先换一个东西看看

看这个项目好像有模型参数:添加链接描述
下载一下👍
我服了竟然要Python2x,下载包花了好久
今天估计不行了,现在都2023年12月25日21:52:53了
回去玩游戏,原

3、实际完成任务and思考总结

  • MLP的深度学习
  • 对keras有了进一步的了解

思考算了吧
没啥思考的
明天要继续看流量预测的算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/578569.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

西南科技大学计算机网络实验四(交换机基本配置与VLAN配置)

一、实验目的 熟悉交换机的各种基本配置与VLAN配置。 二、实验环境 使用RouterSim Network Visualizer软件来模拟网络设备与网络环境。 三、实验内容 1、交换机的基础配置 2、单台交换机上的简单VLAN设置 3、多台交换机上进行VLAN设置 四、实验步骤 4.1 交换机的基础配置…

6.3 多线程的安全与应用

6.3 多线程的安全与应用 1. 多线程概念1. 进程2. 线程 2. 创建多线程3. 线程同步4. 线程安全5. 线程池应用 1. 多线程概念 1. 进程 2. 线程 2. 创建多线程 3. 线程同步 4. 线程安全 5. 线程池应用

编写fastapi接口服务

FastAPI是一个基于 Python 的后端框架&#xff0c;该框架鼓励使用 Pydantic 和 OpenAPI (以前称为 Swagger) 进行文档编制&#xff0c;使用 Docker 进行快速开发和部署以及基于 Starlette 框架进行的简单测试。 step1&#xff1a;安装必要库 pip install fastapi uvicorn st…

设计模式--建造者模式

实验5&#xff1a;建造者模式 本次实验属于模仿型实验&#xff0c;通过本次实验学生将掌握以下内容&#xff1a; 1、理解建造者模式的动机&#xff0c;掌握该模式的结构&#xff1b; 2、能够利用建造者模式解决实际问题。 [实验任务]&#xff1a;计算机组装 使用建造者模…

MySQL explain执行计划详解

使用explain关键字可以模拟优化器执行SQL查询语句&#xff0c;从而知道MySQL是如何处理你的SQL语句的&#xff0c;分析你的查询语句或是表结构的性能瓶颈。 explain执行计划包含的信息 其中最重要的字段为&#xff1a;id、type、key、rows、Extra 各字段详解 id select查询…

C语言第五十八弹----介绍memset内存函数

介绍C语言内存函数memset memset是C语言标准库中的一个函数&#xff0c;用于将一块内存区域的数据设置为指定的值。 源代码 void* memset(void* ptr, int value, size_t num);ptr是指向要设置的内存区域的指针&#xff0c;value是要设置的值&#xff08;以int形式表示&#x…

每日一练2023.12.25——验证身份【PTA】

题目链接 &#xff1a;验证身份 题目要求&#xff1a; 一个合法的身份证号码由17位地区、日期编号和顺序编号加1位校验码组成。校验码的计算规则如下&#xff1a; 首先对前17位数字加权求和&#xff0c;权重分配为&#xff1a;{7&#xff0c;9&#xff0c;10&#xff0c;5&a…

python对图片进行二值化处理

二值化处理是一种常见的图像处理技术,它可以将灰度图像或彩色图像转换为二值图像,其中每个像素只包含0(黑色)或255(白色)。Python中常用的库来进行二值化处理的是OpenCV和Pillow。 以下是一个使用OpenCV对图片进行二值化处理的简单例子: import cv2# 读取图片 img = c…

Windows配置C语言环境(超级详细)

Windows配置C语言环境 1.安装C编译器&#xff08;MinGW-W64 GCC&#xff09;1.1点击安装1.2将压缩包解压到相应目录1.3把mingw添加进系统的环境变量1.4测试 2安装并配置Visual Studio Code2.1下载VSCode2.2“Code Runner”扩展的配置 3.编写C语言 各位小伙伴想要博客相关资料的…

如何使用支付宝沙箱环境支付并公网调用sdk创建支付单服务

文章目录 1.测试环境2.本地配置2. 内网穿透2.1 下载安装cpolar内网穿透2.2 创建隧道3. 测试公网访问4. 配置固定二级子域名4.1 保留一个二级子域名4.2 配置二级子域名5. 使用固定二级子域名进行访问 1.测试环境 MavenSpring bootJdk 1.8 2.本地配置 获取支付宝支付Java SDK,…

【我与java的成长记】之面向对象的初步认识

系列文章目录 能看懂文字就能明白系列 C语言笔记传送门 &#x1f31f; 个人主页&#xff1a;古德猫宁- &#x1f308; 信念如阳光&#xff0c;照亮前行的每一步 文章目录 系列文章目录&#x1f308; *信念如阳光&#xff0c;照亮前行的每一步* 前言一、什么是面向对象面向过程…

输出从0-n的水仙花数

水仙花数&#xff08;Narcissistic number&#xff09;也被称为超完全数字不变数&#xff08;pluperfect digital invariant, PPDI&#xff09;、自恋数、自幂数、阿姆斯壮数或阿姆斯特朗数&#xff08;Armstrong number&#xff09;&#xff0c;水仙花数是指一个 3 位数&#…

9.独立看门狗IWDG窗口看门狗WWDG编码思路

前言&#xff1a; 看门狗是维护系统稳定性的一向技术&#xff0c;可以让代码跑飞及时复位&#xff0c;在产品中非常常用&#xff0c;俗话说&#xff0c;重启能解决90%的问题&#xff0c;作为产品来说&#xff0c;你总不能因为一次bug就让程序卡死不动了&#xff0c;肯定要试着重…

Windows操作系统:共享文件夹,防火墙的设置

1.共享文件夹 1.1 共享文件夹的优点 1.2 共享文件夹的优缺点 1.3 实例操作 ​编辑 2.防火墙设置 2.1 8080端口设置 3.思维导图 1.共享文件夹 1.1 共享文件夹的优点 优点 协作和团队合作&#xff1a;共享文件夹使多个用户能够在同一文件夹中协作和编辑文件。这促进了团…

基于ssm珠江学院大学生自愿者服务网论文

目 录 目 录 I 摘 要 III ABSTRACT IV 1 绪论 1 1.1 课题背景 1 1.2 研究现状 1 1.3 研究内容 2 2 系统开发环境 3 2.1 vue技术 3 2.2 JAVA技术 3 2.3 MYSQL数据库 3 2.4 B/S结构 4 2.5 SSM框架技术 4 3 系统分析 5 3.1 可行性分析 5 3.1.1 技术可行性 5 3.1.2 操作可行性 5 3…

2024,华为重塑笔记本的“创新周期”

作者 | 曾响铃 文 | 响铃说 谈及电脑PC&#xff0c;相信不少消费者都会下意识地给行业贴一个标签&#xff1a;夕阳行业。毕竟当下已经是移动互联网时代&#xff0c;传统PC的使用场景不断萎缩&#xff0c;市场研究机构Gartner报告显示&#xff0c;截至2023年第三季度&#xff…

ViT中的上采样和下采样——patch merge

在视觉Transformer&#xff08;Vision Transformer&#xff0c;ViT&#xff09;中&#xff0c;上采样和下采样通常指的是在不同层之间调整特征图的空间分辨率&#xff0c;以便在不同层次上捕获图像的不同尺度的信息。与传统的卷积神经网络&#xff08;CNN&#xff09;不同&…

案例169:基于微信小程序的小区疫情防控系统

文末获取源码 开发语言&#xff1a;Java 框架&#xff1a;SSM JDK版本&#xff1a;JDK1.8 数据库&#xff1a;mysql 5.7 开发软件&#xff1a;eclipse/myeclipse/idea Maven包&#xff1a;Maven3.5.4 小程序框架&#xff1a;uniapp 小程序开发软件&#xff1a;HBuilder X 小程序…

【深度学习-目标检测】04 - SSD 论文学习与总结

论文地址&#xff1a;SSD: Single Shot MultiBox Detector 论文学习 1. 摘要 单一深度神经网络用于对象检测&#xff1a;SSD方法使用一个单一的深度神经网络来直接检测图像中的对象&#xff0c;这与传统的需要先生成 对象提议&#xff08;区域提议&#xff09;再进行分类的方法…

EasyRecovery数据恢复软件好不好用?值不值得购买?

EasyRecovery是一款专业优秀的数据恢复软件&#xff0c;支持硬盘、光盘、U盘、手机、数码相机等设备&#xff0c;可以尽可能恢复被误删的文件数据&#xff08;视频、音频、图片等&#xff09;&#xff0c;欢迎下载。 EasyRecovery-2024mac最新版本下载: https://wm.makeding.c…