为什么要进行归一化处理?(从寻找最优解这个角度讨论)

例子

假定为预测房价的例子,自变量为面积,房间数两个,因变量为房价。

那么可以得到的公式为:

y=\theta _{1}x_{1}  +\theta _{2}x_{2}

其中x_{1}代表房间数,\theta _{1}代表x_{1}变量前面的系数。

其中x_{2}代表面积,\theta _{2}代表x_{2}变量前面的系数。

首先我们祭出两张图代表数据是否均一化的最优解寻解过程。

未归一化:

归一化之后

为什么会出现上述两个图,并且它们分别代表什么意思。

我们在寻找最优解的过程也就是在使得损失函数值最小的theta1,theta2。

上述两幅图代码的是损失函数的等高线。

我们很容易看出,当数据没有归一化的时候,面积数的范围可以从0~1000,房间数的范围一般为0~10,可以看出面积数的取值范围远大于房间数。

影响

这样造成的影响就是在画损失函数的时候,

数据没有归一化的表达式,可以为:

J=(3\theta _{1}+ 600\theta _{2}-y_{correct} )^{2}

造成图像的等高线为类似椭圆形状,最优解的寻优过程就是像下图所示:

而数据归一化之后,损失函数的表达式可以表示为:

J=(0.5\theta _{1}+ 0.55\theta _{2}-y_{correct} )^{2}

其中变量的前面系数几乎一样,则图像的等高线为类似圆形形状,最优解的寻优过程像下图所示:

从上可以看出,数据归一化后,最优解的寻优过程明显会变得平缓,更容易正确的收敛到最优解。

转载于:https://www.cnblogs.com/Bella2017/p/7753848.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/415446.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

redis安装笔记

下载redis 官网下载地址:http://redis.io/download github下载地址:https://github.com/MSOpenTech/redis/tags 根据系统版本下载对应版本,下载完放置你要放的盘 然后cmd进入命令行,进入redis目录,然后输入启动命令 re…

vscode 配置 路径别名 @

为了保证多个项目复用代码,我喜欢把路径别名设置为,下面介绍vscode中的配置方法。 1、安装插件Path Intellisense 2、配置 "path-intellisense.mappings": {"": "${workspaceRoot}/src" }3、在项目package.json所在同级…

小程序 canvas 设置 字体 字号加粗

之前的版本使用 现在直接使用CanvasContext.font即可 例如 this.ctx2.font normal bold 40px sans-serif;

关于小码哥kylin

技术格言: 用双手改变人生,用代码改变世界! 个人网站:http://www.isainttech.com QQ:56619556 Email:dragonsaintqq.com 微信:kylin10219556 Kylin开发技术交流群:540749978 转载于:https://www.cnblogs.com/kylinsblog/p/7760383.html

小程序 mpvue 使用canvas绘制环形图表

本来想用css3来实现&#xff0c;发现轮廓边上残影严重&#xff0c;所以直接用小程序的canvas使用来。 最终效果如下&#xff1a; 我的整页代码如下&#xff0c;里面已经写出备注来。 <template><div class"statistic"><canvas canvas-id"runCa…

简书搜索爬虫

这期的爬虫是爬取“简书”的搜索结果页&#xff0c;篇幅将会分为两部分来写&#xff0c;第一部分是爬虫部分&#xff0c;主要涉及搜索文章的提取和数据保存&#xff0c;第二部分涉及基本的数据分析和可视化&#xff0c;本篇文章属于爬虫篇。 爬虫源代码 首先看一下整个爬虫的源…

js的加密和解密

最近在研究js的加密和解密的问题&#xff0c;上网上搜出来很多方法&#xff0c;不过不知道到底哪一个会比较管用。这里是今天找到的一些关于base64加密解密的js代码&#xff0c;已经经过试验&#xff0c;可以使用&#xff0c;不过网上很多加密解密的工具&#xff0c;这种方式加…

TCP/IP协议三次握手与四次握手流程解析

一、TCP报文格式TCP/IP协议的详细信息参看《TCP/IP协议详解》三卷本。下面是TCP报文格式图&#xff1a;图1 TCP报文格式上图中有几个字段需要重点介绍下&#xff1a;&#xff08;1&#xff09;序号&#xff1a;Seq序号&#xff0c;占32位&#xff0c;用来标识从TCP源端向目的端…

Hadoop学习笔记—20.网站日志分析项目案例(三)统计分析

网站日志分析项目案例&#xff08;一&#xff09;项目介绍&#xff1a;http://www.cnblogs.com/edisonchou/p/4449082.html 网站日志分析项目案例&#xff08;二&#xff09;数据清洗&#xff1a;http://www.cnblogs.com/edisonchou/p/4458219.html 网站日志分析项目案例&#…

Jmeter使用流程及简单分析监控

一、安装Jmeter 1、下载Jmeter 下载地址&#xff1a;http://jmeter.apache.org/download_jmeter.cgi 目前最新版为2.9&#xff0c;其余文件如源代码等也可从如下官网下载&#xff1a; http://jmeter.apache.org/download_jmeter.cgi 2、安装Jmeter之前 安装Jmeter之前需要先配置…

JMeter工具使用初探

工欲善其事必先利其器&#xff0c;要保证移动应用产品在上线之后能稳定运行于各种复杂环境&#xff0c;仅仅进行功能测试是远远不够的&#xff0c;压力测试越来越被应用开发商所重视。而压力测试从传统的内部压力到基于云计算的压力测试&#xff0c;再到用户视角的外部压测&…

HDU1251 统计难题 trie树 简单

http://acm.hdu.edu.cn/showproblem.php?pid1251题意: 找前缀数量 裸模板 1 #include<cstdio>2 #include<cstring>3 #include<iostream>4 #include<algorithm>5 #include<cmath>6 #include<queue>7 using namespace std;8 const int maxn…

JMeter场景设置与监控

随着IT技术的飞速发展和企业互联网业务规模不断扩张&#xff0c;IT架构经历了以数据计算为核心的C/S架构、以聚焦业务功能及服务化构建应用的经典互联网架构和如今整合IT资源和按需使用的云计算架构三个阶段。 与之同步发展的压力测试同样有三个发展阶段&#xff0c;从防火墙内…

阿里云轻应用服务器 宝塔面板 mongodb 配置外网连接 其一 基础配置

买了一台阿里云轻应用服务器做测试&#xff0c;我默认安装的是宝塔面板&#xff0c;下面详细记录配置mongodb过程。 1、进行安装&#xff0c;通过宝塔面板自带的软件管理进行安装 2、首先需要保证外网能够进行访问 设置监听端口为0.0.0.0&#xff0c;原来的是127.0.0.1只允许…

工作151:初始登录样式

<!--GY歌谣控制登录页面的功能--> <template><div class"main"><div><h1> <img src"./geyao.png" style"width: 29px;height: 29px;margin-right: 10px;line-height: 29px" alt"">星传经管系统&l…

Dubbo超时机制导致的雪崩连接

Bug影响&#xff1a;Dubbo服务提供者出现无法获取Dubbo服务处理线程异常&#xff0c;后端DB爆出拿不到数据库连接池&#xff0c;导致前端响应时间异常飙高&#xff0c;系统处理能力下降&#xff0c;核心基础服务无法提供正常服务。 ​Bug发现过程&#xff1a; ​线 上&#xff…