T7-Dropout 解决 overfitting 过拟合

Dropout 解决 overfitting

相对于过拟合(overfitting,或称:过度学习)是指,使用过多参数,以致太适应训练数据而非一般情况;另一种常见的现象是使用太少参数,以致于不适应当前的训练数据,这则称为欠拟合(underfitting,或称:拟合不足)现象。[2]

防止过拟合,我们需要用到一些方法,如:early stopping、数据集扩增(Data augmentation)、正则化(Regularization)、Dropout等。[3]

本次数据来自 sklearn, 首先导入模块

import tensorflow as tf
from sklearn.datasets import load_digits
from sklearn.cross_validation import train_test_split
from sklearn.preprocessing import LabelBinarizer

在之前代码的基础上修改, 增加 keep_prob 占位符保留数据的概率

# k = 1, 保留 100%, 即没有 dropout 任何数据.
keep_prob = tf.placeholder(tf.float32)

准备训练数据(train)测试数据(test)

digits = load_digits()
X = digits.data
y = digits.target
y = LabelBinarizer().fit_transform(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)

在训练过程中,overfitting 的问题与 keep_prob 相关,keep_prob = 1 没有dropout 任何数据, keep_prob = 0.5 则能明显看出 dropout 的效果。

keep_prob = 1
tensorboard-8.png?raw=true

keep_prob = 0.5
tensorboard-7.png?raw=true


完整代码

# !/usr/bin/python3
# -*- coding: utf-8 -*-from __future__ import print_function
import tensorflow as tf
from sklearn.datasets import load_digits
from sklearn.cross_validation import train_test_split
from sklearn.preprocessing import LabelBinarizer# load data
digits = load_digits()
X = digits.data     # img data
y = digits.target
y = LabelBinarizer().fit_transform(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)def add_layer(inputs, in_size, out_size, layer_name, activation_function=None, ):# add one more layer and return the output of this layerWeights = tf.Variable(tf.random_normal([in_size, out_size]))biases = tf.Variable(tf.zeros([1, out_size]) + 0.1, )Wx_plus_b = tf.matmul(inputs, Weights) + biases# here to dropoutWx_plus_b = tf.nn.dropout(Wx_plus_b, keep_prob)  # +++if activation_function is None:outputs = Wx_plus_belse:outputs = activation_function(Wx_plus_b, )tf.summary.histogram(layer_name + '/outputs', outputs)return outputs# define placeholder for inputs to network
keep_prob = tf.placeholder(tf.float32)       # +++
xs = tf.placeholder(tf.float32, [None, 64])  # 8x8
ys = tf.placeholder(tf.float32, [None, 10])# add output layer
l1 = add_layer(xs, 64, 50, 'l1', activation_function=tf.nn.tanh)
prediction = add_layer(l1, 50, 10, 'l2', activation_function=tf.nn.softmax)# the loss between prediction and real data
cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction),reduction_indices=[1]))  # loss
tf.summary.scalar('loss', cross_entropy)     # +++
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)sess = tf.Session()
merged = tf.summary.merge_all()
# summary writer goes in here
train_writer = tf.summary.FileWriter("logs/train", sess.graph)  # +++
test_writer = tf.summary.FileWriter("logs/test", sess.graph)# tf.initialize_all_variables() no long valid from
# 2017-03-02 if using tensorflow >= 0.12
if int((tf.__version__).split('.')[1]) < 12 and int((tf.__version__).split('.')[0]) < 1:init = tf.initialize_all_variables()
else:init = tf.global_variables_initializer()
sess.run(init)for i in range(500):# here to determine the keeping probabilitysess.run(train_step, feed_dict={xs: X_train, ys: y_train, keep_prob: 1})  # +++if i % 50 == 0:# record losstrain_result = sess.run(merged, feed_dict={xs: X_train, ys: y_train, keep_prob: 1})  test_result = sess.run(merged, feed_dict={xs: X_test, ys: y_test, keep_prob: 1})train_writer.add_summary(train_result, i)test_writer.add_summary(test_result, i)   # +++

Reference

[1] 莫烦Python: Dropout 解决 overfitting
[2] 拾毅者: 机器学习—过拟合overfitting
[3] 一只鸟的天空: 机器学习中防止过拟合的处理方法

转载于:https://www.cnblogs.com/TaylorBoy/p/6814664.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/429335.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PHP伪造来源HTTP,伪造来源采集http.php

伪造来源采集.php"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11","safari 5.1 – Windows">"Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gec…

从零开始构建一个的asp.net Core 项目(一)

最近突发奇想&#xff0c;想从零开始构建一个Core的MVC项目&#xff0c;于是开始了构建过程。 首先我们添加一个空的CORE下的MVC项目&#xff0c;创建完成之后我们运行一下&#xff08;Ctrl F5&#xff09;。我们会在页面上看到“Hello World!”。 既然是从零开始构建的项目&am…

oracle sal01,oracle中 all any in的用法

Oracle的嵌套子查询可以使用Some,Any和All对子查询中返回的多行结果进行处理。Some表示满足其中一个的含义&#xff0c;是用or串起来的比较从句。例如&#xff1a;SELECT * FROM emp WHERE empno hmz OR dept 10Any也表示满足其中一个的含义&#xff0c;也是用or串起来的比较…

BZOJ 4884 [Lydsy2017年5月月赛]太空猫(单调DP)

【题目链接】 http://www.lydsy.com/JudgeOnline/problem.php?id4884 【题目大意】 太空猫(SpaceCat)是一款画面精致、玩法有趣的休闲游戏&#xff0c;   你需要控制一只坐在迷你飞碟上的猫咪在太空里不断探索&#xff0c;让大家看看你能飞得多远。   游戏地图可以看成一个…

oracle 怎么创建类型,ORACLE—002:Create之创建类型

——积累工作中用到的SQLORACLE中也是有类型的&#xff0c;可作为存储过程&#xff0c;函数等的输入输入出。下面看下创建。用法CREATE OR REPLACE TYPE 类型名称 AS OBJECT(字段1 类型,字段2 类型,字段3 类型)例如CREATE OR REPLACE TYPE T_OBJ A…

201521123014 《Java程序设计》第11周学习总结

201521123014 《Java程序设计》第11周学习总结 1. 本周学习总结 1.1 以你喜欢的方式&#xff08;思维导图或其他&#xff09;归纳总结多线程相关内容。 2. 书面作业 Q1 互斥访问与同步访问 完成题集4-4(互斥访问)与4-5(同步访问) 1.1 除了使用synchronized修饰方法实现互斥同步…

前端先锋博客大全

须要想这些人学习&#xff1a; http://www.nowamagic.net/librarys/veda/cate/JavaScript/ 唯有积累&#xff0c;没有奇迹 http://www.zhangxinxu.com/wordpress/ 张鑫旭 http://www.14px.com/ 14px http://hax.iteye.com/category/20374 hax http://w3help.org/zh-cn/ http:…

oracle死锁视频教程,两个Oracle死锁解决实例

关于数据库中的死锁。如果在应用中碰到都会毫不犹豫转交给DBA&#xff0c;但是从目前我接到的deadlock的问题来看&#xff0c;和Oracle官方的描述基本都关于数据库中的死锁。如果在应用中碰到都会毫不犹豫转交给DBA&#xff0c;但是从目前我接到的deadlock的问题来看&#xff0…

FineReport实现java报表统计图表的效果图

Java报表-ERP图表联动 Java报表-多维坐标轴图 Java报表-静态图表 Java报表-时间坐标轴 Java报表-图表报表动态交互 Java报表-图表热点链接 Java报表-图表缩放 Java报表-地图-广州市商场销售分析 Java报表-地图-全国商场销售分析 Java报表-地图-商场柜台销售分析 Java报表-图表分…

Mysql 性能优化20个原则(2)

5. 在Join表的时候使用相当类型的例&#xff0c;并将其索引 如果你的应用程序有很多 JOIN 查询&#xff0c;你应该确认两个表中Join的字段是被建过索引的。这样&#xff0c;MySQL内部会启动为你优化Join的SQL语句的机制。 而且&#xff0c;这些被用来Join的字段&#xff0c;应该…

安装apk文件到linux,使用adb命令,将apk安装到安卓system/app下

adb环境变量配置&#xff1a;1.下载android sdk2.win10配置adb环境变量&#xff0c;控制面板-系统-高级系统设置-高级-环境变量-系统变量-在Path中增加adb.exe的路径E:\sdk\platform-tools3.重新打开cmd&#xff0c;输入adb&#xff0c;可识别即可安装xxx.apk到system下&#x…

使用Dom4j读取指定文件,并写入指定文件

导入dom4j的包&#xff0c;然后写入代码如下package com.dom4j.cn;import java.io.FileOutputStream;import org.dom4j.Document; import org.dom4j.Element; import org.dom4j.io.OutputFormat; import org.dom4j.io.SAXReader; import org.dom4j.io.XMLWriter; import org.ju…

linux ks脚本,Linux ks.cfg 详解

linux安装大致可以分为2个阶段第一阶段&#xff1a;anaconda第二阶段&#xff1a;installinstall阶段系统会按照anaconda阶段设定的参数自动安装&#xff0c;这里主要要说的是anaconda阶段&#xff0c;此阶段是linux的预安装环境&#xff0c;提供linux安装选项的一个接口&#…

干锅土豆

食材&#xff1a;土豆、配料&#xff1a;蒜蓉&#xff0c;干辣椒、蒜苗&#xff0c;海鲜酱油、辣椒粉、孜然粉、花椒粉 做饭&#xff1a;1&#xff1a;土豆切条&#xff0c;洗好&#xff0c;用盐腌制30分钟&#xff0c;倒出水分 2&#xff1a;锅里放多油&#xff0c;煸炒土豆&a…

linux内核空间open,Linux内核源码分析 - open

在linux下&#xff0c;假设我们想打开文件/dev/tty&#xff0c;我们可以使用系统调用open&#xff0c;比如&#xff1a;int fd open("/dev/tty", O_RDWR, 0); 本文将从源码角度看下&#xff0c;在linux内核中&#xff0c;open方法是如何打开文件的。首先看下入口函数…

数据库管理和应用

http://www.dbmng.com/item-11.html转载于:https://www.cnblogs.com/tianciliangen/p/6828062.html

linux命令帮助怎么看,Linux命令帮助

Linux命令帮助教程在Linux man命令详解概述man 命令&#xff0c;它是 Manual pages 的缩写&#xff0c;它是 Linux 系统中在线软件文档的一种普遍的形式&#xff0c;其内容包括计算机程序(包括库和系统调用)、正式的标准和惯例&#xff0c;抽象的概念等。man 工具是显示系统手册…

【转】Yelp是如何实现每天运行数百万个测试的

Yelp每天要运行数百万个测试&#xff0c;确保开发人员提交的代码不会对已有的功能造成破坏。如此巨大规模的测试&#xff0c;他们是怎么做到的呢&#xff1f;以下内容翻译自 Yelp 的技术博客&#xff0c;并已获得翻译授权&#xff0c;查看原文 How Yelp Runs Millions of Tests…

go语言linux下载文件,学习 Go 语言(Golang)PDF

1、简介Go 编程语言是一个使得程序员更加有效率的开源项目。Go 是有表达力、简 洁、清晰和有效率的。它的并行机制使其很容易编写多核和网络应用&#xff0c;而新奇的类型系统允许构建有性的模块化程序。Go 编译到机器码非常快 速&#xff0c;同时具有便利的垃圾回收和强大的运…

数据同步这点事

最近一段时间&#xff0c;在做数据ETL相关的事&#xff0c;结合实践以及自己的思考&#xff0c;记录下来&#xff0c;以做参考。 概述 一般来说&#xff0c;数据团队自己是很少生产数据的&#xff0c;一般都是对业务线的数据进行分析加工&#xff0c;从而让数据产生价值。一方面…