T7-Dropout 解决 overfitting 过拟合

Dropout 解决 overfitting

相对于过拟合(overfitting,或称:过度学习)是指,使用过多参数,以致太适应训练数据而非一般情况;另一种常见的现象是使用太少参数,以致于不适应当前的训练数据,这则称为欠拟合(underfitting,或称:拟合不足)现象。[2]

防止过拟合,我们需要用到一些方法,如:early stopping、数据集扩增(Data augmentation)、正则化(Regularization)、Dropout等。[3]

本次数据来自 sklearn, 首先导入模块

import tensorflow as tf
from sklearn.datasets import load_digits
from sklearn.cross_validation import train_test_split
from sklearn.preprocessing import LabelBinarizer

在之前代码的基础上修改, 增加 keep_prob 占位符保留数据的概率

# k = 1, 保留 100%, 即没有 dropout 任何数据.
keep_prob = tf.placeholder(tf.float32)

准备训练数据(train)测试数据(test)

digits = load_digits()
X = digits.data
y = digits.target
y = LabelBinarizer().fit_transform(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)

在训练过程中,overfitting 的问题与 keep_prob 相关,keep_prob = 1 没有dropout 任何数据, keep_prob = 0.5 则能明显看出 dropout 的效果。

keep_prob = 1
tensorboard-8.png?raw=true

keep_prob = 0.5
tensorboard-7.png?raw=true


完整代码

# !/usr/bin/python3
# -*- coding: utf-8 -*-from __future__ import print_function
import tensorflow as tf
from sklearn.datasets import load_digits
from sklearn.cross_validation import train_test_split
from sklearn.preprocessing import LabelBinarizer# load data
digits = load_digits()
X = digits.data     # img data
y = digits.target
y = LabelBinarizer().fit_transform(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)def add_layer(inputs, in_size, out_size, layer_name, activation_function=None, ):# add one more layer and return the output of this layerWeights = tf.Variable(tf.random_normal([in_size, out_size]))biases = tf.Variable(tf.zeros([1, out_size]) + 0.1, )Wx_plus_b = tf.matmul(inputs, Weights) + biases# here to dropoutWx_plus_b = tf.nn.dropout(Wx_plus_b, keep_prob)  # +++if activation_function is None:outputs = Wx_plus_belse:outputs = activation_function(Wx_plus_b, )tf.summary.histogram(layer_name + '/outputs', outputs)return outputs# define placeholder for inputs to network
keep_prob = tf.placeholder(tf.float32)       # +++
xs = tf.placeholder(tf.float32, [None, 64])  # 8x8
ys = tf.placeholder(tf.float32, [None, 10])# add output layer
l1 = add_layer(xs, 64, 50, 'l1', activation_function=tf.nn.tanh)
prediction = add_layer(l1, 50, 10, 'l2', activation_function=tf.nn.softmax)# the loss between prediction and real data
cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction),reduction_indices=[1]))  # loss
tf.summary.scalar('loss', cross_entropy)     # +++
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)sess = tf.Session()
merged = tf.summary.merge_all()
# summary writer goes in here
train_writer = tf.summary.FileWriter("logs/train", sess.graph)  # +++
test_writer = tf.summary.FileWriter("logs/test", sess.graph)# tf.initialize_all_variables() no long valid from
# 2017-03-02 if using tensorflow >= 0.12
if int((tf.__version__).split('.')[1]) < 12 and int((tf.__version__).split('.')[0]) < 1:init = tf.initialize_all_variables()
else:init = tf.global_variables_initializer()
sess.run(init)for i in range(500):# here to determine the keeping probabilitysess.run(train_step, feed_dict={xs: X_train, ys: y_train, keep_prob: 1})  # +++if i % 50 == 0:# record losstrain_result = sess.run(merged, feed_dict={xs: X_train, ys: y_train, keep_prob: 1})  test_result = sess.run(merged, feed_dict={xs: X_test, ys: y_test, keep_prob: 1})train_writer.add_summary(train_result, i)test_writer.add_summary(test_result, i)   # +++

Reference

[1] 莫烦Python: Dropout 解决 overfitting
[2] 拾毅者: 机器学习—过拟合overfitting
[3] 一只鸟的天空: 机器学习中防止过拟合的处理方法

转载于:https://www.cnblogs.com/TaylorBoy/p/6814664.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/429335.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从零开始构建一个的asp.net Core 项目(一)

最近突发奇想&#xff0c;想从零开始构建一个Core的MVC项目&#xff0c;于是开始了构建过程。 首先我们添加一个空的CORE下的MVC项目&#xff0c;创建完成之后我们运行一下&#xff08;Ctrl F5&#xff09;。我们会在页面上看到“Hello World!”。 既然是从零开始构建的项目&am…

201521123014 《Java程序设计》第11周学习总结

201521123014 《Java程序设计》第11周学习总结 1. 本周学习总结 1.1 以你喜欢的方式&#xff08;思维导图或其他&#xff09;归纳总结多线程相关内容。 2. 书面作业 Q1 互斥访问与同步访问 完成题集4-4(互斥访问)与4-5(同步访问) 1.1 除了使用synchronized修饰方法实现互斥同步…

FineReport实现java报表统计图表的效果图

Java报表-ERP图表联动 Java报表-多维坐标轴图 Java报表-静态图表 Java报表-时间坐标轴 Java报表-图表报表动态交互 Java报表-图表热点链接 Java报表-图表缩放 Java报表-地图-广州市商场销售分析 Java报表-地图-全国商场销售分析 Java报表-地图-商场柜台销售分析 Java报表-图表分…

Mysql 性能优化20个原则(2)

5. 在Join表的时候使用相当类型的例&#xff0c;并将其索引 如果你的应用程序有很多 JOIN 查询&#xff0c;你应该确认两个表中Join的字段是被建过索引的。这样&#xff0c;MySQL内部会启动为你优化Join的SQL语句的机制。 而且&#xff0c;这些被用来Join的字段&#xff0c;应该…

linux命令帮助怎么看,Linux命令帮助

Linux命令帮助教程在Linux man命令详解概述man 命令&#xff0c;它是 Manual pages 的缩写&#xff0c;它是 Linux 系统中在线软件文档的一种普遍的形式&#xff0c;其内容包括计算机程序(包括库和系统调用)、正式的标准和惯例&#xff0c;抽象的概念等。man 工具是显示系统手册…

【转】Yelp是如何实现每天运行数百万个测试的

Yelp每天要运行数百万个测试&#xff0c;确保开发人员提交的代码不会对已有的功能造成破坏。如此巨大规模的测试&#xff0c;他们是怎么做到的呢&#xff1f;以下内容翻译自 Yelp 的技术博客&#xff0c;并已获得翻译授权&#xff0c;查看原文 How Yelp Runs Millions of Tests…

go语言linux下载文件,学习 Go 语言(Golang)PDF

1、简介Go 编程语言是一个使得程序员更加有效率的开源项目。Go 是有表达力、简 洁、清晰和有效率的。它的并行机制使其很容易编写多核和网络应用&#xff0c;而新奇的类型系统允许构建有性的模块化程序。Go 编译到机器码非常快 速&#xff0c;同时具有便利的垃圾回收和强大的运…

数据同步这点事

最近一段时间&#xff0c;在做数据ETL相关的事&#xff0c;结合实践以及自己的思考&#xff0c;记录下来&#xff0c;以做参考。 概述 一般来说&#xff0c;数据团队自己是很少生产数据的&#xff0c;一般都是对业务线的数据进行分析加工&#xff0c;从而让数据产生价值。一方面…

linux下的awk程序在哪里编写,如何编写awk命令和脚本

awk命令是处理或分析文本文件(尤其是按行和列组织的数据文件)的强大方法.您可以从命令行运行简单的awk命令. 应该将更复杂的任务作为awk程序(所谓的awk脚本)写入文件.awk命令的基本格式如下:awkpattern {action}输入文件>输出文件这意味着: 占用输入文件的每一行&#xff1b…

linux中用截取一些信息,Linux如何使用cut命令截取文件信息

在Linux众多命令中&#xff0c;cut命令可用来截取文件信息&#xff0c;截取Linux字符串&#xff0c;下面将针对cut命令的用法做个详细介绍&#xff0c;感兴趣的朋友可以来学习下。cut命令有截取的意思&#xff0c;可从linux文件或者标准输入中读取内容并纵向截取所需信息列的一…

201521123057 《Java程序设计》第12周学习总结

1. 本周学习总结 1.1 以你喜欢的方式&#xff08;思维导图或其他&#xff09;归纳总结多流与文件相关内容。 2. 书面作业 1.字符流与文本文件&#xff1a;使用 PrintWriter(写)&#xff0c;BufferedReader(读) 将Student对象(属性&#xff1a;int id, String name,int age,doub…

tomcat 下载

点project 关闭防火墙才可以让别人访问自己 转载于:https://www.cnblogs.com/feathe/p/6853491.html

linux消息框架,远程处理器消息框架 - 基于Linux 简化 AMP 配置使其更方便更动态地分配资源...

核心的 rpmsg 框架起到开关的作用&#xff0c;根据消息中包含的目的地址将消息传送到相应端点。由于消息报头包含源地址&#xff0c;因此可在不同处理器之间建立专用连接。命名服务处理器可通过向 rpmsg 框架的命名服务发送消息&#xff0c;以动态宣布特定服务。命名服务功能本…

jQuery笔记——选择器

jQuery 最核心的组成部分就是&#xff1a;选择器引擎。它继承了 CSS 的语法&#xff0c;可以对 DOM 元 素的标签名、属性名、状态等进行快速准确的选择&#xff0c;并且不必担心浏览器的兼容性 常规选择器 根据id选择元素就是使用#&#xff0c;还有两种其他选择元素的方式&…

c语言实现NRZ编码,CSC1001-课后笔记

前言&#xff1a;为什么编写此文1. 根据费曼的学习方法Pretend to teach your topic to a classroom. Make sure youre able to explain the topic in simple terms. 假装你在教室里向学生解释这个主题&#xff0c;用尽量简单的词汇去描述它&#xff0c;力求学生能听懂。(听众…

《Java技术》第八次作业

《Java技术》第八次作业 &#xff08;一&#xff09;学习总结 1.用思维导图对本周的学习内容进行总结。 2.通过实验内容中的具体实例说明在执行executeUpdate&#xff08;&#xff09;方法和executeQuery&#xff08;&#xff09;方法中使用动态参数时&#xff0c;为什么要使用…

android 短信 aapp,谈谈App的统一跳转和ARouter

App中每次页面跳转,都需要调用统一导航, 它用的非常频繁, 有必要对它进行一下梳理. 让他能用起来简单方便, 同时能支持各种常用的跳转业务场景.一. Android跳转遇到的问题1.intent-filter跳转不好管理Intent intent new Intent();intent.setAction(Intent.ACTION_SENDTO);inte…

android 自定义spnner弹出框,PopupWindow,ListView实现自定义Spinner

最终的效果图,点击86弹出popup这里写图片描述PupupWindow的布局文件为一个ListView 作为pupup的主体内容android:orientation"vertical"android:layout_width"match_parent"android:layout_height"match_parent">android:id"id/register…

hdu 6026 Deleting Edges(最短路计数)

题目链接&#xff1a;hdu 6026 Deleting Edges 题意&#xff1a; 给你n个点&#xff0c;和一个邻接矩阵&#xff0c;非0表示有边&#xff0c;0表示没边。 现在让你删一些边&#xff0c;构成一棵树&#xff0c;使得每个点到0这个点的距离为没删边之前的最短路。 问有多少棵这样的…

Xamarin XAML语言教程构建进度条ProgressBar

Xamarin XAML语言教程构建进度条ProgressBar Xamarin XAML语言教程构建进度条ProgressBar&#xff0c;ProgressBar被称为进度条&#xff0c;它类似于没有滑块的滑块控件。进度条总是水平放置的。本节将讲解如何使用进度条。注意&#xff1a;进度条在各个平台下基本相同&#xf…