三个数据集与deploy.prototxt

神经网络中经常会出现三种数据集:训练数据集train set、验证数据集validation set、测试数据集test set。对每个训练数据,计算得到准确性,在网络中后向传播误差,从而调整权重weights。对每一个验证数据,也会计算准确性accurary,当准确性达到阈值,就退出训练,这是为了防止过度拟合overfitting。

70% should be train cases, 10% will be testcases and the rest 20% should be validation cases.

测试集test set,用来测试最终确定的网络的准确性和预测能力。

所以容易混淆的就是训练数据集和验证数据集。训练数据集主要用来构建模型,网络通过对训练数据的学习得到权值。验证数据集是可选的,用来辅助模型的构建,used to tune the parameters [i.e., architecture, not weights] of aclassifier, for example to choose the number of hidden units in a neuralnetwork.。叫辅助是因为验证数据集不能直接参与权重的调整,不参与训练,验证集对网络是全新的。叫验证集是因为我们要验证在训练数据中准确性的提升是否可以使模型在验证集中也得到提升。验证集对应交叉验证cross validation阶段。叫交叉是因为我们可能同时有多个模型同时调整参数,要对已经训练好的模型取误差最小的。

https://stackoverflow.com/questions/2976452/whats-is-the-difference-between-train-validation-and-test-set-in-neural-netwo

又看到一个形象化的比方:训练集是习题大全,网络通过刷题来学习。但是我们不想得到一个过拟合的学生,不希望它只是简单地把习题对应的答案记住。所以我们要举行模拟考试,即验证集。而测试集就好比是高考,来评估网络性能的好坏。高考一年只有一次,是要出成绩的时候,而模拟考试可以让我们多次查漏补缺,这就是验证集的意义。有时,把测试数据分成两部分,一部分作为测试数据,一部分作为验证数据,所以验证数据集可以看作是训练数据向测试数据的过渡。

https://blog.csdn.net/chenhaifeng2016/article/details/73681910

在mnist文件夹,除了lenet_train_test.prototxt,还有lenet.prototxt.两者类似。只是首尾有差别。查了一下资料,这里的lenet.prototxt应该就是用deploy.py生成的deploy.prototxt. lenet_train_test.prototxt是其他地方所指的train_val.prototxthttps://blog.csdn.net/fx409494616/article/details/53008971我安装的是windows 下c++的caffe,在pycaffe文件夹下也没有deploy.py文件。应该是压缩包里有已经提供了现成的,即lenet.prototxt.有博客讲解了如何利用deploy.py生成部署文件,但也有博客说这样有点复杂,既然部署文件和训练文件差别很小,可以直接在它的基础上改动。

那么到底为什么相似,又为什么不同?简单来说,lenet_train_test.prototxt写作train_val.prototxt更恰当,因为联系之前提到的验证数据集的作用,这个文件是用来构建网络模型的,叫做lenet_train_test.prototxt也可以理解,因为delpoy得到的letnet.prototxt是最终用来实际使用的,即把测试即使是高考,但也只是一种考试,最终还是要步入社会进行实践。

https://blog.csdn.net/lg1259156776/article/details/52550865

神经网络中,我们通过最小化神经网络来训练网络,所以在训练时最后一层是损失函数层(LOSS),在测试时我们通过准确率来评价该网络的优劣,因此最后一层是准确率层(ACCURACY)。但是当我们真正要使用训练好的数据时,我们需要的是网络给我们输入结果,对于分类问题,我们需要获得分类结果,最后一层我们得到的是概率,我们不需要训练及测试阶段的LOSS,ACCURACY层了。train_val.prototxt文件里面训练的部分都会在deploy.prototxt文件中删除。

deploy.prototxt就是在lenet_train_test.prototxt的基础上稍作改动:

第一层:

input_param { shape: { dim: 1 dim: 1 dim:28 dim: 28 } } 这四个dim参数分别是

第一个:对待识别样本图片进行数据增广的数量,一个图片会变成10个,之后输入到网络进行识别。如果不进行数据增广,可以设置成1。

第二个:图片的通道数,一般灰度图片为单通道,则值为1,如果为非灰度图3通道图片则为3。

第三个:图片的高度,单位像素。

第四个:图片的宽度,单位像素。

https://blog.csdn.net/lanxuecc/article/details/52474476

最后一层:

将accuracy层(type:Accuracy)和loss层(type:SoftmaxWithLoss)替换成name: "prob" type: "Softmax"。因为要运用于实际分类中,我们不知道输入图像的标签,所以只能得到它属于各类的概率。

此外,weight_filler、bias_filler也是可以删除的。因为这两个参数的值,由已经训练好的模型*.caffemodel文件提供。https://blog.csdn.net/u010417185/article/details/52137825

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493711.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络编程套接字socket

哈哈哈,之前的保存成草稿忘了发 目录 一 . 先回顾一下网络初始中的相关概念: 1.网络通信: 2.局域网: 3.广域网: 4.IP地址: 5.端口: 概念 格式 6.协议: 7.五元组: 8.分层…

增长率高达40%!物联网平台如何拉动产业马车飞速狂奔

来源: 联动原素、安信通信研究、IoT Analytics物联网智库 整理发布物联网的低准入门槛造就了这个内容庞大的产业生态,致使更多的企业融入进来。伴随物联网大规模发展,物联网平台在其中的作用越加凸显,新一轮资本涌入、技术开发、业…

Java小对象的解决之道——对象池(Object Pool)的设计与应用

一、概述 面向对象编程是软件开发中的一项利器,现已经成为大多数编程人员的编程思路。很多高级计算机语言也对这种编程模式提供了很好的支持,例如C、Object Pascal、Java等。曾经有大量的软件工程师使用C语言作为他们的谋生工具,随着面向对象…

中国代表性Fintech企业动态观察

来源:全球高科技联盟阿里巴巴系企业一、阿里巴巴金融科技和区块链总体布局揭开面纱9月28日,阿里达摩院官网正式上线,公开5 大研究领域、14 个实验室,从中可一探阿里在金融科技和区块链领域的总体技术布局。阿里金融科技领域致力于…

新建WindowsPhone项目时提示未将对象引用设置到对象的实例

问题: 安装好新系统之后(只有Windows8 专业版和企业版支持hyper-v),然后安装vs2012,再安装Wp8 Sdk,安装完毕后新建Windows Phone项目,会提示未将对象引用设置到对象的实例。 解决方案&#xff1…

windows+caffe下对CIFAR训练

CIFAR是什么 CIFAR-10和CIFAR-100都是带标签的大小为8000万小图数据集的子集。其中CIFAR-10有10类,每类6000个大小为32x32的图像。其中训练图像和测试图像的比例是5:1,对每类图像,随机选择1000个测试图像,剩下的就是训练图像。注意…

BAT看上了产业互联网

来源:《中国经济周刊》2018年 第 43 期摘要:互联网浪潮正从过去的消费互联网向产业互联网转移,巨头们正在把“矛头”从C(消费者)端转向B(企业)端,他们希望越来越多的企业接入互联网,进行数字化和智能化改造&#xff0c…

hdu 1165 坑爹找规律题

http://acm.hdu.edu.cn/showproblem.php?pid1165 不看题解,使劲找规律,应该是可以找到的,就是费时间! Problem DescriptionAs is known, Ackermann function plays an important role in the sphere of theoretical computer sci…

caffe下matlab、python的配置和faster RCNN的运行

因为自己的电脑没有安装linux环境,显卡也不支持CUDA,所以在实现faster RCNN的demo的过程中还是很麻烦的。 完善项目文件 下图是vs2013 打开的caffe解决方案的工程目录。由于windows版本caffe的不完善,要先在其libcaffe项目中添加roi_poling层…

Innodb 表空间卸载、迁移、装载

从MySQL的Innodb特性中我们知道,Inndob的表空间有共享和独享的特点,如果是共享的。则默认会把表空间存放在一个文件中(ibdata1),当开启独享表空间参数Innodb_file_per_table时,会为每个Innodb表创建一个.ib…

马化腾与中国知名科学家联手发起“科学探索奖”

来源:腾讯今日,公布一件大事情:腾讯基金会将投入10亿元人民币的启动资金资助“科学探索奖”,每年将在基础科学和前沿核心技术方面的九大领域,遴选出50名青年科技工作者。获奖人年龄上限为45岁,且每位获奖者…

AI人工智能ML机器学习DL深度学习

人工智能Artificial Intelligence最早是在1956年提出的。几个计算机科学家在达特茅斯会议上希望能使计算机不仅仅是进行简单的计算,而是可以达到人脑相同的功能。关于人工智能,罗辑思维节目还做过一期节目,里面讲到人工智能一开始被嘲笑&…

转:DP和HDP

Dirichlet Process and Hierarchical Dirichlet Process 原文:http://hi.baidu.com/zentopus/item/46a622f5ef13e4c5a835a28e Dirichlet Process and Hierarchical Dirichlet Process 在这篇文章里,我会初步地介绍Dirichlet Process以及Hierarchical Dir…

摩尔定律的三种走向

来源:科学网中兴事件以来,中国集成电路行业的发展受到全国人民的关注。许多人群情激奋,恨不得马上自力更生,赶上先进。也有一些人认为现在的世界经济是一个综合体,一个国家不可能样样领先,需要时日。正好&a…

李航《统计学习方法》笔记

虽然书名是统计学习,但是却是机器学习领域中和重要的一本参考书。当前的机器学习中机器指计算机,但是所运用的方法和知识是基于数据(对象)的统计和概率知识,建立一个模型,从而对未来的数据进行预测和分析&a…

java的关于流程结构做的几个案例

最近在学习中,做了一个java的几个案例,主要是九九乘法口诀,实心菱形和空心菱形的算法,模拟彩票程序以及BMI的测试标准等小案例。 一:九九乘法表 /*** 九九乘法口诀*/public static void main(String[] args) {int sum …

【2018第五届世界互联网大会】世界互联网领先科技成果发布:带你看看这15项“黑科技”...

世界互联网领先科技成果发布现场。来源:央视网11月7日,第五届世界互联网大会“世界互联网领先科技成果发布活动”在浙江乌镇举行。这是世界互联网大会第三次面向全球发布领先科技成果。发布活动由中国工程院院士、中国互联网协会理事长邬贺铨主持&#x…

利用caffe的python接口实现DeepImageSynthesis实例

在之前实现faster rcnn的博客中,先是配置了caffe的python接口,但是在验证的时候用DeepTexture的实例没有成功。改用pycharm而不是jupyter notebook再试一试,毕竟在IDE中更好调试。 新建工程,选择anaconda2作为解释器,因…

SecureCRT

SecureCRT是一款支持SSH(SSH1和SSH2)的终端仿真程序 在内部使用的一些命令 #从本地上传文件 rz -e#从远端下载文件 sz -e 转载于:https://www.cnblogs.com/cfox/p/3430217.html

深度:语音技术革命正在改变人类的交流方式

来源:资本实验室语言是我们日常交流的主要方式,可以让我们快速了解对方的意图,并做出适当的反应。但对很多语言障碍者而言,说话这一看似简单的行为依旧是难以想象的困难。语言是件极其复杂的事情,不仅仅是文字表面上的…