前言
紧接上一篇博客,学习tensorboard
可视化训练过程。
国际惯例,参考博客:
MNIST机器学习入门
Tensorboard 详解(上篇)
Tensorboard 可视化好帮手 2
tf-dev-summit-tensorboard-tutorial
tensorflow官方mnist_with_summaries
预备知识
根据之前学的知识,创建一个卷积结构进行手写数字分类
import tensorflow as tf
import numpy as np
from tensorflow.examples.tutorials.mnist import input_data#读取手写数字
mnist = input_data.read_data_sets('./dataset/',one_hot=True)#定义卷积操作
def conv_layer(input,size_in,size_out,name='conv'):with tf.name_scope(name):w=tf.Variable(tf.truncated_normal([5,5,size_in,size_out],stddev=0.1),name='W')b=tf.Variable(tf.constant(0.1,shape=[size_out]),name='B')conv = tf.nn.conv2d(input,w,strides=[1,1,1,1],padding='SAME')act = tf.nn.relu(conv+b)return tf.nn.max_pool(act,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')#全连接层
def fc_layer(input,size_in,size_out,name='fc'):with tf.name_scope(name):w=tf.Variable(tf.truncated_normal([size_in,size_out],stddev=0.1),name='W')b=tf.Variable(tf.constant(0.1,shape=[size_out]),name='B')act=tf.matmul(input,w)+breturn act#创建模型
def create_model(input_x):#卷积input_img = tf.reshape(input_x,[-1,28,28,1])conv1=conv_layer(input_img,1,32,'conv1')conv2=conv_layer(conv1,32,64,'conv2')#全连接flattened=tf.reshape(conv2,[-1,7*7*64])fc1=fc_layer(flattened,7*7*64, 1024,'fc1')act1=tf.nn.relu(fc1)out=fc_layer(act1,1024,10,'fc2')return out#定义网络输入,输出
X=tf.placeholder(tf.float32,shape=[None,28*28],name='x')
Y=tf.placeholder(tf.float32,shape=[None,10],name='y')logits = create_model(X) #创建模型
prediction=tf.nn.softmax(logits=logits,name='prediction') #预测# 损失函数
loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=logits,labels=Y))
optimize = tf.train.AdamOptimizer(learning_rate=0.01)
train_op = optimize.minimize(loss_op)#评估函数
correct_pred = tf.equal(tf.argmax(prediction,1),tf.argmax(Y,1))
accuracy = tf.reduce_mean(tf.cast(correct_pred,tf.float32))with tf.Session() as sess:sess.run(tf.global_variables_initializer())for step in range(20000):batch_xs,batch_ys=mnist.train.next_batch(50)sess.run(train_op,feed_dict={X:batch_xs,Y:batch_ys})if(step%10==0 or step==1):loss,acc = sess.run([loss_op,accuracy],feed_dict={X: mnist.test.images,Y: mnist.test.labels})print('Step:{0},loss:{1},acc:{2}'.format(step,loss,acc))
依旧是那几个流程:读数据→初始化相关参数→定义接收数据的接口以便测试使用→初始化权重和偏置→定义基本模块(编码和解码)→构建模型(先编码再解码)→定义预测函数、损失函数、优化器→训练
加入TensorBoard
从tensorflow的官方文档来看,支持可视化操作函数有:scalar
、image
、audio
、text
、histogram
这里我们只需要使用scalar
可视化loss
值的变动,image
可视化部分输入数据、histogram
可视化权重与偏置的分布。
很简单,调用方法统一是tf.summary
。
可视化卷积层的权重和偏置
#定义卷积操作
def conv_layer(input,size_in,size_out,name='conv'):with tf.name_scope(name):w=tf.Variable(tf.truncated_normal([5,5,size_in,size_out],stddev=0.1),name='W') b=tf.Variable(tf.constant(0.1,shape=[size_out]),name='B') conv = tf.nn.conv2d(input,w,strides=[1,1,1,1],padding='SAME')act = tf.nn.relu(conv+b)tf.summary.histogram(name+'/weights',w)tf.summary.histogram(name+'/bias',b)return tf.nn.max_pool(act,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')
可视化部分训练数据:
#创建模型
def create_model(input_x):#卷积input_img = tf.reshape(input_x,[-1,28,28,1])tf.summary.image('input',input_img,3)conv1=conv_layer(input_img,1,32,'conv1')conv2=conv_layer(conv1,32,64,'conv2')#全连接flattened=tf.reshape(conv2,[-1,7*7*64])fc1=fc_layer(flattened,7*7*64, 1024,'fc1')act1=tf.nn.relu(fc1)out=fc_layer(act1,1024,10,'fc2')return out
可视化损失函数变动:
# 损失函数
loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=logits,labels=Y))
tf.summary.scalar('loss',loss_op)
最终要把所有需要可视化的操作合并到一起:
merged=tf.summary.merge_all()
而tensorflow
中的操作一般需要由session
执行,也就是说如果我们想写入日志,就需要在session
中执行merged
操作,并使用add_summary
将每次训练的记录写入到日志文件。
with tf.Session() as sess:writer=tf.summary.FileWriter('logs/',sess.graph)sess.run(tf.global_variables_initializer())for step in range(20000):batch_xs,batch_ys=mnist.train.next_batch(50)sess.run(train_op,feed_dict={X:batch_xs,Y:batch_ys})if(step%10==0 or step==1):loss,acc,s = sess.run([loss_op,accuracy,merged],feed_dict={X: mnist.test.images[:100],Y: mnist.test.labels[:100]})print('Step:{0},loss:{1},acc:{2}'.format(step,loss,acc))writer.add_summary(s,step)
然后运行训练脚本,开始训练以后,打开终端,启动tensorboard
tensorboard --logdir 'logs'
其中最后一个参数logs
代表日志存储的地方,根据自己的情况定义
运行以后会弹出一个网址:
/home/xx/anaconda3/lib/python3.6/site-packages/h5py/__init__.py:36: FutureWarning: Conversion of the second argument of issubdtype from `float` to `np.floating` is deprecated. In future, it will be treated as `np.float64 == np.dtype(float).type`.from ._conv import register_converters as _register_converters
TensorBoard 1.12.2 at http://xx-XPS-8700:6006 (Press CTRL+C to quit)
浏览器中打开此网址,能够看到tensorboard显示的你想可视化的内容。
【注】可能参数不会实施更新,在右上角的齿轮那里可以调整刷新间隔,默认30s
后续
可视化对训练过程是十分重要的,有时候模型不起作用,loss
不降或者炸了,可以通过权重来判断是否参数更新是否出现了问题,而且如果是生成对抗网络,可以把训练过程中的重建图像打印出来,也可以看到模型是否有效。
本博文源码:https://download.csdn.net/download/zb1165048017/11536994