Android TensorFlow Lite 深度学习识别手写数字mnist demo

一. TensorFlow Lite

TensorFlow Lite介绍.jpeg

TensorFlow Lite特性.jpeg

TensorFlow Lite使用.jpeg

TensorFlow Lite 是用于移动设备和嵌入式设备的轻量级解决方案。TensorFlow Lite 支持 Android、iOS 甚至树莓派等多种平台。

我们知道大多数的 AI 是在云端运算的,但是在移动端使用 AI 具有无网络延迟、响应更加及时、数据隐私等特性。

对于离线的场合,云端的 AI 就无法使用了,而此时可以在移动设备中使用 TensorFlow Lite。

二. tflite 格式

TensorFlow 生成的模型是无法直接给移动端使用的,需要离线转换成.tflite文件格式。

tflite 存储格式是 flatbuffers。

FlatBuffers 是由Google开源的一个免费软件库,用于实现序列化格式。它类似于Protocol Buffers、Thrift、Apache Avro。

因此,如果要给移动端使用的话,必须把 TensorFlow 训练好的 protobuf 模型文件转换成 FlatBuffers 格式。官方提供了 toco 来实现模型格式的转换。

三. 常用的 Java API

TensorFlow Lite 提供了 C ++ 和 Java 两种类型的 API。无论哪种 API 都需要加载模型和运行模型。

而 TensorFlow Lite 的 Java API 使用了 Interpreter 类(解释器)来完成加载模型和运行模型的任务。后面的例子会看到如何使用 Interpreter。

四. TensorFlow Lite + mnist 数据集实现识别手写数字

mnist 是手写数字图片数据集,包含60000张训练样本和10000张测试样本。
测试集也是同样比例的手写数字数据。每张图片有28x28个像素点构成,每个像素点用一个灰度值表示,这里是将28x28的像素展开为一个一维的行向量(每行784个值)。

mnist 数据集获取地址:http://yann.lecun.com/exdb/mnist/

下面的 demo 中已经包含了 mnist.tflite 模型文件。(如果没有的话,需要自己训练保存成pb文件,再转换成tflite 格式)

对于一个识别类,首先需要初始化 TensorFlow Lite 解释器,以及输入、输出。

 

    // The tensorflow lite fileprivate lateinit var tflite: Interpreter// Input byte bufferprivate lateinit var inputBuffer: ByteBuffer// Output array [batch_size, 10]private lateinit var mnistOutput: Array<FloatArray>init {try {tflite = Interpreter(loadModelFile(activity))inputBuffer = ByteBuffer.allocateDirect(BYTE_SIZE_OF_FLOAT * DIM_BATCH_SIZE * DIM_IMG_SIZE_X * DIM_IMG_SIZE_Y * DIM_PIXEL_SIZE)inputBuffer.order(ByteOrder.nativeOrder())mnistOutput = Array(DIM_BATCH_SIZE) { FloatArray(NUMBER_LENGTH) }Log.d(TAG, "Created a Tensorflow Lite MNIST Classifier.")} catch (e: IOException) {Log.e(TAG, "IOException loading the tflite file failed.")}}

从 asserts 文件中加载 mnist.tflite 模型:

 

    /*** Load the model file from the assets folder*/@Throws(IOException::class)private fun loadModelFile(activity: Activity): MappedByteBuffer {val fileDescriptor = activity.assets.openFd(MODEL_PATH)val inputStream = FileInputStream(fileDescriptor.fileDescriptor)val fileChannel = inputStream.channelval startOffset = fileDescriptor.startOffsetval declaredLength = fileDescriptor.declaredLengthreturn fileChannel.map(FileChannel.MapMode.READ_ONLY, startOffset, declaredLength)}

真正识别手写数字是在 classify() 方法:

 

val digit = mnistClassifier.classify(Bitmap.createScaledBitmap(paintView.bitmap, PIXEL_WIDTH, PIXEL_WIDTH, false))

classify() 方法包含了预处理用于初始化 inputBuffer、运行 mnist 模型、识别出数字。

 

    /*** Classifies the number with the mnist model.** @param bitmap* @return the identified number*/fun classify(bitmap: Bitmap): Int {if (tflite == null) {Log.e(TAG, "Image classifier has not been initialized; Skipped.")}preProcess(bitmap)runModel()return postProcess()}/*** Converts it into the Byte Buffer to feed into the model** @param bitmap*/private fun preProcess(bitmap: Bitmap?) {if (bitmap == null || inputBuffer == null) {return}// Reset the image datainputBuffer.rewind()val width = bitmap.widthval height = bitmap.height// The bitmap shape should be 28 x 28val pixels = IntArray(width * height)bitmap.getPixels(pixels, 0, width, 0, 0, width, height)for (i in pixels.indices) {// Set 0 for white and 255 for black pixelsval pixel = pixels[i]// The color of the input is black so the blue channel will be 0xFF.val channel = pixel and 0xffinputBuffer.putFloat((0xff - channel).toFloat())}}/*** Run the TFLite model*/private fun runModel() = tflite.run(inputBuffer, mnistOutput)/*** Go through the output and find the number that was identified.** @return the number that was identified (returns -1 if one wasn't found)*/private fun postProcess(): Int {for (i in 0 until mnistOutput[0].size) {val value = mnistOutput[0][i]if (value == 1f) {return i}}return -1}

对于 Android 有一个地方需要注意,必须在 app 模块的 build.gradle 中添加如下的语句,否则无法加载模型。

 

android {......aaptOptions {noCompress "tflite"}
}

demo 运行效果如下:

 

识别手写数字5.png

识别手写数字7.png

何程序错误,以及技术疑问或需要解答的,请扫码添加作者VX

 

五. 总结

本文只是 TF Lite 的初探,很多细节并没有详细阐述。应该会在未来的文章中详细介绍。

本文 demo 的 github 地址:https://github.com/xiaobingchan/TFLite-MnistDemo

当然,也可以跑一下官方的例子:https://github.com/tensorflow/tensorflow/tree/master/tensorflow/lite/examples/android/app

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/546932.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RabbitMQ在Ubuntu上的环境搭建

环境配置 - Ubuntu Server 18.04 - RabbitMQ 3.6.10 安装之前 我们使用apt-get进行RabbitMQ安装&#xff0c;在安装之前&#xff0c;强烈建议您把apt源换位国内&#xff0c;大大增加下载安装的速度&#xff0c;点击查看&#xff1a;《Ubuntu apt-get和pip国内源更换》 安装…

QT5开发的程序打包发布

一、开发平台 QT5开发的程序打包发布出来&#xff0c;在任何一台windows系统都能运行&#xff0c;这样就不会限于电脑需不需要安装QT安装包了。 自己用的QT版本是 我的电脑系统是WIn10专业版的。 二、介绍一下打包工具。 1.一个是QT5自带的windeployqt&#xff08;这个大家不…

带你玩转七牛云存储——高级篇

七牛云图片存储优点 支持各种尺寸的图片缩放&#xff1b;支持图片自动压缩&#xff1b;支持水印添加&#xff1a;图片水印、文字水印两种模式&#xff1b;图片防盗链&#xff0c;限制访问来源&#xff1b;设置ip黑白名单&#xff0c;防止恶意盗刷、攻击&#xff1b;自定义图片…

Opencv dnn实现人类性别检测和年龄预测

概述 前面我写了很多篇关于OpenCV DNN应用相关的文章&#xff0c;这里再来一篇文章&#xff0c;用OpenCV DNN实现一个很有趣好玩的例子&#xff0c;基于Caffe的预训练模型实现年龄与性别预测&#xff0c;这个在很多展会上都有展示&#xff0c;OpenCV DNN实现这里非常简洁明了&a…

Vim设置默认字体、窗口大小和配色方案

最新开始学习Vim&#xff0c;每次打开窗口后&#xff0c;发现自动打开的Vim编辑窗口很小&#xff0c;又是使用的高分辨率笔记本&#xff0c;所以字体也很小&#xff0c;上网查找了一下解决方法&#xff0c;总结如下。 修改都是在_vimrc文件进行的&#xff0c;该文件位于vim安装…

MyEclipse2017破解设置与maven项目搭建

下载 版本&#xff1a;MyEclipse2017 Stable 2.0 百度网盘链接&#xff1a;https://pan.baidu.com/s/1vpIMKq9FfMMbhXzkmft_8A 密码&#xff1a;xfbv myeclipse2017 stable 2.0 破解包网盘链接&#xff1a;https://pan.baidu.com/s/1UoIbtIoYjAC_dA4pKtba9Q 密码&#xff1a…

一、详细Python3.8+PyQt5+pyqt5-tools+Pycharm配置

个人使用环境 WIN10x64系统,Python3.8,PyCharm2020.01.03 安装过程 一、安装Python3.8 打开官网https://www.python.org/,选择Downloads

使用 Packer、Ansible 和 Terraform 构建不可变的基础设施

在容器编排领域&#xff0c;Kubernetes 已成为事实上的标准&#xff0c;而容器镜像 (Docker Image) 作为容器技术栈中最关键的创新之一&#xff0c;极大的推动了企业内部 Devops 运动的进程。 容器镜像所具有的轻量性、便携性、分层机制和内核共享机制真正意义上实现了 “Buil…

分享做老师的幸福

所有的荣誉都比不过学生的一句 老师的课真好&#xff01; 学生一句谢谢韩老师 扫去了一切疲惫。 心中就一个目标 我走过的弯路路 学生可以照直走&#xff01; \ 转载于:https://blog.51cto.com/91xueit/1361894

python读txt文件报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode

python读取文件时提示"UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 205: illegal multibyte sequence" 原代码&#xff1a; file open(r"D:\PythonSourceCode\ReadFile\abc.txt", "r") data file.read() print(…

深入解读RabbitMQ工作原理及简单使用

深入解读RabbitMQ工作原理及简单使用 RabbitMQ系列目录 RabbitMQ在Ubuntu上的环境搭建深入解读RabbitMQ工作原理及简单使用Rabbit的几种工作模式介绍与实践Rabbit事务与消息确认Rabbit集群搭建使用HAProxy为RabbitMQ搭建负载均衡REST API控制Rabbit RabbitMQ简介 在介绍Rab…

python根据坐标点拟合曲线绘图

python根据坐标点拟合曲线绘图 任何程序错误&#xff0c;以及技术疑问或需要解答的&#xff0c;请添加 import os import numpy as np from scipy import log from scipy.optimize import curve_fit import matplotlib.pyplot as plt import math from sklearn.metrics impor…

RabbitMQ交换器Exchange介绍与实践

导读 有了Rabbit的基础知识之后&#xff08;基础知识详见&#xff1a;深入解读RabbitMQ工作原理及简单使用&#xff09;&#xff0c;本章我们重点学习一下Rabbit里面的exchange&#xff08;交换器&#xff09;的知识。 交换器分类 RabbitMQ的Exchange&#xff08;交换器&…

二、WIN10 64位下Pycharm打包.py程序为可执行文件exe

Win10在开发环境下,我们可以直接通过IDE (Pycharm)直接运行,当我们完成一个程序时,我们需要在独立环境下执行,因此我们需要将.py程序打包成windows环境下可直接执行的exe文件。 操作步骤如下: 1.在Pycharm中安装插件PyInstaller 搜索需要添加的PyInstaller模块,并安…

受限玻尔兹曼机(RBM)与python在Tensorflow的实现

简介 受限玻尔兹曼机是一种无监督&#xff0c;重构原始数据的一个简单的神经网络。 受限玻尔兹曼机先把输入转为可以表示它们的一系列输出&#xff1b;这些输出可以反向重构这些输入。通过前向和后向训练&#xff0c;训练好的网络能够提取出输入中最重要的特征。 为什么RBM很…

RabbitMQ事务和Confirm发送方消息确认——深入解读

引言 根据前面的知识&#xff08;深入了解RabbitMQ工作原理及简单使用、Rabbit的几种工作模式介绍与实践&#xff09;我们知道&#xff0c;如果要保证消息的可靠性&#xff0c;需要对消息进行持久化处理&#xff0c;然而消息持久化除了需要代码的设置之外&#xff0c;还有一个…

十四、PyCharm开发Python利用WMI修改电脑IP、DNS

1.在PyCharm开发中安装WMI插件 搜索需要添加的WM插件,并安装,安装成功后会有提示!

Python 3深度置信网络(DBN)在Tensorflow中的实现MNIST手写数字识别

任何程序错误&#xff0c;以及技术疑问或需要解答的&#xff0c;请扫码添加作者VX&#xff1a;1755337994 使用DBN识别手写体 传统的多层感知机或者神经网络的一个问题&#xff1a; 反向传播可能总是导致局部最小值。 当误差表面(error surface)包含了多个凹槽&#xff0c;当你…

PHP安装ZIP扩展

2019独角兽企业重金招聘Python工程师标准>>> 下载ZIP扩展包 wget http://pecl.php.net/get/zip-1.10.2.tgztar zxvf zip-1.10.2.tgz 进入解压后的目录&#xff0c;执行 /usr/local/php/bin/phpize 编译 ./configure --with-php-config/usr/local/php/bin/php-config…

使用Docker部署RabbitMQ集群

使用Docker部署RabbitMQ集群 概述 本文重点介绍的Docker的使用&#xff0c;以及如何部署RabbitMQ集群&#xff0c;最基础的Docker安装&#xff0c;本文不做过多的描述&#xff0c;读者可以自行度娘。 Windows10上Docker的安装 因为本人用的是Windows系统&#xff0c;所有推…