opencv2.4.13+python2.7学习笔记--使用 knn对手写数字OCR

阅读对象:熟悉knn、了解opencv和python。

1.knn理论介绍:算法学习笔记:knn理论介绍

2. opencv中knn函数

路径:opencv\sources\modules\ml\include\opencv2\ml\ml.hpp

3.案例

3.1数据集介绍

我们的目的是创建一个可以对手写数字进行识别的程序。为了达到这个目的我们需要训练数据和测试数据。OpenCV 安装包中有一副图片(/samples/python2/data/digits.png), 其中有5000 个手写数字(每个数字重复 500遍)。每个数字是一个20x20 的小图。 所以第一步就是将这个图像分割成 5000个不同的数字。我们在将拆分后的每一个数字的图像重排成一行含有 400 个像素点的新图像。这个就是我们的特征集,所有像素的灰度值。这是我们能创建的最简单的特征集。我们使用每个数字的前 250 个样本做训练数据,剩余的250 个做测试数据。

3.2代码

示例中得到的准确率为91.72%,和官网结果一样,可以结合统计中的抽样重新分配训练集和测试集,也可以尝试用不同的距离度量方法(或者相似度度量方法),取不同的K,重新进行数据实验,时间有限,我并没有去找哪个参数代表的是距离度量方法。[备注,方便查阅]

import numpy as np
import cv2
from matplotlib import pyplot as pltdir='C:/Users/Thinkpad/Desktop/picture/'
img = cv2.imread(dir+'5.png')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)# Now we split the image to 5000 cells, each 20x20 size
cells = [np.hsplit(row,100) for row in np.vsplit(gray,50)]# Make it into a Numpy array. It size will be (50,100,20,20)
x = np.array(cells)# Now we prepare train_data and test_data.
train = x[:,:50].reshape(-1,400).astype(np.float32) # Size = (2500,400)
test = x[:,50:100].reshape(-1,400).astype(np.float32) # Size = (2500,400)# Create labels for train and test data
k = np.arange(10)
train_labels = np.repeat(k,250)[:,np.newaxis]
test_labels = train_labels.copy()# Initiate kNN, train the data, then test it with test data for k=1
knn = cv2.KNearest()
knn.train(train,train_labels)
ret,result,neighbours,dist = knn.find_nearest(test,k=5)# Now we check the accuracy of classification
# For that, compare the result with test_labels and check which are wrong
matches = result==test_labels
correct = np.count_nonzero(matches)
accuracy = correct*100.0/result.size
print accuracy

4.3中的图片

参考资料:[1]http://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_ml/py_knn/py_knn_opencv/py_knn_opencv.html

end!!

 

转载于:https://www.cnblogs.com/llfisher/p/6560696.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/371307.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何远程管理Quartz

选项1:JMX 许多人问他们是否可以通过JMX管理Quartz,但我不确定为什么Quartz doc甚至不会提及它。 是的,您可以使用quartz.properties的以下命令启用石英中的JMX org.quartz.scheduler.jmx.export true之后,您可以使用标准的JMX客…

热启动必须联网吗_供暖结束,地暖是关闭供水阀门还是关闭回水阀门?你做对了吗?...

天气渐渐暖和起来很多城市都停止供暖了一些家庭也停止使用地暖那么今天就来聊一聊,停止供暖后地暖系统应该怎么保养地暖不用时候是关闭供水阀门还是关闭回水阀门?供暖结束 暖气阀门到底要不要关一般来说,我们供暖期结束是不用关闭总阀门的。因…

python学习(九) 网络编程学习--简易网站服务器

python 网络编程和其他语言都是一样的,服务器这块步骤为:1. 创建套接字2. 绑定地址3. 监听该描述符的所有请求4. 有新的请求到了调用accept处理请求 Python Web服务器网关接口(Python Web Server Gateway Interface,简称“WSGI”&…

concurrency 方面的books

http://joeduffyblog.com/2016/11/30/15-years-of-concurrency/转载于:https://www.cnblogs.com/WCFGROUP/p/6566150.html

Spring 3.1缓存和配置

我最近在博客中谈论有关Spring 3.1及其新的缓存注释Cacheable和CacheEvict 。 与所有Spring功能一样,您需要进行一定数量的设置,并且通常使用Spring的XML配置文件来完成。 在缓存的情况下,打开Cacheable和CacheEvict并不容易,因为…

按条件分类_保税仓储企业能否同时存储非保货物?“仓储货物安装台分类监管”如何申请?...

保税仓储企业能否同时存储非保货物呢?保税和非保货物是不是真的不能同在一个“屋檐下”呢?哪些企业可以开展“仓储货物按状态分类监管”业务?企业又该如何申请该项业务?本文就对这些问题进行一下梳理。什么是“仓储货物按状态分类…

ZooKeeper的原理(转)

一、ZooKeeper的角色 领导者(Leader),负责进行投票的发起和决议,更新系统状态。 学习者(Learner),包括跟随者(Follower)和观察者(Observer)&#…

java课堂笔记

转载于:https://www.cnblogs.com/16-C-kai/p/6567042.html

Spring– DAO和服务层

欢迎来到Spring教程的第三部分。 在这一部分中,我们将继续编写Timesheet应用程序,这次我们将实现DAO层,业务服务并编写一些测试。 在上一部分中,我们定义了GenericDao接口,该接口告诉我们需要对实体执行哪些操作。 现在…

51nod 1907(多项式乘法启发式合并)

题目: 分析: 对于一个确定的生成子图,很明显是在一个连通块上走,走完了再跳到另一个连通块上,假设连通块个数为cnt,那么答案一定是$min(a_{cnt-1},a_cnt,..,a_{n-1})$ 那现在的问题就是如何求出对于原图而言…

煮饭的机器人作文_公示|“笔随我心、心由笔动”作文大赛获奖名单

卡士大昌杯“笔随我心、心由笔动”获奖作品开平的咸汤圆滑轮记/我的宅家成长记折叠式小屋/夕阳/包粽子在过去的卡士大昌杯“笔随我心、心由笔动”作文活动中我们收到了许多优秀投稿经过专业团队评选得出获奖选手作品如下主办方协办方一等奖《…

BZOJ 4491: 我也不知道题目名字是什么

4491: 我也不知道题目名字是什么 Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 278 Solved: 154[Submit][Status][Discuss]Description 给定一个序列A[i],每次询问l,r,求[l,r]内最长子串,使得该子串为不上升子串或不下降子串 Input 第一…

Spring-boot中读取config配置文件的两种方式

了解过spring-Boot这个技术的,应该知道Spring-Boot的核心配置文件application.properties,当然也可以通过注解自定义配置文件的信息。 Spring-Boot读取配置文件的方式: 一.读取核心配置文件信息application.properties的内容 核心配置文件是指…

JavaFX 2 GameTutorial第5部分

介绍 这是与JavaFX 2 Game Tutorial相关的六部分系列的第五部分。 我知道自从我写关于游戏的博客以来已经很长时间了,但希望您仍然与我在一起。 如果您想回顾一下,请阅读第1部分 , 第2 部分 , 第3 部分和第4 部分 ,以了…

h5是可以一键打包小程序的_H5手机网站封装打包微信小程序并实现分享及微信支付...

手机网站打包小程序教程,生成小程序,网页版小程序 打包微信小程序,H5封装成微信小程序。微信小程序开发一般分为2种方式,一种就是原生开发小程序,一种是将手机网站打包成小程序。原生开发小程序成本较高,技…

Hive中的数据库、表、数据与HDFS的对应关系

1、hive数据库 我们在hive终端,查看数据库信息,可以看出hive有一个默认的数据库default,而且我们还知道hive数据库对应的是hdfs上面的一个目录,那么默认的数据库default到底对应哪一个目录呢?我们可以通过hive配置文件…

软件工程概论作业3

转载于:https://www.cnblogs.com/clueless/p/6568351.html

使用JSF的面向服务的UI

在大型软件开发项目中,面向服务的体系结构非常常见,因为它提供了可供不同团队或部门使用的功能接口。 创建用户界面时,应应用相同的原理。 对于具有开票部门和客户管理部门等的大型公司,组织结构图可能如下所示: 如果计…

pocib模板流程图_各单据流程POCIB

POCIB各阶段流程报关流程从广义上讲,报关是指进出境运输工具负责人、进出境口货物收发货人、进出境物品的所有人或者他们的代理人向海关办理运输工具、货物、物品进出境手续及相关手续的全过程。其中,进出境运输工具负责人、进出口货物收发货人、进出境物…

WinDbg 查看静态变量

有如下Class。若想查看静态变量内容。因为静态变量和类绑定,仅需要查看类即可。 namespace ConsoleApplication13 {class Program{public static string public_string "pubstr_static";public static string private_string "pristr_static"…