halcon create_ocr_class_svm 使用SVM分类器创建OCR分类器

目录

  • create_ocr_class_svm(算子)
    • 描述
    • 参数

create_ocr_class_svm(算子)

create_ocr_class_svm - 使用支持随机向量机制创建OCR分类器。

create_ocr_class_svm(:: WidthCharacter,HeightCharacter,Interpolation,Features,Characters,KernelType,KernelParam,Nu,Mode,Preprocessing,NumComponents:OCRHandle)

描述

create_ocr_class_svm创建一个使用支持随机向量机制(SVM)的OCR分类器。 OCR分类器的句柄在OCRHandle中返回。

有关SVM如何工作的说明,请参阅create_class_svm。 create_ocr_class_svm使用Mode给出的分类模式创建SVM以进行分类。 SVM的特征向量的长度(create_class_svm中的NumFeatures)由用于OCR的特征确定,这些特征在特征中传递。这些功能如下所述。在create_class_svm中使用KernelType,KernelParam和Nu对内核进行参数化。 SVM的类的数量(create_class_svm中的NumClasses)是根据要在OCR中使用的字符的名称确定的,这些字符在字符中传递。如create_class_svm所述,参数Preprocessing和NumComponents可用于指定数据的预处理(即,特征向量)。为了数值稳定性,通常可以将预处理设置为“标准化”。为了加快分类时间,可以使用’principal_components’或’canonical_variates’,因为可以显着减少输入特征的数量而不会降低识别率。

用于分类的特征由特征确定。功能可以包含一个功能名称元组。这些特征名称中的每一个导致为分类器计算一个或多个特征。一些特征名称计算灰度值特征(例如,‘pixel_invar’)。由于分类器需要恒定数量的特征(输入变量),因此要分类的字符将转换为标准大小,该大小由WidthCharacter和HeightCharacter确定。用于变换的插值由插值确定。它与affine_trans_image中的含义相同。应该选择插值,使得在变换中不会出现混叠效应。对于大多数应用,应使用Interpolation =‘constant’。应该注意的是,变换后的字符的大小不会选择得太大,因为分类器的泛化属性可能对大尺寸变坏。特别地,对于大尺寸,如果使用灰度值特征,则小的分割误差将对计算的特征具有大的影响。这是因为分割错误将改变区域的最小包围矩形,因此角色的缩放与训练集中的字符不同。在大多数应用中,应使用6x8到10x14之间的大小。

参数功能可以包含以下用于字符分类的功能名称。

‘default’
选择’ratio’和’pixel_invar’。

‘pixel’
字符的灰度值(WidthCharacter x HeightCharacter特征)。

‘pixel_invar’
具有灰度值最大缩放的字符的灰度值(WidthCharacter x HeightCharacter特征)。

‘pixel_binary’
作为二进制图像的字符区域缩放为WidthCharacter x HeightCharacter(WidthCharacter x HeightCharacter特征)的大小。

‘gradient_8dir’
在角色图像上计算渐变。梯度方向被离散化为8个方向。根据这些离散化的方向将振幅图像分解为8个通道。从每个通道提取5x5网格上的25个样本。这些样本用作特征(200个特征)。

‘projection_horizo​​ntal’
灰度值的水平投影(参见gray_projections,HeightCharacter特征)。

‘projection_horizo​​ntal_invar’
灰度值的最大缩放水平投影(HeightCharacter特征)。

‘projection_vertical’
垂直投影灰度值(参见gray_projections,WidthCharacter特征)。

‘projection_vertical_invar’
灰度值的最大缩放垂直投影(WidthCharacter特征)。

‘ratio’
角色的宽高比(1个特征)。

“anisometry’”
角色的反分析(参见偏心,1个特征)。

‘width’
在将字符缩放到标准大小之前字符的宽度(不是缩放不变的,请参见smallest_rectangle1,1个特征)。

‘Hight’
在将字符缩放到标准大小之前字符的高度(不是缩放不变的,请参见smallest_rectangle1,1个特征)。

‘zoom_factor’
字符与WidthCharacter和HeightCharacter的值之间的大小差异(不是缩放不变的,1个特征)。

‘foreground’
前景中像素的分数(1个特征)。

‘foreground_grid_9’
在角色的最小封闭矩形内的3x3网格中前景中像素的分数(9个特征)。

‘foreground_grid_16’
在角色的最小封闭矩形内的4x4网格中的前景中的像素分数(16个特征)。

‘compactness’
角色的紧凑性(见紧凑性,1个特征)。

“convexity”
角色的凸性(见凸性,1个特征)。

‘moments_region_2nd_invar’
角色的标准化第二个时刻(参见moments_region_2nd_invar,3个特征)。

‘moments_region_2nd_rel_invar’
角色的标准化第二个相对时刻(参见moments_region_2nd_rel_invar,2个特征)。

‘moments_region_3rd_invar’
角色的标准化第3个时刻(参见moments_region_3rd_invar,4个特征)。

‘moments_central’
角色的标准化中心矩(参见moments_region_central,4个特征)。

‘moments_gray_plane’
归一化灰度值矩和灰度值平面的角度(参见moments_gray_plane,4个特征)。

“phi”
角色的方向(角度)(参见elliptic_axis,1个特征)。

‘num_connect’
连接组件的数量(请参阅connect_and_holes,1功能)。

‘num_holes’
孔数(参见connect_and_holes,1个特征)。

‘COOC’
二元共生矩阵的值(参见gen_cooc_matrix,12个特征)。

‘num_runs’
由高度标准化的区域中的运行次数(1个特征)。

‘chord_histo’
每行运行的频率(HeightCharacter功能)。

创建分类器后,使用trainf_ocr_class_svm对其进行训练。在此之后,可以使用write_ocr_class_svm保存分类器。或者,可以在训练之后立即使用分类器来使用do_ocr_single_class_svm或do_ocr_multi_class_svm对字符进行分类。

SVM和多层感知器(MLP)的比较(参见create_ocr_class_mlp)通常表明SVM通常在训练时更快,特别是对于大型训练集,并且实现比MLP略高的识别率。 MLP在分类方面更快,因此应该优先考虑时间关键应用。请注意,本指南假定参数的最佳调整。

并行

多线程类型:可重入(与非独占运算符并行运行)。
多线程范围:全局(可以从任何线程调用)。
没有并行化处理。
此运算符返回句柄。请注意,即使将此句柄类型的实例用作输入参数,也可以由特定运算符更改该句柄类型的实例的状态。

参数

WidthCharacter(input_control)整数→(整数)
矩形的宽度,分割字符的灰度值被缩放到该矩形。
默认值:8
建议值:1,2,3,4,5,6,7,8,9,10,11,12,14,16,20
典型值范围:4≤WidthCharacter≤20

HeightCharacter(input_control)整数→(整数)
矩形的高度,分割字符的灰度值被缩放到该矩形的高度。
默认值:10
建议值:1,2,3,4,5,6,7,8,9,10,11,12,14,16,20
典型值范围:4≤HeightCharacter≤20

Interpolation(input_control)字符串→(字符串)
用于缩放字符的插值模式。
默认值:‘常数’
值列表:‘bilinear’,‘constant’,‘nearest_neighbor’,‘weighted’

Features(input_control)字符串(-array)→(字符串)
用于分类的功能。
默认值:‘默认’
值列表:‘anisometry’,‘chord_histo’,‘compactness’,‘convexity’,‘cooc’,‘default’,‘foreground’,‘foreground_grid_16’,‘foreground_grid_9’,‘gradient_8dir’,‘height’,'moments_central ',‘moments_gray_plane’,‘moments_region_2nd_invar’,‘moments_region_2nd_rel_invar’,‘moments_region_3rd_invar’,‘num_connect’,‘num_holes’,‘num_runs’,‘phi’,‘pixel’,‘pixel_binary’,‘pixel_invar’,‘projection_horizo​​ntal’, ‘projection_horizo​​ntal_invar’,‘projection_vertical’,‘projection_vertical_invar’,‘ratio’,‘width’,‘zoom_factor’

Characters(input_control)字符串数组→(字符串)
要读取的字符集的所有字符。
默认值:[‘0’,‘1’,‘2’,‘3’,‘4’,‘5’,‘6’,‘7’,‘8’,‘9’]

KernelType(input_control)string→(string)
内核类型。
默认值:‘rbf’
值列表:‘linear’,‘polynomial_homogeneous’,‘polynomial_inhomogeneous’,‘rbf’

KernelParam(input_control)real→(真实)
内核函数的附加参数。
默认值:0.02
建议值:0.01,0.02,0.05,0.1,0.5

Nu(input_control)real→(真实)
SVM的正则化常数。
默认值:0.05
建议值:0.0001,0.001,0.01,0.05,0.1,0.2,0.3
限制:(Nu> 0.0)&&(Nu <1.0)

Mode(input_control)string→(string)
SVM的模式。
默认值:‘one-versus-one’
价值清单:‘一对多’,‘一对一’

Preprocessing(input_control)字符串→(字符串)
用于变换特征向量的预处理类型。
默认值:‘normalization’
值列表:‘canonical_variates’,‘none’,‘normalization’,‘principal_components’

NumComponents(input_control)整数→(整数)
预处理参数:已转换要素的数量(对于Preprocessing ='none’和Preprocessing =‘noalization’)。
默认值:10
建议值:1,2,3,4,5,8,10,15,20,30,40,50,60,70,80,90,100
限制:NumComponents> = 1

OCRHandle(output_control)ocr_svm→(整数)
处理OCR分类器句柄。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/254856.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

码率跟视频质量有关系

码率跟视频质量有关系.首先要清楚, 相同的视频编码方式下, 码率越高肯定画面越清晰. 但是高到一定值, 再往上的画面改善程度就不明显了, 只会增大文件体积. 所以码率选的合适, 才可以保证清晰度又保持文件不会太大. 个人经验如果是h.264编码(当前最好的视频压缩编码方案), …

SQL 字符串分割表函数

1 --字符串分割表函数2 declare str varchar(1000)3 declare split varchar(10) 4 5 declare i int;6 declare count int;7 8 declare ChildStr varchar(1000);9 declare splitStr varchar(1000); 10 declare Index int; 11 12 declare table as table (rowId int,splitStr va…

语句:分支语句、switch case ——7月22日

语句的类型包括&#xff1a;声明语句、表达式语句、选择语句、循环语句、跳转语句、异常语句 1&#xff0e;声明语句引&#xff1a;入新的变量或常量。 变量声明可以选择为变量赋值。 在常量声明中必须赋值。 例如&#xff1a; int i 0;//声明变量i 并赋值&#xff0c;也可以不…

halcon write_ocr_trainf 将训练字符存储到文件中

目录write_ocr_trainf&#xff08;运算符&#xff09;描述参数write_ocr_trainf&#xff08;运算符&#xff09; write_ocr_trainf - 将训练字符存储到文件中。 write_ocr_trainf&#xff08;Character&#xff0c;Image :: Class&#xff0c;TrainingFile ? 描述 运算符w…

码率计算文章

http://bbs.dvbcn.com/showtopic-41431-1.html

PostgreSQL Oracle 兼容性之 - INDEX SKIP SCAN (递归查询变态优化) 非驱动列索引扫描优化...

标签 PostgreSQL , Oracle , index skip scan , 非驱动列条件 , 递归查询 , 子树 背景 对于输入条件在复合索引中为非驱动列的&#xff0c;如何高效的利用索引扫描&#xff1f; 在Oracle中可以使用index skip scan来实现这类CASE的高效扫描&#xff1a; INDEX跳跃扫描一般用在W…

如何确定镜头CCD靶面尺寸?

在组建机器视觉系统时&#xff0c;需要选用适合实际应用的产品。今天&#xff0c;中国机器视觉商城的培训课堂为您带来的是关于工业镜头CCD靶面尺寸的确定方法。 在选择镜头时&#xff0c;我们通常要注意一个原则&#xff1a;即小尺寸靶面的CCD可使用对应规格更大的镜头&#x…

lua去掉字符串中的UTF-8的BOM三个字节

废话不多说&#xff0c;还是先说点吧&#xff0c;项目中lua读取的text文件如果有BOM&#xff0c;客户端解析就会报错&#xff0c;所以我看了看&#xff0c;任务编辑器swGameTaskEditor 在写入文件的时候&#xff0c;也不知道为什么有的文件就是UTF-8BOM格式&#xff1b;但一般都…

JQuery对象与DOM对象的区别与转换

1.jQuery对象和DOM对象的区别 DOM对象&#xff0c;即是我们用传统的方法(javascript)获得的对象&#xff0c;jQuery对象即是用jQuery类库的选择器获得的对象; eg: var domObj document.getElementById("id"); //DOM对象var $obj $("#id"); //jQuery对象;…

halcon append_ocr_trainf 将字符添加到训练文件中

目录append_ocr_trainf&#xff08;算子&#xff09;描述参数append_ocr_trainf&#xff08;算子&#xff09; append_ocr_trainf - 将字符添加到训练文件中。 append_ocr_trainf&#xff08;Character&#xff0c;Image :: Class&#xff0c;TrainingFile ? 描述 运算符a…

CCD 尺寸

CCD&#xff08;包括CMOS感光元件&#xff09;的面积是按其矩形对角线英寸长度为指标的。这和定义电视屏幕尺寸类似。一英寸是25.4毫米。1/2.0英寸、1/1.8都是指CCD 对角线有多少分之一英寸长&#xff0c;分母小的其分数值就大&#xff0c;相应感光元件面积也大。 1/2.…

Quagga的安装碰到的问题

1.如果出现以下错误&#xff1a; vtysh: symbol lookup error: /usr/local/lib/libreadline.so.6: undefined symbol: UP 解决方法如下: 1.rootlocalhost:~ # cd /usr/local/lib 2.rootlocalhost:/usr/local/lib# ls -la libreadline* 3.rootlocalhost:/usr/local/lib# mkd…

X264电影压缩率画质

X264电影压缩率画质全对比&#xff1a; http://www.mov8.com/dvd/freetalk_show.asp?id29778

halcon read_ocr_trainf 从文件中读取训练字符并转换为图像

目录read_ocr_trainf&#xff08;算子&#xff09;描述参数read_ocr_trainf&#xff08;算子&#xff09; read_ocr_trainf - 从文件中读取训练字符并转换为图像。 read_ocr_trainf&#xff08;&#xff1a;Characters&#xff1a;TrainingFile&#xff1a;CharacterNames&am…

(十二)洞悉linux下的Netfilteramp;iptables:iptables命令行工具源码解析【下】

iptables用户空间和内核空间的交互 iptables目前已经支持IPv4和IPv6两个版本了&#xff0c;因此它在实现上也需要同时兼容这两个版本。iptables-1.4.0在这方面做了很好的设计&#xff0c;主要是由libiptc库来实现。libiptc是iptables control library的简称&#xff0c;是Netfi…

Linux 下实现普通用户只能写入某个目录

今天老婆问了我一个问题&#xff1a;如何在linux 下实现某个目录普通用户能够写入文件&#xff0c;但是不能删除或修改&#xff08;只能由root 删除或修改&#xff09;。开始的两分钟里&#xff0c;我初步判断这是做不到的&#xff0c;因为linux 下能 写入&#xff08;w&#x…

CCD和CMOS摄像头成像原理以及其他区别

&#xfeff;&#xfeff;CCD的第二层是分色滤色片&#xff0c;目前有两种分色方式&#xff0c;一是RGB原色分色法&#xff0c;另一个则是CMYG补色分色法&#xff0c;这两种方法各有利弊。不过以产量来看&#xff0c;原色和补色CCD的比例大约在2&#xff1a;1左右。原色CCD的优…

FFMPEG分析比较细的文章

http://blog.csdn.net/ym012/article/details/6538301

恢复Ext3下被删除的文件(转)

前言 下面是这个教程将教你如何在Ext3的文件系统中恢复被rm掉的文件。 删除文件 假设我们有一个文件名叫 ‘test.txt’ $ls -il test.txt15 -rw-rw-r– 2 root root 20 Apr 17 12:08 test.txt 注意&#xff1a;: “-il” 选项表示显示文件的i-node号&#xff08;15&#xff09;…

halcon trainf_ocr_class_svm 训练OCR分类器

目录trainf_ocr_class_svm&#xff08;算子&#xff09;描述参数trainf_ocr_class_svm&#xff08;算子&#xff09; trainf_ocr_class_svm - 训练OCR分类器。 trainf_ocr_class_svm&#xff08;:: OCRHandle&#xff0c;TrainingFile&#xff0c;Epsilon&#xff0c;TrainMo…