可以自定义的文字识别OCR

可以自定义的文字识别OCR

  • 什么是OCR文档自学习
  • 自定义模板
  • 单证票据信息抽取
  • 操作体验

这里提到的可以自定义的文字识别OCR ,其实就是OCR文档自学习。

什么是OCR文档自学习

什么是OCR文档自学习呢?OCR文档自学习,是面向“无算法基础”的企业与个人开发者用户,通过全流程可视化操作,支持用户完成模板配置、数据处理&标注、模型构建&训练、部署发布等操作的一站式工具平台。下面我们开始逐步体验OCR文档自学习创建自定义模板以及信息抽取模型。

自定义模板

打开OCR文档自学习控制台:https://document-automl.console.aliyun.com/automl/intro
点击【我的任务】打开任务列表页
在这里插入图片描述
点击【创建任务】,选择自定义KV模板
在这里插入图片描述
点击【创建】看到提示
在这里插入图片描述
我们还没有开通服务,点击【去开通】跳转到服务开通页面,开通服务之后再次点击创建即可看到任务创建成功页面
在这里插入图片描述
点击【开始创建模板】上传服务清晰度的图片,这里我上传一张电子发票的图片
在这里插入图片描述
上传完成之后点击【下一步】,然后框选四个角的字段
在这里插入图片描述
点击【下一步】配置电子发票识别字段,也就是业务需要的字段
在这里插入图片描述
点击【下一步】上传电子发票验证我们勾选的识别字段是否是对的可以看到字段值位置不太准确,回到上一步重新勾选一下
在这里插入图片描述
再次勾选之后的效果如图
在这里插入图片描述

基本上算是准确了,点击【发布模板并开始API调用】
在这里插入图片描述
自此模板发布成功,可以点击【在线使用】上传电子发票图片检验一下识别效果了。
在这里插入图片描述
同样的方法也可以创建自定义表格模板,大家可以自行尝试。
在自定义KV模板中,在第三步勾选识别字段的时候,位置不够准确,有一部分的偏差,希望后续可以优化一下,具体的情况可以通过截图看出来的。下面我们再来体验一下单证票据信息抽取

单证票据信息抽取

同样的办法需要先创建单证票据信息抽取的任务
在这里插入图片描述
点击【创建】如果提示没有开通服务的话点击【去开通】开通对应的单据票证信息抽取服务,阿里云的产品计费比较精细,企业在选择时完全可以细化公司的业务方向来开通需要的服务,而不需要一次开通全部的服务,这样的设计也可以为企业节约成本开支,还是挺人性化的。下面继续进行单据票证信息抽取
在这里插入图片描述
首先开始上传数据集,上传文件点击【创建】
在这里插入图片描述
点击【标注任务】
在这里插入图片描述
点击【创建标注任务】,这里创建标注任务可以选择【本地文件】【从数据集中选择】
在这里插入图片描述
我们已经创建了数据集,那么我们就直接从数据集中选择【确定】完成之后点击【下一步】
在这里插入图片描述

设置标注字段之后点击【创建】可以看到
在这里插入图片描述
点击【标注】打开标注页面开始表述字段信息
在这里插入图片描述

标注完成之后点击右上角【提交任务】返回到列表页面
在这里插入图片描述
点击【质检】根据实际信息确定标注的是否正确,最后点击【提交任务】
在这里插入图片描述

一段时间后可以看到列表页面显示已完成
在这里插入图片描述
至此单据票证信息抽取的上传数据集及标注数据已经操作完了,在操作过程中对于标注任务创建完成之后没有相关的引导去人工进行标注,导致个人等了挺久时间,以为是会按设定好的字段自动标注,结果最后发现是需要人工标注的,白白耽误了一部分时间,希望后续这块的引导可以丰富一下,方便新手上手使用方便。同样的操作完成电子发票标注02的标注操作
在这里插入图片描述
下面开始继续创建模型操作
在这里插入图片描述
点击【下一步】跳转到数据集绑定页面
在这里插入图片描述
这里训练集选择电子发票标注01数据集,测试集选择电子发票标注02数据集,点击【下一步】提示
在这里插入图片描述
下面我们再根据数据标注的操作添加9个训练集,在创建标注任务时可以选择右上角【使用题目库】
在这里插入图片描述

后续的标注、质检操作无变化,重复操作添加9个数据集,或者也可以在列表页面点击【复制】按钮复制已经标注完成的标注任务,但是这里有一点就是复制过来的标注任务还是会显示待标注状态,需要再次点击【标注】按钮进入标注页面点击【提交任务】之后回到列表页面才会显示质检中状态,希望后期可以丰富一下【复制】按钮的功能,复制完成之后标注状态和质检状态与被复制的标注任务状态一致。另外就是复制的标注任务名称无法修改,希望后期也可以开放修改复制的标注任务名称。还有就是列表页可以增加一个批量质检按钮效果更好哦,比如这样的
在这里插入图片描述
等到所有的标注任务全部质检完成,状态显示为已完成之后
在这里插入图片描述
就可以继续创建我们的模型了,选择训练集和测试集
在这里插入图片描述
点击【下一步】,点击【创建模型】
在这里插入图片描述

可以看到模型中心列表页面显示刚才创建的模型处于训练中
在这里插入图片描述
待模型训练完成之后最后点击【部署】按钮,完成部署之后就可以在线使用,体验模型抽取数据的效果。

操作体验

到此整个OCR文档自学习的主体功能便全部操作完成,大家如果在操作过程中有疑问的话也可以在文章下留言,这里是个人全套测试的体验内容,整体来看我操作过程中对于文档的需求不是很大,功能设计的也比较合理比较容易理解,只是在遇到一些操作中的疑问时回去文档查看,比如标注不是自动化标注,而是需要人工标注的,整体来说,本次体验操作还算流畅,文档内容也足够全面,具体业务场景中遇到的问题以及相应的希望改进的地方,我也在具体的业务中提过了。对于OCR文档自学习功能的用途,个人觉得像文档中提到的KV模板,单据票据,表格,长文档提取等都是有很大应用空间的,作为教育行业,对于固定格式的KV图片内容提取,以及日常报销中的单据票据信息抽取,报销表格内容提取,以及合同或者电子书长文档提取等,都是有应用场景的,整体上来说,对于单据票证信息抽取的体验比较满意,对于标注任务的定位线设计,坐标定位设计感觉很贴心,可以充分的保证所选取内容是自己需要选定的内容,感谢好产品的出现,每一款好产品都离不开无数技术人对产品的精益求精的追求,希望后续可以改进的越来越好,让每一个需要用到OCR文档自学习的开发者都可以不用文档便能轻松操作控制台功能以及API接口调用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/26540.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#——字典diction详情

字典 字典: 包含一个key(键)和这个key所以对应的value&#xff08;值&#xff09;&#xff0c;字典是是无序的&#xff0c;key是唯一的&#xff0c;可以根据key获取值。 定义字典: new Diction<key的类型&#xff0c;value的类型>() 方法 添加 var dic new Dictionar…

OZON芒果店长erp,OZON平台支持什么ERP

在跨境电商的浪潮中&#xff0c;OZON平台凭借其独特的优势&#xff0c;吸引了众多卖家入驻。然而&#xff0c;随着业务规模的不断扩大&#xff0c;如何高效管理商品、处理订单、优化仓储物流等成为了卖家们亟需解决的问题。此时&#xff0c;一款强大的ERP&#xff08;企业资源规…

线性代数|机器学习-P13计算特征值和奇异值

文章目录 1. 特征值1.1 特征值求解思路1.1 相似矩阵构造 1. 特征值 1.1 特征值求解思路 我们想要计算一个矩阵的特征值&#xff0c;一般是用如下公式&#xff1a; ∣ ∣ A − λ I ∣ ∣ 0 → λ 1 , λ 2 , ⋯ , λ n \begin{equation} ||A-\lambda I||0\rightarrow \lamb…

汇聚荣科技有限公司实力强吗?

汇聚荣科技有限公司实力强吗?在当今快速发展的科技行业中&#xff0c;公司的实力往往决定了其市场竞争力和发展前景。对于汇聚荣科技有限公司而言&#xff0c;其是否具备强大的实力&#xff0c;不仅关系到自身的发展&#xff0c;也影响着投资者和合作伙伴的选择。因此&#xf…

植物大战僵尸杂交版2.1版本重磅发布!更新内容介绍讲解

植物大战僵尸杂交版2.1版&#xff0c;简直是游戏迷们的福音&#xff01;这个版本不仅更新了大量的新植物和僵尸角色&#xff0c;还加入了更多的游戏模式和挑战关卡&#xff0c;让玩家们可以更加畅快地玩耍。 植物大战僵尸杂交版V2.1 :苹果安卓 PC防闪退工具修改工具高清工具通关…

16个不为人知的资源网站,强烈建议收藏!

整理了16个不为人知的资源网站&#xff0c;涵盖了课程学习、办公技能、娱乐休闲、小说音乐等多种资源&#xff0c;强烈建议收藏&#xff01; #学习网站 1、中国大学MOOC icourse163.org/ 这是一个汇集了国内顶尖大学免费课程资源的平台&#xff0c;众多985工程院校如北京大…

将HTML转化为PDF,一键操作轻松实现高效文件转换,轻松应对多种需求场景

在信息时代的浪潮中&#xff0c;文件格式的转换已经成为我们日常工作、学习和生活中不可或缺的一部分。无论是网页内容的保存、报告的整理还是简历的发送&#xff0c;我们经常需要将HTML文档转换为PDF格式&#xff0c;以确保文件内容的完整性和可读性。然而&#xff0c;传统的转…

3dmax在设计3D模型时闪退解决方法---模大狮模型网

3ds Max 在设计 3D 模型时闪退可能由多种原因造成&#xff0c;以下是一些常见的解决方法&#xff1a; 更新显卡驱动程序&#xff1a; 一个过时或不稳定的显卡驱动程序可能导致 3ds Max 闪退。请确保你的显卡驱动程序是最新版本&#xff0c;并且与 3ds Max 兼容。 关闭不必要的…

基于MCGS的双容水箱液位控制系统设计【MCGS+MATLAB+研华工控机】

摘 要 液位控制技术在众多工业领域中扮演着至关重要的角色。无论是化工、制药、食品加工还是水处理行业&#xff0c;对液位进行精确控制都是保证生产流程稳定、产品质量可靠的关键环节。因此基于实验平台设计了液位自动控制系统。首先&#xff0c;根据实际液位的控制需求&…

【SpringCloud学习笔记】RabbitMQ(上)

1. RabbitMQ简介 官网地址&#xff1a;https://www.rabbitmq.com/ 2. 安装方式 安装前置准备&#xff1a; 此处基于Linux平台 Docker进行安装&#xff0c;前置准备如下&#xff1a; Linux云服务器 / 虚拟机Docker环境 安装命令&#xff1a; docker run \-e RABBITMQ_DEFAU…

大文件word生成的处理与解决策略

前言 对于简单word文档的生成导出&#xff0c;java已经有着很多技术来进行处理&#xff0c;在有着相对固定的格式样板下&#xff0c;采用word模板导出相对会是比较好的选择。但是当数据量且包含大量图片后&#xff0c;采用模板导出就显得无力了&#xff0c;模板的缺点是无法应…

visdom使用时所遇的问题及解决方法

最近在用visdom进行可视化的过程中&#xff0c;虽然可有效的避免主机拒绝访问&#xff08;该问题的解决方法&#xff0c;请参考深度学习可视化工具visdom使用-CSDN博客&#xff09;即在终端输入python -m visom.server 1.训练过程中visdom出现ValueError: too many file descr…

简约不简单,建筑装饰演绎现代美学

走在城市的大街小巷&#xff0c;你是否曾被那些独特而精美的建筑装饰所吸引&#xff1f;每一栋建筑都像是艺术家的杰作&#xff0c;通过精美的装饰诉说着它的故事。 我们的建筑装饰&#xff0c;不仅注重外在的美观&#xff0c;更追求内在的品质。从古典的雕花到现代的简约线条&…

Mac 下载并激活IDEA

1.https://3.jetbra.in 打开这个网站,点击第一个网速比较快的连接 2.在新页面顶部有一个蓝色的下载链接文字< jetbra.zip(20220801) >点击下载 3.步骤2打开的页面不要关闭后面还有用 4.在idea官网下载idea对应的版本 https://www.jetbrains.com/idea/download/other.htm…

Chromium源码阅读:Mojo实战:从浏览器JS API 到blink实现

​ 通过在前面几篇文章&#xff0c;我们粗略梳理了Mojo这套跨进程通信的设计思路和IDL细节。 实际上&#xff0c;Mojo不止是跨进程通信框架&#xff0c;而是跨语言的模块通信自动化系统。 在浏览器暴露的JS API&#xff0c;也是需要通过Mojo这个系统进行桥接&#xff0c;最终…

乡村振兴的科技创新引领:加强农业科技研发,推广先进适用技术,提高农业生产效率,助力美丽乡村建设

目录 一、引言 二、农业科技研发的重要性 &#xff08;一&#xff09;提升农业生产效率 &#xff08;二&#xff09;促进农业产业升级 &#xff08;三&#xff09;保障粮食安全 三、加强农业科技研发的策略 &#xff08;一&#xff09;加大投入力度 &#xff08;二&…

云渲染动画:C4D如何正确渲染导出动画?

​C4D是一款功能强大的3D建模、动画和渲染软件&#xff0c;在制作动画时&#xff0c;正确的渲染和导出流程至关重要&#xff0c;以确保动画质量和流畅性。 帧率概念 动画就是一幅幅图片连贯起来&#xff0c;30帧/秒&#xff0c;就是一秒出现30张图片一般国外都是30&#xff0c…

数据预处理——调整方差、标准化、归一化(Matlab、python)

对数据的预处理&#xff1a; (a)、调整数据的方差&#xff1b; (b)、标准化&#xff1a;将数据标准化为具有零均值和单位方差&#xff1b;&#xff08;均值方差归一化(Standardization)&#xff09; (c)、最值归一化&#xff0c;也称为离差标准化&#xff0c;是对原始数据的…

UKP3D用户定制图框的思路

为用户定制图框&#xff0c;记录以下图框制作方法&#xff0c;便于用户自已修改。 1.轴测图与平面图的图框&#xff1a; 1.1.图框在安装目录下&#xff0c;例如&#xff1a;E:\Program Files (x86)\UKSoft\UKP3d9.2\config\TemplateAndBlock\CADTemplate\ 1.2.配置文件在安装…

LVS/NAT负载均衡实操

添加规则,并做持久操作 1 添加规则 [rootlvs ~]# ipvsadm -A -t 10.36.178.183:80 -s wrr [rootlvs ~]# ipvsadm -a -t 10.36.178.183:80 -r 192.168.65.201:80 -m -w 3 [rootlvs ~]# ipvsadm -a -t 10.36.178.183:80 -r 192.168.65.202:80 -m -w 1[rootlvs ~]# ipvsadm -Ln …