OCR基本原理

OCR基本原理

news/2025/4/11 13:12:24/文章来源:https://blog.csdn.net/search_129_hr/article/details/126469236

学习内容为《动手学OCR.pdf》

1 OCR基础

1.1 OCR是什么

OCR（Optical Character Recognition，光学字符识别）；
传统意义上的OCR：面向扫描文档类对象；
一般意义上的OCR：场景文字识别（Scene Text Recognition，STR），主要面向自然场景。

1.2 OCR应用场景

OCR应用场景：车牌识别、银行卡信息识别、身份证信息识别、火车票信息识别等；
与其它技术相结合（多模态场景中的通用OCR）：使用OCR技术进行字幕自动翻译、内容安全监控等；与视觉特征相结合，完成视频理解、视频搜索等。

1.3 OCR技术挑战

算法层的问题：透视变换、尺度太小、文字弯曲、背景干扰、字体多变、多种语言、拍摄模糊、光照不足。

在这里插入图片描述

应用层问题：实时处理（要求模型的速度要快）、轻量（应用于移动端或嵌入式硬件）。

2 OCR相关算法

包括文本检测、文本识别、端到端文本识别、文档分析等

2.1 文本检测

在这里插入图片描述

2.2 文本识别

2.3 文档分析

2.4 端到端算法

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/507334.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

实用供暖通风空调设计手册第三版_实用供热空调设计手册第三版即将出版随想...

实用供暖通风空调设计手册第三版_实用供热空调设计手册第三版即将出版随想...

看到西北院组织豪华的暖通空调大师阵容编写的《实用供热空调设计手册》第三版即将出版的信息，暖通空调人都期盼着2020年底见到具有更多新理念、新技术、新方法、新设备、新材料内容的新版《实用供热空调设计手册》。看到《实用供热空调设计手册》第二版，…

阅读更多...

json非法字符有哪些_JSON文件中非法字符的处理

json非法字符有哪些_JSON文件中非法字符的处理

JSON是一种很好的数据格式，但是简单之处也有麻烦的地方，比如如果JSON的字符串里面出现了双引号的话，那真是搞死人了。之前我很傻，每次抛出异常，我就根据异常显示的位置，去慢慢一个一个找错误的地方&#xf…

阅读更多...

python查询模块路径_Visual Studio 2017中的Python无法通过“搜索路径”查找模块

python查询模块路径_Visual Studio 2017中的Python无法通过“搜索路径”查找模块

我正在尝试将一个带有python虚拟环境的现有python项目添加到visual studio 2017，以便我可以调试它。该项目还有一些外部依赖项， 所有内容都安排在以下文件夹中 C:\myproject\code C:\myproject\portablepython C:\myproject\pylibrary 我使用了创建项目…

阅读更多...

python pyquery库_python解析HTML之:PyQuery库的介绍与使用

python pyquery库_python解析HTML之:PyQuery库的介绍与使用

前言Python关于爬虫的库挺多的，也各有所长。了解前端的也都知道， jQuery 能够通过选择器精确定位 DOM 树中的目标并进行操作，所以我想如果能用 jQuery 去爬网页那就 cool 了。就搜了下看 Python 有没有与 DOM 相关的库什么的，还真…

阅读更多...

android 北斗定位代码_iPhone 11 确认支持北斗导航，真相来了！

android 北斗定位代码_iPhone 11 确认支持北斗导航，真相来了！

点击哎咆科技关注我们最近“北斗”火了。因为7月31日，北斗三号全球卫星导航系统正式开通。截止8月7日，微博话题“北斗三号全球卫星导航系统正式开通”已有5.3亿次阅读、8万次讨论。北斗三号全球卫星导航系统的开通，意味着中国自主研发的北斗…

阅读更多...

冯雪手术机器人的应用_未来达芬奇手术机器人的应用将更为广阔

冯雪手术机器人的应用_未来达芬奇手术机器人的应用将更为广阔

达芬奇手术机器人在缝合葡萄皮。在两三厘米见方的人体空间内，机械臂可以如绣花般精细操作。如今，手术机器人正在让很多原本无法想象的手术场景变为现实。其中，达芬奇外科手术机器人系统(以下简称“达芬奇手术机器人”)更是代表了该领域的尖端…

阅读更多...

python如何读取数据时出现错误_连接数据库时出现的错误，怎样解决？？

python如何读取数据时出现错误_连接数据库时出现的错误，怎样解决？？

该楼层疑似违规已被系统折叠隐藏此楼查看此楼 Traceback (most recent call last): File "src\pymssql.pyx", line 636, in pymssql.connect File "src\_mssql.pyx", line 1957, in _mssql.connect File "src\_mssql.pyx", line 676, in _mssql…

阅读更多...

FCENet学习笔记

FCENet学习笔记

论文： Fourier Contour Embedding for Arbitrary-Shaped Text Detection Yiqin Zhu and Jianyong Chen and Lingyu Liang and Zhanghui Kuang and Lianwen Jin and Wayne Zhang CVPR, 2021 1 动机 2021年金连文团队提出了一个FCENet，方法比较新颖&…

阅读更多...

10a大电流稳压芯片_IC芯片大小的完整10A DC/DC电源

10a大电流稳压芯片_IC芯片大小的完整10A DC/DC电源

引言对于数字系统设计师来说，DC/DC电源的定义和设计常常是最后一个设计步骤。设计师必须在DC/DC稳压器电路的设计、布局和调试上花费宝贵的时间。确定合适的DC/DC控制器IC、MOSFET、电感器、电容器、电阻器和二极管只是所面临的诸多挑战的一部分。电源的布局、元件选…

阅读更多...

linux shell rman删除归档_我们一起学一学渗透测试——黑客应该掌握的Linux基础

linux shell rman删除归档_我们一起学一学渗透测试——黑客应该掌握的Linux基础

点击上方「蓝字」关注我们各位新老朋友们：大家好，我是菜鸟小白。欢迎大家关注“菜鸟小白的学习分享”公众号，菜鸟小白作为一名软件测试工程师，会定期给大家分享一些测试基础知识、测试环境的搭建和python学习分享，另外…

阅读更多...

PAN++学习笔记

PAN++学习笔记

1 主要创新点文本检测和识别两个任务结合起来，作为互补，提高检测和识别精度；处理不规则形状的文本；提供一个高效的端到端框架PAN，对实时的应用场景友好。 2 已有工作的痛点将文本检测和识别任务分开，不…

阅读更多...

postgresql 遍历字符串数组_每日一道编程题（348）：1005.K次取反后最大化的数组和...

postgresql 遍历字符串数组_每日一道编程题（348）：1005.K次取反后最大化的数组和...

1005.K次取反后最大化的数组和每日编程中遇到任何疑问、意见、建议请公众号留言或直接撩Q474356284(备注每日编程)给定一个整数数组 A，我们只能用以下方法修改该数组：我们选择某个个索引 i 并将 A[i] 替换为 -A[i]，然后总共重复这个过程 K 次…

阅读更多...

7安装sql cent os server_CentOS7 安装并使用SQL Server

7安装sql cent os server_CentOS7 安装并使用SQL Server

CentOS7 安装并使用SQL ServerLinux 上的 SQL Server 安装指南笔者基于CentOS7进行安装操作下载 Microsoft SQL Server Red Hat 存储库配置文件sudo curl -o /etc/yum.repos.d/mssql-server.repo https://packages.microsoft.com/config/rhel/7/mssql-server.repo运行以下命令&…

阅读更多...

python读取mysql数据_Selenium（Python） ddt读取MySQL数据驱动

python读取mysql数据_Selenium（Python） ddt读取MySQL数据驱动

import unittest from time import sleep from ddt import ddt, data from pymysql import connect from selenium import webdriver def getMySQLTestData(): # 查询数据库的方法 db connect(host"localhost", user"root", password"123456", …

阅读更多...

签字后被开除_员工虚假报销公司可以开除吗？

签字后被开除_员工虚假报销公司可以开除吗？

大家好，我是法小明。今天继续和大家聊聊劳动法那些事，很多企业都会有报销制度，但制度难免会有漏洞，如果劳动者钻空子的话公司可以解除劳动合同吗？我们一起看看下面这个例子：小案例陈某系某公司员工&#xf…

阅读更多...

python创建sqlite3数据库_树莓派使用 Python + SQLite 建立温度数据库

python创建sqlite3数据库_树莓派使用 Python + SQLite 建立温度数据库

相比 MySQL 而言，SQLite 更为轻便、易于维护和部署。本文使用Python向SQLite数据库中插入树莓派温度数据，SQLite数据库中包含一张只包含三个字段的记录表——参数名称，时间和温度值。本文重点解释Python操作SQlite的具体方法，由于…

阅读更多...

论文笔记：推荐系统去偏(Debiased Recommendation)研究综述

论文笔记：推荐系统去偏(Debiased Recommendation)研究综述

1 推荐系统的偏差出现偏差的原因：用户行为数据是观察所得(Observational)而不是实验所得(Experimental)，因此会存在各种偏差，如用户对物品的选择偏差、系统对物品的曝光偏差等；偏差带来的问题：不考虑偏差&#xff0c…

阅读更多...

不良事件总结怎么写_个人年终工作总结怎么写？

不良事件总结怎么写_个人年终工作总结怎么写？

又到了年终，今年注定是不平凡的一年，大家一经历了历风风雨雨，突破重重艰难险阻，一起复工复产。今年，每个人的工作经历都是一部励志经典。那么年终总结怎样写才能更有说服力，更有深度呢？年终总结…

阅读更多...

python爬取b站评论_python高效之爬了B站再爬微博

python爬取b站评论_python高效之爬了B站再爬微博

全文简介本文是用Python爬取微博移动端的数据。可以看一下Robots协议。另外尽量不要爬取太快。如果你毫无节制的去爬取别人数据，别人网站当然会反爬越来越严厉。所以，不要难为别人，到最后其实是在难为你自己。至于为什么不爬PC端&#xff0c…

阅读更多...

c++ 内存管理_Python Bindings - 从 Python 调用 C/C++

c++ 内存管理_Python Bindings - 从 Python 调用 C/C++

python 最被人诟病的问题是什么？ 慢，这是被人诟病最多的问题，很少人知道具体原因，极少人愿意去深入了解并找到原因，更极少的人愿意付出时间去解决这个问题，很多人都是停留在抱怨吐槽阶段，知乎上…

阅读更多...

最新文章