使用.NET开发一个屏幕OCR工具

本文将介绍使用.NET开发的一款桌面截图 OCR 工具,软件已开源,地址:https://github.com/sangyuxiaowu/Snipping_OCR

背景

因为不同地方人们的使用习惯不同,国内可能截图更多的是使用QQ,微信等即时聊天工具提供的截图功能。所以我们竟然可能会遇到这样的场景:按了截图快捷键却发现并没有任何反应,尝试了多次才意识到 —— 没有开聊天软件。

当我们需要OCR识别时也是经常通过这些社交软件,QQ可以在电脑端使用,微信的文字识别却是需要在手机端识别后发给电脑端。

e7d796043b09e095129efa513c75eead.png
QQ截图OCR

作为一个老年人,QQ 已经不怎么用了,而且 QQ 文字识别的结果复制编辑不是很方便。并且针对保密级别比较高的工作,我们还是更倾向于离线的 OCR 工具。

软件的实现

软件的设计非常简单,通过调用 Windows 系统本身的截图功能,在用户截图后,从剪贴板获取到图片后通过 PaddleOCRSharp 来进行 OCR 的识别,然后将结果输出。

软件的难点之一其实调用系统的截图,中间的波折可以查看今天推送的另一篇文章《为应用添加截图功能》。

OCR 识别已经非常成熟了,百度开源的 PaddleOCR 框架相对 Tesseract 中文识别的效果好太多太多了。得益于开源项目 PaddleOCRSharp[1] 对C++代码修改并封装的.NET的工具类库,我们可以方便的在 .NET 项目中实现 OCR 功能。

var ocrResult = new OCRResult();
using PaddleOCREngine engine = new PaddleOCREngine(null, new OCRParameter());
ocrResult = engine.DetectText(imgfile);

ocrResult 的返回结果是带坐标位置的,我们可以通过对其进行进一步的处理实现比如身份证的 OCR 识别。

若想使用其开发 WebAPI ,之前版本可以直接返回 ocrResult,最近某次更新版本后直接返回数据都是空的,可做如下数据处理:

List<Json_TextBlock> res = new List<Json_TextBlock>();
foreach(var item in ocrResult.TextBlocks)
{var points = new List<object>();foreach (var p in item.BoxPoints){points.Add(new { p.X, p.Y });}res.Add(new Json_TextBlock{Score = item.Score,BoxPoints = points,Text = item.Text});
}// 处理适配新版本的 json 问题
/// <summary>
/// 识别的文本块
/// </summary>
public class Json_TextBlock
{public List<object> BoxPoints { get; set; } = new List<object>();public string Text { get; set; }/// <summary>/// 置信度/// </summary>public float Score { get; set; }
}

软件使用

c69395a07f3ab092deccb9ed99466eea.png
Snipping_OCR

可以前往 Github 或 Gitee 下载 https://gitee.com/sang93/Snipping_OCR/releases/

双击 Snipping_OCR.exe 启动软件,最小化按钮可将其最小化到系统托盘,关闭则为退出软件,最小化后双击托盘可显示主界面。

软件启动会尝试注册全局热键 Ctrl + Alt + A 可以使用该热键来启动截图识别,暂时不支持修改设置,若快捷无法正常使用,可以使用其他软件或者系统自带的截图工具 “Win + Shift + S”截图后,在托盘使用右键菜单 “识别剪贴板”来进行 OCR 识别。

bb272b7db1ac1a5702d1587ef9f104db.png
识别剪贴板

可以将图片拖放到左边空白区域来识别,复制图片文件后也可以在托盘使用右键菜单 “识别剪贴板”来进行 OCR 识别。

References

[1] PaddleOCRSharp: https://github.com/raoyutian/PaddleOCRSharp

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/282325.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

segnet 编译与测试

segnet 编译与测试参考&#xff1a;http://sunxg13.github.io/2015/09/10/caffe/http://m.blog.csdn.net/lemianli/article/details/76687508http://blog.h5min.cn/u010069760/article/details/75258539&#xff08;注意&#xff1a;nakefile而非makefile.config&#xff09;1、…

Linux开启fileinfo扩展

在项目初始部署环境的时候&#xff0c;可能考虑的并不全面&#xff0c;就会少装一些扩展&#xff0c;这里讲解如何添加fileinfo扩展1、找到php安装的压缩包2、将压缩包cp到 /data目录下&#xff0c;并解压 cp php-7.0.30.tar.gz /data cd /data tar -zxvf php-7.0.30.tar.gz…

TemplateBinding与Binding区别,以及WPF自定义控件开发的遭遇

在上一次的文章WPF OnApplyTemplate 不执行 或者执行滞后的疑惑谈到怎么正确的开发自定义控件&#xff0c;我们控件的样式中&#xff0c;属性的绑定一般都是用TemplateBinding来完成,如下一个基本的按钮样式&#xff1a; <Style x:Key"SimpleButton" TargetType&q…

Layui版本的WPF开源控件库-Layui-WPF

大家好&#xff0c;我是沙漠尽头的狼。今天介绍一款Layui风格的WPF开源控件库&#xff0c;仓库信息如下&#xff1a;仓库地址&#xff1a;https://github.com/Layui-WPF-Team/Layui-WPF仓库截图&#xff1a;Layui-WPF关于Layui请点击此链接[1]了解&#xff0c;本文不做介绍&…

Mycat 之 通过Keepalived 实现高可用

一、系统拓扑图 一、操作方法 参考本博客的Nginx Keepalived 实现高可用转载于:https://blog.51cto.com/12965094/2164485

Nginx使用upstream实现动静分离

一、为什么要进行动静分离 分离资源&#xff0c;减少不必要到的请求消耗&#xff0c;减少请求延时。 注&#xff1a;我这里&#xff0c;是nginx处理静态资源&#xff0c;apache处理动态资源。 场景分析&#xff1a; 1、未分离之前的场景步骤 &#xff08;1&#xff09;客户…

HMAC

HMAC 的用途 HMAC 算法主要应用于身份验证&#xff0c;用法如下&#xff1a; 1.客户端发出登录请求2.服务器返回一个随机值&#xff0c;在会话记录中保存这个随机值3.客户端将该随机值作为密钥&#xff0c;用户密码进行 hmac 运算&#xff0c;递交给服务器4.服务器读取数据库中…

JS的原型链和继承

原型和原型链 原型prototype&#xff0c;在创建新函数的时候&#xff0c;会自动生成&#xff0c;而prototype中也会有一个constructor&#xff0c;回指创建该prototype的函数对象。 __proto__是对象或者实例中内置的[[prototype]]&#xff0c;其指向的是产生该对象的对象的prot…

Android 的滑动分析以及各种实现

一、滑动效果的产生滑动一个View&#xff0c;本质区别就是移动一个View。改变当前View所在的坐标&#xff0c;原理和动画相似不断改变坐标位置实现。实现View的滑动就必须监听滑动的事件&#xff0c;并且根据事件传入的坐标&#xff0c;动态且不断改变View的坐标&#xff0c;从…

微软产品 .NET 6 迁移之旅

“.NET性能不行&#xff01;”“.NET有什么像样的产品吗&#xff01;&#xff1f;”“升级到.NET 6有什么好处&#xff01;&#xff1f;”……听人扯淡还不如看看微软自己是怎么做的。本文将汇总一下微软的开发博客——这些博客均涉及微软将产品和服务迁移到.NET 6的成果。博客…

Navicat 连接 RDS数据库

场景介绍&#xff1a; 随着业务量的逐渐增加&#xff0c;公司的数据库压力也会逐渐增大&#xff0c;使用自己购买的esc创建的mysql的话&#xff0c;还得考虑相应的dba维护&#xff0c;也比较繁琐&#xff0c;说不定还做的并不完美&#xff0c;这时&#xff0c;RDS就派上用场了&…

bzoj1045 糖果传递

Description 有n个小朋友坐成一圈&#xff0c;每人有ai个糖果。每人只能给左右两人传递糖果。每人每次传递一个糖果代价为1。 Input 第一行一个正整数nn<1000000&#xff0c;表示小朋友的个数&#xff0e;接下来n行&#xff0c;每行一个整数ai&#xff0c;表示第i个小朋友得…

BEGINNING SHAREPOINT#174; 2013 DEVELOPMENT 第9章节--client对象模型和REST APIs概览 client对象模型API范围...

BEGINNING SHAREPOINT 2013 DEVELOPMENT 第9章节--client对象模型和REST APIs概览 client对象模型API范围 本章之前提到过。client对象模型应用中一个不足就是缺乏对SP APIs和訪问功能的支持不足。转载于:https://www.cnblogs.com/yutingliuyl/p/6748382.html

为.NET应用添加截图功能

本文介绍了 .NET 实现截图功能的思路和过程&#xff0c;如果你仅想了解最后的解决方案&#xff0c;可以直接查看文章末尾。截图的功能我们应该都经常使用&#xff0c;在开发软件时&#xff0c;我们有时也或多或少需要提供这方面的功能&#xff0c;无论是为用户更方便提供远程诊…

K8S集群Master高可用实践

本文将在前文基础上介绍k8s集群的高可用实践&#xff0c;一般来讲&#xff0c;k8s集群高可用主要包含以下几个内容&#xff1a;1、etcd集群高可用2、集群dns服务高可用3、kube-apiserver、kube-controller-manager、kube-scheduler等master组件的高可用 其中etcd实现的办法较为…

[转载]智能科普:VR、AR、MR的区别

智能科普&#xff1a;VR、AR、MR的区别 http://news.zol.com.cn/553/5534833.html news.zol.com.cn 2015-11-23 16:00近日&#xff0c; 获得谷歌5亿美元融资的技术公司Magic Leap在WSJD展会中放出了一段实录视频&#xff0c;引起不小骚动。如今&#xff0c;也有媒体称他们为MR公…

PHP项目中,记录错误日志

一、场景介绍&#xff1a; 环境&#xff1a;LNMP 我们通常是通过nginx的错误日志来分析分错的&#xff0c;也就是我们在各个server中定义的error_log。 比如下面这样&#xff0c;就是将错误日志定义在/etc/nginx/logs/error/www.xiaobudiu.top.log&#xff0c;发生错误&#xf…

持续集成指南:GitLab 的 CI/CD 工具配置与使用

1前言写代码这项工作&#xff0c;本质就是将工作自动化&#xff0c;减少手工操作提供效率&#xff0c;因为人的本质都是懒狗&#xff0c;程序员也不能例外&#xff0c;为了各种意义的效率提升&#xff08;懒&#xff09;&#xff0c;我们需要持续集成工具&#xff0c;将代码测试…

php 错误日志 redis' already loaded in Unknown on line 0

环境介绍&#xff1a;LNMP 报错信息&#xff1a;注&#xff1a;这个php_errors.log 是我在php.ini 中定义的错误日志路径 问题原因&#xff1a; 报错信息给出的意思是&#xff1a;redis和memcache 模块已经加载过问题解决&#xff1a; php加载模块有两种方式&#xff0c;一种是…

第一周作业

我的Git账号&#xff1a;AI1452349541 和代码图 这是我在电脑和手机上下的网易有道词典 &#xff0c; C也下了。 ***学习内容总结*** 感觉任务并不是很难&#xff0c;有些任务没完成是 因为还没买电脑不好弄&#xff0c;下周电脑一定到位。 ***遇到的问题…