(图0)
img2txt V0.8 【正式版】
第1步:win10自带截图快捷键:Win+Shift+S,也可以用QQ等截图工具;
第2步:打开软件,完成初始配置(后续调用无需再配置),按需识别:
(1)百度文字识别快捷键:Ctrl+b
(2)百度表格识别快捷键:Ctrl+n
(3)百度图转文字+,批量识别imgs文件夹中的图片
(4)高级公式识别+快捷键:Ctrl+m,需输入随机码,不限次数。
(5)新增:学而思文字识别
(6)新增:学而思表格识别
(7)新增:学而思公式识别
下载地址
链接: https://pan.baidu.com/s/1kj29pFjLniQ9THbUSZMNlA 提取码: 6pp2
效果展示
(图1)
(图2)
百度接口
1.在百度智能云https://console.bce.baidu.com/ai/?_=1586327890123&fromai=1#/ai/ocr/app/create,免费创建应用(上图1,随便起名字、描述应用);每个应用对应着一组:AppID、APIKey、SecretKey(上图2,复制这3个参数),在顶图0工具>配置中填写相应3个参数,保存。
2.识别结果自动弹窗显示,可以选中复制,永久保存在本地result文件夹中,其中:文字识别直接为文字,表格识别为xls的下载链接、公式识别为LaTeX文本。LaTeX文本可以在https://latex.vimsky.com/转换为图片,新版Word及WPS支持直接插入LaTeX文本。
3.辅助工具PDF2IMGS,可以先将PDF文件转为图片,然后将图片拷贝至imgs文件夹,点击图转文字+进行批量识别,单次图片数量不宜过多。
4.辅助工具从曲线(折线)图获取原始数据,科研工作必备辅助工具,4件套打包。
链接:https://pan.baidu.com/s/1kj29pFjLniQ9THbUSZMNlA提取码: 6pp2
5.百度通用文字识别:50000次/天免费;表格文字识别:50次/天免费;公式识别:0次。百度公式识别准确率比较低,接口已暂时停止开放,后续开放我们再进行版本更新。
(图3)
(图4)
学而思接口
1.学而思的AI产品名字比较酷:好未来AI开放平台:https://ai.100tal.com/。注册相对百度简单,创建应用的方式基本上同百度(图3),创建之后,你会获取到该应用的Access Key ID、Access Key Secret。
2.我们主要用到图像文字OCR接口,将印刷OCR、公式OCR、表格OCR接入(分配)到你已经创建的应用。
3.学而思单个接口日调用次数上限(次)均为100次。配合百度的API,日常文档处理基本上够了。
【注】本工具可以提高日常工作效率。如果你的识别需求量比较大,可以多申请几个账号,目前他们对个人注册账号数量尚均无限制。遇到任何问题,可以联系小编。
【注】本工具适于win7以上64位台式电脑或笔记本;XP、Linux等就不用下载了~
好用帮推荐
他来了,他来了,Mathpix拜拜了~~~
文字、表格、公式图片识别神器V0.1测试版
俺不是标题党!!!
开发背景
日常工作中经常遇到大量的图片版文本、表格、公式需要编辑;
用手敲?也太OUT了吧,好歹咱也是个Python全栈。
2018年就开始比较各大厂的文字识别API,
BAT+H,4家的文字识别相差无几,
表格识别,百度遥遥领先,如果给百度90分,其他3家是不及格的。
很长一段时间,没有找到能够替代Mathpix这个歪果产品,
从github找到tensorflow的源代码,可惜功力不够,无法逆向。
这不,本已放弃了自己搞公式识别,
采用InftyReader.exe这个日本软件配合美帝的Mathpix,
勉强可以免费识别日常的工作量。
2020年4月,无意中发现百度终于开放了公式识别的API,
也不知道和我去年在百度的留言是否有关(当时鄙视了一下大厂的AI技术不接地气)。
开发过程
2020年之前一直在用百度的文字识别API,
当然,只是在Jupyter中仅供自己使用,
也曾想过做成微信小程序,但看着微信小程序中琳琅满目的同型产品,
还是果断的放弃了!
如今百度公式识别的API出来了,竟让我又燃起做一个小工具的想法,
拿起键盘就是个干!
哼哧,哼哧的撸了200来行代码,测试了十来次,大体可行:
好久不用tkinter做win桌面应用,还是遇到了不少BUG,
不过,相较于后面打包遇到的BUG,前端UI都不是个事,
具体体现在:
1.conda这个奇葩虽然生猛,但是用Pyinstaller打包,一个小小的工具,竟然300M。
2.重新安装一个版本的Python,新建虚拟环境,结果约到pip不能升级的问题。
3.再次打包,遇到Pyinstaller打包报错Failed to execute script pyi_rth_pkgres。
4.都懒得改应用的图标了,测试版就先这样吧。毕竟它实现了既定的3个识别功能。
链 接: https://pan.baidu.com/s/1kj29pFjLniQ9THbUSZMNlA
提取码: 6pp2
BUG参考文档:
解决Python 3.6使用pip时Unable to locate finder for pip._vendor.distlib的问题www.jianshu.comPyinstaller打包报错Failed to execute script pyi_rth_pkgreswww.mustenaka.cn