他来了,他来了,Mathpix拜拜了~~~
文字、表格、公式图片识别神器V0.1测试版
俺不是标题党!!!
开发背景
日常工作中经常遇到大量的图片版文本、表格、公式需要编辑;
用手敲?也太OUT了吧,好歹咱也是个Python全栈。
2018年就开始比较各大厂的文字识别API,
BAT+H,4家的文字识别相差无几,
表格识别,百度遥遥领先,如果给百度90分,其他3家是不及格的。
很长一段时间,没有找到能够替代Mathpix这个歪果产品,
从github找到tensorflow的源代码,可惜功力不够,无法逆向。
这不,本已放弃了自己搞公式识别,
采用InftyReader.exe这个日本软件配合美帝的Mathpix,
勉强可以免费识别日常的工作量。
2020年4月,无意中发现百度终于开放了公式识别的API,
也不知道和我去年在百度的留言是否有关(当时鄙视了一下大厂的AI技术不接地气)。
开发过程
2020年之前一直在用百度的文字识别API,
当然,只是在Jupyter中仅供自己使用,
也曾想过做成微信小程序,但看着微信小程序中琳琅满目的同型产品,
还是果断的放弃了!
如今百度公式识别的API出来了,竟让我又燃起做一个小工具的想法,
拿起键盘就是个干!
哼哧,哼哧的撸了200来行代码,测试了十来次,大体可行:
好久不用tkinter做win桌面应用,还是遇到了不少BUG,
不过,相较于后面打包遇到的BUG,前端UI都不是个事,
具体体现在:
1.conda这个奇葩虽然生猛,但是用Pyinstaller打包,一个小小的工具,竟然300M。
2.重新安装一个版本的Python,新建虚拟环境,结果约到pip不能升级的问题。
3.再次打包,遇到Pyinstaller打包报错Failed to execute script pyi_rth_pkgres。
4.都懒得改应用的图标了,测试版就先这样吧。毕竟它实现了既定的3个识别功能。
下载链接:
链接:https://pan.baidu.com/s/1N1qu3teQZunA55eCkejGdw 提取码: saph
BUG参考文档:
解决Python 3.6使用pip时Unable to locate finder for pip._vendor.distlib的问题
Pyinstaller打包报错Failed to execute script pyi_rth_pkgres