itext mac中文特别版是一款从图片中识别文字的OCR(光学字符识别)工具。通过截图、拖拽图片,即可以从扫描版的PDF等任意图片中识字,并且可以很好的解决摘抄和批注需求。而且itext mac版使用腾讯、Google 双引擎,识别效果惊人地准确。
iText for mac官方介绍
iText Pro Mac版拥有大量的和吸引人的功能,完美融合macOS。iText Pro是一个小巧的、直观的、精炼的文本编辑器,简单的字处理软件,它完全用Cocoa重写。您可以使用iText从PDF中提取文本,在纸张上的文档,在书中的页面和任何其他图像。
iText for mac软件特点
iText 是一款从图片中识别文字的 OCR 工具。
典型使用场景:
- 从扫描版 PDF 中提取文字
- 从朋友发来的图片中识别文字
- 从任意图片中识字
iText for mac功能介绍
轻松选择图像
iText支持多种方式选择图像,操作非常方便。
捕获屏幕
iText内置屏幕捕获工具。只需按下快捷键⇧⌘1,捕获屏幕上的任何区域,即可提取其中的文本。提示:已识别的文本已复制到系统剪贴板。你可以直接粘贴。
将图像拖动到菜单栏图标
例如,当您在Twitter中看到图像并想要提取内部的文本或数字时,只需将图像拖动到iText的菜单栏图标,您就可以得到您想要的内容。
选择图像文件
当然,您也可以选择要识别的图片文件。但是,在这种情况下,优选上述拖动。
持续认可
例如,在PDF中截取不同位置的屏幕截图,iText将依次识别文本并自动连接结果。
由Google提供支持
首先,我排除了脱机识别库,因为离线库已经死了,无法自我改进。接下来,在许多在线OCR服务中,我比较了微软,谷歌等产品。最后,我选择了Google的服务,因为它非常强大,可以识别50多种语言。
- 对于普通的自然语言,例如书页,新闻稿,识别结果非常准确,甚至高达100%。
- 对于复杂排版,特别是对于特殊字符(例如,程序源代码),识别结果不是那么好,您可能需要在识别后手动修改结果。
- 例如,对于一条垂直线,机器无法区分小写字母l或大写字母I(顺便说一句,你能识别它们吗?); 相反,机器需要理解上下文以优化结果。但是现在机器很难理解程序源代码之类的非自然语言。
优化识别结果
OCR服务可以准确地识别图像中的文本,但不能用于进一步识别,例如段落识别等。
因此,iText包含自己的算法来优化结果,例如,
- 自动识别段落。
- 删除英文单词和标点符号之间的额外空格。
- 将英文的第一个字母大写。
预览原始图像以进行校对
由于目前的OCR技术不能始终100%识别文本,因此有必要检查原始图像以修改结果。在iText中,您可以:
- 拖动图像附近的结果窗口。
- 在结果窗口的左侧显示图像。
自动翻译
识别图像中的文本后,iText可以自动将它们翻译成100多种语言,由Google提供支持。
iText for mac更新日志
优化识别速度