【文字识别】Python3使用百度AI进行文字识别

将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR)。可以实现OCR 的底层库并不多,目前很多库都是使用共同的几个底层OCR 库,或者是在上面进行定制。
Tesseract 是一个OCR 库,目前由Google 赞助(Google 也是一家以OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认最优秀、最精确的开源OCR 系统。
除了极高的精确度,Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体(只要这些字体的风格保持不变就可以),也可以识别出任何Unicode 字符。

此外我们也可以调用百度AI的文字识别API进行文字识别,具体流程如下:

1. 百度智能云注册用户

百度智能云地址:https://cloud.baidu.com/

2. 找到产品服务 / 文字识别 - 概览,创建应用

应用有三个关键参数:AppID,API Key,Secret Key

3. python脚本调用文字识别接口

具体api文档参考下面OCR Python SDK地址

OCR Python SDK地址:https://ai.baidu.com/docs#/OCR-Python-SDK/fad9fbb6

4. 具体文字识别代码如下:只是展示了几个接口,具体的还是看上面OCR Python SDK地址文档说明

'''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
#作者:cacho_37967865
#博客:https://blog.csdn.net/sinat_37967865
#文件:baiduAI.py
#日期:2019-06-18
#备注:Python利用百度AI进行文字识别, pip install baidu-aip
'''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''from aip import AipOcr# 定义常量
APP_ID = '16552814'
API_KEY = '93R0OpMdmPy31WBBgPEKE1qB'
SECRET_KEY = 'kIClrcG******'# 初始化AipFace对象
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)# 打开图片
def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()# 调用通用文字识别接口
def basicGeneral(file):""" 如果有可选参数 """options = {}options["detect_direction"] = "true"  # 检测朝向options["detect_language"] = "true"  # 检测语言result = aipOcr.basicGeneral(file, options)return(result)# 通用文字识别(高精度版)
def basicAccurate(file):options = {}options["detect_direction"] = "true"  # 检测朝向options["detect_language"] = "true"  # 检测语言result = aipOcr.basicAccurate(file, options)return (result)# 识别一些网络上背景复杂,特殊字体的文字。
def webImage(file):options = {}options["detect_direction"] = "true"  # 检测朝向options["detect_language"] = "true"  # 检测语言result = aipOcr.webImage(file, options)return (result)def main():file = get_file_content("bd.png")result = basicGeneral(file)print(result)for word in result['words_result']:print(word['words'])if __name__ == '__main__':main()

识别后的文字:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/568548.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

no connection could be made because the target machine actively refused it.问题解决

第一步:查看端口占用情况netstat -ano 第二步:关闭两台电脑的360,防火墙 第三歩:查看端口。若为两台电脑之间通信。则应使用服务器这台电脑的ip进行连接。利用ipconfig查看本机ip(Ipv4地址) 因为127.0.0…

【图片】图像基本知识以及三原色原理 (rgb)

一、 有关色彩的基本常识    我们知道,只要是彩色都可用亮度、色调和饱和度来描述,人眼中看到的任一彩色光都是这三个特征的综合效果。那么亮度、色调和饱和度分别指的是什么呢? 亮度:是光作用于人眼所引起的明亮程度的…

python 对json数据读取及保存与读取,对dump,dumps,load,loads的理解

一、对json文件的读取 data1{"programmers":[{ "firstName": "Brett", "lastName":"McLaughlin", "email": "aaaa" },{ "firstName": "Jason", "lastName":"Hunte…

【图片】Python对RGB颜色与16进制颜色进行互转

RGB颜色被称为“真彩色”,是Photoshop中默认使用的颜色,也是最常用的一种颜色模式。RGB模式的图像由3个颜色通道组成,分别为红色通道(Red)、绿色通道(Green)和蓝色通道(Blue&#xf…

【Python】pyinstaller模块将py文件打包为windows可执行文件exe

python脚本如果在没有安装python的机器上不能运行,所以将脚本打包成exe文件,降低脚本对环境的依赖性,同时运行更加迅速。当然打包的脚本似乎不是在所有的win平台下都能使用,win7有一部分不能使用,我在win10能够很好的运…

html img src

< img >标签 代表 图片&#xff0c;img标签的作用是向网页中插入一张图片&#xff0c;并不是将图片绘制到网页中。 src 属性&#xff1a;“插入”图片到网页中去。 alt 属性&#xff1a;值可以是一段文字&#xff0c;当图片由于各种原因无法显示时&#xff0c;alt属性的…

【自动化】Python3+Selenium3自动化测试-准备工作

# 系统&#xff1a;win7(64位) # 浏览器&#xff1a;Chrome(75.0.3770.100) # python版本&#xff1a;3.7.0 # Selenium&#xff1a;3.14.1 Selenium简介 Selenium是一款适用于Web应用程序的便携式软件测试框架。 Selenium为编写测试提供了一个回放工具&#xff0c;无需学习测…

基本数据类型float和double的区别

float : 单精度浮点数 double : 双精度浮点数 两者的主要区别如下&#xff1a; 01.在内存中占有的字节数不同 单精度浮点数在机内存占4个字节 双精度浮点数在机内存占8个字节 02.有效数字位数不同 单精度浮点数有效数字8位 双精度浮点数有效数字16位 03.数值取值范围 单精度浮…

【Python】pip模块管理Python包的常用方法

pip 是 Python 包管理工具&#xff0c;该工具提供了对Python 包的查找、下载、安装、卸载的功能。 目前如果你在 python.org 下载最新版本的安装包&#xff0c;则是已经自带了该工具。 Python 2.7.9 或 Python 3.4 以上版本都自带 pip 工具。pip 官网&#xff1a;https://pypi…

OpenCV_ cv2.imshow()

cv2.imshow() cv2.imShow()函数可以在窗口中显示图像。该窗口和图像的原始大小自适应&#xff08;自动调整到原始尺寸&#xff09;。 第一个参数是一个窗口名称&#xff08;也就是我们对话框的名称&#xff09;&#xff0c;它是一个字符串类型。第二个参数是我们的图像。您可以…

【数据库】mysql常用的数据类型

数据类型是指列、存储过程参数、表达式和局部变量的数据特征&#xff0c;它决定了数据的存储格式&#xff0c;代表了不同的信息类型。 有一些数据是要存储为数字的&#xff0c;数字当中有些是要存储为整数、小数、日期型等... MySQL支持多种类型&#xff0c;大致可以分为四类&a…

numpy、cv2等操作图片基本操作

相关包 matplotlibPILcv2numpy 各种操作 读取图片 1 matplotlib.pylab import pylab as plt import numpy as np img plt.imread(examples.png) print(type(img), img.dtype, np.min(img), np.max(img)) [out] (<type numpy.ndarray>, dtype(float32), 0.0, 1.0) …

【Python】base64模块对图片进行base64编码和解码

图片的base64编码就是可以将一副图片数据编码成一串字符串&#xff0c;使用该字符串代替图像地址。 这样做有什么意义呢&#xff1f;我们知道&#xff0c;我们所看到的网页上的每一个图片&#xff0c;都是需要消耗一个 http 请求下载而来的。 没错&#xff0c;不管如何&#xf…

Mysql错误2003 -Can't connect toMySQL server on 'localhost'(10061)解决办法

错误图片 昨天晚上还在用mysql来存储东西,而今天早上发现mysql数据库根本打不开,吓了我一大跳,本来就想重装mysql服务,但是我的数据库都没了,相当于大楼盖起来了,地基一下出现了裂缝,后来经过研究解决办法 如下 我发现mysql的服务一直无法启动如图 显示Cant connect toMySQL s…

【Python实战】使用python计算多种还款方式的还款计划

随着人们经济活动的增加&#xff0c;用钱的地方越来越多&#xff0c;不管是像买房这样的大额支出还是个人消费型支出&#xff0c;越来越多的人选择贷款来解决眼前的经济危机。 而申请贷款就涉及到选择不同的还款方式&#xff0c;所需要偿还的欠款综合也大有不同&#xff0c;那么…

python write报错a byte-like object is required.not str

办法一&#xff1a;根本原因是Python版本问题python2.x中要求用‘wb’&#xff0c;python3.x中要求用w 用open&#xff08;filename&#xff0c;‘w’&#xff09;方式 办法二&#xff1a;encode(ascii)

【Python】浮点数计算时的不准确性以及如何进行精确计算

浮点数一个普遍的问题就是在计算机的世界中&#xff0c;浮点数并不能准确地表示十进制。并且&#xff0c;即便是最简单的数学运算&#xff0c;也会带来不可控制的后果。因为&#xff0c;在计算机的世界中只认识0与1 因为在计算机里面&#xff0c;小数是不精确的&#xff0c;例如…

echarts自定义showlading()样式和文本

1、首先引入echarts.js 2、在页面定义自己的echarts变量 var myChart echarts.init(document.getElementById(main)); 3、自定义showLoading()样式 myChart.showLoading(default, {text:统计中&#xff0c;请稍候...,maskColor: #404a59,textColor: #fff,}); text:文本内…

【视频】视频基本参数介绍

视频&#xff08;Video&#xff09;泛指将一系列静态影像以电信号的方式加以捕捉、纪录、处理、储存、传送与重现的各种技术。 连续的图像变化每秒超过24帧&#xff08;frame&#xff09;画面以上时&#xff0c;根据视觉暂留原理&#xff0c;人眼无法辨别单幅的静态画面&#x…

测试人员做到这几点,线上80%的BUG将落入你手,企业将避免重大风险

BUG事故给敲了很大的警钟&#xff0c;也给公司带来重大损失&#xff0c;作为测试人员&#xff0c;我们如何提现发现线上BUG并及时解决&#xff0c;避免落入用户手中&#xff0c;给企业带来无法挽回的损失。 案例1&#xff1a; 1月20日凌晨&#xff0c;拼多多App因技术漏洞&am…