Python:百度AI开放平台——OCR图像文字识别应用

一、注册百度AI开放平台

使用百度AI服务的步骤为:

  1. 注册:注册成为百度AI开放平台开发者;
  2. 创建AI应用:在百度API开放平台上创建相关类型的的AI应用,获得AppID、API Key和Secret Key;
  3. 调用API:调用相关类型的API,获得AI功能的结果,为开发者的应用服务。

注册的操作步骤:

  1. 登录百度AI开放平台,百度AI开放平台-全球领先的人工智能服务平台,进入百度大脑│AI开放平台首页,如图所示。鼠标点击页面右上角“控制台”,进入登录页面。如果已有百度账号,可以使用账号直接登录;如果没有账号,请点击立即注册,按系统要求输入新用户信息,完成系统注册。
  2. 使用用户名、密码登录平台,并需要进行系统认证,认证通过就成为百度AI开放平台开发者,可以使用系统服务。

二、创建OCR文字识别应用

1、登录进去之后,点击“控制台”,再点击左上角的“三”,如下图

选择人工智能中的“文字识别

2、领取免费资源:点击下图所示的“去领取”,选择“通用场景OCR”,接口名称勾选“全部”,然后点击左下角的“0元领取”按钮即可完成领取免费资源。

3、点击创建应用下的“去创建”链接,进入页面,必须填写上应用名称以及应用描述,然后单击左下角的“立即创建”。创建成功后点击“应用列表”,即可在应用列表页面看到AppID、API Key、Secret Key的信息,将上述3项百度授权信息复制记录下来,创建“文字识别”的Python应用程序需使用。

三、OCR应用程序实现

1、安装baidu-aip模块:在windows的命令提示符输入pip install baidu-aip,安装百度智能第三方库模块,安装完成后Python的环境配置就设置好了

2、调用应用对图形文件进行识别

from aip import AipOcr #调用百度智能模块中文字识别类方法
#填写个人的 baiinu-ocr aip
APP_ID = '————————'API_KEY = '——————————————————————'SECRET_KEY = '————————————————————————'client = AipOcr(APP_ID,API_KEY,SECRET_KEY)
fp = open(r'——————————.png','rb') #打开所需文字识别的文件
img = fp.read()
message = client.general(img) #调用general方法返回的信息是字典类型的,结果保存在键‘words_result’的值中for i in message['words_result']:print(i['words'])fp.close()

注意:我是在windows Python 的IDLE环境下运行的 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/786565.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

渗透测试:数据库UDF提权(linux)

目录 开头: 1.UDF提权简介: 1.1共享库文件(UDF文件)指定目录: 版本特征: 操作系统版本: 2.靶场UDF提权复现 提权前提 1.要有一个高权限的MySQL的账号 ​编辑 2.MySQL的权限配置secure_file_priv为空 3.必须有存放UDF文件的…

PHP8.3-ZTS版本安装流程以及添加扩展

下载php-8.3.x.tar.gz至服务器并解压 [rootapisix-test php-8.3.4]# wget https://www.php.net/distributions/php-8.3.4.tar.gz进入目录执行编译命令,必须要带 --enable-zts 才能激活zts功能 [rootapisix-test php-8.3.4]# ./configure --prefix/usr/local/p…

抖音快手直播录屏+无水印下载视频V3.6

抖音快手直播录屏无水印下载视频更新最新版本V3.6 下载:https://download.csdn.net/download/m0_66047725/88978976 更多资源下载:关注我。

Stable Diffusion WebUI 附加功能/图片放大(Extras):单张图片/批量处理/从目录进行批量处理

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。 大家好,我是水滴~~ 篇文章主要讲解 Stable Diffusion WebUI 的附加功能/图片放大(Extras)的使用,主要…

[ruby on rails] ruby使用vscode做开发

ruby LSP实现 ruby插件推荐用这个来实现,但是现在这个在加载文件索引时候,特别慢,时好时坏,所以现在推荐用Solargraph实现 ruby LSP要求ruby版本3以上,如果在旧版本中使用,需要指定bundleGemfile路径 旧版…

1-31 正则表达式 String Buffer String Builder

一.作用:判断指定的String类型值 是否符合指定的规则存储的公式,正确规则表达式 二.为了避免发开中存在差异,Java提出了一些指定的字符,进行正则的编写 符号含义^行起始符 (实际开发中不常用)$行结束符(实际开发中不常用)[]表示某一个位置 , 当且仅当该位置上只有一种可能 []…

量化交易入门(三十八)CCI指标Python实现和回测

今天我们先单纯用CCI指标来完成策略的编写,后续我们会改进这个策略,将CCI指标和前面讲到的MACD和RSI相结合来优化,看看我们优化后的效果会不会更好。 一、量化策略 CCI指标在量化交易中的策略: 在以下情况下生成买入信号&#…

预处理指令——一些比较少见的概念

前言:预处理是我们的c语言源代码成为可执行程序的第一个步骤。而宏和预处理指令都是在这个阶段完成。本节内容就是关于宏和预处理指令相关知识点的解析。 目录 宏 预定义符号 #define定义常量 #define定义符号 #define定义宏 带副作用的宏参数 宏的替换规则…

基于SSM的“超市管理系统”的设计与实现(源码+数据库+文档+PPT)

基于SSM的“超市管理系统”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SSM 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 系统功能设计图 首页 后台管理登录页面 采购查询管理 采购员登录…

linux正则表达式之[]

1.[]含义 linux正则表达式[]表示字符集合的重复特殊字符的符号。 2.样例 正则表达式[]样例 命令1: grep -n "p[wldn]" anaconda-ks.cfg #需要特别注意的是,在[ ]中“仅代表一个待搜索的字符”。命令1的意思是搜索含有(pw)或(pl)或(pd)或…

配置 施耐德 modbusTCP 分布式IO子站 RPA0100

1. 总体步骤 2. 软件组态:在 Unity Pro 软件中创建编辑 PRA 模块工程 2.1 新建项目 模块箱硬件型号如下 点击 Unity Pro 软件左上方【新建】按钮,选择正确的 DIO 模块型号、背板型号 2.2 模块组态 2.2.1 拖拽添加模块 双击【配置】菜单下的【0&…

数据库设计-MySQL设计小册

前言 最近回顾了下MySQL相关的知识,比如索引、几大日志、事务、MVCC、SQL执行流程、Buffer Pool等等。理论知识看了一大堆,自然还是需要实践的,第一个反应就是数据库设计规范。项目开发中,数据库设计自然是重要的一环&#xff0c…

dotcpp题目 1020: [编程入门]猴子吃桃的问题

一、题目 题目描述 猴子吃桃问题。猴子第一天摘下若干个桃子,当即吃了一半,还不过瘾,又多吃了一个。 第二天早上又将剩下的桃子吃掉一半,又多吃一个。以后每天早上都吃了前一天剩下的一半零一个。 到第N天早上想再吃时&#xff0c…

关于loop( ) 阻塞和非阻塞探究

一、SIR的补充 在上几篇博客中,有朋友私信问我,在ticker函数程序和中断服务程序(ISR)中写 物联网请求报错。怎么回事,在此解释。控制台如下 1.1解释 在使用 Ticker 函数和中断服务程序(ISR)时…

ARM IHI0069F GIC architecture specification (6)

2.3 亲和路由 亲和路由是一种基于分层地址的方案,用于识别中断路由的特定PE节点。 对于 PE,AArch64 状态的亲和性值在 MPIDR_EL1 中定义,AArch32 状态的亲和性值在 MPIDR 中定义: • 关联路由是一个由四个8 位关联字段组成的32 位…

问题解决:gorm查询oracle库表,返回struct字段数据为空的问题

package model// 表对应的struct // github.com/cengsin/oracle v1.0.0 // gorm.io/gorm v1.21.16 // 注意:column:USERNAME字段必须大写(oracle表中字段名大写),否则查询出的struct字段值会为空 type BBUser struct {Username …

开源简单方便功能强大的Devops工具:Goploy

Goploy:加速您的DevOps旅程,拥抱无缝部署——选择Goploy,让您从繁琐的发布与回滚中解放出来,尽享高效、智能与便捷的自动化部署力量! - 精选真开源,释放新价值。 概览 现在大部分流行的发布工具功能虽然强…

Leetcode-2810-故障键盘-c++

题目详见https://leetcode.cn/problems/faulty-keyboard/ 题解 这道题的关键是如何合理地使用STL,毕竟是一道简单题。 之前常用到的Vector容器是单向开口的连续内存空间 deque则是一种双向开口的连续线性空间,又称双端动态数组。所谓的双向开口&#x…

Mongodb字段更新操作符$currentDate

学习mongodb,体会mongodb的每一个使用细节,欢迎阅读威赞的文章。这是威赞发布的第54篇mongodb技术文章,欢迎浏览本专栏威赞发布的其他文章。 本文基于Mongodb的官方文档,整理了Mongodb字段更新操作符$currentDate的定义&#xff…

[数据结构]动态顺序表制作源码分享

顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构,一般情况下采用数组存 储。在数组上完成数据的增删查改。 顺序表一般可以分为: 1. 静态顺序表:使用定长数组存储元素 2. 动态顺序表:使用动态开辟的数组存储。…