玩转OCR | 腾讯云智能结构化OCR初体验

        随着数字化进程的加速,光学字符识别(OCR)技术已逐渐成为提高企业生产力、优化工作流的重要工具。腾讯云智能结构化OCR凭借其领先的技术、广泛的应用场景和灵活的定制化能力,正在帮助各行业客户更高效地进行文档处理与数据提取。本文将为您介绍腾讯云智能结构化OCR的功能特点、技术优势以及实际应用案例,帮助您快速掌握这一高效的文档自动化解决方案。

 

一、产品概述与核心优势

在信息爆炸的时代,企业每天需要处理大量的文档、发票、表单等数据。这些数据大多以纸质或图像的形式存在,而传统的人工录入不仅费时费力,而且容易出现误差。OCR技术作为一种能够自动识别文档内容的技术,逐渐成为了解决这一问题的有效方案。

腾讯云智能结构化OCR,作为一款面向各行业的智能文档处理工具,凭借其精准的识别能力和高效的数据提取能力,得到了各行各业客户的广泛应用。无论是企业日常的财务报表、医疗文档,还是法律合同、身份证件,腾讯云OCR均能实现高效的自动化识别与数据提取。

该产品采用了最先进的深度学习算法,通过多模态大模型技术,结合了图像识别、自然语言处理等多种技术,能够处理各种复杂的文档类型,确保高精度和高可靠性。

核心优势:

功能特点描述
高精度识别支持中英文、复杂排版、混合语言等多种格式,识别精度高达99%以上。
多场景支持适用于身份证、银行卡、发票、合同、票据等多种文档类型,覆盖财务、法律、医疗等多个行业。
灵活定制支持根据行业需求和企业特定场景进行定制化开发,满足各种应用场景。
快速集成提供丰富的API接口,支持快速集成到现有的业务系统中,帮助企业提高工作效率。

 

二、功能亮点

        腾讯云智能结构化OCR提供了强大的文档识别和数据提取能力,以下是几个核心功能模块:

1. 证件识别

        营业执照是企业经营合法性的证明,广泛应用于商业注册、财务审计等多个领域。腾讯云智能结构化OCR支持对营业执照的精准识别,能够提取企业名称、注册号、法定代表人、注册资本、成立日期等关键信息,极大提升了企业信息的自动化提取效率。

        我们以下面的营业执照为例,在线调用腾讯云OCR API 进行识别。

 我们先用在线工具,将图片转成base64编码

复制到腾讯云OCR API的请求参数中,进行识别。

识别结果如下:

 

我们也可以使用代码来调用腾讯云OCR API。

调用 API 代码示例:

import json
import types
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.ocr.v20181119 import ocr_client, models
try:# 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密# 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305# 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取cred = credential.Credential("SecretId", "SecretKey")# 实例化一个http选项,可选的,没有特殊需求可以跳过httpProfile = HttpProfile()httpProfile.endpoint = "ocr.tencentcloudapi.com"# 实例化一个client选项,可选的,没有特殊需求可以跳过clientProfile = ClientProfile()clientProfile.httpProfile = httpProfile# 实例化要请求产品的client对象,clientProfile是可选的client = ocr_client.OcrClient(cred, "ap-guangzhou", clientProfile)# 实例化一个请求对象,每个接口都会对应一个request对象req = models.BizLicenseOCRRequest()params = {"ImageBase64": "************testbase64**************"}req.from_json_string(json.dumps(params))# 返回的resp是一个BizLicenseOCRResponse的实例,与请求对象对应resp = client.BizLicenseOCR(req)# 输出json格式的字符串回包print(resp.to_json_string())except TencentCloudSDKException as err:print(err)

2. 票据识别

在财务报销、物流发票、电子票据等领域,自动化票据识别是提高效率的关键。腾讯云OCR可以精确识别各类票据的内容,包括票号、日期、金额、税号等信息,且支持多种票据格式。

我们以下面的发票为例,在线调用腾讯云OCR API 进行识别。

 

 

这个发票的图片是在线的,我没直接复制链接到腾讯云OCR API的请求参数 URL 中,进行识别。

识别结果如下:

可以看到增值税发票的内容明细被轻松识别出来了。

同理,也可以用代码调用。

调用 API 代码示例:

try{Credential cred = new Credential("SecretId", "SecretKey");// 实例化一个http选项,可选的,没有特殊需求可以跳过HttpProfile httpProfile = new HttpProfile();httpProfile.setEndpoint("ocr.tencentcloudapi.com");// 实例化一个client选项,可选的,没有特殊需求可以跳过ClientProfile clientProfile = new ClientProfile();clientProfile.setHttpProfile(httpProfile);// 实例化要请求产品的client对象,clientProfile是可选的OcrClient client = new OcrClient(cred, "ap-guangzhou", clientProfile);// 实例化一个请求对象,每个接口都会对应一个request对象VatInvoiceOCRRequest req = new VatInvoiceOCRRequest();req.setImageUrl("https://pic1.zhimg.com/v2-062299d754ec02ffd96640802431f996_r.jpg");// 返回的resp是一个VatInvoiceOCRResponse的实例,与请求对象对应VatInvoiceOCRResponse resp = client.VatInvoiceOCR(req);// 输出json格式的字符串回包System.out.println(AbstractModel.toJsonString(resp));
} 
catch (TencentCloudSDKException e) {System.out.println(e.toString());
}

3. 表格识别

对于复杂的表格数据,传统的OCR技术往往难以高效处理。腾讯云智能结构化OCR通过表格识别技术,能够自动识别表格中的行列结构,并提取表格中的数据,支持多种复杂格式的表格,包括财务报表、库存清单等。

我们找到一个表格图片,使用腾讯云的表格识别API进行识别。

直接将图片上传,点击发起调用,瞬间这张表格的内容就被识别成功。

 

调用 API 代码示例:

using System;
using System.Threading.Tasks;
using Newtonsoft.Json;
using TencentCloud.Common;
using TencentCloud.Common.Profile;
using TencentCloud.Ocr.V20181119;
using TencentCloud.Ocr.V20181119.Models;namespace TencentCloudExamples
{class RecognizeTableAccurateOCR{static void Main(string[] args){try{// 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密// 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305// 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取Credential cred = new Credential {SecretId = "SecretId",SecretKey = "SecretKey"};// 实例化一个client选项,可选的,没有特殊需求可以跳过ClientProfile clientProfile = new ClientProfile();// 实例化一个http选项,可选的,没有特殊需求可以跳过HttpProfile httpProfile = new HttpProfile();httpProfile.Endpoint = ("ocr.tencentcloudapi.com");clientProfile.HttpProfile = httpProfile;// 实例化要请求产品的client对象,clientProfile是可选的OcrClient client = new OcrClient(cred, "ap-guangzhou", clientProfile);// 实例化一个请求对象,每个接口都会对应一个request对象RecognizeTableAccurateOCRRequest req = new RecognizeTableAccurateOCRRequest();req.ImageBase64 = "*************************testbase64******************************";// 返回的resp是一个RecognizeTableAccurateOCRResponse的实例,与请求对象对应RecognizeTableAccurateOCRResponse resp = client.RecognizeTableAccurateOCRSync(req);// 输出json格式的字符串回包Console.WriteLine(AbstractModel.ToJsonString(resp));}catch (Exception e){Console.WriteLine(e.ToString());}}}
}

 

三、应用场景与行业案例

行业领域应用场景OCR 技术优势
金融行业银行、保险、证券等金融领域,身份验证、客户资料录入及合同审批等场景。提升业务办理效率,几秒钟内完成身份验证、银行卡信息提取、贷款合同识别,减少人工录入和核对的工作量。
物流行业包裹运单条形码识别、货物清单信息提取等场景。高效识别运单条形码和货物清单中的详细内容,提升货物追踪与运单处理的自动化程度。
医疗行业诊断报告、病历记录、医疗发票等数据管理与归档。准确识别病历文档、报告单和电子处方中的信息,帮助医院和医疗机构智能化管理病患数据,提升文档处理效率。
政府与公共服务身份证、户口本、驾驶证等证件的识别与验证。自动化证件识别与验证,减少人工验证的错误率,提高工作效率,支持政府部门数字化流程的优化。

 

 

四、总结

        腾讯云智能结构化OCR凭借其卓越的识别精度、广泛的行业应用和灵活的定制化能力,正在成为数字化转型的核心驱动力。无论是在身份验证、财务报销,还是在医疗文档处理、合同管理等领域,OCR技术的引入都极大提升了企业的工作效率,减少了人工成本,并优化了流程。随着技术的不断成熟和创新,腾讯云OCR的应用范围将不断扩展,未来将为更多行业提供智能化的解决方案,助力企业在这个信息化和自动化日益加速的时代中脱颖而出。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/65627.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32 高级 WIFi案例1:测试AT指令

需求描述 测试AT指令是否能够正常控制ESP32的wifi,比如重启、读取设备信息等。 思路: stm32通过串口usart2向ESP32发布命令。ESP32通过串口1返回信息。 配置: 第一步:对ESP32芯片烧录可以读取stm32命令的固件(fac…

MySQL查看日志

目录 1. 日志 1.1 错误日志 1.2 二进制日志 1.2.1 介绍 1.2.2 格式 1.2.3 查看 1.2.4 删除 1.3 查询日志 1.4 慢查询日志 1. 日志 1.1 错误日志 错误日志是 MySQL 中最重要的日志之一,它记录了当 mysqld 启动和停止时,以及服务器在运行过 程…

Spring Boot教程之三十九: 使用 Maven 将 Spring Boot 应用程序 Docker 化

如何使用 Maven 将 Spring Boot 应用程序 Docker 化? Docker是一个开源容器化工具,用于在隔离环境中构建、运行和管理应用程序。它方便开发人员捆绑其软件、库和配置文件。Docker 有助于将一个容器与另一个容器隔离。在本文中,为了将Spring B…

机器人基础-自由度及其简单计算

机器人基础-自由度及其简单计算 1.自由度(DOF)2.自由度的计算3.自由度计算例题例1.例2.例3. 对于一个机器人的手腕,一般要求实现对空间坐标轴X、Y、Z的旋转运动,分别是翻/回转(Roll)、俯仰(Pitc…

初学stm32---高级定时器输出n个pwm波

目录 高级定时器简介:(F1) 高级定时器框图 重复计数器特性 高级定时器输出指定个数PWM实验原理 高级定时器输出指定个数PWM实验配置步骤 相关HAL库函数介绍 关键结构体介绍 高级定时器简介:(F1) 1.高级定时器 :TIM1/TIM8 2.主要特性&…

【MySQL】踩坑笔记——保存带有换行符等特殊字符的数据,需要进行转义保存

问题描述 从DBeaver中导出了部分业务数据的 insert sql,明明在开发、测试环境都可以一把执行通过,却在预发环境执行前的语法检查失败了,提示有SQL语法错误。 这条SQL长这样,default_sql是要在odps上执行的sql语句,提…

GPU 进阶笔记(二):华为昇腾 910B GPU

大家读完觉得有意义记得关注和点赞!!! 1 术语 1.1 与 NVIDIA 术语对应关系1.2 缩写2 产品与机器 2.1 GPU 产品2.2 训练机器 底座 CPU功耗操作系统2.3 性能3 实探:鲲鹏底座 8*910B GPU 主机 3.1 CPU3.2 网卡和网络3.3 GPU 信息 3.3…

Excel中一次查询返回多列

使用Excel或wps的时候,有时候需要一次查询返回多列内容,这种情况可以选择多次vlookup或者多次xlookup,但是这种做法费时费力不说,效率还有些低下,特别是要查询的列数过多时。我放了3种查询方法,效果图&…

爱思唯尔word模板

爱思唯尔word模板 有时候并不一定非得latex https://download.csdn.net/download/qq_38998213/90199214 参考文献书签链接

flask后端开发(3):html模板渲染

目录 渲染模板html模板获取路由参数 gitcode地址: https://gitcode.com/qq_43920838/flask_project.git 渲染模板 这样就能够通过html文件来渲染前端,而不是通过return了 html模板获取路由参数

python实战案例笔记:统计出数据中路劲下没有文件的文件夹

数据样例:👇有如下excel数据 需求:有如下excel,a.xls,统计出路劲下没有文件的路劲 详细实现代码: import os from openpyxl import Workbook from datetime import datetimedef get_empty_dirs(paths):# …

GXUOJ-算法-第一次作业(整数划分、汉诺塔、排列问题、数塔问题)

1.整数划分 问题描述 GXUOJ | 整数划分 题解 #include<bits/stdc.h> using namespace std; const int N1010,mod1e97;int n; int f[N];int main(){cin>>n;f[0]1;for(int i1;i<n;i){for(int ji;j<n;j){f[j](f[j]f[j-i])%mod;}}cout<<f[n]; } 2.汉诺塔…

新服务器ubuntu系统相关操作

1、查看驱动:驱动版本535.216.01能够支持cuda12.2,下面直接使用默认安装的cuda。 2、赋予用户管理员权限。 首先有超级用户(root)权限来编辑 /etc/sudoers 文件,visudo 是一个命令,用于安全地编辑 /etc/sudoers 文件。运行: sudo visudo 在 visudo 编辑器中,找到类似…

docker-开源nocodb,使用已有数据库

使用已有数据库 创建本地数据库 数据库&#xff1a;nocodb 用户&#xff1a;nocodb 密码&#xff1a;xxxxxx修改docker-compose.yml 默认网关的 IP 地址是 172.17.0.1&#xff08;适用于 bridge 网络模式&#xff09;version: "2.1" services:nocodb:environment:…

基于16QAM的载波同步和定时同步性能仿真,采用四倍采样,包括Costas环和gardner环

目录 1.算法仿真效果 2.算法涉及理论知识概要 3.MATLAB核心程序 4.完整算法代码文件获得 1.算法仿真效果 matlab2022a仿真结果如下&#xff08;完整代码运行后无水印&#xff09;&#xff1a; 仿真操作步骤可参考程序配套的操作视频。 2.算法涉及理论知识概要 载波同步是…

用ttf文件解决python画图乱码和中文方框问题

#将字体放到某个路径下&#xff0c;下载的字体simsun支持中文 font FontProperties(fname“/usr/share/fonts/chinese/simsun.ttc”,size15) 我的字体文件在 “D:\中文字体TTF源文件\中文字体TTF源文件\simhei.ttf” 帮我解决乱码问题 import os import pandas as pd import…

谷云科技数据集成社区焕新登场:功能、资源、会员权益全面升级

12月26日&#xff0c;谷云科技ETLCloud技术社区迎来全新升级。升级后社区的内容更加丰富&#xff0c;满足社区用户更多需要。 功能更细致&#xff0c;查找更方便 社 区 问 答 | 博 客 文 章 | 文 档 中 心 作为社区内容贡献的核心板块&#xff0c;我们对社区问答、博客…

MySql详细教程-从入门到进阶(超实用)

基础篇 通用语法及分类 DDL: 数据定义语言&#xff0c;用来定义数据库对象&#xff08;数据库、表、字段&#xff09;DML: 数据操作语言&#xff0c;用来对数据库表中的数据进行增删改DQL: 数据查询语言&#xff0c;用来查询数据库中表的记录DCL: 数据控制语言&#xff0c;用…

20241225在ubuntu20.04.5下监控SSD

20241225在ubuntu20.04.5下监控SSD 2024/12/25 20:29 参考资料&#xff1a; 百度&#xff1a;ubuntu查看ssd寿命 方法 1&#xff1a;使用「磁盘」工具监测 SSD 健康状态 sudo apt install gnome-disk-utility 方法 2&#xff1a;使用 smartctl 工具检查 SSD 健康状态 Ubuntu 和…

基于PLC的电梯控制系统(论文+源码)

1.系统设计 电梯采用了PLC控制方式&#xff0c;通过对PLC进行逻辑程序设计&#xff0c;电梯不仅在控制水平上得到了质的提升&#xff0c;同时在安全性上也得到了大大提高。控制系统在构造上实现了简洁化&#xff0c;不仅优化了硬件接线方便了线路施工&#xff0c;同时对控制要…