玩转OCR | 探索腾讯云智能结构化识别新境界

在这里插入图片描述

📝个人主页🌹:Eternity._
🌹🌹期待您的关注 🌹🌹

在这里插入图片描述
在这里插入图片描述

❀ 玩转OCR

  • 腾讯云智能结构化识别
  • 产品介绍
  • 服务应用
  • 产品特征
  • 行业案例
  • 总结

腾讯云智能结构化识别


腾讯云智能结构化OCR产品分为基础版与高级版,广泛适用于各行业,能精准识别卡证、物流单据、工业标签、服务合同及医疗报告等多种文档类型。即便面对版式灵活多变或中英文混合排版的挑战,该产品仍能保持卓越的识别精度。

通过运用先进的多模态大模型技术,腾讯云OCR能够智能建立键值对应关系,并允许客户根据自身需求定制个性化模板,从而显著提高数据抓取与录入的效率。 这一解决方案广泛适用于政务事务处理、票据核销流程、行业表单自动化填写等多个业务场景。

在这里插入图片描述

产品介绍


背景:

在交通、物流、金融、零售等多个行业中,各类票据、表单、文档、合同等文件普遍面临版式布局复杂、中英文混合排版、票据混杂粘贴、印刷体与手写体并存、样式多样且差异显著、英文字段解析难度高等一系列挑战。这些痛点导致传统的通用文字识别技术难以满足企业对高精度识别的业务需求。

为了解决这些问题,我们就需要使用智能结构化:

  • 智能结构化融合了业界领先的深度学习技术、图像检测技术以及OCR大模型能力,能够实现不限版式的结构化信息抽取。无论是固定卡证还是复杂的物流单据,均可实现智能识别。

在这里插入图片描述

服务应用


  • 注册并登录腾讯云,通过实名认证后,开通服务

在这里插入图片描述

  • 开通服务后,我们可以进入控制台,体验demo

在这里插入图片描述

使用文字识别服务:

  • 直接在文字识别体验Demo中体验,智能结构化(高级版)
    在这里插入图片描述

代码调用:


import json
import types
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.ocr.v20181119 import ocr_client, models
try:# 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密# 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305# 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取cred = credential.Credential("SecretId", "SecretKey")# 实例化一个http选项,可选的,没有特殊需求可以跳过httpProfile = HttpProfile()httpProfile.endpoint = "ocr.tencentcloudapi.com"# 实例化一个client选项,可选的,没有特殊需求可以跳过clientProfile = ClientProfile()clientProfile.httpProfile = httpProfile# 实例化要请求产品的client对象,clientProfile是可选的client = ocr_client.OcrClient(cred, "", clientProfile)# 实例化一个请求对象,每个接口都会对应一个request对象req = models.RecognizeGeneralTextImageWarnRequest()params = {"ImageUrl": "https://waizi.org.cn/uploadfile/201402/22/222111297.jpg"}req.from_json_string(json.dumps(params))# 返回的resp是一个RecognizeGeneralTextImageWarnResponse的实例,与请求对象对应resp = client.RecognizeGeneralTextImageWarn(req)# 输出json格式的字符串回包print(resp.to_json_string())except TencentCloudSDKException as err:print(err)

用于测试图片:

在这里插入图片描述

识别结果:

Address: "XX市XX区XX号"
Angle: 0
Business: "XXXXXXXXXXXXXXXXXXXXXXXXXX、XXXXXXXX、XXXXXXXXXX、XXXXXXXX、XXXXXXXX、XXXXXXXXXX"
Capital: "万元整"
ComposingForm: ""
Electronic: false
IsDuplication: 1
Name: "XXXXXX公司"
NationalEmblem: true
Period: "0000年00月00日至0000年00月00日"
Person: "XXX"
QRCode: true
RecognizeWarnCode: [
]
RecognizeWarnMsg: [
]
RegNum: "000000000000000"
RegistrationAuthority: "XX省工商行政管理局"
RegistrationDate: "0000年00月"
RequestId: "5276ef57-3aa7-49f1-b064-dc6beb6a44e3"
Seal: true
SerialNumber: ""
SetDate: "0000年00月"
Title: "营业执照"
Type: "有限责任公司"

产品特征


在这里插入图片描述

产品体验:

在采用腾讯云智能结构化OCR产品的基础与高级版本进行营业执照识别时,我深刻体会到其高效与精准度。该产品能够迅速且准确地捕捉营业执照上的关键字段信息,涵盖了统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限以及经营范围等多个重要细节。

行业案例


物流单据识别:

适用于各种版式不固定、版面复杂、中英文混排的场景,针对进出口物流、货代、进出口贸易的单据,完成高精度的结构化识别,跨境货代场景,快递&快运场景,国际贸易与采购等等

在这里插入图片描述

票据单据识别:

用于企业员工发票报销,通过 OCR 技术提取各种纸质发票、凭证上的发票号码、金额、发票代码等关键信息,支持数据录入和自动核对,减少人工校验成本。

在这里插入图片描述

总结


腾讯云通过持续的技术研发和创新,不断提升智能结构化OCR技术的准确性和效率。

其OCR技术能够高效地将身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息转化为可编辑、可搜索的数字文本,极大地便利了信息的处理和利用。而在给与用户们的体验也很不错,OCR将来定会为我们的生活带来更大便利。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/890477.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【习题答案】构建灵活高效的消息推送能力

判断题 1.testMessage是测试消息标识,False表示测试消息。 正确(True) 错误(False) 2.卡片刷新服务是建立在Form Kit(卡片开发服务)功能基础上的。 正确(True) 错误(False) 单选题 1.推送卡片刷新消息时,在正式发布阶段数量限制…

「下载」智慧城市“一网统管”总体框架全解析:整体架构、运营体系规划、具体运营内容、典型场景、运营工具平台

智慧城市“一网统管”,通过先进的信息技术手段,实现城市管理的智能化、协同化、精准化和高效化。 本文将基于《智慧城市“一网统管”运营研究报告2024》的内容,从发展背景及趋势、“一网统管”运营总体框架、运营体系规划、“一网统管”运营内…

七牛云短信服务

最近在开发公司内部系统&#xff0c;其中涉及到了短信业务&#xff0c;公司选择了七牛云短信服务&#xff0c;具体实现方案如下&#xff1a; 一、引入pom依赖 <!-- 七牛短信--><dependency><groupId>com.qiniu</groupId><artifactId>qi…

功能很强大的单点登录协议 SAML 2.0详解

目录 什么是 SAML 2.0 SAML 2.0 的核心概念 SAML 2.0 的工作流程 SAML 2.0 的优势 SAML 2.0 的挑战 SAML 2.0 的应用场景 小结 什么是 SAML 2.0 SAML 2.0&#xff08;Security Assertion Markup Language 2.0&#xff0c;安全断言标记语言 2.0&#xff09;是一种基于 XM…

突破续航瓶颈:数字样机技术引领新能源汽车复合制动新方向

随着我国经济快速发展和人民生活水平不断提升&#xff0c;汽车保有量截至2023年9月底就已达到了3.3亿&#xff0c;同比增长6.32%。庞大的汽车保有量对我国的环境和能源都产生了巨大的压力&#xff0c;具备节能环保优势的新能源汽车对于有效解决环境恶化和能源危机问题具有重要意…

cesium shader实现顶点动画

四面体顶点动画实现位移和旋转。 import * as Cesium from cesium;// Fragment Shader for Tetrahedron const fs in vec3 v_positionEC; in vec3 v_normalEC; in vec2 v_st; uniform vec4 color; uniform float alpha;void main() {vec3 positionToEyeEC -v_positionEC;ve…

PingCAP TiDB数据库专员PCTA认证笔记

tidb-pcta-note PingCAP TiDB数据库专员PCTA认证笔记 相关链接 官网认证中心 TiDB社区 体系架构 数据库设计 存算分离。三层架构&#xff1a;PD&#xff08;Placement Driver&#xff09;负责集群元信息管理和调度&#xff0c;TiDB负责sql计算&#xff0c;TiKV负责存储存…

建投数据与腾讯云数据库TDSQL完成产品兼容性互认证

近日&#xff0c;经与腾讯云联合测试&#xff0c;建投数据自主研发的人力资源信息管理系统V3.0、招聘管理系统V3.0、绩效管理系统V2.0、培训管理系统V3.0通过腾讯云数据库TDSQL的技术认证&#xff0c;符合腾讯企业标准的要求&#xff0c;产品兼容性良好&#xff0c;性能卓越。 …

电力通信规约-104实战

电力通信规约-104实战 概述 104规约在广泛应用于电力系统远动过程中&#xff0c;主要用来进行数据传输和转发&#xff0c;本文将结合实际开发实例来讲解104规约的真实使用情况。 实例讲解 因为个人技术栈是Java&#xff0c;所以本篇将采用Java实例来进行讲解。首先我们搭建一…

【3D打印机】启庞KP3S热床加热失败报错err6

最近天冷&#xff0c;打印机预热突然失败&#xff0c;热床无法加热&#xff0c;过了一段时间报错err6&#xff0c;查看另一篇资料说是天气冷原因&#xff0c;导致代码的PID控温部分达不到预期加热效果&#xff0c;从而自检报错&#xff0c;然后资料通过修改3D打印机代码的方式进…

SpiderFlow平台v0.5.0流程的执行过程

流程执行过程&#xff1a; 1. 流程启动 流程的执行通常从一个 开始节点 开始&#xff0c;该节点是整个爬虫任务的起点。开始节点没有实际的功能作用&#xff0c;主要作用是标记流程的起始。 执行顺序&#xff1a;在执行过程中&#xff0c;系统按照流程中的连接线顺序依次执行…

MySQL追梦旅途之慢查询分析建议

一、找到慢查询 查询是否开启慢查询记录 show variables like "%slow%";log_slow_admin_statements&#xff1a; 决定是否将慢管理语句&#xff08;如 ALTER TABLE 等&#xff09;记录到慢查询日志中。 log_slow_extra &#xff1a; MySQL 和 MariaDB 中的一个系…

Liveweb视频融合共享平台在果园农场等项目中的视频监控系统搭建方案

一、背景介绍 在我国的大江南北遍布着各种各样的果园&#xff0c;针对这些地处偏僻的果园及农场等环境&#xff0c;较为传统的安全防范方式是建立围墙&#xff0c;但是仅靠围墙仍然无法阻挡不法分子的有意入侵和破坏&#xff0c;因此为了及时发现和处理一些难以察觉的问题&…

Debezium日常分享系列之:Debezium 3.0.5.Final发布

Debezium日常分享系列之&#xff1a;Debezium 3.0.5.Final发布 重大变化Kafka信号源变更事件源信息块 新功能和改进核心允许在未知表上进行临时阻塞快照快照分发失败处理改进连接器启动配置日志改进 Postgres支持PostgreSQL 17的故障转移复制槽 Oracle跟踪部分回滚事件的新指标…

【Jenkins】持久化

文章目录 持续集成CI持续部署CD部署部署到linux服务器 持续集成好处&#xff1a; 持续集成CI 持续集成&#xff08;Continuous integration&#xff0c;简称CI&#xff09;指的是频繁地&#xff08;一天多次&#xff09;将代码集成到主干。 持续集成的目的就是让产品可以快速…

领域自适应

领域自适应&#xff08;Domain Adaptation&#xff09;是一种技术&#xff0c;用于将机器学习模型从一个数据分布&#xff08;源域&#xff09;迁移到另一个数据分布&#xff08;目标域&#xff09;。这在源数据和目标数据具有不同特征分布但任务相同的情况下特别有用。领域自适…

从零创建一个 Django 项目

1. 准备环境 在开始之前&#xff0c;确保你的开发环境满足以下要求&#xff1a; 安装了 Python (推荐 3.8 或更高版本)。安装 pip 包管理工具。如果要使用 MySQL 或 PostgreSQL&#xff0c;确保对应的数据库已安装。 创建虚拟环境 在项目目录中创建并激活虚拟环境&#xff…

【SH】在Ubuntu Server 24中基于Python Web应用的Flask Web开发(实现POST请求)学习笔记

文章目录 Flask开发环境搭建保持Flask运行Debug调试 路由和视图可变路由 请求和响应获取请求信息Request属性响应状态码常见状态码CookieSession 表单GET请求POST请求 Flask 在用户使用浏览器访问网页的过程中&#xff0c;浏览器首先会发送一个请求到服务器&#xff0c;服务器…

mybatis-plus配置找不到Mapper接口路径的坑

mybatis-plus今天遇到一个问题&#xff0c;就是mybatis 没有读取到mapper.xml 文件。 org.apache.ibatis.binding.BindingException: Invalid bound statement (not found): com.husy.mapper.SystemUserMapper.findUserByName at com.baomidou.mybatisplus.core.override.Myba…

Latex+VsCode+Win10搭建

最近在写论文&#xff0c;overleaf的免费使用次数受限&#xff0c;因此需要使用本地的形式进行编译。 安装TEXLive 下载地址&#xff1a;https://mirror-hk.koddos.net/CTAN/systems/texlive/Images/ 下载完成直接点击iso进行安装操作。 安装LATEX Workshop插件 设置VsCode文…