深眸科技革新升级OCR技术,与AI视觉实现有效融合赋能各行业应用

OCR即光学字符识别,是通过扫描仪或工业相机等电子设备检查打印的字符,并通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

目前,随着机器视觉和人工智能技术的进一步升级,OCR技术实现了与AI视觉的有效融合,在工业领域的实际生产应用中发挥着越来越重要的作用,包括在食品、医药、电力、消费电子等众多行业中具备良好的应用效果。

字符识别流程

图像预处理

目的:提高图像质量,从而提高OCR的准确性。

常见的图像预处理操作包括灰度化、二值化、降噪和图像增强等。

文字分割

目的:将图像中的文字区域切割出来,便于后续的文字识别。

文字分割可通过基于连通区域的方法或基于深度学习的方法实现。

文字识别

目的:将区域中的文字内容转化为计算机可识别的字符编码。

文字识别可以通过模版匹配的方法或基于深度学习的方法实现。

后处理

目的:进一步提高OCR的准确性,去除识别结果中的错误信息。

常见的后处理操作包括纠错、排版和格式化等。

场景复杂多样 字符识别难题凸显

在实际生产中,众多场景需要用OCR技术实现对印刷字符的检测,包括自动化设备控制、产品品质控制和物流控制等识别场景,但由于这些识别场景复杂多样,想要进一步提升字符识别应用效果往往面临困难。

高效率难题

由于生产工艺的影响,字符标签往往存在印刷模糊、歪斜、污染、破损等问题,导致检测效率较低。

高通用性难题

对于字符的检测包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制。

生产环境难题

识别过程容易受生产环境、产品品质和工艺、拍摄角度等影响,从而出现字符图像不清晰、畸形、缺失等情况。

研发难题

OCR在复杂场景的应用部署需要研发人员的深度参与,还需要字符样本深度学习训练、反复调参,操作门槛较高。

综上所述,在复杂多样的识别场景中,传统OCR技术面临多重难题,为实现缺陷字符的进一步检出,各制造厂商开始运用AI+机器视觉检测技术,对出厂前产品进行更严格检测,包括根据不同的产品材料、缺陷情况和客户需求,使用不同的光源、不同照射角度和不同像素的工业相机,对被识别字符的缺陷和复杂背景进行区分,最后利用缺陷图像的颜色、灰度、形状、大小等来识别。

技术革新升级 深度学习与OCR有效融合

随着字符识别技术加速渗透工业领域,作为机器视觉前沿技术的引领者,深眸科技坚持对OCR技术的革新升级,通过将深度学习与字符识别技术有效融合,全面赋能各行业应用。

深眸科技创新研发的轻辙标注训练平台,通过字符识别模块配合具备较高精度的工业相机拍摄取图,集推、训、测、转一体,能够在字符复杂、环境干扰等情况下,实现全场景、复杂条件下的字符识别。

通过深度学习算法,轻辙标注训练平台能够助力OCR技术能实现更高的识别精度和速度,并精准且快速完成因生产工艺导致的字符标签印刷模糊、歪斜、污染、破损等缺陷的检出,从而满足字符识别的高效率要求;轻辙标注训练平台还能通过自主学习各类工业场景中不同类型的字符,包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制,进一步提升了在字符识别场景中的通用能力。

深眸落地案例 OCR技术在各行业的应用

医药行业 · 药盒OCR检测

项目背景:

对于小盒装产品医药行业往往会将数个产品用透明塑料薄膜先包裹在进行装箱。塑料薄膜存在反光、多层堆叠(降低了字符的对比度)现象,会对字符识别产生严重的干扰。

检测难点:

· 多个产品多行字符

· 需要实现较高的识别准确率

· 塑料薄膜存在反光、堆叠对识别产生影响

解决方案:

深眸科技在此项目中,通过工业相机拍摄取图,以OCR技术加持,系统能够排除反光、堆叠等因素的干扰,提取分析并比较药盒生产日期、二维码等字符的完整性、正确性和是否存在缺失,当检测到问题时,发出信号给剔除装置并警报提示。

医药行业 · 药盒OCR检测项目

电力行业 · 电力线路杆号牌分拣

项目背景:

线路塔杆的杆号牌是线路杆塔的“身份证”,担负着宣传电力知识、安全警示的作用,杆号牌的字迹模糊、脱落等现象,给线路巡视检修、故障抢修等工作带来许多潜在隐患。

检测难点:

· 杆号牌字符不确定,无法预置字符库方式建立图像字符模版

· 字符方向与来料多样,存在相近字符的干扰

· 字符存在挤压变形,影响字符输出

解决方案:

深眸科技自研的轻辙标注训练平台,能够通过搭配文本检测算法与优化SVTR文本识别、文本方向分类器、文本尺度修正等算法,规范字符在尺度处理上的统一性。同时满足客户快速换型生产要求,在部分字符缺损、漏检、小数点符号干扰的情况下,对所有字符联想检出。

电力行业 · 电力线路杆号牌分拣项目

消费电子行业 · OCR错漏检测

项目背景:

空调内机外壳的品牌LOGO以及商标丝印在生产时会有缺损和错误的情况,同时装配阶段也会发生混料现象。由于生产量巨大,人工质检已经不能满足生产效率。

检测难点:

· 多种不同型号产品

· 商标丝印各不相同,软件切换时间短

· 单位检测时间需要判断多个图像特征

· 缺陷类型多样,产品成像角度不稳定

解决方案:

深眸科技的轻辙标注训练平台通过自研算法,能够秒级切换不同产品型号生产,还能动态判断产品字符内容,并以高性能软件架构实现效率提升,实现空调内机外壳品牌LOGO和商标丝印等字符的精准识别。

消费电子行业 · OCR错漏检测项目

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/145099.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

鸿蒙原生应用开发-折叠屏、平板设备服务卡片适配

一、多设备卡片适配原则 为不同尺寸的卡片提供不同的功能 在卡片开发过程中请考虑适配不同尺寸的设备,特别是在折叠屏和平板设备上,设备屏幕尺寸的变化直接影响了卡片内容的展示。请发挥想象力设计具有自适应能力的卡片,避免在卡片内容不做…

代码随想录图论|130. 被围绕的区域 417太平洋大西洋水流问题

130. 被围绕的区域 **题目:**给你一个 m x n 的矩阵 board ,由若干字符 ‘X’ 和 ‘O’ ,找到所有被 ‘X’ 围绕的区域,并将这些区域里所有的 ‘O’ 用 ‘X’ 填充。 题目链接:130. 被围绕的区域 解题思路&#xff1a…

物联网AI MicroPython学习之语法 I2C总线

学物联网,来万物简单IoT物联网!! I2C 介绍 模块功能: I2C Master设备驱动 接口说明 I2C - 构建硬件I2C对象 函数原型:I2C(id, scl, sda, freq)参数说明: 参数类型必选参数?说明idintYI2C外设&#xff…

数据结构(c语言版本) 二叉树的遍历

要求 实现二叉树的创建,并输入二叉树数据 然后先序遍历输出二叉树、中序遍历输出二叉树、后序输出二叉树 例如二叉树为: 该二叉树的先序遍历结果为: A B D C E F 该二叉树的中序遍历结果为: B D A E C F 该二叉树的后序遍历结果…

Mybatis的Mapper接口传递多个参数的时候必须要加@Param注解吗?

答案是&#xff1a;不一定&#xff0c;取决于mybatis的版本、jdk的版本和javac的编译选项。 测试代码 Maven依赖&#xff1a; <dependency><groupId>org.mybatis.spring.boot</groupId><artifactId>mybatis-spring-boot-starter</artifactId>…

linux三次握手、四次挥手

TCP协议是一个安全的、面向连接的、流式传输协议&#xff0c;所谓的面向连接就是三次握手&#xff0c;对于程序猿来说只需要在客户端调用connect()函数&#xff0c;三次握手就自动进行了。先通过下图看一下TCP协议的格式&#xff0c;然后再介绍三次握手的具体流程。 1.tcp协议…

kafka个人笔记

大部分内容源于https://segmentfault.com/a/1190000038173886, 本人手敲一边加强印象方便复习 消息系统的作用 解耦 冗余 扩展性 灵活性&#xff08;峰值处理 可恢复 顺序保证 缓冲 异步 解耦&#xff1a;扩展两边处理过程&#xff0c;只需要让他们遵守约束即可冗余&#xf…

Leetcode刷题详解——衣橱整理

1. 题目链接&#xff1a;LCR 130. 衣橱整理 2. 题目描述&#xff1a; 家居整理师将待整理衣橱划分为 m x n 的二维矩阵 grid&#xff0c;其中 grid[i][j] 代表一个需要整理的格子。整理师自 grid[0][0] 开始 逐行逐列 地整理每个格子。 整理规则为&#xff1a;在整理过程中&am…

Git常用操作-MD

文章目录 1. 本地创建分支&#xff0c;编写代码&#xff0c;提交本地分支到远程仓库2. 提交本地代码到本地仓库3. 提交本地代码到本地dev分支4. 提交本地dev分支到远程仓库5. 本地dev分支拉取远程master分支&#xff0c;并将master分支内容合并到本地dev6. 同义命令7. 撤销上次…

计算机视觉的应用16-基于pytorch框架搭建的注意力机制,在汽车品牌与型号分类识别的应用

大家好&#xff0c;我是微学AI&#xff0c;今天给大家介绍一下计算机视觉的应用16-基于pytorch框架搭建的注意力机制&#xff0c;在汽车品牌与型号分类识别的应用&#xff0c;该项目主要引导大家使用pytorch深度学习框架&#xff0c;并熟悉注意力机制模型的搭建&#xff0c;这个…

PDF文件中更改 PDF 文本颜色的最有效解决方案

PDF 是最常用的文档类型之一&#xff0c;也是商业中使用的首选文档。在工作中&#xff0c;我们经常需要修改PDF的文本内容&#xff0c;转换格式&#xff08;如PDF转Word&#xff0c;PDF转Excel等&#xff09;&#xff0c;合并PDF&#xff0c;以达到更好的工作效果。 然而&…

【精选】JavaScript语法大合集【附代码和超详细介绍以及使用】

JavaScript语法大合集 JavaScript引入到文件 嵌入到HTML文件中 <body><script>var num10;console.log(num);</script> </body>引入本地独立JS文件 <body><script src"./hello.js"></script> </body>引入网络来源…

基于SpringBoot+Vue的新能源汽车充电桩管理系统

基于SpringBootVue的新能源汽车充电桩管理系统的设计与实现~ 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringBootMyBatisVue工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 主页 充电桩详情 管理员界面 摘要 本项目是基于Spring Boot 和 …

【深度学习】吴恩达课程笔记(五)——超参数调试、batch norm、Softmax 回归

笔记为自我总结整理的学习笔记&#xff0c;若有错误欢迎指出哟~ 【吴恩达课程笔记专栏】 【深度学习】吴恩达课程笔记(一)——深度学习概论、神经网络基础 【深度学习】吴恩达课程笔记(二)——浅层神经网络、深层神经网络 【深度学习】吴恩达课程笔记(三)——参数VS超参数、深度…

前端安全策略保障

文章目录 前言后台管理系统网络安全XSSCSRFSQL注入 后言 前言 hello world欢迎来到前端的新世界 &#x1f61c;当前文章系列专栏&#xff1a;前端系列文章 &#x1f431;‍&#x1f453;博主在前端领域还有很多知识和技术需要掌握&#xff0c;正在不断努力填补技术短板。(如果出…

AR贴纸特效SDK,无缝贴合的虚拟体验

增强现实&#xff08;AR&#xff09;技术已经成为了企业和个人开发者的新宠。它通过将虚拟元素与现实世界相结合&#xff0c;为用户提供了一种全新的交互体验。然而&#xff0c;如何将AR贴纸完美贴合在人脸的面部&#xff0c;同时支持多张人脸的检测和标点及特效添加&#xff0…

遵循开源软件安全路线图

毫无疑问&#xff0c;开源软件对于满足联邦任务所需的开发和创新至关重要&#xff0c;因此其安全性至关重要。 OSS&#xff08;运营支持系统&#xff09; 支持联邦政府内的每个关键基础设施部门。 联邦政府认识到这一点&#xff0c;并正在采取措施优先考虑 OSS 安全&#xff…

LeetCode算法题解|LeetCode738. 单调递增的数字、LeetCode968. 监控二叉树

一、LeetCode738. 单调递增的数字 题目链接&#xff1a;738. 单调递增的数字 题目描述&#xff1a; 当且仅当每个相邻位数上的数字 x 和 y 满足 x < y 时&#xff0c;我们称这个整数是单调递增的。 给定一个整数 n &#xff0c;返回 小于或等于 n 的最大数字&#xff0c…

新晋“学霸”夸克大模型拿下C-Eval和CMMLU双榜第一

11月16日&#xff0c;根据最新成绩&#xff0c;千亿级参数的夸克大模型登顶C-Eval和CMMLU两大权威评测榜单&#xff0c;多项性能优于GPT-4。在国内大模型赛道火热的当下&#xff0c;夸克自研大模型凭借过硬的研发能力及数据、行业、平台等优势成为新晋“学霸”。 作为国内最权…

[C++]:8.C++ STL引入+string(介绍)

C STL引入string(介绍&#xff09; 一.STL引入&#xff1a;1.什么是STL2.什么是STL的版本&#xff1a;2-1&#xff1a;原始版本&#xff1a;2-2&#xff1a;P. J 版本&#xff1a;2-3&#xff1a;RW 版本&#xff1a;2-4&#xff1a;SGL版本&#xff1a; 3.STL 的六大组件&…