OrionX GPU算力池助力AI OCR场景应用

01 AI OCR的历史及概念

OCR(Optical Character Recognition,光学字符识别)是指采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

2012年AlexNet在ImageNet竞赛夺冠以来,深度学习方法开始在图像视频领域大幅超越传统算法,基于CV(计算机视觉)和NLP(自然语言处理)卷积神经网络和基于长短期记忆的方法开始扩张到OCR领域。在AI OCR系统中,人工神经网络主要充当特征提取器和分类器的功能,输入是字符图像,输出是识别结果,且识别率很高,不需要花大量时间去设计字符特征。

OCR处理分为:图像预处理、文本检测(Detection)、文本识别(Recognition)这三大步骤。

图像预处理,用于对待处理的原始图像进行一些矫正操作,以助于降低后续的检测和识别难度。例如调整图像对比度、旋转对齐、进行局部裁剪、折痕和墨点等干扰信息的淡化等。现有多数深度学习识别算法具体流程包括图像校正、特征提取、序列预测等模块,流程如图所示:

文件检测算法,CTPN是在ECCV 2016提出的一种文字检测算法,是目前流传最广、影响最大的开源文本检测模型,可以检测水平或微斜的文本行。CTPN结合CNN与LSTM深度网络,能有效的检测出复杂场景的横向分布的文字。CTPN模型主要包括三个部分,分别是卷积层、Bi-LSTM层、全连接层,其结构如下图所示:

文字识别,使用CRNN网络(循环卷积神经网络)的技术思想是用深度卷积来生成图像基础特征,再使用Bi-LSTM循环网络(双向长短时记忆网络,能吸收上下文语义信息)进行时序特征训练(这一步利用文本序列的前后特征能有效提升效果),最后引入CTC损失函数来实现端对端的不定长序列识别,解决训练时字符无法对齐的问题。CRNN网络结构包含三部分,从下到上依次为:卷积层、循环层、转录层。其结构如下图所示:

02 AI OCR助力企业降本增效

传统财务报销场景下,企业员工在日常差旅报销时,需要手动将火车票、住宿费发票中的金额、坐席等信息录入到系统中。会计再根据员工录入的信息,核验员工职级与报销标准是否匹配。以往手动录入信息的方式需要员工反复核对信息的准确性及完整性,同时审核人员也需要花费大量的时间进行人工校对,极大影响了工作效率。

当前,随着企业新发展阶段需要,使用人工智能等技术助力企业提高效率,降低成本,已成为企业数智化转型的战略方向。

很多企业已开始将银行单证处理、财务发票报销等场景,从原来人工手动处理方式,转换到为使用AI OCR系统处理方式。用户通过前端系统上送图片文件到AI OCR系统,AI OCR系统通过人工智能深度算法模型对非结构化的图片特征检测、识别类型、提取文字、形成结构化数据,再经过智能审核系统查重验真,最后将结果数据发送给前端系统自动填单。使用AI OCR系统,可以极大的提高人工录入准确率、降低过程中的人工错误、极大提高了财务报销场景的处理效率和准确率。

AI OCR系统,大量使用深度学习模型,GPU作为AI算力重要引擎,利用并行计算架构,极大地提升了提高识别准确率和速度,这大大帮助企业实现流程自动化处理、节省人员成本、高效率处理数据信息。

03 AI OCR应用痛点

随着AI OCR技术的大量应用及需求增加,产生了大量算力需求。然而当前的GPU算力资源大多是都是分配给单个项目,存在着大量浪费和运维难题:

  • GPU算力资源目前采用物理机模式或单业务系统分配,分配粒度粗、利用率低;
  • GPU算力资源分配不灵活,不能有效共享和安全隔离分配算力资源;
  • 没有统一GPU算力资源管理平台,平台团队无法及时和周期性掌握GPU资源利用率和任务运行情况;
  • GPU算力资源在机柜资源、用电等,生命周期内的综合运营成本非常高;
  • 硬件采购流程周期长,不能及时响应业务场景创新需求;新采购的GPU算力资源,都要按照系统需要安装部署、安全加固、定期升级,平台团队工作强度高。

04 GPU池化助力AI OCR技术高效应用

趋动科技致力于为用户提供国际领先的AI算力资源池化解决方案,并将GPU资源池化能力拓展到整个数据中心。

OrionX通过软件定义AI算力,颠覆了原有的AI应用直接调用物理GPU的架构,增加软件层,将AI应用与物理GPU解耦合,通过构建GPU资源池,对资源池中的GPU资源进行统一管理、维护和调配,资源池的大小可以根据系统管理需求而定,比如,可以将数据中心内所有的物理GPU纳入资源池中,也可以将一个GPU服务器作为一个资源池。该架构实现了GPU资源池化,让用户高效、智能、灵活地使用GPU资源,达到了降本增效的目的。

OrionX还支持“隔空取物”功能,即OrionX支持将虚拟机或者容器运行在一台没有物理GPU的服务器上。用户可以通过计算机网络,透明地使用其他服务器上的GPU 资源,且无需修改该虚拟机或者容器内 AI 应用的代码。也是通过这个功能,OrionX 帮助用户实现了数据中心级的 GPU 资源池,实现了AI 应用和 GPU 物理资源的解耦合,AI 应用在一个不满足训练条件的纯 CUP 服务器上,也一样能够快速调集多个 GPU 卡完成训练任务。

05 OrionX创新点及收益

1 改变GPU算力资源使用方式

通过软件定义算力的方式,将传统GPU资源以整卡为单位进行分配,变为以算力1%,显存1MB为基本单位进行资源提供,实现GPU按需分配,整体利用率提升明显。

2 GPU算力资源池化

支持GPU的跨节点调用,AI应用可以部署到数据中心的任意位置,不管所在的节点上有没有GPU。GPU资源供应范围从单个节点扩展到由网络互联起来的整个数据中心,优化管理模式,简化运维操作。

3 GPU资源云化

数据中心内GPU资源按需调用,动态伸缩,用完释放。AI应用可以根据负载需求调用任意大小的GPU,甚至可以聚合多个物理节点的GPU;在容器或虚机创建之后,仍然可以调整虚拟GPU的数量和大小;在AI应用停止的时候,立刻释放GPU资源回到整个GPU资源池,以便于资源高效流转,充分利用。

06 OrionX预期收益

1 提升AI场景效能

通过实现GPU池化,实现让用户共享数据中心内所有服务器上的GPU,大幅提升资源利用率、降低GPU服务器采购成本、机柜密度。AI相关业务人员不必再关心底层资源状况,能够专注于更有价值的业务层面,让应用开发变得更加便捷和简洁。

2 提升AI应用支撑能力

通过GPU资源切分和资源按需分配,AI推理场景下有利于多模型并行,业务运行效率显著提高,在同等AI算力条件下可以支撑数倍业务量的弹性扩展。

3 加速项目周期

GPU资源池化后支持动态秒级分配和回收GPU算力和显存资源,大大提升GPU资源分配效率。同时,AI程序代码无需改动,这可以有效提高项目上线时间。

4 优化GPU算力资源使用方式

通过软件定义算力的方式,将传统GPU资源以整卡为单位进行分配,变为以算力1%,显存1MB为基本单位进行资源提供,实现GPU按需分配,整体利用率提升明显。

5 提升运维管理人效提升

OrionX AI GPU算力资源池化技术提供统一UI管理运维页面。通过管理终端,运维人员可以快速可视化的采集所有GPU服务器和GPU资源的分配情况和运行利用率,且支持定期输出GPU资源池运行报表。资源池化、管理全流程、系统平台级、运维可视化的管理模式,收缩的边界范围,都将加倍提升管理效率。

6 节能减排

归功于OrionX调度引擎的高效轮转,可大幅提升AI应用支撑数量,并由此降低GPU服务器采购成本及相应服务器能源消耗和机房环境能耗成本,减少业务系统总体运营成本,提升投资效能,助力国家2050双碳减排目标实现。

建设AI算力资源池可以更好支持人工智能场景在企业经营数智化升级过程中业务系统创新的敏捷增长,具体表现在提升基础设施利用率、减少设备运行和人员运维的费用、减少重复建设、优化资源配置、提升服务能力等,能有效加速客户在人工智能领域的创新速度!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/53681.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ARM 工业计算机搭载 FUXA 组态软件:开启智能制造新时代

工业自动化已经成为提高生产效率、保证产品质量以及提升企业竞争力的关键因素。而在工业自动化的舞台上,FUXA 组态软件与 ARM 工业计算机的组合正发挥着越来越重要的作用,以其高效稳定、数据可视化、实时监控等优势,在复杂场景应用中展现出卓…

JavaScript第五天(函数,this,严格模式,高阶函数,闭包,递归,正则,ES6)高级

这里写目录标题 JavaScript高级第03天1.函数的定义和调用1.1函数的定义方式1.2函数的调用 2.this2.1函数内部的this指向2.2改变函数内部 this 指向2.2.1 call方法2.2.2 apply方法2.2.3 bind方法2.2.4 call、apply、bind三者的异同 3.严格模式3.1什么是严格模式3.2开启严格模式3…

opencv图像透视处理

引言 在图像处理与计算机视觉领域,透视变换(Perspective Transformation)是一种重要的图像校正技术,它允许我们根据图像中已知的四个点(通常是矩形的四个角)和目标位置的四个点,将图像从一个视…

【鸿蒙开发从0到1 day09】

鸿蒙开发基础-ArkUI基本布局 一 .设计资源-图标库1.阿里矢量图图标库2.HarmonyOS图标库 二.布局属性1.内边距2.外边距3.边框线4.边框圆角 三.背景属性1.背景颜色2.背景图片(1)背景图的缩放(2)背景图的显示位置 四.颜色渐变1.线性渐变2.径向渐变 五.阴影六.可选择链操作符(?)七…

如何更改磁盘卷标名称?

磁盘卷标(Volume Label)是用来标识和管理磁盘驱动器的名称,通常在文件资源管理器中显示。卷标有助于用户快速识别和区分不同的磁盘或分区。 为什么要更改磁盘卷标名称? 磁盘卷标作为磁盘的名字,可以帮助用户更容易地识…

通过C# 裁剪PDF页面

在处理PDF文档时,有时需要精确地裁剪页面以适应特定需求,比如去除广告、背景信息或者仅仅是为了简化文档内容。 本文将指导如何使用免费.NET控件通过C#实现裁剪PDF页面。 免费库 Free Spire.PDF for .NET 支持在 .NET (C#, VB.NET, ASP.NET, .NET Core)…

【特点】浅谈大模型的特点

在人工智能(AI)的发展历程中,大模型无疑是一个重要的里程碑。大模型是指利用海量数据,通过先进的算法和技术,训练得到的具有强大预测和决策能力的模型,这类模型具备了强大的语言理解和生成能力,能够完成各种复杂的自然…

搬运5款冷门但值得下载的PC软件

​ 分享5款冷门但值得下载的Windows软件,个个都很实用,你可能一个都没见过,但是我觉得你用过之后可能就再也离不开了。 1. 图片管理——Picasa ​ Picasa 是一款由谷歌开发的图片管理和编辑软件,能够帮助用户轻松地组织、编辑和…

电子邮件加密软件哪个好用?分享这五款加密工具,防范邮件泄密!2024企业必备!

"密语藏锋刃,安全重于山。" 在数字洪流中,电子邮件是企业沟通的重要桥梁,其安全性不容忽视。 因此,选择一款高效可靠的电子邮件加密软件,是企业保障信息安全的关键。 本文将为您推荐五款2024年企业必备的电…

基于SpringBoot+Vue+MySQL的垃圾分类回收管理系统

系统展示 用户前台界面 管理员后台界面 系统背景 二十一世纪互联网的出现,改变了几千年以来人们的生活,不仅仅是生活物资的丰富,还有精神层次的丰富。在互联网诞生之前,地域位置往往是人们思想上不可跨域的鸿沟,信息的…

Uniapp + Vite + Vue3 + uView + Pinia 实现自定义底部 Tabbar(最新保姆级教程)

Uniapp Vite Vue3 uView Pinia 实现自定义底部 Tabbar(最新保姆级教程) 1、效果展示2、环境准备2.1 新建 uniapp 项目2.2. 安装 uView2.3 安装 pinia 3. 配置环境4. 创建目录结构5、编写 pages.json 页面路由6、编写 tabbar.js 状态数据7、编写 tabb…

软件测试之压力测试

🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 压力测试 压力测试是一种软件测试,用于验证软件应用程序的稳定性和可靠性。压力测试的目标是在极其沉重的负载条件下测量软件的健壮性和错误处理能力&…

日本IT工作内容---一篇梗概

日本IT工作现场是一个充满活力、技术导向且多元化的工作环境。以下是对日本IT工作内容的详细概述: 1. 软件开发(Software Engineering, SE) 主要任务:编写、测试和维护软件,以满足客户需求。这包括使用多种编程语言和…

HCIP--<OSPF2>

目录 一,OSPF的不规则区域 1)远离骨干区域的非骨干区域 2)不连续骨干区域(和上面一样) 二,OSPF数据库表 三。优化OSPF的LSA(缺少LSA的更新量) [1]手工汇总:减少骨干区域的LSA [2]特殊区域&…

编程新纪元:AI如何成为你的编程伙伴

随着人工智能技术的不断进步,我们正步入一个编程的新纪元。在这个时代,AI不仅仅是一个工具,更是程序员的伙伴。它通过提供智能辅助、自动化编码和增强开发效率,正在改变我们编写和理解代码的方式。本文将探讨AI如何成为程序员的得…

【关爱多系统萎缩患者】必知!这些维生素是健康守护神

亲爱的朋友们,今天我们来聊聊一个需要更多社会关爱与理解的群体——多系统萎缩(MSA)患者。面对这一复杂而罕见的疾病,科学合理的饮食调整,尤其是维生素的补充,显得尤为重要。让我们一起成为他们健康路上的温…

深入CSS 布局——WEB开发系列29

CSS 页面布局技术允许我们拾取网页中的元素,并且控制它们相对正常布局流、周边元素、父容器或者主视口/窗口的位置。 一、正常布局流(Normal Flow) CSS的布局基础是“正常流”,也就是页面元素在没有特别指定布局方式时的默认排列…

P5734 【深基6.例6】文字处理软件

1. string的函数 #include <bits/stdc.h> using namespace std; int main() {int n,m; cin >> n;string s, a, b, c;cin >> s;for (int i 0; i < n; i) {cin >> m;if (m 1) {cin >> a;s a;cout << s << endl;}if (m 2) {int …

自然语言处理系列六十三》神经网络算法》LSTM长短期记忆神经网络算法

注&#xff1a;此文章内容均节选自充电了么创始人&#xff0c;CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》&#xff08;人工智能科学与技术丛书&#xff09;【陈敬雷编著】【清华大学出版社】 文章目录 自然语言处理系列六十三神经网络算法》LSTM长短期记忆神经网络算…

Windows一键安装Mysql数据库|非官方复杂安装,解压即可,操作简单

我们都知道在官方安装mysql数据库极其复杂&#xff0c;还极大概率遇到各种问题&#xff0c;今天教大家只要解压就可安装完数据库&#xff0c;操作及其简单绿色。 版本包括了mysql8或mysql5&#xff0c;各位各取所需即可。 不管你之前是否安装过数据库&#xff0c;只要端口330…