智能识别云服务端平台之神【合合信息TextIn】

 一、前言

          众所周知,随着互联网和人工智能的发展,我们非常多的场景需要用到智能“识别”功能,比如人脸识别、通用文字识别、表格识别、办公文档识别、身份证、名片、营业执照等国内外卡证文字识别等等,同时识别与理解面临的全球性技术难题,看不清、看不准、认不全、难理解,那目前市场上有没有一款最好的智能识别云服务端平台产品呢?当然有,它就是 合合信息TextIn

二、合合信息TextIn简介

1、官.网地址:https://www.textin.com/

合合信息TextIn是上海合合信息科技股份有限公司旗下智能文字识别云服务平台,专注文字识别领域16年,对企业、开发者、个人用户提供智能文字识别引擎、产品、云端服务。

2 丰富的识别类型

通用文字、表格、印章等识别

     通过领先的深度学习技术,对各种表格,图片,文档、证件、面单等多种通用场景进行快速、精准的检测和识别,支持简体中文/繁体中文/英文/数字/西欧主流语言/东欧主流语言等共52种语言,同时支持印刷体、手写体、倾斜、折叠、旋转。

     大家可以通过这个地址来体验:https://www.textin.com/experience/text_recognize_3d1

卡证文字识别

      我先用我自己的身份.证来测试(https://www.textin.com/experience/id_card),非常精致,简直就是yyds

     然后我们来识别下自己的银行卡(https://www.textin.com/experience/bank_card),非常快,非常精致。

 

企业证照识别

然后我们来识别下营业执照https://www.textin.com/experience/business_license

各种票据识别

我们点击这个地址https://www.textin.com/experience/vat_invoice

我们只需要上传票据图片,然后里面的文字能非常开始识别出来,非常丝滑,非常精准、快。

各种状态的车牌识别

我们点击这个地址https://www.textin.com/experience/plate_number进行上传图片识别,精准

更多识别类型,欢迎大家到官.网体验 https://www.textin.com/

三、多家识别产品体验对比

 1、与某观进行对比

        进入官.网,我们点击使用,首先提示需要登录,而且还没有注册的地方,莫名其妙,体验非常不好,而且还需要申请,我申请后,点击在线体验,还是提示要登录,问题是我账号哪里来?页面也返回不了,直接果断放弃了。

 2、和鹅厂识别官.网对比

      点击本地文件识别,还需要登录,体验非常不好,还需要实名认证等等。

然后我们放进去一张本地图片,好像很多文字识别不出来,不是那么精准,速度一般。

3、我们使用合合信息TextIn来识别

TextIn可以看出非常精准,连 “限时秒杀2“都能识别出来,速度非常快,

4、识别弯曲的书本文字来对比分析

     然后我们对比下鹅厂和TextIn分别识别弯曲的书本文字,图片如下

 

我们看下鹅厂的识别效果,我们可以看到弯曲的地方,“通”字识别成了“看”,有一定的错误率,而且识别时间比较长。

​​​​​​​

 

我们看下合合信息TextIn的效果,“通”字完美的识别出来了,基本上文字都对了,是不是非常神奇。

​​​​​​​

 

合合信息TextIn为什么识别这个弯曲图片文字这里这么精准呢?是因为使用文档图像质量增强:图像矫正+去摩尔纹技术,最大极限的识别文字,简直就是yyds.

5、我们对比识别下包含文字和英文的图片

  我们利用TextIn来识别下面的图片,效果如下,时间上大约不到1秒。

利用鹅厂的来识别效果如下,但是时间画得比较久,大概花了3秒左右,而且第一行“white白色”,之间还有空格,但是这里识别是挨在一起的,识别格式不精准。

6、结果对比

 TextIn的在识别弯曲书本文字上比鹅厂正确率高,基本上都能准确快速识别出来,鹅厂的识别正确率不是那么高,而且还非常慢,说明 TextIn在识别上更胜一筹,通过识别包含中文和英文的图片,TextIn在识别时间上更加快速精准,而且格式不会搞错,所以强烈推荐给大家使用。

那么TextIn还解决哪些痛点问题,是其它商品不具备的呢?

  • 解决了场景及版式多样性问题
  • 解决了采集设备不确定性问题
  • 解决了用户需求多样性问题
  • 解决了文档图像质量退化严重问题
  • 解决了文字检测及版面分析困难问题
  • 解决了非限定条件文字识别率低问题
  • 解决了结构化智能理解能力差问题

那这些强大的功能又是基于啥技术来实现的呢?我们可以接着往下看。

四、TextIn的主要核心技术

1、图像处理技术

  • 切边增强

       切边后图像带来的收益,更好的展示(美观度),提升下游任务(OCR识别,信息抽取等)的准确率,一般用于票据识别,会议拍摄PPT。

  • 弯曲矫正

     我们识别的时候,有些图片会有形变类型,比如:弯曲、折叠、皱、透视、混合弯折...

我们采用弯曲矫正技术,可以更好的展示,提升下游任务(OCR识别,版面分析/还原等)的准确率,

主要用在

  • 基于偏移场学习的方法

  • 文档矫正系统Pipeline

  • 摩尔纹去除系统Pipeline
    消除屏幕纹对画质的干扰提高图像、文字清晰度
     

部分技术效果如下

2、文档理解核心技术

  • 数据知识双驱动文本图像智能理解

    提出了基于数据及知识双驱动的端到端文本图像识别及结构化理解新方法

  • 通用NLP抽取(https://www.textin.com/market/detail/contents-extract

     基于自研NLP信息抽取技术,无需配置与训练,可对单页/多页、任意版式文档,智能分析与提取客户自定义关键信息。推荐使用场景:各种证件、票据、非标文档以及合同/标书/保单/网页截图等各类电子文档

  • TextIn Studio 训练平台SAAS版(https://global.textin.com/

      可用于国内外卡证、票据、单据、企业内部文档等各种固定和不固定版式文档的结构化信息提取。基于NLP技术,依托多模态高性能预训练模型,利用少量样本可快速产出高可用性的信息抽取模型。

   

五、总结

        合合信息TextIn(https://www.textin.com/ 主要采用了图像处理里面的切边增强、曲面矫正、去摩尔纹、PS检测等技术,同时在文档理解上,采用了版面分析与信息提取、训练平台TextIn Studio
等等核心技术,解决了识别场景及版式多样性、用户需求多样性、采集设备不确定性、文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差问题,在识别弯曲图片文字上正确率非常高,简直就是yyds,强烈推荐给大家使用。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/284883.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【ArcGIS微课1000例】0015:ArcGIS如何创建/自定义快捷键?

为了提高工作效率,强大的ArcGIS提供了很多快捷键,如访问 ArcMap 菜单命令、窗口操纵、刷新或暂停地图绘制、通过拖放进行移动或复制等等。本文在ArcGIS已有快捷键的基础之上,为了提高工作效率,讲解如何定制个性化的快捷键。 参考阅读:【ArcGIS风暴】ArcGIS快捷键大全 文章…

Bresenham 算法

1965 年,Bresenham 为数字绘图仪开发了一种绘制直线的算法,该算法同样使用于光栅扫描显示器,被称为 Bresenham 算法。 原理 算法的目标是选择表示直线的最佳光栅位置。Bresenhan 算法在主位移方向上每次递增一个单位。另一个方向的增量为 0…

ML.NET 更新

点击上方蓝字关注我们(本文阅读时间:5分钟)ML.NET是一款面向.NET开发人员的开源,跨平台机器学习框架,可以将自定义机器学习集成到.NET应用中。我们很开心地向您介绍我们在过去几个月中所做的工作。ML.NET:https://dotnet.microsof…

Andriod之提示java.lang.SecurityException: getDataNetworkTypeForSubscriber导致程序奔溃

1、问题 修改targetSdkVersion 33 适配Android13后4G网络环境被其它app拉起来提示这个异常 2、原因 我们定位到代码在这行函数 telephonyManager.getNetworkType()Android11 的权限有关,由于缺少该权限导致无法访问接口而提示安全异常 3、解决办法 方法1:我们直接申请RE…

[译]基于GPU的体渲染高级技术之raycasting算法

[译]基于GPU的体渲染高级技术之raycasting算法 PS:我决定翻译一下《Advanced Illumination Techniques for GPU-Based Volume Raycasting》。像我翻译其他资料一样,只按我的需要和观点来翻译。有的部分详细翻译,附加注解,有的部分…

【GIS风暴】什么是地理空间智能(Geospatial AI)?

人工智能(Artificial Intelligence,AI)已经成为新技术革命下一阶段的热词,也成为未来产业的驱动力量。使用智能算法,数据分类和智能预测、分析,AI在很多领域将有一系列的工具来帮助解决问题。 将AI用于GIS这一具体的领域的分析、方法和解决方案,就叫地理空间智能(Geos…

JavaScript 清除图片背景颜色 使之透明

主要JS /**清除图片背景颜色 **/ function removeImgBg(img) {//背景颜色 白色const rgba [255, 255, 255, 255];// 容差大小const tolerance 60;var imgData null;const [r0, g0, b0, a0] rgba;var r, g, b, a;const canvas document.createElement(canvas);const cont…

day01基础部分

一、python是什么样的语言 1、编译型语言和解释型语言,python是解释型语言 1.1、编译型语言就是把源程序代码一次性翻译成机器码(计算机可识别的代码),然后交给计算机去运行,一般需经过编译(compile&#x…

WPF 制作 Windows 屏保

分享如何使用WPF 制作 Windows 屏保WPF 制作 Windows 屏保作者:驚鏵原文链接:https://github.com/yanjinhuagood/ScreenSaver框架使用.NET452;Visual Studio 2019;项目使用 MIT 开源许可协议;更多效果可以通过GitHub[1]|码云[2]下…

Windows 7 下右键发送到菜单项没了

为什么80%的码农都做不了架构师?>>> 问题描述: 突然有一天,Windows 7 下右键发送到菜单项没了,如图所示: 问题原因 黑人问号脸? 转载于:https://my.oschina.net/taadis/blog/1591398

【ArcGIS微课1000例】0016:ArcGIS书签操作(添加书签、管理书签)知多少?

书签可以将地图数据的某一视图状态保存起来,以便在使用时打开书签,直接回到这一视图状态。可创建多个书签以便快速回到不同的视图状态,也可以对书签进行管理。 文章目录 1 创建书签2 管理书签注意:书签只针对空间数据,在【布局视图】中是不能创建书签的。 1 创建书签 可…

分享一个WPF 实现 Windows 软件快捷小工具

分享一个WPF 实现 Windows 软件快捷小工具Windows 软件快捷小工具作者:WPFDevelopersOrg原文链接:https://github.com/WPFDevelopersOrg/SoftwareHelper框架使用.NET40;Visual Studio 2019;项目使用 MIT 开源许可协议;项目使用 MV…

学习环境配置:Manjaro、MSYS2以及常见软件

0.前言 在说Manjaro之前,要先说一下Linux发行版。对于各大发行版而言,内核只有版本的差异,最重要的区别就是包管理系统。常见的包管理系统包括:Pacman,Apt , Yum和Portage。在学习Linux的过程中,和大数人一…

【ArcGIS微课1000例】0017:ArcGIS测量距离和面积工具的巧妙使用

文章目录 1 交互式测量2 测量要素ArcGIS提供了快速测量距离和面积的工具,通过测量工具可对地图中的线和面进行测量。 工具条: 测量工具位于【工具】工具条上,如下图所示: 测量界面: 功能按钮简介: 可使用此工具在地图上绘制一条线或者一个面,然后获取线的长度与面的面…

[转]HTTP/3 未来可期?

2015 年 HTTP/2 标准发表后,大多数主流浏览器也于当年年底支持该标准。此后,凭借着多路复用、头部压缩、服务器推送等优势,HTTP/2 得到了越来越多开发者的青睐,不知不觉的 HTTP 已经发展到了第三代。本文基于兴趣部落接入 HTTP/3 …

【ArcGIS微课1000例】0018:ArcGIS设置相对路径和数据源

文章目录 ArcGIS设置相对路径ArcGIS设置数据源ArcGIS设置相对路径 菜鸟们在使用ArcGIS时经常会碰到将地图文档(.mxd)拷贝到别的电脑上或改变一个路径时,出现数据丢失的现象,具体表现为图层前面出现一个红色的感叹号,如下图所示。 出现以上问题的根本原因是数据GSS.tif的原…

AI 之 OpenCvSharp 安卓手机摄像头识别人脸

OpenCvSharp是OpenCv的包装器,相当于底层是OpenCv只是用.Net的方式调用底层的接口的实现,所以,从OpenCv的知识架构来讲,源码是一样一样的。就是换个语言写而已。1. OpenCvSharp 尽可能地以原生 OpenCV C/C API 风格为蓝本。2. Ope…

iVX低代码平台系列制作APP简单的个人界面

一、前言 我们知道,目前市场上开发app或者小程序这些应用,都离不开一个个人界面,就是类似下面的这种界面,我们可以利用iVX低代码平台来开发,简单快速,如果还有不知道iVX低代码平台是啥的,猛戳这…

[转]【高并发】高并发秒杀系统架构解密,不是所有的秒杀都是秒杀!

前言 很多小伙伴反馈说,高并发专题学了那么久,但是,在真正做项目时,仍然不知道如何下手处理高并发业务场景!甚至很多小伙伴仍然停留在只是简单的提供接口(CRUD)阶段,不知道学习的并发…

【ArcGIS微课1000例】0019:什么是Shapefile文件?Shapefile文件之全解

文章目录 Shapefile文件组成Shapefile文件创建Shapefile文件大小限制Shapefile文件注意事项ESRI Shapefile(shp),或简称shapefile,是美国环境系统研究所公司(ESRI)开发的一种空间数据开放格式。该文件格式已经成为了地理信息软件界的一个开放标准,这表明ESRI公司在全球的…