一、前言
众所周知,随着互联网和人工智能的发展,我们非常多的场景需要用到智能“识别”功能,比如人脸识别、通用文字识别、表格识别、办公文档识别、身份证、名片、营业执照等国内外卡证文字识别等等,同时识别与理解面临的全球性技术难题,看不清、看不准、认不全、难理解,那目前市场上有没有一款最好的智能识别云服务端平台产品呢?当然有,它就是 合合信息TextIn
二、合合信息TextIn简介
1、官.网地址:https://www.textin.com/
合合信息TextIn是上海合合信息科技股份有限公司旗下智能文字识别云服务平台,专注文字识别领域16年,对企业、开发者、个人用户提供智能文字识别引擎、产品、云端服务。
2、 丰富的识别类型
通用文字、表格、印章等识别
通过领先的深度学习技术,对各种表格,图片,文档、证件、面单等多种通用场景进行快速、精准的检测和识别,支持简体中文/繁体中文/英文/数字/西欧主流语言/东欧主流语言等共52种语言,同时支持印刷体、手写体、倾斜、折叠、旋转。
大家可以通过这个地址来体验:https://www.textin.com/experience/text_recognize_3d1
卡证文字识别
我先用我自己的身份.证来测试(https://www.textin.com/experience/id_card),非常精致,简直就是yyds
然后我们来识别下自己的银行卡(https://www.textin.com/experience/bank_card),非常快,非常精致。
企业证照识别
然后我们来识别下营业执照https://www.textin.com/experience/business_license
各种票据识别
我们点击这个地址https://www.textin.com/experience/vat_invoice
我们只需要上传票据图片,然后里面的文字能非常开始识别出来,非常丝滑,非常精准、快。
各种状态的车牌识别
我们点击这个地址https://www.textin.com/experience/plate_number进行上传图片识别,精准
更多识别类型,欢迎大家到官.网体验 https://www.textin.com/
三、多家识别产品体验对比
1、与某观进行对比
进入官.网,我们点击使用,首先提示需要登录,而且还没有注册的地方,莫名其妙,体验非常不好,而且还需要申请,我申请后,点击在线体验,还是提示要登录,问题是我账号哪里来?页面也返回不了,直接果断放弃了。
2、和鹅厂识别官.网对比
点击本地文件识别,还需要登录,体验非常不好,还需要实名认证等等。
然后我们放进去一张本地图片,好像很多文字识别不出来,不是那么精准,速度一般。
3、我们使用合合信息TextIn来识别
TextIn可以看出非常精准,连 “限时秒杀2“都能识别出来,速度非常快,
4、识别弯曲的书本文字来对比分析
然后我们对比下鹅厂和TextIn分别识别弯曲的书本文字,图片如下
我们看下鹅厂的识别效果,我们可以看到弯曲的地方,“通”字识别成了“看”,有一定的错误率,而且识别时间比较长。
我们看下合合信息TextIn的效果,“通”字完美的识别出来了,基本上文字都对了,是不是非常神奇。
合合信息TextIn为什么识别这个弯曲图片文字这里这么精准呢?是因为使用文档图像质量增强:图像矫正+去摩尔纹技术,最大极限的识别文字,简直就是yyds.
5、我们对比识别下包含文字和英文的图片
我们利用TextIn来识别下面的图片,效果如下,时间上大约不到1秒。
利用鹅厂的来识别效果如下,但是时间画得比较久,大概花了3秒左右,而且第一行“white白色”,之间还有空格,但是这里识别是挨在一起的,识别格式不精准。
6、结果对比
TextIn的在识别弯曲书本文字上比鹅厂正确率高,基本上都能准确快速识别出来,鹅厂的识别正确率不是那么高,而且还非常慢,说明 TextIn在识别上更胜一筹,通过识别包含中文和英文的图片,TextIn在识别时间上更加快速精准,而且格式不会搞错,所以强烈推荐给大家使用。
那么TextIn还解决哪些痛点问题,是其它商品不具备的呢?
- 解决了场景及版式多样性问题
- 解决了采集设备不确定性问题
- 解决了用户需求多样性问题
- 解决了文档图像质量退化严重问题
- 解决了文字检测及版面分析困难问题
- 解决了非限定条件文字识别率低问题
- 解决了结构化智能理解能力差问题
那这些强大的功能又是基于啥技术来实现的呢?我们可以接着往下看。
四、TextIn的主要核心技术
1、图像处理技术
- 切边增强
切边后图像带来的收益,更好的展示(美观度),提升下游任务(OCR识别,信息抽取等)的准确率,一般用于票据识别,会议拍摄PPT。
- 弯曲矫正
我们识别的时候,有些图片会有形变类型,比如:弯曲、折叠、皱、透视、混合弯折...
我们采用弯曲矫正技术,可以更好的展示,提升下游任务(OCR识别,版面分析/还原等)的准确率,
主要用在
- 基于偏移场学习的方法
- 文档矫正系统Pipeline
- 摩尔纹去除系统Pipeline
消除屏幕纹对画质的干扰提高图像、文字清晰度
部分技术效果如下
2、文档理解核心技术
- 数据知识双驱动文本图像智能理解
提出了基于数据及知识双驱动的端到端文本图像识别及结构化理解新方法
- 通用NLP抽取(https://www.textin.com/market/detail/contents-extract)
基于自研NLP信息抽取技术,无需配置与训练,可对单页/多页、任意版式文档,智能分析与提取客户自定义关键信息。推荐使用场景:各种证件、票据、非标文档以及合同/标书/保单/网页截图等各类电子文档
- TextIn Studio 训练平台SAAS版(https://global.textin.com/)
可用于国内外卡证、票据、单据、企业内部文档等各种固定和不固定版式文档的结构化信息提取。基于NLP技术,依托多模态高性能预训练模型,利用少量样本可快速产出高可用性的信息抽取模型。
五、总结
合合信息TextIn(https://www.textin.com/) 主要采用了图像处理里面的切边增强、曲面矫正、去摩尔纹、PS检测等技术,同时在文档理解上,采用了版面分析与信息提取、训练平台TextIn Studio
等等核心技术,解决了识别场景及版式多样性、用户需求多样性、采集设备不确定性、文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差问题,在识别弯曲图片文字上正确率非常高,简直就是yyds,强烈推荐给大家使用。