“记账”很麻烦,看这场竞赛中的队伍与合合信息是如何解决问题的

在我们日常生活中或多或少都会有记账的情况,以此来对自己的收支和消费习惯进行分析,来帮助自己减少不必要的开支,优化财务决策、合理分配资金,减少财务压力和不必要的浪费。

但记账这个动作本身就是一件比较麻烦的。虽然现阶段有很多APP应用来帮助我们进行记账,不再像原来一样需要手写记录,但还是存在比较多的问题。比如:每记录一笔都要手动点选分类,长期下来很浪费时间。另外,如果想自动记账还得授权支付应用的权限接口给记账程序,这样会对财产造成安全隐患。

刚好,在最近的“中国大学生服务外包创新创业大赛”上就有大学生团队针对记账问题提供了它们的解决方案。

首先,介绍一下什么是中国大学生服务外包创新创业大赛

中国大学生服务外包创新创业大赛是在为了积极响应国家关于鼓励服务外包产业发展、加强服务外包人才培养的相关战略举措与号召而衍生出的全国性竞赛,该赛事自2010年创立以来,成为服务外包产业领域的国家级赛事。尤其在本届大赛上共有803所全国院校的8006支团队报名参赛,报名团队数再创新高!可以说是非常有影响力的一项赛事。

本届大赛的内容设计充分聚焦企业发展中所面临的技术、管理等现实问题,与产业的结合度更紧密,其中智能文字识别技术是大赛重点关注的技术之一。

合合信息作为国内外智能文字识别领域领先的科技企业,基于自身在行业领域的认知,从“基于智能文字场景个人财务管理创新应用”等议题出发,向广大学生群体发出了“产品征集令”,相关赛题吸引了全国70多所高校的近300支队伍积极参与,也涌现出许多优秀的作品。

尤其是中南大学研发的“记账全能王”让我印象深刻,该应用非常有效的解决了现行业现状记账的痛点:

他们团队首先对大量用户调研,分析出绑定支付自动记账和图片识别记账更受欢迎,尤其是在45-60岁的中年用户:

也调研了市面常见的记账类APP,指出了它们现阶段存在的几大问题,尤其是自动记账导致隐私过度收集这一块做了充分的说明:

它们也针对该问题,在APP中提供了通过识别账单图片来录入账单信息的方式进行记账:

这个功能看似很简单,实际难度是很大的!

虽然这个功能核心步骤就两个:票据图片识别、提取信息。

但要做好这两步需要下很大的功夫。首先,票据种类特别多,二是票据本身保存不好的话,会有很多褶皱或者字迹不太清晰的情况,三是因拍摄环境复杂的原因会导致图片反光、明暗不同等呈现质量差的问题。这样就会导致在识别的时候很容易造成识别不准确或识别失败的情况。

他们为了解决票据识别的问题,使用了合合信息提供的智能文字识别服务平台接口来对票据进行识别及预处理,该接口支持识别的票据种类非常多、无论是发票、火车票、金融票据等都能提供精度很高的识别效果:

图片识别出文本后,就需要对其进行预处理,这一步骤通常包括去除标点符号、数字和特殊字符,将文本转换为小写,以及进行分词。他们采用了jieba这个专为中文文本设计的分词工具库进行分词,然后将文本中的词语转换为数值向量,以便计算机能够理解和处理,最后再对图片中的账单信息部分进行文本分类与信息关系抽取,抽取出具体的金额、地点、店铺等信息,也就是命名实体识别(NER)

什么是命名实体识别(NER)呢?

是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等等,并把我们需要识别的词在文本序列中标注出来。

举个例子就很容易理解,比如现在有一段文本:

我和张三昨天去看了蜘蛛侠,感觉还不错,下周还想去看阿凡达,你要跟我们一起吗?

我们要在上面文本中识别出电影名称的信息,那么我们需要识别出来内容则是:蜘蛛侠、阿凡达。

而对于上述提到的账单识别而言,我们则需要把图片包含的文本信息中的账单相关部分提取出来并排除掉与其无关的信息,这就是典型的命名实体识别。

中南大学为了处理这个问题,使用了基于谷歌BERT(Bidirectional Encoder Representations from Transformers)衍生的Bert-Chinese作为预训练模型:

 然后将各种票据类型数据输入到模型中并进行训练。训练完成后再进行微调,运用到下流任务(如账单类别判定)等任务中,最后提取出账单信息,整个的算法步骤流程图如下图所示:

 他们团队所使用的技术路线如下图所示:

我也使用了“记账全能王”app测试了一下,效果也是很不错的:

 识别结果

中南大学团队整体表现在我看来是非常亮眼的,不仅洞悉了“中老年人使用记账本应用需要经历繁琐的操作”现象背后发现“图片识别记账方式更受欢迎”的趋势,并针对性地进行产品优化,还灵活地将合合信息智能图像识别模块与小票识别的API落地到记账场景中,再结合大模型将复杂的小票信息秒速转换成了简洁、高效的数据输入,这是非常难能可贵的。

另外我还认为该类应用具有不错的前景和商业价值,国务院印发的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》《新一代人工智能发展规划》等文件中也提到:人工智能在个人财务管理领域的深入应用,有利于推动个人财务管理数字化,帮助消费者以较低的成本,实现消费的合理安排、财务风险的可靠保障以及钱财的最优跨期配置。在国家大力支持的背景下,该赛道一定具有不错的未来!


在中国信通院进行的测试中,合合信息智能文字识别产品顺利通过全部7项基础类功能指标测试以及9项增强类功能指标测试,获得“增强级”评级,其智能文字识别产品展现出良好的性能和服务成熟度。

以具有较大难度的证件类和票据类性能测试为例,面对旋转、阴影、反光、褶皱、形变、模糊、多语言、低像素、光照不均等复杂场景,合合信息智能文字识别产品均有较高的识别准确率,字符准确率分别为99.21%和99.59%,字段准确率分别为97.87%和98.42%。

其实,中南大学利用合合信息票据识别接口来识别票据的功能只是合合信息众多功能中的一小部分,除此之外合合信息还有很多强大的功能和产品,特别是他们推出的扫描全能王、名片全能王等智能文字识别产品已经服务全球上百个国家和地区的上亿用户。

在去年我也使用过合合科技的PS检测和摩尔纹去除等服务,效果都很不错,特别是PS检测上,这一直是很多行业迫切需要解决的难点,特别是在保险、金融、银行等领域,如果将虚假篡改过的信息资料审核通过可能会带来巨大的影响甚至是经济上的损失:

今年也看到合合信息团队对图像篡改检测“黑科技”持续优化升级,应用面也拓展至“截图篡改检测”:除了原本支持的文档、证书、证件等自然场景图像的识别检测外,还支持转账记录、交易记录、聊天记录等多种截图的识别检测,无论是从原图中“抠下”关键要素后移动“粘贴”至另一处的“复制移动”图片篡改手段,还是“擦除”、“重打印”等方式,图像篡改检测技术均可“慧眼”识假!

不难看出,合合信息的产品不仅质量高且具有十足的多样性,能应用的领域也非常广泛。

通过这次的大赛也可以看到,现代学生的作品不再局限于传统互联网思维下的应用开发,而是逐渐发展为结合人工智能、大模型进行创新、创造新时代的产品,也真正实现了“用新技术解决旧问题”。

还能够感受到的是,现阶段企业对于人才的需求人从单一性变为多样性了,知识面单一的人才显然已经不能满足时代需求,因此交叉学习也越来越重要。

举办该大赛还有一个重要的目的是:促成校企双方在科研项目、人才培养等方面深度合作,助推产学研用协同创新发展。因此,大赛对参赛作品的评分标准也十分“仿真”,涉及技术资源及经济成本控制,对项目创意前景的判断、对市场需求的分析等方面,覆盖商业价值、社会应用价值等多方面的评估。

CharGPT以及其他生成式AI的爆火让我们清晰的感受到未来一定是人工智能的时代,行业也会渴望每一位对专业学术领域有着深刻独到理解,具备构建解决方案潜力的人才。

在大赛的闭幕式上,合合信息人力行政部负责人杜杰介绍了他们公司的人才培养计划:

“企业期望与新一代青年才俊共同开拓科技新场景。在时代进步的每一个阶段,我们都需要不同的新生力量来创造新的可能性。”杜杰表示,现阶段,合合信息通过“星火计划”等系列人才培育计划和配套分享平台,助力科技青年在实践中强化专业能力,未来也将持续联合高校和行业机构,共同探索产学研融合之路,让大学生们创新的科技灵感能够更便捷地寻找沃土里,从而“落地生花”。

相信它们的举措以及大赛的继续开展会持续影响更多的从业者!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/39133.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构入门 — 时间复杂度、空间复杂度

前言 数据结构_空间复杂度_时间复杂度讲解_常见复杂度对比 本文介绍数据结构中的时间复杂度和空间复杂度 ***文章末尾,博主进行了概要总结,可以直接看总结部分*** 博主博客链接:https://blog.csdn.net/m0_74014525 点点关注,后期…

哈夫曼树(赫夫曼树、最优树)详解

目录 哈夫曼树(赫夫曼树、最优树)详解 哈夫曼树相关的几个名词 什么是哈夫曼树 构建哈夫曼树的过程 哈弗曼树中结点结构 构建哈弗曼树的算法实现 哈夫曼树(赫夫曼树、最优树)详解 哈夫曼树相关的几个名词 路径:…

实验三 图像分割与描述

一、实验目的: (1)进一步掌握图像处理工具Matlab,熟悉基于Matlab的图像处理函数。 (2)掌握图像分割方法,熟悉常用图像描述方法。 二、实验原理 1.肤色检测 肤色是人类皮肤重要特征之一&#xff…

7.原 型

7.1原型 【例如】 另外- this指向: 构造函数和原型对象中的this都指向实例化的对象 7.2 constructor属性 每个原型对象里面都有个constructor属性( constructor构造函数) 作用:该属性指向该原型对象的构造函数 使用场景: 如果有多个对象的方法&#…

Springboot 实践(4)swagger-ui 测试controller

前文项目操作,完成了项目的创建、数据源的配置以及数据库DAO程序的生成与配置。此文讲解利用swagger-ui界面,测试生成的数据库DAO程序。目前,项目swagger-ui界面如下: 以”用户管理”为例,简单讲述swagger-ui测试数据库…

无涯教程-Perl - s函数

描述 这不是功能。这是正则表达式替换运算符。根据PATTERN中指定的正则表达式,将数据替换为REPLACE。与m //一样,分隔符由s后的第一个字符定义。 语法 以下是此函数的简单语法- s/PATTERN/REPLACE/返回值 如果失败,此函数返回0,如果成功,则返回替换次数。 例 以下是显示…

【Python机器学习】实验10 支持向量机

文章目录 支持向量机实例1 线性可分的支持向量机1.1 数据读取1.2 准备训练数据1.3 实例化线性支持向量机1.4 可视化分析 实例2 核支持向量机2.1 读取数据集2.2 定义高斯核函数2.3 创建非线性的支持向量机2.4 可视化样本类别 实例3 如何选择最优的C和gamma3.1 读取数据3.2 利用数…

Open3D 最小二乘拟合平面(SVD分解法)

目录 一、算法原理二、代码实现三、结果展示1、点云2、拟合结果四、优秀博客本文由CSDN点云侠原创,原文链接。爬虫网站自重。 一、算法原理 本文实现矩阵奇异值分解方法的最小二乘拟合平面。原理如下: 对于得到的 n n

欧拉函数(质因子分解)

思路: (1)欧拉函数:输入n则输出1~n中与n互质的数的个数。 (2)计算公式: (3)证明:(容斥原理)对于n个数,先分别摘除所有被pi整除的数,…

亿信ABI有什么不同,来看最新DEMO演示

为了给用户营造更好的体验环境,提供更丰富、更完善的服务,亿信华辰旗下核心产品亿信ABI DEMO再次上新啦!本次亿信ABI DEMO环境在原有基础上焕新升级,带来了全新的主视觉界面、丰富的行业应用和功能演示DEMO,我们一起来…

季度到季度的组件选择

组件&#xff1a;<template><div class"quarter"><div class"input-wrap" id"closeId" mouseover"handler" click.stop"btn" :style"{color:colorItem}"><i class"el-icon-date"&…

【Java】BF算法(串模式匹配算法)

☀️ 什么是BF算法 BF算法&#xff0c;即暴力算法&#xff0c;是普通的模式匹配算法&#xff0c;BF算法的思想就是将目标串S的第一个与模式串T的第一个字符串进行匹配&#xff0c;若相等&#xff0c;则继续比较S的第二个字符和T的第二个字符&#xff1b;若不相等&#xff0c;则…

【计算机视觉|生成对抗】用深度卷积生成对抗网络进行无监督表示学习(DCGAN)

本系列博文为深度学习/计算机视觉论文笔记&#xff0c;转载请注明出处 标题&#xff1a;Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks 链接&#xff1a;[1511.06434] Unsupervised Representation Learning with Deep Conv…

腾讯云CVM服务器竞价实例是什么?和按量计费有什么区别?

腾讯云服务器CVM计费模式分为包年包月、按量计费和竞价实例&#xff0c;什么是竞价实例&#xff1f;竞价实例和按量付费相类似&#xff0c;优势是价格更划算&#xff0c;缺点是云服务器实例有被自动释放风险&#xff0c;腾讯云服务器网来详细说下什么是竞价实例&#xff1f;以及…

NLP——操作步骤讲义与实践链接

数据集与语料 语料是NLP的生命之源&#xff0c;所有NLP问题都是从语料中学到数据分布的规律语料的分类&#xff1a;单语料&#xff0c;平行语料&#xff0c;复杂结构 语料的例子&#xff1a;Penn Treebank, Daily Dialog, WMT-1x翻译数据集&#xff0c;中文闲聊数据集&#xf…

大数据:Numpy基础应用详解

Numpy基础应用 Numpy 是一个开源的 Python 科学计算库&#xff0c;用于快速处理任意维度的数组。Numpy 支持常见的数组和矩阵操作&#xff0c;对于同样的数值计算任务&#xff0c;使用 NumPy 不仅代码要简洁的多&#xff0c;而且 NumPy 的性能远远优于原生 Python&#xff0c;…

mysql-5.5.62-win32安装与使用

1.为啥是这个版本而不是当前最新的8.0&#xff1f; 因为我要用32位。目前mysql支持win32的版本最新只到5.7.33。 首先&#xff0c;到官网MySQL :: MySQL Downloads 然后选 选一个自己喜欢的版本就好。我这里是如标题版本。下载32位的zip。然后回来解压。 完了创建系统环境变…

项目实施方案案例模板-拿来即用

《项目实施方案》实际案例模板&#xff0c;拿来即用&#xff0c;原件可获取。 项目背景 项目目标 项目范围 项目总体计划 项目组织架构 5.1. 项目职责分工 项目风险点 6.1. 项目风险分析 6.2. 项目实施关键点 项目管理规范 7.1. 项目实施约束 7.2. 项目变更冻结 7…

(三) CUDA 硬件实现

一组带有on-chip 共享内存的SIMD多处理器 GPU可以被看作一组多处理器, 每个多处理器使用单一指令&#xff0c;多数据架构(SIMD)【单指令流多数据流】 在任何给定的时钟周期内&#xff0c;多处理器的每个处理器执行同一指令&#xff0c;但操作不同的数据 每个多处理器使用以下…

HASH索引,AVL树,B树,B+树的区别?

1. 什么是 Hash 1.1 Hash 函数 Hash 本身其实是一个函数&#xff0c;又被称为散列函数&#xff0c;它可以大幅提高我们对数据的检索效率。因为它是散列的&#xff0c;所以在存储数据的时候&#xff0c;它也是无序的。 Hash 算法是通过某种确定性的算法(例如MD5&#xff0c;S…