第十四届中国大学生服务外包大赛细品,上百支队伍与合合信息用AI共克“记账”难题

前言

熟悉我的小伙伴应该知道我在大学时期参与了很多竞赛,我向来对比赛是比较热枕的,以我个人观点,我认为可以通过竞赛激发学习激情和检验自己的技能水平掌握情况,大学生很少有机会能够了解到课堂之外市场的需求,外包服务竞赛就是一个很好的机会能够帮助大学生接触到市场需要何种服务以及人才需求,而且大学的很多比赛都可以积累自己的操行分,拿到一个好的名次收获颇多,可以说学业事业一箭双雕。正好这次第十四届中国大学生服务外包大赛圆满落幕,在我的大学竞赛生涯中曾也参见过此类比赛且获得过金奖,正好借此次机与大家一起细品中国大学生服务外包大赛。

比赛背景

中国大学生服务外包创新创业大赛(以下简称“大赛”),是响应国家关于鼓励服务外包产业发展、加强服务外包人才培养的相关战略举措与号召,举办的每年一届的全国性竞赛。服务外包是指将某些业务或工作过程外包给其他机构或公司来完成,在一定程度上降低企业的成本和提高效率。获得服务外包的比赛奖项,可以证明获奖者在团队合作、项目管理、沟通协调等方面具备较强的能力和经验,这对于未来就业和个人职业发展都是有帮助的。而且此类比赛一般来说在各大高校都是有保研加分的,自然关注的人比较多。

大赛自2010年创立以来,累计吸引了1600余所院校、50余万名大学生参加,成为服务外包产业领域的国家级赛事。本届大赛共有803所全国院校的8006支团队报名参赛,报名团队数再创新高。而且随着技术的不断迭代,市场需求也再不断更迭,大赛的竞赛主题也响应着时代的发展而诞生了很多贴切前沿技术主题的问题。比如就最近比较火热的AI大模型运用,这次大赛就很好的结合了当今热点技术话题,启发了更多参与比赛的大学生思考。

本次竞赛内容设计充分聚焦企业发展中所面临的技术、管理等现实问题,与产业的结合度更紧密,智能文字识别技术是大赛重点关注的技术之一。智能文字识别技术融合了智能图像处理、光学字符识别、深度学习、自然语言处理等技术,可在多语言、多版式、曲面、褶皱、背景干扰等复杂场景下进行文字信息的识别分析与理解,在生产、教育、生活等多个领域中有着广泛的应用。

合合信息在智能文字识别领域有着十余年深耕经验,基于自身在行业领域的认知,从“基于智能文字场景个人财务管理创新应用”等议题出发,向广大学生群体发出了“产品征集令”,得到了积极的反馈,相关赛题吸引了包括重庆大学、北京邮电大学、哈尔滨工业大学、华东理工大学、四川大学、西北大学等全国70多所高校的近300支队伍积极参与,也涌现出许多优秀的作品。

参赛作品评析

本次大赛中,诸多高校参赛队伍很好地洞悉了不同用户群体的痛点,例如从“中老年人使用记账本应用需要经历繁琐的操作”现象背后发现“图片识别记账方式更受欢迎”的趋势,并针对性地进行产品开发优化。

以中南大学的作品记账全能王—基于图像预处理和BERT模型的OCR账单识别系统项目为例。

 项目设计方向

针对此需求,中南大学很好的理解了项目开发的疑难点。首先此类应用面对的是中老年人,那么开发左眼皮应该是适应中老年人的安卓手机APK比较合适。此外不需要设计更多繁杂的功能,只适合记账使用,应用应该操作简单明了,要容易快速上手,不要设计太多复杂的过程最好。传统记账一般都是手动输入或者是其他应用辅助进账,比较麻烦。而本次比赛借助合合信息智能图像识别模块可以快速进行小票识别,直接按照模版读取到对应框架内容中。因此如何结合智能图像识别模块以及设计对应简洁、高效的数据输入财务管理工具是项目的主要难题。

中南大学的作品采取的是SpringCloud微服务架构,Spring Cloud可以帮助开发者实现微服务架构的快速搭建和部署,提高系统的可扩展性和弹性。对于比赛快速开发服务来说,选择此架构没有一点问题,而如何进行图像识别以及识别准确率技术要求是比较大的难点。能够支持识别外卖账单、超市小票、手账、证券、支付宝微信消费截图等,且准确率较高的技术栈来说,OCR识别是一种不错的技术,此外还应训练出符合记账文本对应的分类模型以及信息抽取标注模型。以上技术难点中南大学都有考虑到且做出了比较规范的处理,比如Python的jieba分词库以及文本转换技术Word2Vec,信息抽取与关系抽取则是考虑到了序列标注模型(BiLSTM-CRF)。以上技术都较为成熟,使用起来不会有太大问题,适合快速开发。且作品还考虑到了企业端,另做能够获取消费者的消费习惯,投放广告,提高账单识别的技术框架,比较全面。

此外如有根据已存有历史数据能够自动生成历史账单画像,或者是能够结合AI大模型自动对账号数据进行评估或许能够完成的更加全面。尽管如此此作品完成程度已经足够高,简单高效最贴切竞赛主题。

 开发方向

中南大学的作品代码开发方向十分清晰。前端使用Flutter框架,Flutter采用自绘引擎,具有出色的性能和渲染效果。通过使用丰富的小部件库,开发者可以轻松创建精美的用户界面,并实现高度的自定义。这使得Flutter在设计感强烈的应用程序、品牌应用以及注重用户体验的项目中具备竞争力。开发模式采取前后端分离的模式,在这种模式下,前端和后端可以独立开发,互不干扰,相互配合,最终组合成一个完整的应用程序,提高了开发效率,提高了系统的可维护性和可扩展性,前后端交互简单明了,易于调试和测试。

中南大学作品记账全能王—基于图像预处理和BERT模型的OCR账单识别系统不仅解决了市场上存在财务小票记账的痛点,也灵活地将合合信息智能图像识别模块与小票识别的API落地财务管理场景,将复杂的小票信息秒速转换成了简洁、高效的数据输入,构建了一个多场景下的财务管理工具,让用户在不同场景中都能轻松地进行记账和财务管理。

可以毫不夸张地说,BERT已经对自然语言处理进行了显著的变革。比如使用一个在大型无标号数据集上训练的模型,在11个独立的自然语言处理任务中取得佳绩。只需稍加微调就能实现。BERT引发了许多新的自然语言处理体系结构、训练方法以及语言模型,如Google TransformerXL、OpenAI的GPT-2、XLNeT、ERNIE2.0、RoBERTa等。自然语言处理的最大挑战之一是缺乏训练数据。因为自然语言处理是一个具有许多不同任务的多样化领域,大多数任务专用的数据集只包含几千或几十万个人工标记的培训示例。因此能够支撑起庞大的数据集是大模型结合其他领域的关键,运行BERT是一项GPU密集型任务,需要大量的算力资源支持。

 

谈到图像处理技术就不得不谈一下OCR技术了。随着技术的不断发展,OCR技术在工业界中的应用也从最开始的简单的光学字符识别拓展到涵盖图像预处理、文字识别、版面分析、文档理解等多项技术的智能文档处理领域。文档处理与人工智能的结合,可以实现对大量文档的自动化处理和分析,提高工作效率和准确性,降低人力成本和时间成本,对于企业的知识管理和业务分析具有重要的意义。合合信息依托自研的智能文字识别服务平台,在解决工业界中面临的各类问题中所做一些相关工作进展和研究成果,并探讨当前工业界中面临的一些关键技术难题和挑战。相信合合信息在模式识别、深度学习、图像处理、自然语言处理等领域的深耕厚积薄发,用技术方案惠及更多的人。

 

合合信息智能文档处理技术采用精准的图像裁剪、形变矫正以及去除阴影和摩尔纹等技术,利用人工智能技术对文档图像进行增强和清晰度提升,从而提高文档图像的质量和阅读体验。通过这种方法,可以有效提升文档处理下游任务的质量和效率,例如识别转换和图像分析等。目前,该技术已经被应用于智能文字识别产品,为来自全球上百个国家和地区的数亿用户提供了服务。

 

文档处理与人工智能的结合,可以实现对大量文档的自动化处理和分析,提高工作效率和准确性,降低人力成本和时间成本,对于企业的知识管理和业务分析具有重要的意义。 此外,未来的图文智能处理技术也将会更加可定制化,根据不同的行业和应用场景,为客户提供量身定制的解决方案。这将有助于满足客户的不同需求,提升客户的体验和满意度。

比赛发展

 

从技术创新的视角来看,参赛队伍展现出了深刻的思考。他们将先进的大模型技术与智能文档处理领域的实际需求相融合。通过将文本识别和文本理解技术应用于大量的消费票据,他们成功地实现了有效的分类。这项创新使得财务结算过程从过去的繁琐手动操作变为高度自动化的流程。这一实践充分展示了他们运用新技术来解决传统难题的能力。

 

据大数据统计,现在有百分之七十以上的大学生毕业后所从事的职业与本科专业无关。这就表示,大学生走出大学校门时,迎接他们的可能是一个完全陌生的领域,如果不想被淘汰,就必须不断充实提高自己的知识储备。由此可见,建立多元化的人才培养机制非常重要。当前,科技的创新、突破与发展越来越依赖于多学科的交叉、融合,这就对复合型人才的培养提出了更高的要求。大赛对参赛作品的评分标准也十分“仿真”,涉及技术资源及经济成本控制,对项目创意前景的判断、对市场需求的分析等方面,覆盖商业价值、社会应用价值等多方面的评估。

在这个人工智能时代,科技企业在应用场景中扮演着关键角色,并在人才培养方面发挥着重要作用。未来,各行各业都渴望拥有那些对专业学术领域有深刻理解、具备解决问题潜力的人才,特别是在不断发展的人工智能领域。在这一背景下,大赛为学生提供了一个卓越的科技领域展示平台。

科技企业通过参与这样的活动,不仅能够挖掘潜在的人才,还能够与学术界建立更紧密的联系,共同推动技术的发展和创新。总之,这种校企合作在人才培养和行业发展方面取得了显著成就,为未来的科技进步奠定了坚实基础。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/40857.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

P1123 取数游戏

取数游戏 题目描述 一个 N M N\times M NM 的由非负整数构成的数字矩阵,你需要在其中取出若干个数字,使得取出的任意两个数字不相邻(若一个数字在另外一个数字相邻 8 8 8 个格子中的一个即认为这两个数字相邻),求…

EXCEL按列查找,最终返回该列所需查询序列所对应的值,VLOOKUP函数

EXCEL按列查找,最终返回该列所需查询序列所对应的值 示例:国标行业分类汉字,匹配id 使用VLOOKUP函数 第一参数:拿去查询的值。 第二参数:匹配的数据。 Ps:Sheet1!$C 21 : 21: 21:E 117 ,需要…

Redis系列(三):深入解读Redis主从同步机制

首发博客地址 https://blog.zysicyj.top/ Redis高可靠靠什么保证? 为什么要提这个呢,因为Redis主从库目的呢其实就是为了实现高可靠。上篇文章中我们说过Redis的AOF、RDB日志其实就是为了减少数据丢失,这是高可靠的一部分。 这篇文章呢&#…

Lua 位和字节

一、位运算 从 Lua 5.3 版本开始&#xff0c;提供了针对数值类型的一组标准位运算符&#xff0c;与算数运算符不同的是&#xff0c;运算符只能用于整型数。 运算符描述&按位与|按位或&#xff5e;按位异或>>逻辑右移<<逻辑左移&#xff5e;&#xff08;一元运…

Git 如何使用TortoiseGit 操作本地仓库

初始化仓库 方法一: 新建一个文件夹,进入文件夹内部操作 1、右键--> 在这里创建Git 版本库 注意: 不要直接在桌面上操作,否则桌面就是一个仓库 方法二: 1、右键-->Git GUI here 方法三: 命令行模式 1、 git init 创建完毕仓库,我们发现,此时我们创建的文件夹下…

leetcode做题笔记83删除排序链表中的重复元素

给定一个已排序的链表的头 head &#xff0c; 删除所有重复的元素&#xff0c;使每个元素只出现一次 。返回 已排序的链表 。 输入&#xff1a;head [1,1,2] 输出&#xff1a;[1,2] 思路一&#xff1a;模拟题意 struct ListNode* deleteDuplicates(struct ListNode* head){i…

FreeRTOS qemu mps2-an385 bsp 移植制作 :系统运行篇

相关文章 FreeRTOS qemu mps2-an385 bsp 移植制作 &#xff1a;环境搭建篇 FreeRTOS qemu mps2-an385 bsp 移植制作 &#xff1a;系统启动篇 开发环境 Win10 64位 VS Code&#xff0c;ssh 远程连接 ubuntu VMware Workstation Pro 16 Ubuntu 20.04 FreeRTOSv202212.01&a…

React 全栈体系(二)

第二章 React面向组件编程 一、基本理解和使用 1. 使用React开发者工具调试 2. 效果 2.1 函数式组件 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>1_函数式组件</title> </head> &l…

计算机竞赛 python 爬虫与协同过滤的新闻推荐系统

1 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; python 爬虫与协同过滤的新闻推荐系统 &#x1f947;学长这里给一个题目综合评分(每项满分5分) 难度系数&#xff1a;3分工作量&#xff1a;3分创新点&#xff1a;4分 该项目较为新颖&…

软件压力测试对软件产品起到什么作用?

一、软件压力测试是什么? 软件压力测试是一种通过模拟正常使用环境中可能出现的大量用户和大数据量的情况&#xff0c;来评估软件系统在压力下的稳定性和性能表现的测试方法。在软件开发过程中&#xff0c;经常会遇到一些性能瓶颈和稳定性问题&#xff0c;而软件压力测试的作…

C语言刷题指南(一)

&#x1f4d9;作者简介&#xff1a; 清水加冰&#xff0c;目前大二在读&#xff0c;正在学习C/C、Python、操作系统、数据库等。 &#x1f4d8;相关专栏&#xff1a;C语言初阶、C语言进阶、数据结构刷题训练营、有感兴趣的可以看一看。 欢迎点赞 &#x1f44d; 收藏 ⭐留言 &am…

认识excel篇3之数据的有效性(数据验证)

数据有效性不仅能够对单元格的输入数据进行条件限制&#xff0c;还可以在单元格中创建下拉列表菜单方便用户选择输入。如果没有做数据验证&#xff0c;单元格内默认可以输入任意类型的数据。数据验证就是限制单元格输入数据&#xff08;必须输入符合要求的才能输入&#xff09;…

VS2022如何查看类成员都在哪里被调用了(VS如何打开Call Hierarchy视图)

文章目录 打开Call Hierarchy视图查看成员的调用 打开Call Hierarchy视图 单击菜单栏的“视图” > “调用层次结构”&#xff0c;即可打卡Call Hierarchy视图。 查看成员的调用 在代码编辑窗口&#xff0c;右键单击想要查看的类成员&#xff0c;然后选择“查看调用层次结…

机器学习算法之-逻辑回归(2)

为什么需要逻辑回归 拟合效果太好 特征与标签之间的线性关系极强的数据&#xff0c;比如金融领域中的 信用卡欺诈&#xff0c;评分卡制作&#xff0c;电商中的营销预测等等相关的数据&#xff0c;都是逻辑回归的强项。虽然现在有了梯度提升树GDBT&#xff0c;比逻辑回归效果更…

一、数学建模之线性规划篇

1.定义 2.例题 3.使用软件及解题 一、定义 1.线性规划&#xff08;Linear Programming&#xff0c;简称LP&#xff09;是一种数学优化技术&#xff0c;线性规划作为运筹学的一个重要分支&#xff0c;专门研究在给定一组线性约束条件下&#xff0c;如何找到一个最优的决策&…

JavaScript请求数据的4种方法总结(Ajax、fetch、jQuery、axios)

JavaScript请求数据有4种主流方式&#xff0c;分别是Ajax、fetch、jQuery和axios。 一、Ajax、fetch、jQuery和axios的详细解释&#xff1a; 1、 Ajax Ajax&#xff08;Asynchronous JavaScript and XML&#xff09;是一种使用JavaScript在用户的浏览器上发送请求的技术&…

使用低版本vcpkg时,bootstrap-vcpkg.bat无法生成vcpkg.exe的可能原因

缘由 需要使用vcpkg中低版本的第三方库&#xff0c;下载vcpkg后&#xff0c;回退至指定版本&#xff0c;运行bootstrap-vcpkg.bat生成vcpkg.exe时&#xff0c;命令行窗口总是一闪而过&#xff0c;但是vcpkg.exe却没有生成。 添加pause&#xff0c;查看错误 编辑bootstrap-vc…

docker的网络模式

docker0网络 docker容器的 虚拟网关loopback &#xff1a;回环网卡、TCP/IP网卡是否生效virtual bridge&#xff1a;linux 自身继承了一个虚拟化功能&#xff08;kvm架构&#xff09;&#xff0c;是原生架构的一个虚拟化平台&#xff0c;安装了一个虚拟化平台之后就会系统就会自…

区间预测 | MATLAB实现QRBiLSTM双向长短期记忆神经网络分位数回归时间序列区间预测

区间预测 | MATLAB实现QRBiLSTM双向长短期记忆神经网络分位数回归时间序列区间预测 目录 区间预测 | MATLAB实现QRBiLSTM双向长短期记忆神经网络分位数回归时间序列区间预测效果一览基本介绍模型描述程序设计参考资料 效果一览 基本介绍 区间预测 | MATLAB实现QRBiLSTM双向长短…