大模型时代下的“金融业生物识别安全挑战”机遇

作者:中关村科金AI安全攻防实验室 冯月

金融行业正在面临着前所未有的安全挑战,人脸安全事件频发,国家高度重视并提出警告,全行业每年黑产欺诈涉及资金额超过1100亿元。冰山上是安全事件,冰山下隐藏的是“裸奔”的技术防御系统,快速发展的生成式算法平均每1.5天就有一个新的变种出现,而防御技术的迭代上线周期超过90天,零日漏洞风险敞口超过88.5天。

其中核心问题是攻击数据的严重不足,“引擎缺乏燃料”,现有防御方法跟不上攻击方法的演变速度,基于事件的专家防御体系强依赖于人工数据采集、标注、处理的流程,以扩大corner case规模,该过程占据了技术迭代更新过程中超过90%的时间成本。

行业迫切需要一个针对“零日漏洞”的“零日修复”方案缩小风险敞口,下一代防伪技术金融领域的多模态防伪专有大模型为此提供了一个新思路,大模型可以同时解决燃料和引擎问题,实现“tesla的跑车油改电”、“福特的汽车代马车”。中关村科金通过使用超过2PB的海量数据对大模型进行专项调优,增广基础攻击数据类型、激发模型“涌现”潜能,激活其域外识别能力,将识别数量级从1个9提升到3个9,大幅缩小漏洞风险敞口。大模型是跨时代的产物,是当下解决金融机构面临的生物识别零日漏洞频发危机的唯一可行路径。

人脸安全事件层出不穷,国家多部门发出紧急警告

从具体事件来看,据媒体披露,2024年一家跨国公司香港分部的职员受“换脸、换声”技术欺骗,将2亿港元分别转账15次、转到5个本地银行账户内;2023年包头警方发布一起利用“换脸、换声”技术欺诈案例,福州市某科技公司法人代表郭先生10分钟内被骗430万元;2021年交通银行受到来自IP地址为中国台湾的犯罪分子攻击,7次通过了交通银行的人脸识别,6次通过活体检测。

从国家监管预警趋势看,公安部分两次于2020年、2022年向头部互联网服务机构发出预警,披露9种人脸安全风险;国家网信办于2021年、2023年发出警示,并要求各互联网机构提升人脸识别技术应用安全管理水平;国家金融管理中心,原中国银保监会,于2021年、2023年直接向金融机构下达指示,警惕利用AI新型技术实施诈骗、加强人脸识别技术应用安全管理。这只是冰山上的数字,如果我们下沉到海平面之下,深入到金融机构中,一家普通规模的金融机构一年就要面临超过1万次攻击;据联盟统计,全行业每年黑产欺诈涉及资金超1100亿元。

究其原因,金融是国民经济的血脉,也是被不法分子攻击的首要目标,可谓“野火烧不尽、春风吹又生”。

提升金融业技术防御水平已迫在眉睫,新攻击方法层出不穷,而金融机构科技建设严重滞后,形同裸奔

从机构建设速度看,最快更新时间需要90天。据公开招标信息披露,过去2年间,以国股行为首的头部金融机构已经完成了一轮技术升级,但相较于上一次技术升级,间隔在3-5年;而在金融机构采买的服务中,最短的升级速度也在90天以上,更常见的是1年1次的更新服务。

从攻击方法的创新速度看,平均1.5天就有一种新攻击方法出现。国际顶会CVPR2023仅一年便发布超过130篇关于图像、人脸、声音的生成方法,2024年sora发布仅一周后,阿里便发布了EMO算法,精细的还原了一个人的声音、面部表情、口型、舌动;在应用市场中,新增注入攻击、换脸换声软件超过百余种,包括uface、趣换脸、insightface、Xpression等。

从作案工具易得性看,在地下交易市场中,攻击道具交易已颇具规模,通常200元就能买到一次定点攻击服务。金融行业的技术更新速度已经严重制约了金融安全防御体系的建设零日漏洞(0-day)已经从操作系统、计算机网络下沉到了人工智能中,并深度影响着金融行业的健康发展,在新型攻势的88.5天(90-1.5)中,机构防御手段如同裸奔

金融机构防御体系建设慢的核心问题是攻击数据的有效性不足

这一方面是吃不饱导致的。攻击数据少是一个相对概念,是一种由认知偏差导致的数据的动态不足,而不是绝对数量的不足,“人不能知道自己不知道的东西(unconscious incompetence)”。防御方案需要针对攻击特点来设计,天然滞后于攻击的发生,这就带来了认知的客观时间差。金融机构的技术更新就是典型样例,防御升级通常围绕事件展开,如通过巡检、或者行业联盟共享的素材,而这些事件所提供的负样本数目非常少。这些数据是不足以支撑一次训练,也即无法提升专家模型的能力。因此,通常技术部门需要先对这些负样本(corner case)进行解析,分析其生成原理和特征,然后人工进行数据采集、数据标注、数据处理,最后用于训练,验证,最终完成技术升级,超过90%的时间成本被花在了数据的构建上,这也直接造成了机构“裸奔现象”。

更重要的,另一方面是吸收少导致的。从攻击数据到模型性能存在一个“能量转化率”,这是一种系统性能力不足,也可以比作“营养失调”、“肠胃差”。专家模型的认知方式与人有较大差异,从标注方式来看,专家模型训练数据真值(ground truth)是在采集前确定的,全部都有真值;人的训练数据是先对海量无标数据的归纳、然后通过极少数量的有标数据启发得来的。专家模型本身并不是拟合的“人的认知”,而是拟合的“特定攻击手法的作案特征”,这也就解释了为什么专家模型在针对同类攻击行为的检出上远高于人类,但对新攻击的识别远逊于人类。

业务目标是更快的补全漏洞,如果我们头疼医头、脚痛医脚只能陷入被动解决吸收问题更重要。因此,我们迫切需要一种划时代的应用,一个胃口好、消化好的铁胃来解决零日漏洞频发危机。

一种零日修复方案、下一代防伪技术,金融领域的多模态防伪专有大模型提供了一个新思路

更强的编码能力。谷歌在2018年提出了预训练模型,transformer技术崭露头角,基于transformer的BERT技术向我们证明了一切专家问题本质是编码问题,编码能力的提升直接影响着专家判断的准确性。

更强的数据承载能力。2020年,OpenAI发表了关于scaling laws的关键论文,并在2022年GPT3.0上证明了超大规模的数据可以产生“知识涌现”现象,如今大模型规模已经突破100B。

好胃口+好消化=超强的域外推理能力,大模型增强了对没见过问题的处理能力。2023年,google发布多模态大模型Gemini,中关村科金对其进行了防伪能力的专项测试,发现其不仅可以指出图片的真假,甚至可以讲出图片假在什么地方,如纹理、毛发、环境、一致性等。尽管此时的通用大模型能力还不如专有大模型,但我们快速将大模型引入了防伪体系建设中,我们在超过4亿规模的真人图像、音频样本数据集上,通过“基于超过100种基础伪造攻击算法实现的万倍数据增广方案”最终将数据集扩大到2PB。经过测试,“金融领域的多模态防伪专有大模型”相较于“传统专家模型”能力有显著提升,以针对“对抗样本攻击”的防御为例,我们将防御指标从1个9(90%),提升到了3个9(99.9%),大幅缩小漏洞风险敞口。

大模型是跨时代的产物,是当下解决金融机构面临的生物识别“零日漏洞”频发危机的唯一可行路径。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/777883.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT:多轮对话并搭建简单的聊天机器人

1 多轮对话 多轮对话能力至关重要,它不仅能深化交流,精准捕捉对方意图,还能促进有效沟通,增强理解。在智能客服、教育辅导等领域,多轮对话更是提升服务质量、增强用户体验的关键。 注意:大模型没有多轮对话…

uniapp h5 touch事件踩坑记录

场景:悬浮球功能 当我给悬浮球设置了 position: fixed; 然后监听悬浮球的touch事件,从事件对象中拿到clientY和clientX赋值给悬浮球的left和top属性。当直接赋值后效果应该是这样子: 注意鼠标相对悬浮球的位置,应该就是左上角&a…

JAVA使用POI实现Excel单元格合并-02

JAVA使用POI实现Excel单元格合并 实现效果 解释&#xff1a;只要是遇见与前一行相同的数据就合并 引入jar <dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>5.2.2</version></depe…

OpenHarmony实战开发-使用ArkTS语言实现简易视频播放器

介绍 本篇Codelab使用ArkTS语言实现视频播放器&#xff0c;主要包括主界面和视频播放界面&#xff0c;我们将一起完成以下功能&#xff1a; 主界面顶部使用Swiper组件实现视频海报轮播。主界面下方使用List组件实现视频列表。播放界面使用Video组件实现视频播放。在不使用视频…

广场舞团系统的设计与实现|Springboot+ Mysql+Java+ B/S结构(可运行源码+数据库+设计文档)

本项目包含可运行源码数据库LW&#xff0c;文末可获取本项目的所有资料。 推荐阅读100套最新项目持续更新中..... 2024年计算机毕业论文&#xff08;设计&#xff09;学生选题参考合集推荐收藏&#xff08;包含Springboot、jsp、ssmvue等技术项目合集&#xff09; 目录 1. 系…

MySQL进阶-----索引的语法与SQL性能分析

目录 前言 一、索引语法 1.SQL语法 2.案例演示 二、SQL性能分析 三、慢查询日志 1.开启日志 2.测试样例 四、profile详情 1.开启profile 2.profile测试SQL语句 五、explain详情 1.语法结构 2.执行顺序示例&#xff08;id&#xff09; 3.执行性能示例(type) 前言 本…

记录pycharm配置Anaconda环境时没有反应的问题

记录pycharm配置Anaconda环境时没有反应的问题 背景 下载最新pycharm后在设置中配置add interpreter Anaconda环境时&#xff0c;x选中conda.ba文件点击Load Enviroments后&#xff0c;没有反应&#xff0c;就闪了一下&#xff0c;也有添加成功 探索路程 试过了重启&#x…

Vue 04 Vue 中的 Ajax、slot 插槽

Vue学习 Vue 0401 Vue中的Ajax服务器准备axios使用跨域问题解决Vue-CLI 配置代理1Vue-CLI 配置代理2案例: 用户搜索vue-resource 02 slot插槽默认插槽具名插槽作用域插槽slot总结 Vue 04 B站 Vue全家桶&#xff08;BV1Zy4y1K7SH&#xff09; 学习笔记 Vue 中的 ajax 01 Vue中的…

【动态规划】斐波那契数列模型

【动态规划】斐波那契数列模型 文章目录 【动态规划】斐波那契数列模型前言一、第 N 个泰波那契数二、三步问题三、使用最小花费爬楼梯四、解码方法总结 前言 ​ 我们将深入探讨解决斐波那契数列模型相关问题的解决方法。通过一系列精心挑选的例题&#xff0c;我们将展示如何运…

Excel:使用VLOOKUP函数,抓取指定数据,后一个列

Excel:使用VLOOKUP函数&#xff0c;抓取指定数据&#xff0c;后一个列 我们有这样一个数据源 要是实现这个页面的赋值 就是对应关系映射 使用 VLOOKUP(A2,Sheet2!$A$2:$B$9,2,FALSE)第一个参数是需要匹配的单元格。 第二个参数是数据源&#xff0c;我这里数据源用的是shee…

Unity图集编辑器

图集编辑器 欢迎使用图集编辑器新的改变编辑器图片 欢迎使用图集编辑器 Unity图集操作很是费劲 无法批量删除和添加图集中的图片 新的改变 自己写了一个图集编辑器 客&#xff1a; 支持批量删除 左键点击图片代表选中 右键点击图标定位到资产支持批量添加 选中图片拖拽到编…

python统计分析——单样本均值检验

参考资料&#xff1a;python统计分析【托马斯】 1、单样本均值的t检验 检验一个正态分布数据的均值和一个参考值的差异&#xff0c;我们一般使用单样本t检验&#xff0c;该检验基于t分布。 如果我们知道一个正态分布总体的均值和标准差&#xff0c;那么我们可以计算对应的标准…

CMOS逻辑门电路

按照制造门电路的三极管不同&#xff0c;分为MOS型、双极性和混合型。MOS型集成逻辑门有CMOS、NMOS、PMOS&#xff1b;双极型逻辑门有TTL&#xff1b;混合型有BiCMOS。 CMOS门电路是目前使用最为广泛、占主导地位的集成电路。早期CMOS电路速度慢、功耗低&#xff0c;后来随着制…

ubuntu编译OpenCV and seetaFace2

opencv opencv-4.5.2 opencv_contrib-4.5.2 SeetaFace2 SeetaFace2-master https://github.com/seetafaceengine 指定安装目录&#xff0c;和OpenCV放一个目录下了 安装前 安装 安装后 Qt安装 Windows下 Linux下 报错1 原因&#xff1a; 报错…

HTTP状态 405 - 方法不允许

方法有问题。 用Post发的请求&#xff0c;然后用Put接收的。 大家也可以看看是不是有这种问题 <body><h1>HTTP状态 405 - 方法不允许</h1><hr class"line" /><p><b>类型</b> 状态报告</p><p><b>消息…

Rust控制台输出跑马灯效果,实现刷新不换行,实现loading效果

要在 Rust 中实现控制台刷新而不换行&#xff0c;以实现类似 "loading" 状态的效果&#xff0c;你可以使用 \r&#xff08;回车符&#xff09;来覆盖上一行的内容。 use std::io::{self, Write}; use std::thread; use std::time::Duration;fn main() {let loading_…

没学数模电可以玩单片机吗?

我们首先来看一下数电模电在单片机中的应用。数电知识在单片机中主要解决各种数字信号的处理、运算&#xff0c;如数制转换、数据运算等。模电知识在单片机中主要解决各种模拟信号的处理问题&#xff0c;如采集光照强度、声音的分贝、温度等模拟信号。而数电、模电的相互转换就…

蓝桥杯_day6

文章目录 不同路径不同路径II拿金币珠宝的最高价值 不同路径 【题目描述】 一个机器人位于一个 m x n 网格的左上角 &#xff08;起始点在下图中标记为 “Start” &#xff09;。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角&#xff08;在下图中标记为…

【I.MX6ULL移植】Ubuntu-base根文件系统移植

1.下载Ubuntu16.04根文件系统 http://cdimage.ubuntu.com/ 1 2 3 4 5 2.解压ubuntu base 根文件系统 为了存放 ubuntu base 根文件系统&#xff0c;先在 PC 的 Ubuntu 系统中的 nfs 目录下创建一个名为 ubuntu_rootfs 的目录&#xff0c;命令如下&#xff1a; 【注意&…

基于单片机病房呼叫系统数码管显示房号设计

**单片机设计介绍&#xff0c;基于单片机病房呼叫系统数码管显示房号设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机病房呼叫系统数码管显示房号设计概要主要涵盖了利用单片机技术实现病房呼叫系统&#xff0c;并…