机器学习模型验证——以数据为中心的方法

构建机器学习模型时,人们往往将激情和精力集中于收集数据和训练模型,对测试模型和验证结果往往缺少应有的关注。正确的验证技术有助于估计无偏见的广义模型的性能,并更好地理解模型训练的效果。您需要确保机器学习模型经过准确的训练,能输出正确的数据,在部署到现实场景中时,它还能做出准确的预测。经过适当验证的模型足够可靠,能够适应现实世界中的各种新场景。 不幸的是,没有任何一种验证技术可以适用于所有的机器学习模型。选择正确的验证方法需要理解组数据和时间索引数据。 本文将介绍主要的机器学习模型验证方法,并说明测试和验证机器学习模型结果重要的原因。  

模型验证的重要性

验证机器学习模型的结果旨在确保数据的正确性和准确性。通过验证可以在小问题变成大问题之前发现问题,是实现任何机器学习模型的关键一环。

安全性

模型验证的一个最关键方面是寻找安全漏洞。训练数据和机器学习模型数据都很有价值,对于私有数据或敏感数据的情况尤其如此。机器学习模型可能会意外泄漏数据,这意味着验证技术应该能检查数据泄漏的漏洞。 在将训练数据输入机器学习模型之前,采取严格的安全措施也很重要。例如,可以对数据进行匿名或化名处理。

可靠性

验证机器学习模型对于检查模型的可靠性也很重要。您需要了解模型,了解它的优缺点。了解模型有助于解释和查找稍后输出中的错误。了解模型的行为还能帮助您注意到可能发生的任何偏差和偏见。

避免偏见

虽然机器学习技术已彻底改变计算世界,但它的好坏取决于它的创造者。这意味着许多机器学习模型内置了偏见。算法可能存在偏见和/或训练数据也可能存在偏见。 知道如何在机器学习模型中寻找偏见以及如何修正偏见,是模型验证的一个重要方面,这将使机器学习的世界变得更美好、更公平。

预防概念偏差

概念偏差是指允许机器学习模型退化,允许其预测的结果与预期的结果不同的情况。概念偏差会发生,而模型偏差的方式却不可预测。偏差无益于机器学习模型,因为这会使输出数据的用处不大。 虽然最初的机器学习模型验证不会发现概念偏差,但通过适当的维护和定期测试就能做到。概念偏差会随着时间的推移而发生,但这完全可以通过日常维护加以预防。  

正确的数据和正确的人员

如果您正在构建机器学习模型,或是有意在公司中应用AI技术,则至关重要的是,使用正确的训练数据和正确的人员验证和维护模型。如果不验证模型,也不实施持续维护,机器学习模型可能会退化。

持续监控

没有一种机器学习模型是完美的,它们也不会一直保持完美。机器学习模型需要持续监控和调整,以确保输出准确、相关的信息。 虽然机器学习在经过训练后基本上是自主的,但验证和监控却需要人机协同。人工定期维护和检查机器学习模型非常重要。这项工作可以定期进行,也可以实时进行。  

模型验证技术

有许多不同的模型验证技术,正确方法的选择将取决于数据以及要通过机器学习模型实现的目标。以下是最常见的模型验证技术。

训练和测试拆分或保留

最基本的验证技术类型是训练和测试拆分。验证技术的重点是查看机器学习模型对以前从未见过的数据的反应。所有验证方法均基于训练和测试拆分,但略有不同。 使用这种基本的验证方法,可以将数据分成两组:训练数据和测试数据。需要保留测试数据,在测试模型之前,不要向机器学习模型公开它们。大多数人按三七比例分割数据,70%的数据用于训练模型。

再带入

在再带入验证方法中,所有数据均被用作训练数据。然后,将机器学习模型输出的错误率与训练数据集的实际值进行比较。该方法易于实现,它有助于快速找到数据中的漏洞。

K折交叉验证

K折交叉验证与测试拆分验证类似,不同之处在于前者将数据拆分为两个以上的组。在这种验证方法中,“K”被用作占位符,表示要拆分成的数据组的数量。 例如,可以将数据分成10个组。一组被排除在训练数据之外。然后,使用训练数据之外的数据组验证机器学习模型。接着,进行交叉验证。作为训练数据使用的9个数据组也分别被用于测试机器学习模型。每次测试和分数均可提供有关机器学习模型中有效性的新信息。

随机子抽样

随机子抽样的功能与训练和测试验证模型方法相同。关键的区别在于,前者将随机抽取数据的子样本,然后形成测试集。所有其他未在随机子样本中选择的数据均作为训练数据。

自助抽样

自助抽样也是一种机器学习模型验证技术,它使用放回抽样方法。这种验证方法对于估计总体数量最为有用。 使用自助抽样验证方法时,将从整个数据集中抽取一个小样本。这个小样本中将包括平均值或其他有意义的统计数据。需要替换数据,纳入计算的新统计数据,然后再次运行模型。

嵌套交叉验证

验证技术大多数都是为了评估结果的误差。嵌套交叉验证技术用于评估机器学习模型的超参数。用这种方法测试超参数可以防止过度拟合。 要使用这种模型,需要将两个K折交叉验证循环相互嵌套。内环用于超参数整定,外环用于误差测试和准确性估计。  

选择正确的模型

以上列出的机器学习验证模型列表并不详尽,还有其他类型的测试模型和验证技术。每个模型功能各不相同,对数据和机器学习模型提供的见解也略有不同。验证方法往往也有正误。重要的是在选择时要评估不同的验证技术,为模型选择正确的验证技术,确保其不会出错。 选择正确的验证模型很不容易。您需要了解数据和机器学习模型,以确保能够获得所需的信息。在此环节,您不能草率,也不能跳过。选择正确的验证技术意味着要测试机器学习模型,知道它是安全、没有偏见的,并且能可靠地提供高质量的输出。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/186134.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

EUREKA: HUMAN-LEVEL REWARD DESIGN VIACODING LARGE LANGUAGE MODELS

目录 一、论文速读 1.1 摘要 1.2 论文概要总结 相关工作 主要贡献 论文主要方法 实验数据 未来研究方向 二、论文精度 2.1 论文试图解决什么问题? 2.2 论文中提到的解决方案之关键是什么? 2.3 用于定量评估的数据集是什么?代码有…

2023.11.28 使用tensorflow进行“三好“权重分析

2023.11.28 使用tensorflow进行"三好"权重分析 这是最基础的一个神经网络问题。许久没有再使用,用来做恢复训练比较好。 x1w1 x2w2 x3*w3 y,已知x1,x2,x3和y,求w1,w2,w3 这是一个三元一次方程,正常需要三组数据就能…

软件工程--需求工程--学习笔记(超详细)

软件需求工程是软件开发周期的第一个阶段,也是关系到软件开发成败最关键阶段,本章讲解需求的基础知识和需求工程的关键活动。这些知识对于结构化方法、面向对象方法、面向服务方法等都是适用的 本文参考教材:沈备军老师的《软件工程原理》 目…

js提取iconfont项目的图标

iconfont 可以让我们轻松使用字体图标,比如使用 iconfont 提供的 js,就可以愉快的码代码了。 //at.alicdn.com/t/c/font_xxxxx.js通常公司会有提供一套图标供所有系统使用,比如图标库里有 1000 个图标,但某个项目只需要使用 10 个…

系列十九、Spring实例化bean的方式

一、概述 所谓实例化bean,大白话讲就是Spring如何把这一个个的普通的Java对象创建为Spring bean的。 二、方式 Spring中实例化bean常用的有以下四种,即: ① 构造器方式; ② 静态工厂方式; ③ 实例工厂方式;…

关于mybatis插入返回主键id和SpringBoot事务注解自调用演示

文章目录 一. 插入返回任意规则主键ID二. SpringBoot自调用事务2.1 场景12.2 场景2 自调用结论总结 一. 插入返回任意规则主键ID 实体对象 TableName("bank") Data public class Entity {TableId("id")Integer id;TableField("money")Integer …

超详细!Opencv人脸识别!附源码!

一、新建环境 注意!!确定后需要关闭项目,重新打开,终端的环境才会变化!! 二、下载安装包(只需要3个即可) 1. 下载dlib包 pip install dlib-19.19.0-cp38-cp38-win_amd64.whl.whl …

Linux 如何在文件中查找指定内容,grep的用法

Linux 如何在文件中查找指定内容 1、 如我们 查找 log_file_catalina.out 文件中,包含 ‘总数:900’ 的字符内容 2、 在日志中查看 83910_law_21CFBC7EB25B1FF60255FE7F4BE1BCCF1CE726F6_0.bdyhf 的相关内容 grep 83910_law_21CFBC7EB25B1FF60255FE7…

人工智能概论

一、关键技术 人工智能包含了七项关键技术: 1. 机器学习: 机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,是人工智能技术的核心。 从学习模式划分,分…

虚拟数据生成_以Python为工具

生成虚拟数据_以Python为工具 生成虚拟数据技术在现实生活中具有多个重要的应用领域。它为数据隐私保护、机器学习算法开发、数据处理和可视化等方面提供了实用且有价值的解决方案。尤其是能满足定制化需求的虚拟数据,在预期的方向上让数据定向随机。 &#x1f339…

原生GPT本地及云端部署方式保姆级教程

前提条件 部署必须要有一个超过1年的Github账号 本地服务部署 运行效果 部署方法 下载安装包 暂时无法在飞书文档外展示此内容 GitHub授权登录: https://dash.pandoranext.com/ 登录后是这个样子: 复制下面红框里面这个License Id 编辑Config.js…

flutter开发实战-轮播Swiper更改Custom_layout样式中Widget层级

flutter开发实战-轮播Swiper更改Custom_layout样式中Widget层级 在之前的开发过程中,需要实现卡片轮播效果,但是卡片轮播需要中间大、两边小一些的效果,这里就使用到了Swiper。具体效果如视频所示 添加链接描述 这里需要的效果是中间大、两边…

【人工智能Ⅰ】实验3:蚁群算法

实验3 蚁群算法的应用 一、实验内容 TSP 问题的蚁群算法实现。 二、实验目的 1. 熟悉和掌握蚁群算法的基本概念和思想; 2. 理解和掌握蚁群算法的参数选取,解决实际应用问题。 三、实验原理 1.算法来源 蚁群算法的基本原理来源于自然界…

【JavaScript】3.2 JavaScript性能优化

文章目录 1. 避免全局查找2. 避免不必要的属性查找3. 使用快速的JavaScript方法4. 避免不必要的DOM操作5. 使用Web Workers进行后台处理总结 性能优化是任何编程语言的重要组成部分,JavaScript也不例外。在这个章节中,我们将探讨如何优化JavaScript代码&…

GAN:WGAN

论文:https://arxiv.org/pdf/1701.07875.pdf 发表:2017 WGAN 算法流程 从GAN 到 WGAN 的转变 相比于原始 GAN,WGAN 只需要修改以下几点,就能使得训练更稳定,生成质量更高: 1. 此时的判别器相当于做回归…

【DDD】领域驱动设计总结——如何构造领域模型

文章目录 一 分离领域二 领域对象分类2.1 实体(ENTITY)2.2 值对象(VALUE OBJECT)2.3 服务(SERVICE)2.4 模块(MODULE) 三 管理领域对象的生命周期3.1 聚合(AGGREGATE)3.2 工厂(FACTORY)3.3 存储库…

记i18n ally工具检测语言失败的一则思路

情况 只有某个文件检测不到汉字,其余都可以检测出来,困扰许久,发个博客记一下思路 解决方法: 1、肯定不是i18n ally工具的问题,因为其他的vue都能检测成功 2、是这个文件的问题 采用排除法 先删掉所有代码&#…

解决keil右键Go To Definition跳转不过去的问题

解决: 在魔法棒中如图所示打上√

flask web开发学习之初识flask(二)

文章目录 一、创建程序实例并注册路由1. 为视图绑定绑定多个URL2. 动态URL 二、启动开发服务器1. 自动发现程序实例2. 管理环境变量3. 使用pycharm运行服务器4. 更多的启动选项5. 设置运行环境6. 调试器7. 重载器 一、创建程序实例并注册路由 app.py # 从flask包中导入flask类…

NoSQL 数据建模错误会降低性能

数据建模错误是破坏性能的最简单方法之一。当您使用 NoSQL 时,特别容易搞砸,(讽刺的是)NoSQL 往往用于对性能最敏感的工作负载。NoSQL 数据建模最初可能看起来非常简单:只需对数据进行建模以适应应用程序的访问模式。但…