如何减少AI中的偏见问题:八种方法避免AI偏见渗入模型

克服与避免 AI 偏见的八大方法

AI 中的算法偏见是一个普遍存在的问题,它虽然不可能完全消除,但却可以通过科学的方法积极地防止这种偏见。我们将在本文中围绕如何应对AI中的偏见问题展开深入的讨论。

您可能会回想起新闻中报道的一些存在偏见的算法示例,例如语音识别无法识别代词“她的”,但能够识别“他的”,或者面部识别软件不太可能识别出有色人种。虽然不可能完全消除 AI 偏见,但我们不仅要知道如何减少 AI 偏见,还必须积极努力地防止这种偏见。若要了解如何减少 AI 中的偏见,我们首先要了解用于生成和开发模型的训练数据。

在我们发布的 AI 与机器学习现状报告中,只有 15% 的公司表示 AI 的数据多样性、减少偏见和全球规模“不重要”。尽管这一结果已经非常不错,但仍然有 24% 的公司认为无偏见、多样化的全球性 AI 至关重要。这意味着许多公司仍需要努力克服 AI 偏见,这不仅有助于推动 AI 项目的成功,而且在当今环境下至关重要。

算法的作用是在存在人为偏见时予以干预,因此通常被认为是无偏见的。您要记住的重要一点是,这些模型是由人类编写的,而且通过由社交生成的数据进行了训练。这就带来了向模型中引入并扩大现有人类偏见,进而导致 AI 无法真正为每个人带来价值的挑战和风险。

负责任和成功的公司必须知道如何减少 AI 偏见,并主动从他们的训练数据着手。为了最大程度地减少偏见,应运用统计信息和数据探索来监控异常值。基本上来说,我们可以通过比较和验证不同训练数据样本的代表性来减少和避免 AI 偏见。如果没有这种偏见管理,任何 AI 计划最终都会以失败而告终。

AI-偏差

您可以通过以下八种方法来避免 AI 偏见渗入模型。

减少 AI 中的偏见的八个步骤

  1. 定义并缩小您要解决的业务问题

    尝试解决过多问题通常意味着您需要使用大量无法管理的类所涵盖的大量标签。首先,在相对狭小的范围内定义问题有助于您确保模型能够在它的具体作用方面表现良好。

  2. 对数据收集进行结构化处理,允许有不同的意见

    单个数据点通常会有多个有效的意见或标签。收集这些意见并考虑合法的(通常是主观的)分歧会令您的模型更加灵活。

  3. 了解您的训练数据

    学术数据集和商业数据集都会存在可能将偏见引入到算法之中的类和标签。您对数据的了解和拥有程度越高,出现令人反感的标签的可能性就越低。

  4. 组建一支多样化的 ML 团队,让他们提出各种问题

    同一工作场所,不同的人会有不同的体验和想法。种族、性别、年龄、经历、文化等背景因素不同的人,肯定会提出不同的问题,而且会以不同的方式与您的模型进行交互。这种提问有助于您在模型投入生产之前发现问题。

  5. 考虑所有最终用户

    同样,请记住一点:您的最终用户将不会像您或您的团队那样简单。因此,一定要了解他们。通过学习去预测不喜欢您的人如何与您的技术交互,以及在交互时可能出现的问题来避免 AI 偏见。

  6. 确保标注多样性

    人工标注者资源库扩展的越广泛,您的观点就越具多样化。这可以切实帮助您减少初始启动时以及继续训练模型时的偏见。

  7. 进行测试和部署并考虑反馈

    在整个生命周期中,模型很少是静态的。一个常见但比较严重的错误就是在部署模型时,最终用户无法向您提供有关模型在现实世界中应用情况的反馈。因此,应开放讨论和论坛,以获取反馈,这将有助于继续确保您的模型能够真正地为每个人带来价值。

  8. 制定具体的计划,以利用此类反馈来改善您的模型

    您不仅要持续使用客户反馈来审查模型,还需要聘请独立人员来审核变更、边缘案例、可能遗漏的偏见等等。因此,您要确保获得有关模型的反馈,并提供自己的反馈,以改善模型性能,并进行不断迭代,以提高准确率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/726052.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript编程艺术:深度解析计算机程序的构造与解释【文末送书-32】

文章目录 JavaScript编程艺术:深度解析计算机程序的构造与解释第一部分:程序的构造第二部分:程序的解释第三部分:实例分析 计算机程序的构造和解释(JavaScript版)【文末送书-32】 JavaScript编程艺术&#…

795. 前缀和(acwing)

文章目录 795.前缀和题目描述前缀和 795.前缀和 题目描述 输入一个长度为n的整数序列。 接下来再输入m个询问,每个询问输入一对l, r。 对于每个询问,输出原序列中从第l个数到第r个数的和。 输入格式 第一行包含两个整数n和m。 第二行包含n个整数&a…

利用MATLAB模拟点电荷的电场分布

一、实验目的: 1.熟悉点电荷的电场分布情况; 2.学会使用Matlab绘图; 二、实验内容: 1.根据库伦定律,利用Matlab强大的绘图功能画出单个点电荷的电场分布情况,包括电力…

小型园区配置示例——华为

小型园区配置示例 组网图形 图1 小型园区组网图 组网需求数据规划配置思路操作步骤业务验证 组网需求 某企业划分为A、B两个部门,企业中的用户可以相互访问,并且企业中的用户可访问Internet。 如图1所示,在小型园区中,S2700…

idea2023版使用废弃类没有删除线处理方法

idea2023版使用废弃类没有删除线处理方法 新版Idea使用废弃类时,默认是黄色警告处理方法1. 打开file -> setting2. 编辑(Editor) -> 检查(Inspections) -> 搜索Deprecated API usage 新版Idea使用废弃类时,默认是黄色警告 处理方法 1. 打开file -> setting 2. 编…

【树】-Lc102-二叉树的层次遍历(队列)

写在前面 最近想复习一下数据结构与算法相关的内容,找一些题来做一做。如有更好思路,欢迎指正。 目录 写在前面一、场景描述二、具体步骤1.环境说明2.代码 写在后面 一、场景描述 给定一个二叉树,返回其按层次遍历的节点值。(即逐…

单点登录是怎么工作的?

本文转自 公众号 ByteByteGo,如有侵权,请联系,立即删除 单点登录是怎么工作的? 今天来聊聊单点登录(Single Sign On)。 01 单点登录的主要参与者 用户 - 申请访问应用程序的个人身份供应商(I…

浪潮服务器使用ARCCONF查看RAID配置信息

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、获取ARCCONF二、使用步骤1.Windows Server 20221.查看RAID控制器2.查询控制器属性3.查询虚拟磁盘属性4.查询物理硬盘属性 2.Ubuntu-22.043.CentOS7 三、配置…

Java学习笔记10——静态内部类使用及意义

当不需要内部类对象与外部类对象有任何联系时,可以使用static关键字来声明这个内部类,这种静态内部类也称为嵌套类(nested class)。当我们创建一个静态内部类的对象时,并不需要先创建外部类的对象,与类中的…

matlab读取hdf5格式的全球火灾排放数据库Global Fire Emissions Database(GFED)数据

1.引言 火灾是大气中痕量气体和气溶胶的重要来源,并且是全球尺度上最重要的干扰因素。此外,森林砍伐和热带泥炭地火灾以及火灾频率增加的地区,都会增加大气中二氧化碳的积累。烧毁面积提供了生物质燃烧事件期间受火灾影响土地的估算&#xff…

300分钟吃透分布式缓存-20讲:Redis如何处理文件事件和时间事件?

Redis 事件驱动模型 事件驱动模型 Redis 是一个事件驱动程序,但和 Memcached 不同的是,Redis 并没有采用 libevent 或 libev 这些开源库,而是直接开发了一个新的事件循环组件。Redis 作者给出的理由是,尽量减少外部依赖&#xff…

Flink:Temporal Table 的两种实现方式 Temporal Table DDL 和 Temporal Table Function

博主历时三年精心创作的《大数据平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,…

上海计算机学会 2023年11月月赛 乙组T4 平分子集(三)(状态压缩 折半枚举)

第四题:T4平分子集(三) 标签:状态压缩、折半枚举题意:一个集合被称之为可平分的,如果它可以被分为两部分,且两部分的元素之和相等。空集也算可平分的。给定一个集合 a 1 , a 2 , a 3 , … , a …

WordPress建站入门教程:phpMyAdmin4.8.5出现Fatal error: Unparenthesized错误怎么办?

我们在本地电脑使用小皮面板phpstudy安装phpMyAdmin4.8.5成功后,但是点击【管理】功能打开时却出现如下错误: Fatal error: Unparenthesized a ? b : c ? d : e is not supported. Use either (a ? b : c) ? d : e or a ? b : (c ? d : e) in D:\…

基于springboot的精准扶贫管理系统论文

精准扶贫管理系统 摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了精准扶贫管理系统的开发全过程。通过分析精准扶贫管理系统管理的不足,创建了一个计算机管理精准扶贫管理系统的方案。文章介绍了精…

NumPy数据处理详解的笔记4

NumPy数据处理详解的笔记4 第2章NumPy与数组操作 2.1 数组形状变换函数 np.reshape与 np.resize等的区别如下 函数名 变形前后数组元素数量不一致的行为 有无参数order 元素变更的影响 np.reshape 出现运行时错误 有 …

深度学习的应用实例:从自然语言处理到计算机视觉的突破

深度学习在各个领域中展现出了强大的应用潜力,特别是在自然语言处理、计算机视觉、语音识别和机器翻译等方向,其取得的成果令人瞩目。 一、自然语言处理:深度学习的革命性影响 自然语言处理(NLP)一直是人工智能领域的…

【新书推荐】16.2 显示中断

本节内容:屏幕显示的实现——显示I/O中断处理程序。显示器通过显示适配卡与系统相连,显示适配卡是显示输出的接口。早期显示适配卡是CGA和EGA等,目前常见的适配卡是VGA、TVGA、DVI、DP、Mini HDMI和Micro HDMI接口等。它们都支持两类显示方式…

全量知识系统问题及SmartChat给出的答复 之19 关于演示模板

Q.60 可参考的演示模版 (word-def occupiedinterest 5type EBsubclass SEBtemplate (script $Demonstrateactor nilobject nildemands nilmethod (scene $Occupyactor nillocation nil))fill (((actor) (top-of *actor-stack*))((method actor) (t…

简洁实用的wordpress外贸网站模板

坚果蜜饯wordpress跨境电商模板 木瓜干、菠萝干、夏威夷果、芒果干、椰片、巴旦木等wordpress跨境电商模板。 https://www.jianzhanpress.com/?p3944 珠宝手饰wordpress外贸网站模板 金银手饰、珍珠手饰、翡翠手饰、钻石手饰、玉石珠宝手饰wordpress外贸网站模板。 https:…