FairJob:促进在线广告系统公平性研究

       在人工智能(AI)与人类动态的交汇处,既存在机遇也存在挑战,特别是在人工智能领域。尽管取得了进步,但根植于历史不平等中的持续偏见仍然渗透在我们的数据驱动系统中,这些偏见不仅延续了不公平现象,还加剧了社会的分歧。历史上的偏见影响了数据收集,对AI模型的结果产生了影响,经常放大了现有的不平等状况。尽管存在关于隐私、责任和公共关系的担忧,但收集特殊和敏感类别数据对于偏见评估至关重要。此外,不断演变的法律框架,例如最近的AI法案和通用数据保护条例[英国信息专员办公室,2022年],要求检测、预防和减轻偏见,同时对敏感数据的使用施加了一些限制。

      在广告中的算法歧视可能与敏感垂直领域有关,这些领域突出了有益的就业、金融和住房机会,或者关于谁看到了可能不太受欢迎的广告,例如掠夺性贷款服务的广告。虽然广告中的不公平行为不是惩罚性的,而是辅助性的,即公平性在于提供平等获取宝贵机会的机会,但确保广告实践的公平性至关重要。

      大多数关于广告中歧视行为的研究都是通过创建广告活动、选择目标受众,并从用户的角度分析数据进行的,而没有访问算法特征。缺乏公开可用的、现实的数据集导致研究人员基于私有数据发布结果,导致科学界的主张无法复现。这为关键评估和在科学界建立在先前工作之上带来了挑战。

在线广告筛选简化流程

为了促进现实场景中的公平性研究,本文发布了一个大规模的公平意识广告FairJob数据集

链接:https://huggingface.co/datasets/criteo/FairJob。

1 广告中的公平性问题

1.1 招聘广告中的性别歧视

     研究表明,招聘广告的投放过程中存在性别歧视现象。例如,管理职位的招聘广告更倾向于展示给男性用户,这可能导致女性用户获得的机会更少,加剧性别差距。

      这种歧视可能并非广告服务平台的本意,而是由于数据偏差或算法设计不当导致的。

1.2 市场偏差

       广告投放平台通常采用实时竞价 (RTB) 机制进行广告投放。在这个过程中,平台会根据用户和广告主的特征进行竞价,并选择最优的广告进行展示。

      由于市场竞争和成本效益的考虑,一些广告主可能会针对特定群体投放广告。例如女性用户可能更贵,因此平台可能会减少对女性用户的广告投放。这种市场偏差可能会导致广告投放结果出现不公平现象。

1.3 算法偏差

广告推荐算法可能会根据用户的历史行为和特征进行推荐,如果这些数据和算法存在偏差,那么推荐结果也可能存在偏差。

例如,如果算法认为男性用户更倾向于点击某些类型的广告,那么这些广告就会更频繁地展示给男性用户,从而导致女性用户获得的机会更少。

1.4 评估指标

       广告推荐系统的评估指标通常包括点击率、转化率等,但这些指标可能无法完全反映广告的公平性。

     例如,即使广告投放结果在不同群体之间没有显著差异,但如果某些群体对广告的响应率本身就较低,那么这种结果仍然是不公平的。

1.5 数据隐私

为了评估和解决广告中的公平性问题,需要收集和分析用户的数据,包括敏感数据(例如性别、种族等)。

然而,收集敏感数据可能涉及到数据隐私和安全问题,需要进行严格的保护和管理。

2 FairJob数据集

       FairJobs 数据集是一个用于研究广告推荐系统公平性的大型数据集。它包含匿名化的用户和广告主特征,以及广告投放结果,旨在帮助研究人员评估和解决广告中的公平性问题。

2.1 数据来源

     FairJobs 数据集来自 Criteo AdTech 公司在 2024 年进行的一项为期 5 个月的招聘广告投放活动。数据包含以下信息:

  • 用户特征: 包括 20 个匿名化的类别特征和 39 个匿名化的数值特征。
  • 广告主特征: 包括 7 个匿名化的类别特征。
  • 广告投放结果: 包括点击情况(是否点击广告)、广告是否为高级职位、以及用户、广告和广告投放的唯一标识符。
  • 敏感属性代理: 由于数据集不包含性别等敏感信息,因此使用用户与男性或女性产品互动的倾向作为性别代理。

2.2 数据特点

  • 大规模: 数据集包含 107 万多条记录,可以用于训练和评估大规模的机器学习模型。
  • 多样性: 数据集包含多种类型的特征,包括类别特征和数值特征,可以用于研究不同类型特征的公平性问题。
  • 不平衡性: 数据集的正负样本比例严重不平衡,可以用于研究不平衡数据下的公平性问题。
  • 匿名化: 数据集经过匿名化处理,保护用户隐私。

2.3 数据应用

     FairJobs 数据集可以用于以下研究:

  • 公平性评估: 评估广告推荐系统的公平性,例如不同性别群体获得广告的机会是否平等。
  • 公平性算法设计: 开发新的公平性算法,例如“公平性惩罚”和“对抗训练”,以减少算法偏差。
  • 评估指标改进: 开发新的评估指标,例如“群体公平性”和“机会公平性”,以更全面地评估广告推荐系统的公平性。
  • 数据隐私保护: 研究数据匿名化、差分隐私等技术,保护用户数据隐私。

2.4 FairJobs 数据集的优势

  • 真实场景: 数据集来自真实的广告投放活动,可以更好地反映现实世界中的公平性问题。
  • 匿名化: 数据集经过匿名化处理,可以保护用户隐私。
  • 开放获取: 数据集开放获取,方便研究人员进行研究和实验。

2.5 FairJobs 数据集的局限性

  • 敏感属性代理: 由于数据集不包含性别等敏感信息,因此使用用户与男性或女性产品互动的倾向作为性别代理,可能存在一定的误差。
  • 数据不平衡性: 数据集的正负样本比例严重不平衡,可能会影响模型的训练和评估。
  • 市场偏差: 数据集可能存在市场偏差,例如某些广告主可能更倾向于投放给特定群体。

3 实验

3.1 实验设置

实验源代码:https://github.com/criteo-research/FairJob-dataset

3.1.1 数据集

FairJob 数据集,包含 1,072,226 条记录,每条记录包含用户特征、产品特征、点击标签、性别代理、职位等级等信息。

3.1.2 模型

3.1.2.1 基线模型

  • Dummy: 基于单一阈值对正类概率进行分类。在无感知设置中使用,即不考虑受保护属性。Dummy分类器的性能虽然有限,但它提供了一个基准,帮助我们理解在没有任何模型学习的情况下的公平性水平。
  • XGBoost:一个强大的梯度提升框架,用于处理各种类型的数据。在实验中,分别在不公平(包含受保护属性)和无感知(不包含受保护属性)设置下使用。
  • XGBoostLogistic Regression:逻辑回归是一种广泛应用于二元分类问题的统计方法。在实验中,使用逻辑回归来评估不公平、无感知和公平设置下的性能。

3.1.2.2 公平性模型

  • 公平 XGBoost: 使用公平性惩罚的 XGBoost 模型。
  • 公平 Logistic Regression: 使用公平性惩罚的 Logistic Regression 模型。

3.1.3 训练设置

  • 特征嵌入: 使用嵌入方法将类别特征转换为数值特征。
  • 类别不平衡: 使用过采样方法来处理类别不平衡问题。
  • 超参数调整: 使用 Optuna 库进行贝叶斯优化,以找到最佳的超参数设置。
  • 评估: 使用测试集评估模型的公平性和性能。

3.2 评估指标

3.2.1 公平性指标

  • 人口统计学平等性 (Demographic Parity, DP): 该指标衡量模型对不同性别群体预测结果的差异。理想情况下,DP 应该为 0,表示模型对不同性别的用户展示高级职位广告的概率相同。
  • 平等化机会 (Equal Opportunity): 该指标确保模型对不同性别群体预测正类结果的能力相同。然而,FairJob 论文没有使用该指标,因为它可能导致更多对弱势群体的误分类。
  • 平等化公平 (Equalized Odds): 该指标确保模型对不同性别群体预测正类和负类结果的能力相同。FairJob 论文也没有使用该指标,因为它可能导致更多对弱势群体的误分类。

3.2.2 性能指标

  • 负对数似然 (Negative Log-Likelihood, NLLH): 该指标衡量模型预测结果的准确度。NLLH 越低,模型的预测能力越强。
  • ROC 曲线下面积 (Area Under the ROC Curve, AUC): 该指标衡量模型区分正类和负类结果的能力。AUC 越高,模型的预测能力越强。
  • 点击-排名效用 (Click-Rank Utility, U): 该指标衡量模型推荐广告的点击率。U 越高,模型推荐的广告越受用户欢迎。
  • 产品-排名效用 (Product-Rank Utility, ˜U): 该指标考虑了选择偏差,衡量模型推荐广告的点击率。˜U 越高,模型推荐的广告越受用户欢迎,并考虑了选择偏差的影响。

3.3 实验结果

  • 基线模型: Dummy 模型在 DP 方面表现最佳,但在 NLLH 和 AUC 方面表现较差。XGBoost 模型在 NLLH 和 AUC 方面表现较好,但在 DP 方面表现较差。
  • 公平性模型: 使用公平性惩罚的模型在 DP 方面表现有所提高,但 NLLH 方面有所下降。公平性惩罚的 Logistic Regression 模型在 DP 和 ˜U 方面表现有所提高,同时 NLLH 方面下降较少。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/41244.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Centos新手问题——yum无法下载软件

起因:最近在学习centos7,在VM上成功安装后,用Secure进行远程登陆。然后准备下载一个C编译器,看网络上的教程,都是用yum来下载,于是我也输入了命令: yum -y install gcc* 本以为会自动下载&…

docker部署redis/mongodb/

一、redis 创建/root/redis/conf/redis.conf 全部执行命令如下 docker run -it -d --name redis -p 6379:6379 --net mynet --ip 172.18.0.9 -m 400m -v /root/redis/conf:/usr/local/etc/redis -e TXAsia/Shangehai redis redis-server /usr/local/etc/redis/redis.conf 部署…

C#——密封类详情

密封类 密封类是密封方法的扩展,用于确保某个类不会被继承。在C#中,你可以使用sealed关键字来声明一个密封类。 public sealed class SealedClass {// 类成员定义 } 如果使用密封类继承的话,程序会报错!!&#xff0…

01:spring

文章目录 一:常见面试题1:什么是Spring框架?1.1:spring官网中文1.2:spring官网英文 2:谈谈自己对于Spring IOC和AOP的理解2.1:IOCSpring Bean 的生命周期主要包括以下步骤: 2.2&…

解决微信读书和Apple Books导入epub电子书不显示图片的问题

title: 解决微信读书和Apple Books导入epub电子书不显示图片的问题 tags: 个人成长 categories:杂谈 最近找到一本很喜欢的书的电子版的epub版,发现无论是导入微信读书,还是Apple家的Books, 都无法正常显示图片。 于是我用calibre打开epub电子书&#x…

安卓虚拟位置修改

随着安卓系统的不断更新,确保软件和应用与最新系统版本的兼容性变得日益重要。本文档旨在指导用户如何在安卓14/15系统上使用特定的功能。 2. 系统兼容性更新 2.1 支持安卓14/15:更新了对安卓14/15版本的支持,确保了软件的兼容性。 2.2 路…

linux中可执行文件为什么不能拷贝覆盖

对于一个普通的文件,假如有两个文件,分别是file和file1,我们使用 cp file1 file的方式使用file1的内容来覆盖file的内容,这样是可以的。 但是对于可执行文件来说,当这个文件在执行的时候,是不能通过cp的方…

将 KNX 接入 Home Assistant 之四 功能测试

一:测试标准的KNX网关功能 测试软件识别是否正常 可以看到再ETS6和ETS5上都能正常识别 测试数据收发 可以正常发送数据 测试配置设备参数(下载配置) 可以看出,在ETS5上是可以正常下载参数的 但是 ETS6下载是失败的&#xff…

Pandas 学习笔记(四)--CSV文件

CSV文件 CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。 读取与写入 读取csv文件 i…

可视化作品集(08):能源电力领域

能源电力领域的可视化大屏,有着巨大的用武之地,不要小看它。 监控能源生产和消耗情况: 通过可视化大屏,可以实时监控能源生产和消耗情况,包括发电量、能源供应情况、能源消耗情况等,帮助管理者及时了解能…

C语言 | Leetcode C语言题解之第218题天际线问题

题目: 题解: struct pair {int first, second; };struct Heap {struct pair* heap;int heapSize;bool (*cmp)(struct pair*, struct pair*); };void init(struct Heap* obj, int n, bool (*cmp)(struct pair*, struct pair*)) {obj->heap malloc(si…

调制信号识别系列 (一):基准模型

调制信号识别系列 (一):基准模型 说明:本文包含对CNN和CNNLSTM基准模型的复现,模型架构参考下述两篇文章 文章目录 调制信号识别系列 (一):基准模型一、论文1、DL-PR: Generalized automatic modulation classification method b…

软件架构之操作系统

第 2 章操作系统 本章主要介绍操作系统的基本概念及其形成、发展历史和主要类型,并指出操作系统的5 大管理功能。掌握操作系统原理的关键在于深入理解“一个观点、两条线索”。一个观点是以资源管理的观点来定义操作系统;两条线索是指操作系统如何管理计…

【计算机毕业设计】020基于weixin小程序订餐系统

🙊作者简介:拥有多年开发工作经验,分享技术代码帮助学生学习,独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。🌹赠送计算机毕业设计600个选题excel文件,帮助大学选题。赠送开题报告模板&#xff…

100359.统计X和Y频数相等的子矩阵数量

1.题目描述 给你一个二维字符矩阵 grid,其中 grid[i][j] 可能是 X、Y 或 .,返回满足以下条件的子矩阵数量: 包含 grid[0][0]X 和 Y 的频数相等。至少包含一个 X。 示例 1: 输入: grid [["X","Y",…

密室逃脱——收集版修改测试

一、原版修改 1、导入资源 Unity Learn | 3D Beginner: Complete Project | URP 2、设置Scene 删除SampleScene,打开UnityTechnologies-3DBeginnerComplete下的MainScene 3、降低音量 (1) 打开Hierarchy面板上的Audio降低音量 (2) 打开Prefabs文件夹&#xf…

lnmp php7 安装ssh2扩展

安装ssh2扩展前必须安装libssh2包 下载地址: wget http://www.libssh2.org/download/libssh2-1.11.0.tar.gzwget http://pecl.php.net/get/ssh2-1.4.tgz (这里要换成最新的版本) 先安装 libssh2 再安装 SSH2: tar -zxvf libssh2-1.11.0.tar.gzcd libss…

【日志信息管理】管理日志信息的类

日志用于记录程序的执行记录包括程序的出错记录,程序致命退出原因,程序的正常执行记录。这样我们就可以很快的察觉程序的错误原因、执行状况等等,因此管理日志信息是非常重要的。 日志一般由以下部分组合: 日志时间、日志等级、…

Java 基础--File - IO流(2)

I/O流 定义 数据从硬盘流向内存为输入流,数据从内存流向硬盘为输出流。输入也叫读取数据,输出也叫写出数据。 IO分类 1.按照数据的流向分为:输入流和输出流 ①输入流:把数据从其他设备上读取到内存中的流 ②输出流&#xff1…

Qt 基础组件速学 事件过滤器

学习目标:理解事件过滤器 前置环境 运行环境:qt creator 4.12 学习内容和效果演示: Qt 提供了事件过滤器的机制,允许我们在事件到达目标对象之前对事件进行拦截和处理。这在以下情况下非常有用: 全局事件处理: 我们可以在应用程序级别安装一个事件过…