第9章 大模型的有害性(上)

 

9.1 引言

本章将探讨大型语言模型(LLMs)可能带来的有害性,重点讨论以下几个方面:

  • 性能差异
  • 社会偏见和刻板印象

在后续内容中,还会涉及其他层面的危害,如有害信息、虚假信息、隐私和安全风险、版权问题、环境影响及权力集中等。这些内容揭示了“能力越大责任越大”的原则,尤其是在AI领域的大模型应用中,我们需要平衡其强大能力与潜在危害。

本章首先回顾一些历史上成熟的危害预防机制,例如贝尔蒙特报告IRB,以及**基因编辑(CRISPR)**等生物医学领域的经验。这些案例提供了对AI领域安全与伦理问题的宝贵经验,帮助我们构建AI系统的危害预防框架。

9.2 社会群体

在AI中,特别是大型语言模型的应用中,许多决策会依据受保护的社会群体属性(如种族、性别、宗教、年龄等)。这些群体在AI系统中的表现可能受到不同文化背景的影响,且历史上边缘化群体通常面临更大的伤害风险。大型语言模型的性能差异和社会偏见问题往往与历史上的歧视现象一致,尤其是交叉性理论指出,处于多个边缘化群体交集的个体(如黑人女性)通常面临更为严重的歧视。

9.3 量化性能差异/社会偏见在LLMs中的危害

大型语言模型通过大规模数据预训练,往往会无意中继承数据中的偏见,从而在性能和社会偏见上表现出不公平的特征。以下是通过两种测试量化这些危害的例子:

名字偏见

动机:测试模型对涉及人名的理解。

  • 原始任务:使用SQuAD数据集进行测试。
  • 修改后的任务:交换SQuAD中的人名,并测试模型的回答准确性。
  • 结果显示,模型对于熟知的名人名字更准确,但对于不知名的人物表现差。

示例结果:

模型参数数量原始准确率修改后准确率名字交换结果(Flips)
RoBERTa-base123M91.249.615.7%
RoBERTa-large354M94.482.29.8%
RoBERTa-large w/RACE354M94.487.97.7%

刻板印象

动机:评估模型对涉及刻板印象的文本的偏好。

  • 任务:比较模型对具有刻板印象和反刻板印象的句子的概率。
  • 结果显示,所有模型都有对刻板印象数据的系统偏好,较大的模型往往具有更高的刻板印象得分。

示例结果:

模型参数数量刻板印象得分
GPT-2 Small117M56.4
GPT-2 Medium345M58.2
GPT-2 Large774M60.0

9.4 测量与决策

现有的公平性指标虽然可以量化性能差异,但往往无法同时最小化多个目标,且无法满足所有利益相关者的期望。例如,词汇表、解码参数等设计决策可能显著改变结果,因此,衡量偏见的指标并非总能可靠地预测下游的伤害。此外,现有的基准测试也面临批评,许多测试无法真实反映出LLMs对社会群体的影响。

9.5 其他考虑因素

大型语言模型可能通过多种方式造成伤害,尤其是在涉及社会群体的表现和历史性边缘化问题时,伤害的影响尤其值得关注。理解这些伤害的社会后果,需要考虑群体背景、历史压迫及社会结构等因素。尽管具体的下游应用环境中伤害的影响较为直观,但作为基础模型的LLMs所引发的上游问题同样不可忽视。

9.6 决策问题

目前,许多针对AI偏见和伤害的缓解措施效果有限。有效的缓解措施需要采用更广泛的社会技术方法,这些方法需要涵盖LLMs的应用环境,并根据不同的社会情境作出适应性调整。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/62857.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Hyperf jsonrpc

依赖的 composer 包 composer require hyperf/json-rpc composer require hyperf/rpc-server composer require hyperf/rpc-client composer require hyperf/service-governance composer require hyperf/service-governance-consul composer require hyperf/service-gove…

ECharts柱状图-交错正负轴标签,附视频讲解与代码下载

引言: 在数据可视化的世界里,ECharts凭借其丰富的图表类型和强大的配置能力,成为了众多开发者的首选。今天,我将带大家一起实现一个柱状图图表,通过该图表我们可以直观地展示和分析数据。此外,我还将提供…

07《缓存》计算机组成与体系结构 系列课

目录 深入了解缓存内存 缓存的重要性 游戏中的存储需求与主内存 虚拟内存和按需分页 现代系统中的多级缓存 缓存级别的大小与速度 缓存相关的术语 缓存命中与未命中 页面命中与缺页 局部性原理 结语 深入了解缓存内存 大家好,欢迎来到今天的课程。上节课…

【Exchange渗透02】Exchange 渗透信息收集

目录 一、Exchange 介绍 二、Exchange基础 1. exchange 开放端口 2. 域内定位 exchange 服务器 3. exchange 相关账号 4. exchange 目录介绍 管理中心 /ecp Outlook用户邮箱 /owa 三、Exchange 外网信息收集 1. 识别exchange版本 2. 通过exchange获取AD域名 3. 探测…

Linux中dos2unix详解

dos2unix 是一个用于将文本文件从DOS/Windows格式转换为Unix/Linux格式的工具。在不同的操作系统中,文本文件中的换行符表示方式是不一样的。具体来说: 在DOS和Windows系统中,换行由两个字符组成:回车(Carriage Retur…

贵州大学oj平台软工24-11-27第5次小测

题目&#xff1a;阶乘和函数 题目描述 设计一个计算阶乘和的函数&#xff0c;用于求1!2!...n!并返回结果。 其中n是函数的参数。 程序的开始部分及main函数已经写好如下&#xff1a; #include <stdio.h> double factSum(int n); int main(){ int n; scanf("…

FPGA实战篇(触摸按键控制LED灯)

1.触摸按键简介 触摸按键主要可分为四大类&#xff1a;电阻式、电容式、红外感应式以及表面声波式。根据其属性的不同&#xff0c;每种触摸按键都有其合适的使用领域。 电阻式触摸按键由多块导电薄膜按照按键的位置印制而成&#xff0c;但由于耐用性较差且维护复杂&#xff0c…

java基础概念47-ArrayList、LinkList和迭代器

一、ArrayList集合 1-1、ArrayList的两种添加信息的方式 1-2、ArrayList集合底层逻辑 1、利用空参创建的集合&#xff0c;在底层创建一个默认长度为0的数组 2、添加第一个元素时&#xff0c;底层会创建一个新的长度为10的数组 3、存满时&#xff0c;会扩容1.5倍。 4、如果…

Milvus python库 pymilvus 常用操作详解之Collection(下)

上篇博客 Milvus python库 pymilvus 常用操作详解之Collection&#xff08;上&#xff09; 主要介绍了 pymilvus 库中Collection集合的相关概念以及创建过程的代码实现&#xff0c;现在我们要在该基础上实现对于collection中插入数据的混合检索&#xff08;基于dense vector 和…

C++学习日记---第16天

笔记复习 1.C对象模型 在C中&#xff0c;类内的成员变量和成员函数分开存储 我们知道&#xff0c;C中的成员变量和成员函数均可分为两种&#xff0c;一种是普通的&#xff0c;一种是静态的&#xff0c;对于静态成员变量和静态成员函数&#xff0c;我们知道他们不属于类的对象…

Java基础之网络编程:开启网络通信的神秘之门

一、网络编程概述 网络编程是通过计算机网络进行数据传输和通信的编程技术&#xff0c;在 Java 中&#xff0c;我们可以使用丰富的网络编程功能和 API 来实现不同计算机之间的数据交互。 Java 网络编程是指在 Java 语言中使用网络协议和 API 进行网络通信的编程技术。Java 网络…

Go 语言函数编程指南:定义、调用技巧与返回值机制

&#x1f407;明明跟你说过&#xff1a;个人主页 &#x1f3c5;个人专栏&#xff1a;《Go语言探索之旅》&#x1f3c5; &#x1f516;行路有良友&#xff0c;便是天堂&#x1f516; 目录 一、引言 1、Go语言简介 2、Go语言的特点 二、函数定义 1、Go语言函数定义 2、函…

qt实现对pdf的编译、读、写、显示

PDFium 的下载和编译 PDFium 是一个开源的 PDF 渲染引擎,支持 PDF 的加载、解析和显示功能。1.1 下载 PDFium 源码 克隆 PDFium 的官方源码仓库: git clone https://pdfium.googlesource.com/pdfium.git cd pdfium 下载依赖项和工具链: gclient sync 1.2 配置编译环境 PDF…

在办公室环境中用HMD替代传统显示器的优势

VR头戴式显示器&#xff08;HMD&#xff09;是进入虚拟现实环境的一把钥匙&#xff0c;拥有HMD的您将能够在虚拟现实世界中尽情探索未知领域&#xff0c;正如如今的互联网一样&#xff0c;虚拟现实环境能够为您提供现实中无法实现的或不可能实现的事。随着技术的不断进步&#…

Springboot项目中子模块maven层级不一致的问题

&#xff08;一&#xff09;问题描述 campus-common、campus-pojo、campus-server都是campus-flower-system的子模块&#xff0c;但是只有campus-common在campus-flower-system下 &#xff08;二&#xff09;解决方法 打开父工程&#xff08;我这里是campus-flower-system&…

springboot-mybatis-plus集成篇

前言 MyBatis 最佳搭档&#xff0c;只做增强不做改变&#xff0c;为简化开发、提高效率而生。 简单用例 UserMapper.java Mapper public interface UserMapper extends BaseMapper<User> { }User.java TableName(value "user") public class User implem…

nginx配置http及https

nginx配置http及https 1.动静分离2.负载均衡3.配置https4.请求重定向5.常用参数配置介绍 现在日常工作中的项目大多数都是采用前后端分离&#xff0c;就用到了nginx进行反向代理、处理静态资源等&#xff1b;因此&#xff0c;记录整理了nginx一些常用的配置&#xff1b; 1.动静…

react学习记录

一、目录结构react优秀代码之react目录结构简洁之道React 作为一个库&#xff0c;不会决定你如何组织项目的结构。这是件好事&#xff0c;因为这样 - 掘金【React】项目的目录结构全面指南_react项目结构-CSDN博客 1、创建项目&#xff1a;开发文档 Getting Started | Create…

SpringBoot 架构下的在线家具商城:规划与实践之路

第1章 绪论 1.1选题动因 当前的网络技术&#xff0c;软件技术等都具备成熟的理论基础&#xff0c;市场上也出现各种技术开发的软件&#xff0c;这些软件都被用于各个领域&#xff0c;包括生活和工作的领域。随着电脑和笔记本的广泛运用&#xff0c;以及各种计算机硬件的完善和升…

ios上滚动条不能滑动 滚动卡住的问题

iosapp上viewweb h5不能滑动的问题 1.给滑动容器添加样式 overflow-x: hidden!important; overflow-y:scroll!important; touch-action: auto!important; -webkit-overflow-scrolling: touch!important;//惯性滑动2.html添加 <meta content"yes" name"appl…