生成式人工智能的风险与治理——以ChatGPT为例

文 | 西南政法大学经济法学院 马羽男

以ChatGPT为代表的生成式人工智能在创造社会福利的同时,也带来了诸多风险。因此,当务之急是结合我国生成式人工智能发展状况,厘清其应用价值与潜在风险之间的关系,以便在不影响应用发展的前提下有效化解风险。

生成式人工智能的运行机理主要分为三个阶段,也就是机器学习和人工标记的准备阶段、运用算法对数据进行处理以求出处理后结果的运算阶段、数据运算产出成品向社会输出并产生影响的生成阶段。当前,生成式人工智能最突出的风险就是在准备阶段的数据合规风险、运算阶段的算法偏见风险以及生成阶段的知识产权风险。

准备阶段的数据合规风险。我国当前的数据合规体系是建立在《网络安全法》《数据安全法》《个人信息保护法》之上的,要求数据处理者在处理过程中采取必要措施以保障基本的数据安全、网络安全和个人信息安全。基于我国的法律框架,生成式人工智能的数据合规风险主要体现在三个方面:数据来源合规风险、数据使用合规风险、数据的准确性风险。首先是数据来源合规风险。以 ChatGPT为代表的生成式人工智能,初始阶段往往要采集大量数据以供其训练。基于此,可能会面临如下问题:一是收集个人信息用户是否同意;二是收集使用已公开的信息是否在“合理范围”;三是收集的样本受到版权保护,进行训练时可否被认定为“合理使用”。其次是数据使用合规风险。一方面是数据泄露风险。用户会将个人信息、商业信息甚至商业机密等传输给ChatGPT。分析ChatGPT运行机理不难发现,在迭代训练中,它也会使用用户输入的信息和交互信息。因此,如何保证这些数据的安全是一个很大的难题。另一方面是用户行使个人信息删除权比较困难。虽然 OpenAI的隐私协议中规定了用户对其个人信息享有相关的权利,但是鉴于要求生成式人工智能系统删除数据的复杂特性,开发者能否实现对个人信息的真实删除,从而达到符合法规的要求还存在较大的不确定性。最后是数据的准确性风险。因为在 ChatGPT训练的早期,被投入到数据中的内容是由开发人员从网络中获得和选择的,因此就有可能出现因为数据的缺失或错误等情况而致使所生成内容的不准确。

运行阶段的算法偏见风险。以“人工标注”为辅助的“机器学习”,通过二者的结合,提高了生成式人工智能的智能化与精确性。但是,这也使得算法偏见的概率急剧增加。这种结合方法比传统的机器学习方法更能体现人的主观判断和偏好,这是由于人们将自己的偏好信息加入到机器学习的模型中,从而增加了人们的偏见,并且这种偏见很难被追踪和防范。在对 ChatGPT的运作方式进行分析后发现,算法偏见主要表现为两方面:其一,由于接收到的数据需要人工标注,因此在理解过程中存在着一定的误差。其二,对数据进行加工,当 ChatGPT对数据进行加工得出结论后,由于原始结果与大众期望不一致,需要对之进行修正,但这一过程同样会产生一定程度的算法偏见。

生成阶段的知识产权风险。生成式人工智能的兴起,对众多产业提出了新的挑战,而最具冲击之处,在于在生成阶段对知识产权领域所构成的挑战。因为生成式人工智能具有高度的智能化,所以在运算过程中,与之前的人工智能系统相比,其知识产权的归属发生了颠覆性的变化。ChatGPT是一种生成式人工智能,它在处理和分析数据方面远远强于分析式人工智能,其内容生成过程主要包括内容自动化编纂、智能化修整加工、多模态转换、创意生成等,直接影响着出版的内容生产模式和内容供应模式。尽管ChatGPT的创造者中包含一些自然人的创作因素,从某种意义上来说,更符合作品的构成要件,但这种由生成式人工智能所创造的作品能否被赋权,仍然存在争论,并且具体的赋权认定标准研究还处于空白状态。因此,知识产权风险成为生成式人工智能无法规避的第三大风险。

针对上述生成式人工智能三个方面的风险,建议采取以下三种应对策略来化解风险。

强化生成式人工智能企业的数据合规建设。生成式人工智能的发展不能只重能力和效率而忽视安全,相关企业应当利用良好的数据合规体系来保障数据安全。企业数据合规建设可以通过三个措施强化。其一,确立数据合规原则。其原则主要有四点,分别是合法合规原则、告知同意原则、正当目的原则、最小必要原则。其二,建立数据合规的多元技术机制。首先是宏观层面的行业标准要统一。各行业的主管部门,应该带头建立一个数据版本的“新华辞典”,让数据编码、制式等保持一致,确保数据的来源、内容和处理逻辑能够被“反事实验证”。其次是中观层面的内外审查体系。在内部设立数据合规专门机构,负责企业日常的数据合规处理,在外部引入第三方审查机制,对企业数据合规进行审计和伦理审查。最后是微观层面的伦理规范。将伦理规范与原则以法律形式嵌入到技术应用的行为逻辑中去,使之能够因势而为。其三,完善数据合规相关法律。首先是完善立法,在立法层面加快出台数据、人工智能方面的基本法,以作为企业数据合规法律方面的顶层指导。其次是执法完善,尽快明确各部门的执法权限,避免“多头治理”产生“九龙治水”的局面。最后是完善司法,完善电子证据制度,保障权利人的相关诉权。

技管结合矫正生成式人工智能的算法偏见。这主要包含两个措施。其一,针对生成式人工智能机器学习过程中所出现的先天性算法偏见,应当调整相关算法模型的学习路径,遵守相关规范和技术标准,在生成式人工智能投入市场前应当进行实质审查。鉴于生成式人工智能的特征,可将其纠偏工作分为两个方面:一方面,采用算法程序编译预防机器学习中可能存在的先天偏见;另一方面,设置人工标注的标准,提高从业人员的执业水平以应对人工标注的算法偏见。其二,针对生成式人工智能的自我学习而得出的后天性算法偏见,应当通过建立敏捷化、自动化、全流程的监管体系来消除偏见。首先,实现对算法技术的自动化监管。针对机器学习和人工标注实现自动化监管,每当出现算法偏见时暂停输出结果,返回查找问题根源。其次,建立多元主体监管模式。行政主体、平台、行业协会、企业自身多方主体参与监管。最后,落实全流程敏捷的监管机制。对生成式人工智能产出结论的全过程进行监管,切实降低由于算法偏见导致错误结论的概率,有效推进可信算法体系的构建。

采用有限保护模式,以防范生成式人工智能作品在知识产权方面的风险。相较于传统的人工智能技术,生成式人工智能的创新之处在于其拥有一定程度的自我认知,并且参与了输出结果的加工和创造。如果基于其自我认知,而将其所有成果都进行保护,那么未来可能会出现生成式人工智能公司手握“创作霸权”的局面。但从商业角度而言,生成式人工智能公司耗费大量金钱和技术资本打造高度智能的人工智能程序,如果对该程序衍生的“作品”完全不予保护,也有违公平。因此,对于ChatGPT生成物的知识产权属性,现阶段应该根据其技术运行模式、参与程度、创新程度等进行综合评判,对其产品的知识产权采用有所区分的有限保护模式。等到未来生成式人工智能发展到一定阶段,深入了解其运行机制时,再确定具体的知识产权保护模式。

以ChatGPT为代表的生成式人工智能方兴未艾,它所带来的法律风险,很多都应在既有法律框架内妥善应对。面对风险和问题,不能因为产业有风险和理论有争议,就限制生成式人工智能发展。这需要采取“法律+技术”的融合治理来营造一个好的市场环境,保障生成式人工智能市场茁壮成长。

【本文系国家社科基金一般项目“个人信息的竞争法保护疑难问题研究”(23BFX186)阶段性成果】

(来源:中国社会科学网)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/23699.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

0606 作业

#include <stdio.h> #include <string.h>typedef struct usr{char unm[21];char pwd[21]; }user;int main(int argc, const char *argv[]) {FILE* userfilefopen("./user_tible.txt","r");printf("输入username:");user u;scanf(&qu…

人工智能在肿瘤预后预测中的最新研究进展|顶刊精析·24-06-07

小罗碎碎念 今天要分享的文献主题&#xff0c;大家一定非常熟悉&#xff0c;因为绝大多数AI4cancer的文章都会提到它——预后预测&#xff0c;所以今天的文献主题是——人工智能肿瘤预后预测。 在正式开始分享之前&#xff0c;我想先带着大家梳理两个问题。解决了以下两个问…

Chrome 自动执行 JS 脚本 | Tampermonkey 插件

文章目录 第 1 步:安装插件 Tampermonkey第 2 步:固定到工具栏第 3 步:在网站上启用 Tampermonkey第 4 步:查看效果第 5 步:调试 JS 代码😂 背景:有个网站,每次进去都要点 3 次才能把相关页面展开。而且,页面经常会自己刷新,导致展开的页面又收回去了。【这一天天的…

【Python】实现极致:克服PyInstaller打包挑战,解决libpython3.10.so.1.0库丢失难题

【Python】实现极致&#xff1a;克服PyInstaller打包挑战&#xff0c;解决libpython3.10.so.1.0库丢失难题 大家好 我是寸铁&#x1f44a; 总结了一篇【Python】实现极致&#xff1a;克服PyInstaller打包挑战&#xff0c;解决libpython3.10.so.1.0库丢失难题✨ 喜欢的小伙伴可以…

MFC设置窗口在Z轴上的位置

函数原型&#xff1a; BOOL CWnd::SetWindowPos(const CWnd* pWndInsertAfter, int x, int y, int cx, int cy, UINT nFlags);返回值&#xff1a; 如果函数成功&#xff0c;则返回非零值&#xff1b;否则返回0。 参数&#xff1a; pWndInsertAfter&#xff1a;标识了在Z轴次…

ai智能全自动批量剪辑软件神器,让视频创作变得简单!

随着科技的飞速发展&#xff0c;人工智能技术在各个领域都取得了突破。在视频制作领域&#xff0c;AI智能全自动批量剪辑软件神器的出现&#xff0c;为视频创作者带来了前所未有的便利。接下来咱们详细介绍这款软件的特点和优势&#xff0c;以及它如何让视频创作变得更加简单。…

【网络安全的神秘世界】Kali安装中文输入法

&#x1f31d;博客主页&#xff1a;泥菩萨 &#x1f496;专栏&#xff1a;Linux探索之旅 | 网络安全的神秘世界 | 专接本 今天就手把手教你如何在kali中安装和配置输入法 首先&#xff0c;打开终端&#xff0c;输入下面这行代码&#xff1a; # sudo apt install ibus ibus-pi…

【机器学习】Python与深度学习的完美结合——深度学习在医学影像诊断中的惊人表现

&#x1f525; 个人主页&#xff1a;空白诗 文章目录 一、引言二、深度学习在医学影像诊断中的突破1. 技术原理2. 实际应用3. 性能表现 三、深度学习在医学影像诊断中的惊人表现1. 提高疾病诊断准确率2. 辅助制定治疗方案 四、深度学习对医疗行业的影响和推动作用 一、引言 随着…

网络安全领域六大顶级会议介绍:含会议介绍、会议地址及会议时间和截稿日期

**引言&#xff1a;**从事网络安全工作&#xff0c;以下六个顶会必须要知道&#xff0c;很多安全的前沿技术都会在如下会议中产生与公开&#xff0c;如下会议发表论文大部分可以公开下载。这些会议不仅是学术研究人员展示最新研究成果的平台&#xff0c;也是行业专家进行面对面…

Flutter_Android上架GooglePlay_问题

上架GooglePlay权限问题 问题描述 REQUEST_INSTALL_PACKAGES 权限问题解决方式 方式1 找到所有使用该权限的库修改删除该权限引用 方式2 打开项目 ~/andoird/app/src/main/AndroidMainfest.xml 添加文本<uses-permission android:name"android.permission.REQUES…

2024.6.06总结1103

今天去导员那领了三方&#xff0c;当导员问我是哪个地区时&#xff0c;我回答是武汉&#xff0c;当她问我是哪个公司时&#xff0c;我回答是华为。导员一定&#xff0c;愣了一下&#xff0c;随即给我竖起了一个大拇指。 可能&#xff0c;她是很震惊吧&#xff0c;毕竟&#xff…

基于springboot的中小企业人事管理系统源码数据库

随着科学技术的飞速发展&#xff0c;社会的方方面面、各行各业都在努力与现代的先进技术接轨&#xff0c;通过科技手段来提高自身的优势&#xff0c;中小企业人事管理系统当然也不能排除在外。中小企业人事管理系统是以实际运用为开发背景&#xff0c;运用软件工程原理和开发方…

[洛谷] 刷题栈 队列

目录 1.后缀表达式 2.表达式括号匹配 3.表达式求值 4.表达式的转换 5.机器翻译 1.后缀表达式 后缀表达式 - 洛谷 #include<iostream> #include<cstdio> using namespace std;int stk[100]; // 用于存储操作数的栈 int index 0; // 栈顶索引int main() {c…

C++开发基础之初探CUDA计算环境搭建

一、前言 项目中有使用到CUDA计算的相关内容。但是在早期CUDA计算环境搭建的过程中&#xff0c;并不是非常顺利&#xff0c;编写此篇文章记录下。对于刚刚开始研究的你可能会有一定的帮助。 二、环境搭建 搭建 CUDA 计算环境涉及到几个关键步骤&#xff0c;包括安装适当的 C…

【SCSS】use的详细使用规则

目录 use加载成员选择命名空间私有成员配置使用 Mixin重新赋值变量 use 从其他 Sass 样式表中加载 mixins、函数和变量&#xff0c;并将来自多个样式表的 CSS 组合在一起。use加载的样式表被称为“模块”。 加载成员 // src/_corners.scss $radius: 3px;mixin rounded {bord…

Hive面试问题

1.hive如何自定义函数 2.hive优化 3.hive数据倾斜 1.数据倾斜的表现 数据倾斜是由于数据分布不均匀&#xff0c;造成数据大量的集中到一点&#xff0c;造成数据热点的现象。 主要表现&#xff1a;任务进度长时间维持在 99%或者 100%的附近&#xff0c;查看任务监控页面Yarn(808…

分析示例 | Simufact焊接工艺仿真变形精确预测汽车结构

导语 焊接是汽车制造过程中一个关键环节&#xff0c;白车身、发动机、底盘和变速箱等都离不开焊接工艺的应用&#xff0c;主要涉及气保焊、电阻点焊、激光焊、电子束焊等多种焊接工艺。由于汽车车型众多、成形结构复杂、汽车制造质量、效率、成本等方面的综合要求。如何高效、…

杰理AC632N提升edr的hid传输速率, 安卓绝对坐标触摸点被识别成鼠标的修改方法

第一个问题: 首先修改edr的hid传输速率.修改你的板级配置,里面的一个地方给注释掉了,请打开那个注释就能提升edr的hid传输效率了 第二个问题: 修改632n系别把触摸板的hid报告描述符识别成鼠标点,修改如下: 注释掉上面的pnp,改成下面的

element plus的容器组件

element-plus的容器组件主要有el-container,el-aside,el-header,el-main,el-footer,后面4个组件其父组件必须是el-container。 el-container采用flex布局&#xff0c;如果其子元素包含el-header或el-footer时会采用垂直布局&#xff0c;否则会采用水平布局&#xff0c;可设置其…

LeetCode|938. Range Sum of BST

. 序言 开启python刷题时代&#xff0c;主要也是为了面试。 . 题目 Given the root node of a binary search tree and two integers low and high, return the sum of values of all nodes with a value in the inclusive range [low, high]. Example 1: Input: root …