在版权付费方面,OpenAI 比人想象中的还要「小气」

随着新闻出版商与AI公司达成“使用新闻训练AI模型”的协议,像 OpenAI 等科技企业愿意为受版权保护的信息支付的价格逐渐浮出水面。

据 The Information 报道,OpenAI 每年愿意向出版商提供 100万到500万美元来支付受版权保护的新闻文章训练其AI模型。

图片

但即使对于小型新闻出版商来说,这个数额其实很小,这可能会让 OpenAI 难以达成交易。

与此同时,苹果也不甘示弱,最近的一份报告称,苹果正在寻求与媒体公司合作,将内容用于人工智能训练,并在多年内提供至少 5000 万美元来购买数据。

图片

这些数字与一些早期的非人工智能许可交易相似。例如谷歌在2020年宣布将总共投资10亿美元与新闻机构合作。在新法律的压力下,谷歌最近还同意每年向加拿大出版商支付总计 1 亿美元,以换取他们文章的链接。

AI模型训练受到挑战

当今的大语言模型主要是根据互联网信息进行训练的。虽然一些AI公司没有透露它们如何获取训练数据,但明显都少不了使用网络爬虫从互联网获取大量数据。

但目前这种做法现在面临着重大挑战。

一方面,OpenAI 的 GPT 爬虫已被一些媒体公司禁止访问数据,其中包括《纽约时报》和 The Verge 的母公司 Vox Media。

另一方面,一些公司认为对其数据进行爬取训练构成版权侵权。

就在一周前,纽约时报法院起诉OpenAI 和微软侵犯版权!要求销毁 ChatGPT 以及任何其他使用《纽约时报》作品而没有付费的大语言模型和训练集。

该诉讼指控 OpenAI 和微软未经允许利用《纽约时报》数百万篇的受版权保护的数据训练ChatGPT等人工智能模型。更重要的是,诉讼声称 ChatGPT 和 Bing Chat 经常复制《纽约时报》文章的长篇逐字副本。这使得 ChatGPT 用户能够绕过《纽约时报》的付费墙。

图片

何以解决?唯有付费

良好的合作伙伴关系可以让人工智能公司避免数据版权问题,并且这在过去的一年里已经成为一种很常见的做法。Axel Springer(Business Insider 的母公司)和美联社等出版商已与 OpenAI 签署协议,授权GPT-4 等模型开发新闻采集技术。

OpenAI 和苹果并不是唯一希望与新闻机构合作的人工智能开发商。据报道,谷歌演示了一款名为 Genesis 的AI工具,该工具可以获取事实并向《纽约时报》、《华尔街日报》和《华盛顿邮报》的高管提供新闻报道。与此同时,一些新闻机构在新闻编辑室中使用了生成式AI工具,但结果好坏参半。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/605312.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【leetcode】力扣热门之合并两个有序列表【简单难度】

题目描述 将两个升序链表合并为一个新的 升序 链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 用例 输入:l1 [1,2,4], l2 [1,3,4] 输出:[1,1,2,3,4,4] 输入:l1 [], l2 [] 输出:[] 输入:l1 []…

王中阳Go赠书活动第一期:《TVM编译器原理与实践》

文章目录 前言TVM编译器的实现过程关于《TVM编译器原理与实践》编辑推荐内容简介作者简介图书目录书中前言/序言《TVM编译器原理与实践》全书速览入手《TVM编译器原理与实践》传送门:结束语参加抽奖 前言 随着人工智能的发展,计算机视觉、自然语言处理和…

MySQL复习汇总(图书管理系统)

MySQL图书管理系统(49-94)源码_71.备份book数据库到e盘的mybook.sql文件(备份文件中要求包含建库命令)-CSDN博客 CROSS JOIN:交叉连接(笛卡尔积) -- 1、 创建一个名称为book的数据库。 -- 2、 打开book数据库…

Vue2-组件的基本应用

个人练习,仅供参考。 1.先在components中创建公用的内容(public.vue)。components文件夹下放组件供其他页面调用。 2.在用到组件的页面导入该公用组件(import navTitle from "/components/public.vue";)。 …

linux账户文件/etc/passwd详解

linux 账户文件/etc/passwd Linux 的/etc/passwd 文件是系统中最重要的文件之一,它存储了系统中所有用户的基本信息,包括用户名、密码、用户 ID、组 ID、主目录、登录 shell。 /etc/passwd 文件中的每行记录对应一个用户 每条记录的格式如下&#xff1a…

论文阅读记录SuMa SuMa++

首先是关于SuMa的阅读,SuMa是一个完整的激光SLAM框架,核心在于“基于面元(surfel)”的过程,利用3d点云转换出来的深度图和法向量图来作为输入进行SLAM的过程,此外还改进了后端回环检测的过程,利用提出的面元的概念和使…

qt-C++笔记之QProcess

qt-C笔记之QProcess code review! 文章目录 qt-C笔记之QProcess一.示例:QProcess来执行系统命令ls -l命令并打印出结果说明 二.示例:QProcess来执行系统命令ls -l命令并打印出结果,代码进一步丰富三.示例:使用 QProcess 在 Qt 中…

深入浅出理解Dilated Convolution(空洞卷积,膨胀卷积)

温故而知新,可以为师矣! 一、参考资料 github仓库:Multi-Scale Context Aggregation by Dilated Convolutions 图片素材来源:Convolution arithmetic 理解Dilation convolution Dilated Convolution —— 空洞卷积(膨…

汪林望教授将于每周三以互动问答直播形式教您如何用龙讯旷腾计算软件PWmat计算不同材料性质

打开VX→搜索“汪林望计算讲座”,关注汪老师的频道,每周三下午16:00我们准时直播! 大家提前准备好问题,可直接提问讨论,当面请教 汪林望教授 中科院半导体所首席科学家 北京龙讯旷腾科技有限公司创始人 美国劳伦斯…

竹云董事长董宁受邀出席2023粤港澳大湾区创新战略学术研讨暨数字科技发展报告会议

科技与创新共舞,数字与产业交融。12月28日,2023 年粤港澳大湾区创新战略学术研讨暨数字科技发展报告会议在深商报告厅举行,深圳市科学技术协会党组成员、驻会副主席石兴中,深圳市商业联合会副会长、深商总会秘书长石庆&#xff0c…

React Native集成到现有原生应用

本篇文章以MacOS环境开发iOS平台为例,记录一下在原生APP基础上集成React Native React Native中文网 详细介绍了搭建环境和集成RN的步骤。 环境搭建 必须安装的依赖有:Node、Watchman、Xcode 和 CocoaPods。 安装Homebrew Homebrew是一款Mac OS平台下…

电商API接口|电商平台使用的物流API的安全风险

电子商务平台的物流 API 如果出现安全漏洞,则消费者的个人信息会被大量暴露。 物流 API 整合了企业和第三方供应商之间的数据和服务,以解决各种市场需求。如果 电商API 接口集成不当,可能会出现泄露个人身份信息 (PII) 的风险。许多使用 API…

京东商品详情API接口(item_get-获得JD商品详情)电商领域的重要角色

电商API接口在电商领域中扮演着重要的角色,它们为电商平台提供了许多功能和便利。以下是电商API接口的一些主要用途: 商品信息查询:通过API接口,第三方开发者或商家可以查询电商平台上的商品信息,包括商品详情、价格、…

Spark六:Spark 底层执行原理SparkContext、DAG、TaskScheduler

Spark底层执行原理 学习Spark运行流程 学习链接:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ 一、Spark运行流程 流程: SparkContext想西苑管理器注册并向资源管理器申请运行Executor资源管理器分配Executor,然后资源管理器启动Ex…

系列十四、理解MySQL varchar(50)

一、理解MySQL varchar(50) 1.1、概述 日常开发中,数据库建表是必不可少的一个环节,建表的时候通常会看到设定某个字段的长度为varchar(50),例如如下建表语句: 那么怎么理解varchar(50)?这个分情况的,MySQ…

静态路由、代理ARP

目录 静态路由静态路由指明下一跳和指明端口的区别代理ARP 我们知道,跨网络通信需要路由 路由有三种类型: 1.直连路由。 自动产生的路由,当网络设备连接到同一网络时,他们可以自动学习到对方的存在。自动学习相邻网络设备的直连信…

用通俗易懂的方式讲解:使用 Mistral-7B 和 Langchain 搭建基于PDF文件的聊天机器人

在本文中,使用LangChain、HuggingFaceEmbeddings和HuggingFace的Mistral-7B LLM创建一个简单的Python程序,可以从任何pdf文件中回答问题。 一、LangChain简介 LangChain是一个在语言模型之上开发上下文感知应用程序的框架。LangChain使用带prompt和few…

盛元广通实验室业务流审批管理系统2.0

系统通过对取样、分析、数据处理、检验报告等分析全过程中多种影响因素的有效管理,强化检验质量,获得准确可靠的分析成果。业务流审批管理系统主要包括了检测管理、业务受理、样品管理、资源质量管理、分包管理、报告生成、统计分析等,系统能…

7N65-ASEMI高压NPN型MOS管7N65

编辑:ll 7N65-ASEMI高压NPN型MOS管7N65 型号:7N65 品牌:ASEMI 连续漏极电流(Id):4A 漏源电压(Vdss):650V 栅极阈值电压:30V 单脉冲雪崩能量:150mJ 集电极电流(脉冲&#xff…

网络安全B模块(笔记详解)- 网络爬虫渗透测试

LAND网络渗透测试 1.进入虚拟机操作系统:BT5中的/root目录,完善该目录下的land.py文件,填写该文件当中空缺的Flag1字符串,将该字符串作为Flag值(形式:Flag1字符串)提交;(land.py脚本功能见该任务第6题) 输入flag sendp(packet) Flag:sendp(packet) 2.进入虚拟机操作…