OpenAI 是如何被10亿美元收买了“非盈利”灵魂的?

来源:AI科技评论

编译:陈彩娴、琰琰

近日,一篇名为“How OpenAI Sold its Soul for $1 Billion”(OpenAI是如何因为 10 亿美元出卖自己的灵魂)的文章在 Reddit 上引起了热议。

文章作者 Alberto Romero 抨击知名的非营利机构 OpenAI 为了金钱而出卖自己原有的“为人类造福”宗旨。

OpenAI 成立于 2015 年,创立之初便将自己定位为“非营利组织”,目标是以安全的方式实现通用人工智能(AGI),使全人类平等收益,而不是为公司的股东创造利润。

但在 2019 年,OpenAI 违背了它的初衷,成为了一家名为“OpenAI LP”的营利性公司,由一家名为“OpenAI Inc”的母公司控制。这时,OpenAI 成了一家有利润上限的机构,股东的投资回报被限制为不超过原始投资金额的 100 倍。也就是说,如果你投资 1000 万美元,你最多能得到 10 亿美元的回报。

OpenAI 的结构改了之后,没几个月,微软就注资了 10 亿美元。而微软与 OpenAI 的合作关系,是基于一个重要前提,即微软有权将 OpenAI 的部分技术商业化,比如 GPT-3 与 Codex。今年 5 月末,微软的官方网站便报道了他们用 GPT-3 的技术赋能内部商业产品,为用户服务:

微软新闻:https://blogs.microsoft.com/ai/from-conversation-to-code-microsoft-introduces-its-first-product-features-powered-by-gpt-3/

当 OpenAI 因金钱关系与大型商业公司达成合作协议,我们还能相信他们会信守承诺,从全人类的福祉出发来发展人工智能吗?亦或是,技术终将沦为资本的俘虏,情怀也难逃被出卖的命运?

1

金钱始终排在第一位

文章作者 Alberto 指出,OpenAI 的技术野心,决定了它难逃要与资本合作的宿命。

作为一个高定位的人工智能研究实验室,OpenAI 的雄心壮志要求它必须获取足够的资源支持,其中,金钱始终是排在第一位。比方说,去年夏天火热全网的 GPT-3,在训练阶段就已花费了大约 1200 万美元:

GPT-3 是一个大规模语言模型,光参数量就已达到 1750 亿。如果不寻求交易,他们很难获得这么雄厚的研究经费。所以,在他们意识到需要投资时,发现微软当时正等着给自己提供云计算服务,交换条件是微软届时能将它们尚未成熟的系统商业化。这时,一方可以获得计算资源,一方可以达到盈利,何乐而不为呢?

早在2020年2月,麻省理工科技评论的记者 Karen Hao 就发表了一篇文章,探究了 OpenAI 与微软的合作。Karen Hao 在“The messy, secretive reality behind OpenAI’s bid to save the world”一文中明确指出,经过对 OpenAI 内部员工的数次采访,她发现 OpenAI 的公开宣称内容(实现通用人工智能、使人类平均受益)与内部的运营方式存在不一致之处。

新闻链接:https://www.technologyreview.com/2020/02/17/844721/ai-openai-moonshot-elon-musk-sam-altman-greg-brockman-messy-secretive-reality/

为什么一家以造福全人类为基础的公司突然需要大量的私人资金?要知道,从创立之初,Open AI 就获得了马斯克、Sam Altman与 Peter Thiel(Paypal 创始人)等人 10 亿美元的私人投资。OpenAI 从非营利到营利的转变,不仅引起了公众舆论的不解,也在公司内部遭到了批评。

艾伦人工智能研究所的所长 Oren Etzioni 在得知微软注资 OpenAI 时,当时即表示怀疑态度,称:“我不同意非营利组织不具备竞争力的观点……如果规模更大、资金更多就代表(这个机构)会发展地更好,那 IBM 就不会被挤下第一名的位置。”

Vice News 的知名撰稿人 Caroline Haskins 也认为,OpenAI 已经违背了他们当初的使命:“(我们)从来没有试过靠风险投资者来改善人类的命运。”

我们不得不承认,OpenAI 将研究重点放在需要由更大算力与更大数据驱动的神经网络上,这必然需要很多金钱。但是,Alberto 也指出,如 Oren Etzioni 所言,金钱并不是取得最先进的 AI 成果的唯一途径。更多时候,你需要的是极富创造性的想法,而不是靠堆更多的算力,或更多的数据。

2

OpenAI 是如何沦落的?

GPT-2 与 GPT-3 的诞生

2019 年初,已经成为营利性公司的 OpenAI 发布了一个强大的语言模型——GPT-2,能够生成达到人类水平的文本。尽管 GPT-2 在当时是一个巨大的飞跃,但也有许多研究人员将其比喻为一只“危险的怪兽”,无法与大众共享。比如,他们担心 GPT-2 会被用来“传播假新闻、垃圾邮件与虚假信息”。

但这份担心很快就被打消。GPT-2 没有被广泛证明有滥用的风险,所以研究人员还是纷纷使用了 GPT-2。

罗格斯大学的教授 Britt Paris 曾评论,GPT-2 的诞生似乎不是为了造福人类,反而像是 OpenAI 利用了人工智能可能会给人类社会带来的恐慌,从而引起媒体的注意。他们认为,GPT-2 并不像 OpenAI 声称的那样强大,但是,从营销的角度来看,他们可以吸引媒体的关注。

如果 GPT-2 没有他们宣称的那么强大,那为什么要让它看起来更危险呢?Alberto 认为,单从这一点来看,OpenAI 就已经没有遵守自己的道德标准。

2020 年 6 月,GPT-3 发布,比 GPT-2 大了 100 倍,更强大,本质上也许更危险。但 OpenAI 似乎认为新系统足够安全,可以与世界分享,所以通过 API 发布。他们设置了一个候补名单来逐个审查访问请求,但这并不能控制系统最终被用于何处。

“Language Models are Few-Shot Learners”一文中,他们甚至承认,如果 GPT-3 落入坏人之手,可能会带来不好的后果,比如“错误信息、垃圾邮件、网络钓鱼、滥用法律和政府程序、欺诈性学术论文写作和社会工程托辞”,或加剧性别、种族和宗教的偏见。

论文地址:https://arxiv.org/pdf/2005.14165.pdf

他们认识到问题的存在,但仍然允许用户对系统进行试验。关于通过 API 发布,OpenAI 当时的回应是“支付他们接下来的 AI 研究、安全与政策制定等工作”。

一句话总结,就是说:“负责”保护人类免受 AI 侵害的公司决定让人们使用一个能够造成虚假信息和危险偏见的系统,以便他们可以支付昂贵的维护费用。这还是“对所有人都有价值”吗?

所以,当时社交媒体上很快就出现了关于 GPT-3 可能造成的潜在问题的激烈讨论。Facebook 人工智能研究的负责人 Jerome Pesenti 当时就写了一条推文,在推文中举了一个例子,谈到 GPT-3 可能会生成加剧种族与性别歧视的文本:

UC Berkeley 的计算机系学生 Liam Porr 还用 GPT-3 写了一篇能提高写作效率的文章,与订阅者分享,但没有透露其中的技巧。这篇文章在 Hacker News 上排名第一。如果 UC Berkerley 的大学生都会设法用人工智能编写的作品欺骗所有人,那么一群有恶意的人会做什么呢?

链接:https://adolos.substack.com/p/feeling-unproductive-maybe-you-should

除了传播假新闻,GPT-3 的另一个危害是传播人类无法区分的假新闻。这一点也被 OpenAI 在“Language Models are Few-Shot Learners”一文中认可、甚至强调了:

“[M]ean human accuracy at detecting the longer articles that were produced by GPT-3 175B was barely above chance at 52%. This indicates that, for news articles that are around 500 words long, GPT-3 continues to produce articles that humans find difficult to distinguish from human written news articles.”

(人类在检测 GPT-3 175B 生成的较长文章时的平均准确率仅略高于 52%。这表明,GPT-3 能够继续生成人类难以区分的、长度约为 500 字的新闻文章。)

Codex and Copilot,侵权了吗?

今年他们也做了类似的事情。

几周前,OpenAI、GitHub和微软联合发布了一款编程工具 Copilot,这款工具基于GitHub及其他网站的源代码,可根据上文提示为程序员自动编写下文代码!被称为是结对编程的虚拟版本。

结对编程是一种常见的敏捷软件开发技术——即两个开发人员在同一个项目上并肩协作,轮流编写代码并检查合作伙伴的输出。

抛开可能对开发者造成的潜在威胁不谈,这款工具仅发布几天后便遭到了猛烈的抨击,原因是它在未经许可的情况下,使用了公共的Github存储库的开源代码。

当时,GitHub的首席执行官 Nat Friedman 公布这则消息后,Hacker news上已经有不少网友在讨论,Copilot可能会存在潜在的法律风险。

链接:https://news.ycombinator.com/item?id=27676939

比如,一位网友就指出了多个疑问:

AI生成的代码属于我?还是GitHub?

生成的代码属于哪个许可证?

如果生成的代码侵权,谁来承担法律责任?

一位从事开源工作的开发者 Armin Ronacher 直接在 Twitter 上分享了一个示例,表明 Copilot确实存在剽窃版权代码的可能。

下面也有一位网友评论说:“我们也发现Copilot 直接复制了一段GPL代码,这说明它在商业使用上是有风险的。

其实,就算Copilot没有逐字复制代码,也会产生一个道德问题:GitHub 或者 OpenAI 等公司是否有权使用数千名开发者的开源代码对自己的系统进行训练,并将这些系统的使用权卖给开发者自己?

一位开发者兼游戏设计师 Evelyn Woods 对此评论说:“他们好像在把开源当成一个笑话!”

3

我们还能寄希望于 OpenAI 吗?

OpenAI 现在真正的意图是什么?

Alberto 发出疑问:

难道他们已经与微软的利益捆绑在一起,以至于忘记了最初“造福人类”的宗旨?还是他们真的以为自己拥有最好的工具和人才可以独自开拓这条道路,这是否意味着OpenAI出卖了自己的灵魂?他们是按照自己的意愿来建设未来,还是考虑到了更多人?更重要的是,他们是否想从中获取巨额利润?

OpenAI 在迈向更复杂人工智能的道路上占据了主导地位,当然,也有许多其他有潜力的机构在做相关的工作,这些机构并没有与金钱产生直接的联系,因而也受到了外界广泛的关注。

就目前来看,大型科技公司的目标似乎是并不是建立一个满足科学好奇心的通用人工智能,也不是建立一个最安全、最负责、最道德的人工智能。他们的首要任务是赚钱!

当然,这本身并不违法,但在道德上需要警惕,因为他们可能会不惜一切手段去实现目标,而这个过程可能会对大多数人产生不利影响。

之前 OpenAI 联合创始人埃隆·马斯克(Elon Musk)就曾批评其称:OpenAI 应该更加开放!

4

OpenAI 已经不再“Open”

在 Reddit 上,Alberto Romero 的文章也引起了网友的讨论。

链接:https://www.reddit.com/r/MachineLearning/comments/pizllt/d_how_openai_sold_its_soul_for_1_billion_the/

网友纷纷称:OpenAI 早已应该更名为“ClosedAI”。

也许 OpenAI 公司仍在坚持他们最初的使命,但他们也应该意识到:不能为了达到目的而不择手段,因为不合理的手段可能会损害更远大的目标。

毫无疑问,科学家们都希望实现通用人工智能。科学的好奇心是没有限度的,但我们也应该对潜在的风险保持警惕,就像核聚变是了不起的发明,但核聚变炸弹不是。

换一个角度来讲,我们愿意为了实现通用人工智能而付出任何代价吗?至少从道德上,很多人是不愿意的。科学家们或许更应该注意到这一点。

我们正在快速地更新这些深刻改变人们生活的技术。但是,如果只关心自己的利益和目标,无论是 OpenAI 还是其他人,最后都应该对后果承担很大的责任。

参考链接

  • https://onezero.medium.com/openai-sold-its-soul-for-1-billion-cf35ff9e8cd4

  • https://www.reddit.com/r/MachineLearning/comments/pizllt/d_how_openai_sold_its_soul_for_1_billion_the/

  • https://blogs.microsoft.com/ai/from-conversation-to-code-microsoft-introduces-its-first-product-features-powered-by-gpt-3/

  • https://www.theverge.com/2019/11/7/20953040/openai-text-generation-ai-gpt-2-full-model-release-1-5b-parameters

  • https://openai.com/blog/openai-api/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483868.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【算法】蓝桥杯dfs深度优先搜索之排列组合总结

【导航】 上一篇文章 → 《【算法】蓝桥杯dfs深度优先搜索之凑算式总结》 为了重申感谢之意,再次声明下文的大部分灵感均来自于【CSDN】梅森上校《JAVA版本:DFS算法题解两个例子(走迷宫和求排列组合数)》  强烈大家去上面那篇文…

人工神经网络能否驾驭生物神经元的“浓稠”程度?5到8层可能并非极限

来源:图灵人工智能编译:李扬霞编辑:青暮计算神经科学家通过训练人工神经网络来模仿生物神经元,提供了一种探讨单个脑细胞复杂性的新方法。虽然我们糊状的大脑似乎与计算机处理器中的芯片大相径庭,但科学家对两者的比较…

困扰爱因斯坦的「幽灵般的超距作用」,是如何被贝尔定理证明确实存在的?...

文章来源:机器之心作者:Ben Brubaker原文链接:https://www.quantamagazine.org/how-bells-theorem-proved-spooky-action-at-a-distance-is-real-20210720/我们理所当然地认为,世界上某个地方发生的一件事不会立即对远方的事物产生…

Jupyter notebook 导入和卸载 conda 虚拟环境

一、导入 进入Anaconda Prompt,激活要使用的虚拟环境。 conda activate xxx # 你要使用的虚拟环境名称安装 ipykernel 插件, 建议使用 pip 进行安装, conda 安装容易失败 pip install ipykernel安装完成之后,键入以下命令 pyt…

处理器管理与进程管理

4.python练习 1.观察父进程、子进程 2.观察进程运行状态 3。输入多个作业的作业编号,到达时间,所需CPU时间,形成列表,以备算法使用。 转载于:https://www.cnblogs.com/hclhechunlu/p/10580946.html

小白 LeetCode 242 有效的字母异位词

字母异位词 字符串由相同字母组成,但允许排列顺序不同。 如“aaabbb” 与 “ababab” 是字母异位词, 而“aabb” 与 “ab” 不是字母异位词。 题目:给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。 示例…

LSTM之父:吐槽了两年,来划划重点:“这5篇最高引论文都源于我们。”

来源:AI科技评论作者:陈彩娴编辑:青暮昨晚,“递归神经网络之父”Jrgen Schmidhuber 在推特上亲自发文,称目前引用数最高的5项神经网络工作都基于他的团队成果,一时引起了网友的广泛讨论。这并不是他首次发声…

初学者配置环境变量

1. 首先选择计算机右击,选择最后一个属性,进入属性面板 2. 点击“高级系统设置”,点击“环境变量” 3. 在“系统变量”的处配置所需要配置的环境变量,点击“新建”按钮 4. 配置java的环境变量 JAVA_HOME 、CLASSPATH 、 Path5. JA…

小白 LeetCode 5605 检查两个字符串数据是否相等

题目:给你两个字符串数组 word1 和 word2 。如果两个数组表示的字符串相同,返回 true ;否则,返回 false 。 数组表示的字符串 是由数组中的所有元素 按顺序 连接形成的字符串。 示例 1: 输入:word1 [&q…

Mac OS X下Maven的安装与配置

Mac OS X下Maven的安装与配置: 下载maven:https://maven.apache.org/download.cgi 打开Terminal,输入以下命令,设置Maven classpath,输入命令 vim ~/.bash_profile(编辑环境变量配置文件) MAVEN_HOME/…

演讲实录丨吴朝晖院士:从AI到CI——脑机智能的发展

来源:中国人工智能学会原创 :CAAI作者:吴朝晖院士吴朝晖中国科学院院士浙江大学校长IEEE/CAAI/CCF/CAA Fellow以下是吴朝晖院士的演讲实录:21世纪被称为“脑研究世纪”,伴随着脑科学和认知科学的兴起,特别是…

LeetCode 1480 一维数组的动态和

题目: 给你一个数组 nums 。数组「动态和」的计算公式为:runningSum[i] sum(nums[0]…nums[i]) 。 请返回 nums 的动态和。 示例 1: 输入:nums [1,2,3,4] 输出:[1,3,6,10] 解释:动态和计算过程为 [1,…

推荐系统简介

推荐系统简介 文章目录推荐系统简介1.推荐系统概述推荐系统目的我们推荐的目的:推荐系统的应用推荐系统的基本思想推荐系统的数据分析推荐系统分类2.推荐系统简介基于人口统计学的推荐基于内容的推荐基于协同过滤的推荐混合推荐3.推荐系统评测推荐系统的实验方法推荐…

清华大学孙茂松:透过喧嚣,坐看云起,NLP 的迷思与感悟

来源:智源社区图源:澎湃新闻2010年深层神经网络在语音识别研究方向上取得里程碑式进展,以这一事件为新起点和新动能,整个人工智能领域迅速跃迁到深度学习时代,包括自然语言处理(NLP)等关键领域也…

2022年科学突破奖,9人共获奖金1500万美元,mRNA 新冠疫苗2位奠基人获奖

来源:科研圈编辑:David9 月 9 日,2022 年科学突破奖获奖名单在美国旧金山公布。生命科学奖、物理学奖、数学奖分别授予 5 个项目共 9 位科学家,每个项目奖金金额为 300 万元。新冠 mRNA 疫苗技术奠基者 Katalin Karik 与 Drew Wei…

多巴胺如何驱使我们克服复杂情况、逆境、情绪, 让我们掌控周遭的环境的

来源:本文摘自《贪婪的多巴胺》仅仅是“想要”很少能让你得到任何东西。你必须弄清楚如何获得它,以及它是否值得拥有。事实上,如果我们做事时不考虑怎么做和下一步做什么,失败甚至不是最坏的结果。结果可能从吃得有点儿多发展为不…

火爆股市的元宇宙,究竟关VR/AR什么事?

来源:VR每日必看VR设备被普遍认为是进出元宇宙的主要终端,据Wind数据,VR概念的上市公司包括歌尔股份、中科创达、欣旺达等55家公司。大洋彼岸的“蝴蝶”扇动翅膀,A股的元宇宙概念也火热起来。A股代表性企业中青宝已经连续两日“20…

2018-2019-2 网络对抗技术 20165301 Exp2 后门原理与实践

2018-2019-2 网络对抗技术 20165301 Exp2 后门原理与实践 实验内容 (1)使用netcat获取主机操作Shell,cron启动(2)使用socat获取主机操作Shell, 任务计划启动(3)使用MSF meterpreter(或其他软件)生成可执行文件,利用ncat或socat传送…

世界机器人大会|人工智能VS人类

来源:新华社作者:北京邮电大学人工智能学院 刘伟配音:郑琬策划、终审:刘君校对:周雪晴2021世界机器人大会于9月10日至13日在北京召开,世界机器人博览会及世界机器人大赛将同期举办。其实,智能不…

LeetCode LCP 06. 拿硬币

题目:桌上有 n 堆力扣币,每堆的数量保存在数组 coins 中。我们每次可以选择任意一堆,拿走其中的一枚或者两枚,求拿完所有力扣币的最少次数。 示例 1: 输入:[4,2,1]输出:4解释:第一…