改变宇宙之前,GPT-3最先改变的可能是OpenAI

大数据文摘出品

来源:bdtechtalks

编译:Hippo

GPT-3是人工智能研究实验室OpenAI的最新成果。它是有史以来规模最大的语言模型,引发了一系列关于人工智能将如何快速改变众多行业的讨论。

但是,很少有人去讨论GPT-3是如何改变OpenAI本身的。在创建有史以来最成功的自然语言处理系统的过程中,OpenAI已逐渐从一个非盈利性人工智能实验室演化成一家出售人工智能服务的公司。

由于纠缠在两个相互矛盾的目标之间,该实验室处于一种不稳定的状态。一方面要开发有利可图的人工智能服务,另一方面又要探索人类级别的人工智能并造福所有人。在这之间寻求平衡是OpenAI成立的特殊使命。

OpenAI构架的变化

2019年3月,OpenAI宣布它将从非营利实验室转变为“盈利设限”公司。这种模式为从投资者和大型科技公司筹集资金开辟了道路,投资方被告知他们的回报将以投资额的100倍为上限(这上限够诱人!)。

为什么会发生这样的架构变化?该公司在一篇网站告示中宣布,此举旨在“迅速增加我们在算力和人才方面的投资以平衡实现公司使命所需要的支出。”

“算力和人才”是这里的关键词。

人才和算力成本是人工智能研究的两个核心挑战。从事OpenAI这类研究的人才库非常有限。鉴于对人工智能商业化的兴趣日益浓厚,大型科技公司之间在为自己的项目招募人工智能研究人员时存在激烈的竞争。这引发了一场军备竞赛,每家科技巨头都给出更高的薪水和津贴以吸引人工智能研究人员。

Google和Facebook抢走了3位深度学习鼻祖中的2位,即Geoffrey Hinton和Yann LeCun。备受尊敬的人工智能专家Ian Goodfellow(同时也是对抗式生成网络GAN的发明者)就职于Apple,另一位人工智能天才Andrej Karpathy在Tesla工作。

OpenAI对科学研究仍然有浓厚的兴趣,但是随着大多数人工智能人才被吸引到可以提供丰厚薪水的公司,非营利性人工智能实验室发现要填补他们的职位空缺越来越难,除非他们能够提供类似水平的薪水。根据2018年《纽约时报》的报道,只有少数OpenAI的研究人员每年能获得超过100万美元的收入,而报告称另一家人工智能研究实验室DeepMind在2018年向700名员工支付了超过4.83亿美元的薪水。

深度学习算法是人工神经网络的主要组成部分,而其算力需求是导致人工智能成本进一步增加的主要原因。在能够胜任实际任务之前,神经网络必须对利用大量案例进行训练,这一过程需要昂贵的计算资源。近些年OpenAI参与了一些非常昂贵的人工智能项目,包括通过机械手臂玩转Rubik魔方,通过扮演游戏对手击败Dota2冠军,以及一组人工智能扮演不同角色玩500万次捉迷藏游戏。

据估计,训练GPT-3至少需要460万美元。需要明确的是,训练深度学习模型并不是一个纯粹的一次性的过程。反复的试验、意外的错误和超参数调整可能会使成本增加数倍。

OpenAI并不是第一个采用商业模式的人工智能研究实验室。面对类似的困境,DeepMind在2014年接受了Google提出的6.5亿美元的收购提议。

OpenAI领导层的变化

在联合创始人之一Sam Altman的领导下,OpenAI开始向投资者开放市场化营销,他辞去了备受推崇的创业加速器Y Combinator的总裁一职并成为OpenAI的首席执行官。

在Altman之前,Greg Brockman是该组织的代表。Brockman是OpenAI的联合创始人兼CTO,同时也是一位经验丰富的科学家和工程师。

在科技投资领域,声誉和产品管理能力比科学天才更受重视,而Altman正是那种受投资者信任,并能把资金交给他管理的人。在Y Combinator任职期间,他帮助创立了许多成功的公司,包括Airbnb和Dropbox。

2019年5月,在接受知名科技媒体TechCrunch采访时,Altman说:“我们从未取得任何收益,目前也没有赚钱的计划。也许某一天我们会赚到钱,但我们并不知道如何做。”

但这并没有妨碍投资者对OpenAI大笔投资。微软相信Altman会以某种方式找到使投资获利的方法,因此他们在7月向该公司提供了10亿美元的投资。

OpenAI任务的改变

但是,技术投资公司和类似OpenAI这样的科学研究实验室是存在根本上的冲突的。

OpenAI的既定使命是确保能够“构建安全的通用人工智能(AGI)并向全世界分享这项技术来惠及全人类”。

但是根据专家估计,要想实现AGI这个崇高的目标至少需要几十年的时间,而科技投资者的耐心极少能有那么久。如果几年之内其投资无法得到回报,他们将会变得懈怠。对于这一点只需要看看著名的Boston Dynamics(波士顿动力公司),尽管在YouTube上发布的机器人视频像病毒似的疯狂传播,但筹资者已经几度易手。

那么,OpenAI如何能够在保持AGI研究的同时获得资助者青睐?

“OpenAI正在开发一系列功能越来越强大的人工智能技术,这需要大量资金以支撑算力。想要覆盖这些成本最显而易见的方法是制造出一个产品,但这将意味着我们工作重心的转移。我们选择了折中的方法,我们打算推出部分“准AGI”技术,而微软成为我们将这些“准AGI技术”商业化的首选合作伙伴,”OpenAI在宣布获得Microsoft投资的博客公告中写道。

相关链接:

https://openai.com/blog/microsoft/

但是有明显迹象表明,OpenAI至少部分地成为了一家产品公司。

GPT-3的商业版本

2020年5月,Microsoft宣布与OpenAI合作并专门为OpenAI建设世界前五名级别的超级计算机,由此Microsoft可以充分挖掘OpenAI的才能来创建Altman所说的“我们的梦想系统”。超级计算机一方面将帮助OpenAI训练其深度学习模型,另一方面还将为Microsoft Azure云计算平台的其他客户提供服务。

此后不到两周,OpenAI在arXiv(论文预印本网站)上发表了第一版的GPT-3论文。与之前的GPT-2不同,GPT-3不会向公众发布。OpenAI选择了商业发布,开发人员可以通过应用程序编程接口(API)购买对GPT-3的访问权限。

OpenAI 的API公告于6月11日发布,一些开发人员可以获得相关技术的早期访问权限。

这使GPT-3与微软认知服务(Microsoft Cognitive Services)十分相似,后者是一个基于黑盒子的人工智能云平台,通过API接口向开发人员提供计算机视觉、自然语言处理和其他人工智能类功能,同时无需提供后台运行的模型的实际细节。

这至少将帮助OpenAI返还Microsoft投资的一部分,同时Microsoft也将从双方合作中受益并更深入地应用该项技术,能够将其与Bing,Office 365,Outlook.com和Teams等产品集成。

GPT-3的商业发布使OpenAI与成为人工智能产品公司更近了一步,而与非盈利性人工智能科学研究的初衷越发偏离。

淡化人工智能警告

在开发出GPT-2后,基于对“技术的恶意应用”(例如散布垃圾邮件和虚假新闻)的担忧,OpenAI团队决定不向公众发布。取而代之的是采用了分阶段的方法,先发布了一个较小版本的人工智能模型并进行了评估,之后才发布了较大的模型。

虽然当时的作者认为性能良好的语言模型不会造成假新闻的泛滥,但他也支持在发布技术之前先认真地思考一下这种技术可能带来的后果。

GPT-3比GPT-2大三个数量级。在深度学习的语言模型中,关键问题之一是记忆广度。随着神经网络生成的文本变长,人工智能开始失去连贯性。实验表明,较大的神经网络通常具有较长的记忆广度,这意味着GPT-3中被误用的可能性比GPT-2要大得多。

但是这次OpenAI并没有为GPT-3可能成为制造垃圾邮件机的和虚假新闻的武器而大声疾呼。相反,OpenAI高管们试图淡化有关GPT-3的警告。7月, Sam Altman在一条推文中删除了“ GPT-3宣传”。

Altman的评论大部分是正确的,因为人工智能在达到人类智力水平之前还有一段路要走。GPT-3的许多实验表明,尽管取得了令人着迷的进步,但语言模型仍然难以解决一些体现智能的基本任务。

尽管如此,Altman的言论依然可以表明公司高管向投资者保证一切都在控制之中。

作为产品公司的OpenAI

GPT-3自发布以来受到了技术界的广泛好评。许多开发人员和企业家都发布了GPT-3自动生成内容的推文,例如诗歌、模因(文化的基本单位,与基因在生物进化过程中所起的作用相类似)、推文和网站模型。

一位开发人员甚至设法用GPT-3生成Python代码用来搭建深度学习模型。

GPT-3具有明显的优势,并有可能成为人工智能业务的转折点。深度学习的主要限制之一在于它是狭义的人工智能系统。它在特定的任务上可以表现很好,但推广到其他领域中就表现不佳了。想要创建一个新的深度学习应用程序,就必须从零开始训练模型或运用迁移学习对新任务的预训练模型进行参数微调。

这种限制阻碍了人工智能服务作为平台的发展。尽管GPT-3仍然属于狭义的人工智能领域,但事实证明,它在许多没有学习样本的训练中依然能够运行。这就意味着你无需重新调整参数,它也能适应新的应用程序。

这种功能已经催生了许多运用人工智能模型创造新服务的点子。Debuild.co就是这样一个通过GPT-3创建Web应用程序的公司。

帮助租户研究潜在房东的公司Augrented,正在探索通过GPT-3撰写法律告示或其他简单的英语声明,帮助租户捍卫自己的权利。

OthersideAI也在运用GPT-3向用户提供创意工具。

GPT-3最终可能会成为一个新平台,在此平台上将创建新的业务和生态系统。这对于Altman是成功的,但是它会使OpenAI成为一个产品/服务公司,这与发布开源人工智能模型并让开发人员用它来做自己的事情是完全不同的。

现阶段的OpenAI需满足客户需求,扩展其基础架构,处理合规性问题等。随着人工智能模式成为初创公司生死攸关的力量,OpenAI还必须能够应对开展深度学习业务所带来的特定挑战。OpenAI仍有许多问题需要处理,如消除有害偏差,解决模型衰减等等。这些都是成本极其高昂的任务,处理1750亿参数的深度学习模型尤为如此。

与此同时,OpenAI在需要弄清如何解决这些事情的同时,还需保持盈利。

尽管Altman是一位非常成功的企业家,他也无法单打独斗。随着OpenAI进一步涉足产品管理领域,它将需要Microsoft的更多帮助。

OpenAI已经在依靠Microsoft的云架构来训练和运行其模型,但不久的将来,它可能需要这家技术巨头来协助处理合法性、客户支持、安全隐私、产品扩展等其他问题。

OpenAI的未来

旧金山OpenAI总部

OpenAI的故事描绘出了科学人工智能研究面临的挑战。目前,人们普遍认为更大的深度学习模型将发展出更先进的人工智能系统。这意味着人工智能研究实验室需要大量资金吸引人才来训练他们日益庞大的深度学习模型。

目前,唯一愿意提供资金的是那些大型高科技公司,但投资者同样希望获得投资回报,这就迫使研究实验室不得不利用部分资源来创造有利可图的产品。如此一来,大型公司可能会完全将实验室纳入自己的商业目标。

在Google收购DeepMind之后,我们已经看到了这种趋势:人工智能实验室必须将资源同时分配给AGI研究部门和致力于创造可盈利产品的“应用人工智能”部门,但是该公司尚未实现收支平衡。

至于OpenAI,它现在还发展的很好。越是困于将人工智能服务商业化,不忘初心就越难。它是会坚持维持研究人类智力水平的人工智能的透明性、坚持开放源代码性质,还是会倾向于通过生产商业实体,并将其研究作为公司的机密和知识产权予以严密保护?它是会坚持“以人为本”,还是以满足投资者(及未来所有者)作为其主要关注点?

时间会证明一切。

相关报道:

https://bdtechtalks.com/2020/08/17/openai-gpt-3-commercial-ai/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487091.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

day2-元组 列表-赋值和深浅拷贝

一 元组 元组其实跟列表差不多,也是存一组数,只不是它一旦创建,便不能再修改,所以又叫只读列表 用途:一般情况下用于自己写的程序能存下数据,但是又希望这些数据不会被改变,比如:数据…

乖乖给行人让路?学界推出无人机控制技术NMPC,可在低空中实现自主导航和避障...

来源:万物智能视界前天,在深圳经济特区40周年庆上,上千架无人机在深圳上空演绎了一场大型灯光秀。近些年,各种无人机高空秀屡见不鲜,在刚刚过去的七夕夜上,上海警方也运用无人机开启了一场反欺诈安防宣传。…

一天学习一个设计模式之命令模式

命令模式(Command),将一个请求封装为一个对象,从而使你可用不同的请求对客户进行参数化;对请求排队或记录请求日志,以及支持可撤销的操作。 代码如下: 1 /** 2 * 抽象命令角色类 3 */ 4 publi…

PNAS:张航课题组揭示人类为何“扭曲”概率信息

来源:脑科学2020年8月25日,北京大学心理与认知科学学院、北京大学IDG麦戈文脑科学研究所、北大-清华生命科学联合中心的张航研究组在美国科学院院刊(PNAS)上发表了题为“The bounded rationality of probability distortion”的文…

修改结构体中成员的值

#include <iostream> using namespace std; struct student { char name[10]; float grade; }; //更改student数据的grade成员&#xff0c;参数形式为引用 void change(student& x, float grade) { x.grade grade; } //更改student数据的grade成员&…

为什么AI感知与人类感知无法直接比较?

来源丨TechTalks作者丨Ben Dickson编译丨科技行者人类级别的表现、人类级别的精度……在开发AI系统的企业中&#xff0c;我们经常会听到这类表述&#xff0c;其指向范围则涵盖人脸识别、物体检测&#xff0c;乃至问题解答等各个方面。随着机器学习与深度学习的不断进步&#xf…

微软白皮书:47页报告详解中国芯片设计云技术

来源&#xff1a;智东西在多方面因素的推动下&#xff0c;中国的芯片设计行业迎来了前所未有的发展契机。当前&#xff0c;我国芯片设计业的产品范围已经涵盖了几乎所有门类&#xff0c;且部分产品已拥有了一定的市场规模&#xff0c;但我国芯片产品总体上仍然处于中低端&#…

一文读懂马斯克展示脑机接口:硬币大小芯片植入猪脑 实时读取猪脑信息

视频&#xff1a;马斯克展示脑机接口设备无线实时读取猪脑信息&#xff0c;时长约7分10秒来源&#xff1a;腾讯科技马斯克展示了一群实验猪。这些实验猪之前曾接受过外科手术&#xff0c;由手术机器人将最新版的Neuralink设备植入大脑。这些项目的目标都是利用大脑植入技术实现…

循环,函数,指针作业

一、循环 题目1&#xff1a;7-6 统计素数并求和 提交列表&#xff1a; 流程图&#xff1a; 问题&#xff1a; 解决&#xff1a;mn最多一个素数&#xff0c;都为0无答案&#xff1b;m和n本身也可能是素数。 题目2&#xff1a;7-12 约分最简分式 提交列表&#xff1a; 流程图&…

华为徐文伟:后香农时代,面向数学的十大挑战问题

本文为2020年8月28日徐文伟在长沙由中国工业与应用数学学会举办的“数学促进企业创新发展论坛”上的发言来源&#xff1a;中国科学院院刊徐文伟华为技术有限公司董事&#xff0c;华为战略研究院院长后香农时代数学决定未来发展的边界数学作为基础的基础&#xff0c;将决定未来发…

06006_redis数据存储类型——String

1、概述 &#xff08;1&#xff09;字符串类型是Redis中最为基础的数据存储类型&#xff0c;它在Redis中是二进制安全的&#xff0c;这意味着该类型可以接受任何格式的数据&#xff0c;如JPEG图像数据或Json对象描述信息等&#xff1b; &#xff08;2&#xff09;在Redis中字符…

comparator 多个条件控制_JUnit5学习之四:按条件执行

欢迎访问我的GitHubhttps://github.com/zq2599/blog_demos内容&#xff1a;所有原创文章分类和汇总&#xff0c;及配套源码&#xff0c;涉及Java、Docker、Kubernetes、DevOPS等&#xff1b;本篇概览本文是《JUnit5学习》系列的第四篇&#xff0c;有时咱们希望测试方法仅在一定…

“星链”或成美军未来作战理念新载体

本文来源&#xff1a;中国军网在美国航天政策愈发重视商业航天发展&#xff0c;尤其是美太空军发展对巨型弹性低轨星座提出重大需求的背景下&#xff0c;美国太空探索公司SpaceX乘势将业务从商业航天发射、载人航天货物和乘员运输逐渐扩展至低轨宽带通信服务&#xff0c;即“星…

基基于多态的职工管理系统

效果 添加 显示 删除 查找 排序&#xff08;不演示了&#xff09; 清空所有 头文件 员工类 #pragma once #include <iostream> #include <string> using namespace std;//职工抽象基类 class Worker { public://显示个人信息virtual void showInfo() 0;//获取…

typescript箭头函数参数_Typescript 入门基础篇(一)

Typescript 基础Typescript是Javascript的一个超集。以下typescript简称为ts, 此文章主要是对ts官网文档的一个简化&#xff0c;缩短学习基础时间。类型基础ts 的类型主要有布尔值、数字、字符串、数组、元组、枚举、Any、Void、Null和Undefined、Never。# Boolean let boo : b…

sublime学习笔记

学习课程地址&#xff1a;快乐的sublime编辑器_sublime编辑器使用 另可参考笔记地址&#xff1a; http://c.haoduoshipin.com/happysublime/ http://blog.csdn.net/u014465934/article/details/72810763 PS&#xff1a;博主的一些文章地址&#xff1a;http://happypeter.github…

里程碑式的数学证明,攻破著名Erdős猜想中关键障碍

大数据文摘出品来源&#xff1a;wired编译&#xff1a;Canary、Andy最近&#xff0c;两名数学家解决了一个关于整数相加性质最著名猜想中的第一部分。该猜想由匈牙利传奇数学家Paul Erdős于60多年前提出&#xff0c;一个无限整数序列在何时一定会包含至少有三个等差数的模式&a…

浅复制和深复制

浅复制是由默认构造函数实现的&#xff0c;将对应数据成员一一复制。 浅复制 template<class T> Array<T>::Array(const Array<T>&a) {sizea.size;a.list list; }如果主函数中有这样的语句&#xff1a; int main() {Array<int> a(10);Array<…

admin select 2 异步_解决Angularjs异步操作后台请求用$q.all排列先后顺序问题

最近我在做angularjs程序时遇到了一个问题1.页面有很多选择框&#xff0c;一个选择框里面有众多的选择项&#xff0c;和一个默认选定的项,像下面这样(很多选择框&#xff0c;不只一个)&#xff1a;2.众多的选项要从后台接口得到&#xff0c;默认项从另一个后台接口得到&#xf…

产业|世界十大工业自动化公司,你知道几家?

来源&#xff1a;机械前线国内工业自动化行业的竞争激烈&#xff0c;国外工业自动化设备、产品制造商依然控制国内上游产品供应的主要市场&#xff0c;下面来看看国外最赚钱的工业自动化公司有哪些。▶1、德国西门子西门子股份公司(SIEMENSAGFWB:SIE&#xff0c;NYSE:SI)是全球…