麦肯锡专访 Mistral AI CEO:三五年后的工作,要比现在更有意义

【编者按】总部位于巴黎的人工智能初创公司 Mistral AI 成立仅一年,就被誉为现有大模型巨头的有力挑战者。

今年 2 月,Mistral AI 正式发布了旗舰级大模型 Mistral Large,直接对标 OpenAI 的 GPT-4;几周前,Mistral AI 发布了其新一代开源语言模型 Mixtral 8x22B,声称实现了最高的开源性能和效率。

该公司首席执行官兼联合创始人 Arthur Mensch 以及其他两位联合创始人 Guillaume Lample 和 Timothée Lacroix 在回到法国创办 Mistral 之前,分别任职于 Google DeepMind 和 Meta,后来因意识到生成式人工智能在欧洲的绝佳机会,辞职选择创业。

日前,Mensch 在接受麦肯锡高级主管 Eric Hazan 和 Stéphane Bout 采访时,详细介绍了 Mistral 的开源战略、欧洲如何在人工智能竞赛中竞争,以及人工智能将如何改变工作场所。部分核心观点如下:

人类在人工智能的进程中仍然非常重要,我们应该将生成式人工智能工具视为提高生产力和创造力的一种方式。

大型语言模型和生成式人工智能就像一种新的编程语言,它更加抽象,也更容易被人类语言所控制。

人们将专注于其他模型无法完成且永远不会被取代的工作,其中包括人际关系管理、发散思维、创造性思维和发明新想法。

三五年后,我们所做的工作应该比现在的工作更有意义。

语言问题可能在一定程度上阻碍了欧洲生成式人工智能的发展。

开源模型的部分价值在于,它可以帮助客户创建更便宜、更快速、更好的应用程序。

在这里插入图片描述

图|Mistral AI 首席执行官兼联合创始人 Arthur Mensch

学术头条在不改变原文大意的情况下,做了简单的编译。内容如下:

Eric Hazan:能否向我们介绍一下您创建 Mistral AI 的历程?是什么促使您创办了这家公司?

Arthur Mensch:当然可以,我是科学家出生。我拥有机器学习和功能性磁共振成像专业的博士学位,之后在数学专业做了两年博士后研究。之后我加入了Google DeepMind,我在那里从事了两年半的大型语言模型(LLMs)研究,大约一年前离开了。

Eric Hazan:是什么让您进入生成式人工智能领域的?

Arthur Mensch: 我想我是被典型的研究偶然性带到那里的。我当时正在研究深度学习,因此产生了浓厚的兴趣。我就此写了一篇论文,但随后又回到数学研究领域,一待就是两年。我加入 DeepMind 时,有一个研究深度学习的小团队,当我做了一些有趣的工作来改进流程时,我的兴趣又被点燃了。

Eric Hazan:在共同创办 Mistral AI 公司的过程中,有什么趣闻轶事想与我们分享?

Arthur Mensch: 我和联合创始人 Guillaume Lample、Timothée Lacroix 从学生时代就认识,已经有十年了。我在 DeepMind 工作,Guillaume 和 Thimothée 在 Meta 工作,我们三人都在硅谷生活和工作并研究深度学习。当我们看到生成式人工智能领域正在加速发展时,我们意识到,这是一个在法国创建公司并加快创建先进大型语言模型进程的绝佳机会。

Eric Hazan:换个更宽泛的问题,你认为人类在人工智能的进程中处于什么位置?

Arthur Mensch:人类仍然非常重要。我们应该将生成式人工智能工具视为提高生产力和创造力的一种方式。通常情况下,生成式人工智能工具只有在正确提示的情况下才能生成有趣的内容,或者创建一个足够聪明的应用程序。

无论是开发者还是创新者,都需要做大量的工作,才能真正产生可操作且有价值的结果。除了功能更强大之外,它与传统的文字编辑器并无太大区别。但你确实应该将它视为一种生产力工具和创建新应用程序的途径。因此,在这种情况下,大型语言模型和生成式人工智能就像一种新的编程语言,它更加抽象,也更容易被人类语言所控制。

Eric Hazan:这是下一个问题的绝佳切入点。您认为我们的生活,尤其是我们的工作方式在未来三到五年内会发生怎样的变化?

Arthur Mensch:我认为,对于许多琐碎的工作来说,一些工具将赋予我们力量,它们要么可以帮助我们完成这些工作,要么可以帮助我们更快地完成这些工作。这意味着我们将能够专注于其他模型无法完成且永远不会被取代的工作,其中包括人际关系管理、发散思维、创造性思维和发明新想法。一般来说,三五年后我们所做的工作应该比现在的工作更有意义。

Eric Hazan:让我们换个话题,具体谈谈 Mistral,您如何解释自己在生成式人工智能领域的发展速度?

Arthur Mensch:我想谈两点。首先,我们拥有一支非常强大的团队,他们经验丰富,能够在很短的时间内完成生产和交付。这并不是一件容易的事,但这就是我们能够在短短四个月内完成模型发布的原因。

我们之所以能以如此快的速度为人所知并获得一定的知名度,与我们从一开始就采用的开源策略密不可分。这创造了巨大的需求,从采用指标来看,我们基本上领先于那些已经存在了五年的公司。这一战略发挥了很好的作用,我们现在正利用这一战略为我们的产品提供反馈。

Eric Hazan:在复杂的环境中,所有的人工智能公司似乎都很相似,是什么让 Mistral 与众不同?

Arthur Mensch:Mistral 的与众不同之处在于我们的便携式解决方案,它可以通过我们的应用编程接口 (API) 作为软件即服务 (SaaS) 与任何云提供商一起使用。您可以访问云上的类似 API,也可以访问我们的 API。最重要的是,它可以作为一个平台进行部署。

因此,如果你有一个私有云,你想对工作负载进行大量定制,或者你在企业内部运行,我们基本上是唯一的解决方案。这一切都与我们乐于广泛分享我们的技术有关—— 这也是我们乐于分享开源技术的原因。

一般来说,我们的价值主张有三个方面。首先是部署的灵活性和平台的可移植性,允许用户在虚拟私有云(VPC)、内部部署和云中部署。其次是价值,因为我们的模型在价格方面定位非常准确,而且它们的运行速度非常快,性能达到顶级水平。第三是定制化,当我们提供模型时,我们会对模型权重进行授权,因此客户的技术团队可以随意修改这些权重,我们计划很快通过服务来支持这一点。

Eric Hazan:Mistral 对开源模型有很强的承诺。你认为它们能加快价值的采用和创造吗?

Arthur Mensch:当然,我认为这是一种基础架构技术,可以被转换成任何类型的应用。我们确实相信,应用制造商需要创造差异化,也需要深入掌握技术。而做到这一点的唯一途径就是能够访问整个堆栈。发起这场运动的方法就是让人们相信,我们的开源模式可以让他们创建更便宜、更快速、更好的应用程序,这就是我们的起点。

在过去的六个月里,我们已经开始看到一些成果,因为许多公司意识到,他们可以将工作负载从闭源 API 转移到开源模型。我们现在推出了商业模式,这些模式的部署和交付就像开源模式一样具有完全透明的访问权限——这为我们的客户带来了很多价值。

Eric Hazan:现在我请 Stéphane 谈谈欧洲背景下的生成式人工智能。

Stéphane Bout:我们注意到全球范围内出现了大量的人工智能投资和激烈的研发竞争。与其他地区相比,欧洲如何才能保持独特性和竞争力?

Arthur Mensch:首先要牢记的是,这是一款基础设施软件,通常需要一些支持和与团队的互动。因此,我们建议欧洲客户与在性能方面具有竞争力的本地公司合作。很明显,这也是一种创造更多本地参与、塑造我们产品的路线图并产生一些非常有价值的支持的方式。

第二个方面,我认为可能在一定程度上阻碍了欧洲生成式人工智能的发展,那就是语言问题。所有最早的人工智能公司在美国成立,主要用英语工作。我们正在用我们的模型来解决这个问题,使它们在法语、德语和其他欧洲语言方面更加强大。

作为一家欧洲公司,我们意识到了语言问题,这对我们来说非常重要,比美国公司重要得多。与美国的另一个重要区别是,欧洲的公共云普及率较低。仍有很多欧洲企业没有使用公共云,这往往有很好的理由。因此,我们在私有云和企业内部部署方面的产品确实能引起这些客户的共鸣。

Stéphane Bout:在全球人工智能市场中,欧洲的主要优势和可能存在的弱点是什么?

Arthur Mensch:作为一个地区,欧洲人才济济,来自许多国家的许多人在数学和计算机科学方面都很强。这对 Mistral 来说是一个巨大的推动力,对客户来说也是一个巨大的推动力,因为客户通常都拥有强大的团队。

一个弱点是欧洲仍然是一个较为分散的市场。欧洲没有美国那样的技术生态系统,在那里,向其他技术公司销售产品是显而易见的。法国和欧洲其他国家也有一些科技公司,但它们之间的联系不如美国紧密。

原文作者:

Stéphane Bout,Eric Hazan

原文链接:

https://www.mckinsey.com/featured-insights/lifting-europes-ambition/videos-and-podcasts/creating-a-european-ai-unicorn-interview-with-arthur-mensch-ceo-of-mistral-ai

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/10030.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Element快速上手!

Element是饿了么公司前端团队开发的一套基于Vue的组件库,用于快速构建网页~ 官网链接: Element - The worlds most popular Vue UI frameworkElement,一套为开发者、设计师和产品经理准备的基于 Vue 2.0 的桌面端组件库https://element.elem…

UML之用例图

1.用例图 用例图指参与者,用例,边界以及它们之间的关系构成的用于描述系统功能的视图。说明是谁要使用系统,以及可以使用该系统可以做些什么。展示了一个外部用户能够观察到的系统功能模型图 2.用例图的元素 (1)参与…

Redis 实战之监视器

监视器 成为监视器向监视器发送命令信息总结 成为监视器 发送MONITOR 命令可以让一个普通客户端变为一个监视器, 该命令的实现原理可以用以下伪代码来实现: def MONITOR():# 打开客户端的监视器标志client.flags | REDIS_MONITOR# 将客户端添加到服务器…

C++初阶之stack,queue,priority_queue的使用和模拟以及仿函数的创建和使用

个人主页:点我进入主页 专栏分类:C语言初阶 C语言进阶 数据结构初阶 Linux C初阶 算法 欢迎大家点赞,评论,收藏。 一起努力,一起奔赴大厂 目录 一.stack,queue,priority_queue简介以及代码模拟 1.1 stack …

uniapp 版本检查更新

总体来说uniapp的跨平台还是很不错的,虽然里面各种坑要去踩,但是踩坑也是开发人员的必修课和成长路。 这不,今天就来研究了一下版本检查更新就踩到坑了。。。先来看看检查更新及下载、安装的实现。 先来看看页面: 从左到右依次为…

推荐3个实用的github开源项目

目录: 1、AI生成高清短视频 2、媒体平台爬虫 3、文本转语音项目

【Linux网络编程】I/O多路转接之select

select 1.初识select2.了解select基本概念和接口介绍3.select服务器4.select特点及优缺点总结 点赞👍👍收藏🌟🌟关注💖💖 你的支持是对我最大的鼓励,我们一起努力吧!😃😃…

系统架构设计师 - 计算机组成与体系结构(1)

计算机组成与体系结构 计算机组成与体系结构计算机结构 ★CPU 组成结构运算器组成控制器组成 计算机体系结构冯诺依曼结构哈弗结构 嵌入式芯片(了解) 存储系统 ★★★★概述Cache主存编址磁盘管理磁盘基本结构与存取过程磁盘优化分布存储磁盘管理 大家好…

数据挖掘(二)数据预处理

前言 基于国防科技大学 丁兆云老师的《数据挖掘》 数据挖掘 数据挖掘(一)数据类型与统计 2、数据预处理 2.1数据清理 缺失值处理: from sklearn.impute import SimpleImputer# 创建一个SimpleImputer对象,指定缺失值的处理策略…

Spring框架学习笔记(二):Spring IOC容器配置 Bean,分别基于XML配置bean 和 基于注解配置 bean

1 Spring 配置/管理 bean 介绍 Bean 管理包括两方面 :创建 bean 对象;给 bean 注入属性 Bean 配置方式:基于 xml 文件配置方式;基于注解方式 2 基于 XML 配置 bean 2.1 通过类型来获取 bean 方法:给getBean传入一…

无人机+三角翼:小摩托无人机技术详解

无人机与三角翼的结合,为航空领域带来了一种新型且独特的飞行器——“小摩托”无人机。这种无人机结合了无人机的灵活性和三角翼的飞行稳定性,成为了航空运动领域中的一款热门产品。以下是对“小摩托”无人机技术的详解: 1. 定义与特点&#…

MFC中关于CMutex类的学习

MFC中关于CMutex类的学习 最近在项目中要实现两个线程之间的同步,MFC中提供了4个类,分别是CMutex(互斥量)、CCriticalSection(临界区)、CEvent(事件对象)、CSemaphore(信号量)。有关这4个类的说明,大家可以参考微软官方文档: CM…

七、Redis三种高级数据结构-HyperLogLog

Redis HyperLogLog是用来做基数统计的算法,HyperLogLog在优点是,在输入的元素的数量或者体积非常大时,计算基数占用的空间总是固定的、并且非常小。在Redis里每个HyperLogLog键只需花费12KB内存,就可以计算接近 264 个元素的基数。…

#04 构建您的第一个神经网络:PyTorch入门指南

文章目录 前言理论基础神经网络层的组成前向传播与反向传播 神经网络设计步骤1:准备数据集步骤2:构建模型步骤3:定义损失函数和优化器步骤4:训练模型步骤5:评估模型结论 前言 在过去的几天里,我们深入了解了…

头歌实践教学平台:CG1-v2.0-直线绘制

第1关&#xff1a;直线光栅化-DDA画线算法 一.任务描述 1.本关任务 (1)根据直线DDA算法补全line函数&#xff0c;其中直线斜率0<k<1&#xff1b; (2)当直线方程恰好经过P(x,y)和T(x,y1)的中点M时&#xff0c;统一选取直线上方的T点为显示的像素点。 2.输入 (1)直线两…

使用com.google.common.collect依赖包中的Lists.transform()方法转换集合对象之后,修改集合中的对象属性,发现不生效

目录 1.1、错误描述 &#xff08;1&#xff09;引入依赖 &#xff08;2&#xff09;模拟代码 &#xff08;3&#xff09;运行结果 1.2、解决方案 1.1、错误描述 最近在开发过程中&#xff0c;使用到了com.google.common.collect依赖包&#xff0c;通过这个依赖包中提供的…

Vue踩坑,less与less-loader安装,版本不一致

无脑通过npm i less -D安装less之后&#xff0c;继续无脑通过npm i less-loader -D安装less-loader出现如下错误&#xff1a; 解决方法&#xff1a; 1) npm uninstall less与 npm uninstall less-loader 2) 直接对其版本&#xff1a; npm i less3.0.4 -D npm i less-loader…

es关闭开启除了系统索引以外的所有索引

1、es 开启 “删除或关闭时索引名称支持通配符” 功能 2、kibanan平台执行 POST *,-.*/_close 关闭索引POST *,-.*/_open 打开索引3、其他命令 DELETE index_* // 按通配符删除以index_开头的索引 DELETE _all // 删除全部索引 DELETE *,-.* 删除全…

鸿蒙OpenHarmony开发板解析:【系统能力配置规则】

如何按需配置部件的系统能力 SysCap&#xff08;SystemCapability&#xff0c;系统能力&#xff09;是部件向开发者提供的接口的集合。 开发前请熟悉鸿蒙开发指导文档&#xff1a;gitee.com/li-shizhen-skin/harmony-os/blob/master/README.md点击或者复制转到。 部件配置系统…

Java入门——类和对象(上)

经读者反映与笔者考虑&#xff0c;近期以及往后内容更新将主要以java为主&#xff0c;望读者周知、见谅。 类与对象是什么&#xff1f; C语言是面向过程的&#xff0c;关注的是过程&#xff0c;分析出求解问题的步骤&#xff0c;通过函数调用逐步解决问题。 JAVA是基于面向对…