“开放”的大模型到底有多“开放”?!

大模型技术论文不断,每个月总会新增上千篇。本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产。若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读。而最新科技(Mamba,xLSTM,KAN)则提供了大模型领域最新技术跟踪。若对于具身智能感兴趣的请移步具身智能专栏。技术宅麻烦死磕AI架构设计。

过去一年,声称开放的生成式人工智能系统数量急剧增加。但它们到底有多开放?鉴于即将出台的欧盟人工智能法案对开源系统会进行不同进行了不同的监管,生成式人工智能中什么算作开源的问题将变得尤为重要,迫切需要进行实际的开放性评估。

有趣的是研究人员使用一个基于证据的框架,该框架区分了开放性的 14 个维度,从训练数据集到科学和技术文档,从许可到访问方法。通过调查 45 多个生成式人工智能系统(包括文本和图像)。虽然开源一词被广泛使用,但许多模型只是“开放权重”,许多模型的拥有者并没有提供完整的有关训练和微调数据的信息来进行科学、法律和监管审查。

本次的研究调查产生了40个被描述为“开源”或“开放”的文本生成大模型。使用上述的评估框架检查每个系统的开放性,并按开放性分数对系统进行排名。作为参考,我们还添加了ChatGPT。

的确从业人员在选择“开源”大模型的时候,需要考虑很多维度。虽然本次研究,小编私下认为评估模型类型还是不够多,尤其是打分规则的设计值得商榷。但是它最大的贡献在于提出了一套基本的评估标准(方向),这些方向对于企业在进行模型选择的时候能够提供决策依据。为后面大模型使用涉及的应用适配、维护升级以及商业风险都能够提前进行评估。当然还少考虑了免费的因素。!

例如:BloomZ和 Llama均不会通过pypi等有索引和版本控制的公共代码存储库以软件包形式分发模型。相反,两者主要用于本地部署。BloomZ可通过 Petals API获得,而Llama的API仅在注册后可用。

这些模型在许可方面也有所不同。BloomZ有两个相关许可证。其源代码是Apache 2.0,这是OSI批准的开源许可证,而模型权重是在负责任的AI 许可证 (RAIL)下发布的。Llama 2是在Meta自己的社区许可证下发布的。这两个许可证都旨在限制有害用例,但它们在实现模型输出的表示方式上存在一个关键区别。RAIL规定用户不得“在未明确且清晰地声明文本由机器生成的情况下生成内容”,而Llama规定用户不得“表示Llama 2输出由人类生成”。

随着框架可以深入研究生成式AI系统的细节,BloomZ实质上算是开源状态,而Meta的Llama最多是开放权重,并且在几乎所有其他方面都是封闭的。Llama在所有当前可用版本中都是一个典型的例子,该模型声称开放性的好处在于模型权重。

每个单元都记录了一个三级开放性判断(︎ ✔开放、~ 部分或✘封闭)。其中✔︎为 1,~为0.5,✘为0分。请注意,RL可能是指RLHF或其他形式的微调

从上图可以观察到两种广泛的工作方式。一种是AllenAI的OLMo Instruct、BloomZ和LLM360的AmberChat等系统中所见的广泛开源方法,这些系统正在接近完全开放状态并位居开放排行榜榜首。这些系统背后的组织竭尽全力提供训练数据、代码、训练管道和文档。

大量系统(后三分之一)只提供模型权重,但很少或根本不分享有关其系统其他部分的细节。这些系统最好被称为开放权重,而不是开源。

值得注意的是,所有大型商业参与者——Meta、Google、Cohere、Microsoft和Mistral——都处于较低的排名,许多以它们为基础的替代方案也是如此。文本生成器的当前开放状态是混合的。存在一些非常开放的系统,但最著名的模型只是开放权重。许多系统很少共享有关指令调整步骤或元提示技术的信息。用于训练和微调的数据集和方法很少被共享或披露。系统、数据和代码文档通常不完整,缺乏学术严谨性。

训练数据缺乏开放性尤其令人担忧。<小编认为也是合理,毕竟数据才是真正的资产>,下半部分的大多数模型没有提供任何有关数据集的详细信息,除了通用的描述符。

上图为图像生成,与文本生成相比,大模型要少得多。目前可用的图像数据集相对较少,文本转图像生成器在机器学习架构方面也有所不同<可以移步了解!>。

与基于证据的开放性评估最相关的是文本转图像生成器如何实现跟踪合成图像来源的方法,以及设置防止创建不良内容的护栏。一些系统使用水印来实现某种形式的来源跟踪。对于审核,文本转图像系统通常依赖于及时审核的形式,通常是文本过滤或分类。这种来源和安全措施的状态并不总是有记录的。鉴于各种文本转图像的特色,评估框架的各个维度都做相应的调整。

在开放性、透明度和文档方面,Stable Diffusion脱颖而出。其他一些评估系统都是建立在Stable Diffusion的各种模型之上或对其进行了微调。其他一些系统仅是开放权重的。Open AI的DALL-E完全闭源。

其实开放性并不是解决文本生成器的科学和伦理挑战。开放数据不会减轻轻率部署大型语言模型的有害后果,也不会减轻从互联网上抓取所有公开数据的可疑版权影响。然而,开放性确实使原创研究成为可能,包括努力构建可重复的工作流程和理解指令调优LLM架构的基本原理。开放性还实现了制衡,培养了对数据及其管理以及模型及其部署的问责文化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/30904.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java面向对象(上)

一.面向对象与面向过程 1.面向过程 面向过程(procedure Oriented Programming),简称POP,主要思想就是将问题分解成一个个步骤去解决,把这个步骤称为函数. 典型语言:C语言 优点:可以大大简化代码 缺点:当代码量过大时,不方便维护 2.面向对象 面向对象(Object Oriented Pr…

Harbor 源码编译arm版本镜像

1. 先准备一个国外的arm服务器&#xff0c;&#xff08;使用国内的也行&#xff0c;只是有时候下载依赖会断&#xff0c;需要科学上网&#xff09; 2. git clone harbor的源码包&#xff0c;切换到要编译的分支 3. 修改harbor/Makefile Makefile里面的这些字段设置为true&…

四川财谷通信息技术抖音小店信誉之选,购物新体验

在当今数字化浪潮的推动下&#xff0c;电商平台的兴起为人们的生活带来了极大的便利。而在众多电商平台中&#xff0c;抖音小店以其独特的社交属性和便捷的购物体验&#xff0c;逐渐赢得了消费者的青睐。四川财谷通信息技术有限公司旗下的抖音小店&#xff0c;更是凭借其可靠的…

记录SpringBoot启动报错解决

记录SpringBoot启动报错解决 报错现场 Failed to configure a DataSource: url attribute is not specified and no embedded datasource could be configured. Reason: Failed to determine a suitable driver class Action: Consider the following:If you want an embedde…

33.获取入口点

上一个内容&#xff1a;32.双击列表启动目标游戏 前置知识 25.入口点注入&#xff08;查看pe头&#xff09;、32.双击列表启动目标游戏 以它的代码为基础进行修改 效果图&#xff1a; 代码实现&#xff1a;原理通过读文件流的方式把文件加载到内存中然后解析pe结构 void CWnd…

uniapp 实人认证

首先Dcloud创建云服务空间&#xff0c;开启一键登录并充值 下一步 1. 右键项目 》 创建uniCloud云开发环境 》右键uniCloud》关联云服务空间 2. cloudfunctions右键 新建云函数&#xff0c;任意命名&#xff08;例&#xff1a;veify&#xff09;&#xff0c;然后右键项目》管…

Python 基础:异常

目录 一、异常概念二、处理异常2.1 抛出异常2.2 使用 try-except 代码块2.3 使用 try-except-else 代码块2.4 静默失败 三、总结 遇到看不明白的地方&#xff0c;欢迎在评论中留言呐&#xff0c;一起讨论&#xff0c;一起进步&#xff01; 本文参考&#xff1a;《Python编程&a…

Vite文件目录结构介绍

我们通过命令create-vite shop-admin基于Vite创建vue3项目后&#xff0c;其默认的文件目录结构如下&#xff1a; shop-admin ├─ index.html ├─ package-lock.json ├─ package.json ├─ public │ └─ vite.svg ├─ src │ ├─ App.vue │ ├─ assets │ │ └…

C++多重继承,虚基类与友元

一.多重继承 就是一个类继承多个基类&#xff1b; class <派生类名>&#xff1a;<派生方式1><基类名1>,<派生方式n><基类名n> class Derived:public:Base1,public:Base2 上述形式&#xff1a;基类之间由逗号隔开&#xff0c;且必须指明继承方式…

【Python绘画】气球祝福节日快乐

本文收录于 《一起学Python趣味编程》专栏&#xff0c;从零基础开始&#xff0c;分享一些Python编程知识&#xff0c;欢迎关注&#xff0c;谢谢&#xff01; 文章目录 一、前言二、代码示例三、知识点梳理四、总结 一、前言 本文介绍如何使用Python的海龟画图工具turtle&#…

示例:WPF中DataGrid简单设置合并列头

一、目的&#xff1a;应用DataGridTemplateColumn列模板&#xff0c;去拆分列头和单元格布局的方式设置列头合并样式 二、实现 效果如下 三、环境 VS2022 四、示例 应用DataGridTemplateColumn自定义列头信息和单元格信息 <DataGrid AutoGenerateColumns"False"…

【机器学习】线性回归:从基础到实践的深度解析

&#x1f308;个人主页: 鑫宝Code &#x1f525;热门专栏: 闲话杂谈&#xff5c; 炫酷HTML | JavaScript基础 ​&#x1f4ab;个人格言: "如无必要&#xff0c;勿增实体" 文章目录 线性回归&#xff1a;从基础到实践的深度解析引言一、线性回归基础1.1 定义与目…

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 机器人搬砖(100分) - 三语言AC题解(Python/Java/Cpp)

&#x1f36d; 大家好这里是清隆学长 &#xff0c;一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 &#x1f4bb; ACM银牌&#x1f948;| 多次AK大厂笔试 &#xff5c; 编程一对一辅导 &#x1f44f; 感谢大家的订阅➕ 和 喜欢&#x1f497; &#x1f…

怎么缩小pdf文件大小

在数字化时代&#xff0c;pdf文件已经成为我们日常生活和工作中不可或缺的一部分。然而&#xff0c;随着pdf文件内容的增多&#xff0c;其大小也会相应增加&#xff0c;这给文件的传输、存储和共享带来了诸多不便。因此&#xff0c;如何有效地压缩pdf文件大小&#xff0c;成为了…

【Kafka】Kafka生产者数据重复、数据有序、数据乱序-07

【Kafka】Kafka生产者数据重复、数据有序、数据乱序-07 1. 数据重复1.1 数据传递语义1.2 幂等性1.2.1 如何开启幂等性1.2.2 同一个消息&#xff0c;多个分区都会存在吗&#xff1f; 1.3 事务1.3.1 Kafka 事务原理1.3.2 Kafka事务的作用和意义作用具体应用场景 2. 数据有序3. 数…

Python数据可视化:直方图、核密度估计图、箱线图、累积分布函数图

本文使用数据来源自2023年数学建模国赛C题&#xff0c;以附件1、附件2数据为基础&#xff0c;通过excel的数据透视表等功能重新汇总了一份新的数据表&#xff0c;从中截取了一部分数据为例用于绘制图表。绘制的图表包括一维直方图、一维核密度估计图、二维直方图、二维核密度估…

[机器学习算法] Q学习

Q学习&#xff08;Q-Learning&#xff09;是一种基于值的强化学习算法&#xff0c;用于在给定状态下选择动作&#xff0c;以最大化累积奖励。它通过不断更新一个称为Q表&#xff08;Q-table&#xff09;的表来学习动作的价值。 一、理解基本概念 状态 (State, S) 这是环境的…

Matlab数学建模实战应用:案例2 - 传染病传播

目录 前言 一、问题分析 二、模型建立 三、Matlab代码实现 四、模型验证 灵敏度分析 五、模型应用 实例总结 总结 前言 传染病传播模型是公共卫生和流行病学的重要研究内容&#xff0c;通过数学建模可以帮助我们理解传染病的传播规律和趋势&#xff0c;以便制定有效的…

【Python】使用OpenCV特征匹配检测图像中的【特定水印】

如果没有方向 往哪里走都是前方 做自己的光 不需要多亮 曾受过的伤 会长出翅膀 大雨冲刷过的天空会更加明亮 流过泪的眼睛也一样 做自己的光 悄悄的发亮 逆风的方向 更容易飞翔 世界怎样在于你凝视它的目光 那未曾谋面过的远方 或许就在身旁 &#x1f3b5…

设计软件有哪些?景观插件篇,渲染100邀请码1a12

建立大型景观也是设计师常用的设计方法&#xff0c;我们介绍一些景观插件。 1、AutoGrass AutoGrass是用于快速生成逼真的草地和植被场景的3ds Max插件&#xff0c;它提供了大量的草地预设和工具&#xff0c;使用户能够轻松地创建各种各样的草地效果&#xff0c;包括草地、草…