解读 | 阿里通义千问模型全尺寸开源 “诚意满满“背后的名与利



大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq

12 月 1 日阿里开源了 72B 和 18B 大模型以及音频大模型 Qwen-Audio,再加上之前八月份、九月份开源的 7B 和 14B 大模型,号称是 "全尺寸开源"。我也去 Github 上瞅了一眼,通义应该确实是 "兜库底" 了,所有规格的模型都开源了。

对于这个事情,我的第一反应是:难得啊,对于阿里这种技术相对封闭的公司来说。但是仔细想想,目前对于大模型来说,开不开源真的很重要吗?其实是需要打个问号的,除非你 OpenAI 的 GPT-4 开源,不然业界应该很难激起过多的浪花,因为大家都见多不怪了。现在对于大模型真正卡脖子地方是在 "算力" 和 "数据" 上,而不在 "算法" 上。以前是这三驾马车都很重要,然后算法可能会更加重要一些。但是现在大模型时代则不太一样,特别是在美国芯片禁令的情况下,主要矛盾已经明显倾向于对于算力的需求上。现在国内很多大模型从算法实现角度,都可以用 "套壳" LLaMA 来达到 "自研大模型" 商业化的目的,这个时候你通义开不开源其实并不太重要。而说到 "套壳",就又是另外一个有意思的话题了,这里不过多展开。

现在主要矛盾点在于我要有足够的算力、足够高质量的数据来进行微调甚至是从头训练。对于很多大模型厂商来说,区别只是在我选 LLaMA 来微调还是选通义大模型来微调,而相信大多还是会选 LLaMA。这其实可以类比到手机领域,安卓大家都可以用,很多时候有安卓就够了,你鸿蒙开源对于小米、对于 vivo 的操作系统研发意义大吗,我小米会把自己手机操作系统切到基于鸿蒙的吗 (可能确实有参考意义,比如对于小米澎湃 OS 的研发,但是对于大多数厂商来说还是用安卓就够够的了),大家更加在意的是能够拥有性能更加好的芯片、算力更加好的处理器,比如前段时间经常上热搜的全大核天玑 9300,这才是核心竞争力。

虽然 (是反转没错了),在大家有 LLaMA 可选的情况下,通义的开源意义确实不大。但是开源总能赢得好名声,这点毋庸置疑,何况通义开源了自己全规格的模型,其开源的 70B 大模型也是目前开源大模型中最大规模的,可以说 "诚意满满",对于博一个好名声应该是不难的,这是 ""。

然后咱们来说说 "",通义大模型是开源了,大家要用、要微调得要有算力吧,算力哪里来,答案就是阿里云,你品,你细品。来,继续分析,阿里还有个号称国产 HaggingFace 的魔塔 ModelScope,要用开源的通义你就得上魔塔,而魔塔部署在哪里呢,魔塔的算力来源于哪里呢,答案依旧是阿里云,你品,你细品。阿里的这招太 "精明" 了,真的是既想要名也想要利啊

从这个角度来说,其实在 12 月 1 日阿里宣布全量开源通义前问大模型的时候,阿里已经彻底换赛道了,已经是不想跟大家玩大模型了,已经不再是 "百模大战" 中的一员了。未来,"百模大战" 肯定会继续,而阿里更加聪明,烧钱去做大模型,效果嘛打不过 GPT-4,落地商业化嘛又难,竞争对手又像疯了一样的涌进来,换个赛道,躺着挣钱它不香嘛。这大概率也是在学英伟达、特别是在学 AWS。提供付费算力,这才是大模型时代正确的挣钱的方式啊,这些才是大模型时代挣麻了的企业啊。继续给阿里支招,继续开源数据集,让大家在阿里云上训练(烧钱)彻底没有技术上的障碍,而变成一个愿不愿意花钱的问题。

阿里云,是懂计算的。计算无法计算的价值,数钱数到手抽筋


【极智视界】

《解读 | 阿里通义千问模型全尺寸开源 "诚意满满"背后的名与利》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/209928.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Web和深度学习的辣椒检测产量预测系统

1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 研究背景与意义 辣椒是一种重要的经济作物,被广泛种植和消费。然而,辣椒的产量预测一直是农业生产中的重要问题。准确地预测辣椒的产量可以帮助农民合理安…

高项备考葵花宝典-项目进度管理输入、输出、工具和技术(下,很详细考试必过)

项目进度管理的目标是使项目按时完成。有效的进度管理是项目管理成功的关键之一,进度问题在项目生命周期内引起的冲突最多。 小型项目中,定义活动、排列活动顺序、估算活动持续时间及制定进度模型形成进度计划等过程的联系非常密切,可以视为一…

【论文笔记】FSD V2: Improving Fully Sparse 3D Object Detection with Virtual Voxels

原文链接:https://arxiv.org/abs/2308.03755 1. 引言 完全稀疏检测器在基于激光雷达的3D目标检测中有较高的效率和有效性,特别是对于长距离场景而言。 但是,由于点云的稀疏性,完全稀疏检测器面临的一大困难是中心特征丢失&…

vFW搭建IRF

正文共:2328字 40图,预估阅读时间:5 分钟 IRF(Intelligent Resilient Framework,智能弹性架构)技术通过将多台设备连接在一起,虚拟化成一台设备,集成多台设备的硬件资源和软件处理能…

两个月软考-高项上岸

文章目录 前言结缘软考功亏一篑有始有终2个月计划资料部分计划截图 总结 前言 我们看小说或者电视剧电影都会看到这样的情节,主角一开始锦衣玉食,突然家道中落,啥都没了,主角再一路奋起重新找回了属于自己的一切;还有…

Vue项目中实现浏览器标签页名字的动态修改

修改router/index.js文件 路由条目下面添加meta属性 meta:{title:DevOps运维平台 }示例 使用Vue的全局守卫函数beforeEach,在路由切换前动态修改浏览器标签页名字 router.beforeEach((to,from,next) > {document.title to.meta.titlenext() })

Error: Cannot find module ‘E:\Workspace_zwf\mall\build\webpack.dev.conf.js‘

执行:npm run dev E:\Workspace_zwf\zengwenfeng-master>npm run dev> mall-app-web1.0.0 dev E:\Workspace_zwf\zengwenfeng-master > webpack-dev-server --inline --progress --config build/webpack.dev.conf.jsinternal/modules/cjs/loader.js:983thr…

[笔记]ARMv7/ARMv8 交叉编译器下载

开发 Cortex-A7、Cortex-A72 或其他 ARM 架构 profile 芯片时,经常需要下载对应架构的交叉编译器,所以写这篇笔记,用于记录一下交叉编译器下载流程,免得搞忘。 编译环境:ubuntu 虚拟机 下载地址 我们可以从 ARM 官网…

09 视频分片上传Minio和播放

文章目录 一、流程设计1. 分片上传实现思路2. 文件分片上传流程3. 视频播放流程 二、代码实现1. 后端代码2. 文件上传前端代码3. 视频播放前端代码 一、流程设计 1. 分片上传实现思路 2. 文件分片上传流程 3. 视频播放流程 二、代码实现 1. 后端代码 pom.xml <dependenc…

多线程案例-单例模式

单例模式 设计模式的概念 设计模式好比象棋中的"棋谱".红方当头炮,黑方马来跳.针对红方的一些走法,黑方应招的时候有一些固定的套路.按照套路来走局势就不会吃亏. 软件开发中也有很多常见的"问题场景".针对这些问题的场景,大佬们总结出了一些固定的套路.按…

vue实现可拖拽列表

直接上代码 <!-- vue实现可拖拽列表 --> <template><div><button click"logcolig">打印数据</button><TransitionGroup name"list" tag"div" class"container"><divclass"item"v-f…

深度学习记录--激活函数

激活函数的种类 对于激活函数的选择&#xff0c;通常有以下几种 sigmoid&#xff0c;tanh&#xff0c;ReLU&#xff0c;leaky ReLU 激活函数的选择 之前logistic回归一直使用的激活函数都是sigmoid函数&#xff0c;但一般来说&#xff0c;tanh函数是比sigmoid函数更加好的选…

【Python】 生成二维码

创建了一个使用 python 创建二维码的程序。 下面是生成的程序的图像。 功能描述 输入网址&#xff08;URL&#xff09;。 输入二维码的名称。 当单击 QR 码生成按钮时&#xff0c;将使用 QRname 中输入的字符将 QR 码生成为图像。 程序代码 import qrcode import tkinterd…

Oracle的错误信息帮助:Error Help

今天看手册时&#xff0c;发现上面有个提示&#xff1a; Error messages are now available in Error Help. 点击 View Error Help&#xff0c;显示如下&#xff0c;其实就是oerr命令的图形化版本&#xff1a; 点击Database Error Message Index&#xff0c;以下界面等同于命令…

Python中利用遗传算法探索迷宫出路

更多资料获取 &#x1f4da; 个人网站&#xff1a;ipengtao.com 当处理迷宫问题时&#xff0c;遗传算法提供了一种创新的解决方案。本文将深入探讨如何运用Python和遗传算法来解决迷宫问题。迷宫问题是一个经典的寻路问题&#xff0c;寻找从起点到终点的最佳路径。遗传算法是一…

Java解决矩阵对角线元素的和问题

Java解决矩阵对角线元素的和问题 01 题目 给你一个正方形矩阵 mat&#xff0c;请你返回矩阵对角线元素的和。 请你返回在矩阵主对角线上的元素和副对角线上且不在主对角线上元素的和。 示例 1&#xff1a; 输入&#xff1a;mat [[1,2,3],[4,5,6],[7,8,9]] 输出&#xff1a…

连接Redis报错解决方案

连接Redis报错&解决方案 问题描述&#xff1a;Could not connect to Redis at 127.0.0.1:6379: 由于目标计算机积极拒绝&#xff0c;无法连接。 问题原因&#xff1a;redis启动方式不正确 解决方案&#xff1a; 在redis根目录下打开命令行窗口&#xff0c;输入命令redi…

听GPT 讲Rust源代码--src/tools(12)

File: rust/src/tools/rust-analyzer/crates/rust-analyzer/src/config.rs 在Rust源代码中&#xff0c;rust/src/tools/rust-analyzer/crates/rust-analyzer/src/config.rs文件的作用是定义和解析rust-analyzer的配置文件。该文件包含了各种配置项的数据结构和枚举类型&#xf…

MQTT主题、通配符和最佳实践

MQTT主题在MQTT生态系统非常重要&#xff0c;因为代理&#xff08;broker&#xff09;依赖主题确定哪个客户端接收指定的主题。本文我们将聚集MQTT主题、MQTT通配符&#xff0c;详细讨论使用它们的最佳实践&#xff0c;也会探究SYS主题&#xff0c;提供给代理&#xff08;broke…

【npm | npm常用命令及镜像设置】

npm常用命令及镜像设置 概述常用命令对比本地安装全局安装--save &#xff08;或 -S&#xff09;--save-dev &#xff08;或 -D&#xff09; 镜像设置设置镜像方法切换回npm官方镜像选择镜像源 主页传送门&#xff1a;&#x1f4c0; 传送 概述 npm致力于让 JavaScript 开发变得…