阿里发布通义千问2.5:一文带你读懂通义千问!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

一些结论

  1. 阿里云在AI智领者峰会上发布了通义千问2.5版本,并开源了1100亿参数模型Qwen1.5-110B

  2. 通义千问2.5在理解能力、逻辑推理、指令遵循、代码能力上分别提升了9%、16%、19%、10%,官方号称“全面赶超 GPT-4”。

  3. 在目前最新的LMSYS Chatbot Arena Leaderboard排行榜中,Qwen-Max-0428目前位列第10名,Qwen1.5-110B-Chat则为第13名。第14名是GPT-4-0613

  4. 小米的“小爱同学”宣布接入通义大模型,新东方、微博、众安保险和完美世界也与通义进行合作。

  5. 通义千问支持网页端、app,免费使用,地址见文末。

阿里一直是AI开源领域的“尖子生”。2024年5月9日,阿里云官方在AI智领者峰会中官宣了通义千问2.5版本,并开源了1100亿参数模型Qwen1.5-110B

这不是阿里第一次升级通义千问。2023年4月,阿里正式发布通义千千问。当时国内AI大模型和AI工具均处于小荷才漏尖尖角的状态。国外的ChatGPT太耀眼了,尤其是GPT-4发布后,它的能力和表现更是令人震惊。于是,国内的AI玩家们开始发力中文大模型。2023年10月,阿里发布了通义千问2.0,当时号称“性能赶超GPT-3.5”。也是在这时,通义千问开始收获用户们的注意力。

有一说一,在国内一众AI对话工具里,通义千问的体验可以说是名列前茅的,奈何它太低调。我之前也写过一些测评文章,感兴趣的朋友可以翻回去看看。更加难能可贵的是,相比网红Kimi Chat,通义千问更加重视基础模型的能力,我一直认为,基础模型能力才是一款AI工具上限的决定性因素,而不是之前大家都在卷的上下文长度。毕竟当一个维度上涨到一定程度,它的作用是边际递减的,一般用户也用不到200万字的上下文。

关于通义千问2.5

对于这次的通义千问2.5版本,阿里官方的口号是“全面赶超 GPT-4”,并表示相比上一代2.1版本,2.5在理解能力、逻辑推理、指令遵循、代码能力上分别提升了9%、16%、19%、10%。注意,阿里官方的说法是,在中文语境下,文本理解、文本生成、知识问答、生活建议、闲聊、对话和安全风险等多项能力上赶超 GPT-4。但实际使用体验还需验证。

值得一提的是,阿里官方晒出了一张LLM排行榜的截图,图中GPT-4-Turbo-1106版本和Qwen-Max-0403并列第一名。排行榜来自于上海AI实验室推出的OpenCompass。

在最新的OpenCompass排行榜中,通义系列模型的排名有所回落,但依然处于第4和第5名。(来源:https://rank.opencompass.org.cn/home)

关于Qwen1.5-110B

这里有必要解释一下通义千问和Qwen模型之间的关系。首先,通义千问是阿里云推出的LLM模型的一个统称,模型分为闭源开源两大类。闭源模型包括上面排行榜截图里的Qwen-Max-0403Qwen-Max-0107等。开源模型则包括本次AI峰会提到的1100亿参数模型Qwen1.5-110B,以及小尺寸模型0.5B、1.8B、4B、7B、14B。而我们平时基于用户角度提到的“通义千问”则是指阿里官方基于通义闭源模型推出的免费的AI对话平台,类似于GPT系列模型和ChatGPT的关系。

阿里云CTO周靖人表示:“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。” 未来通义大模型还会持续开源

通义大模型坚持开源战略,其开源的这些大模型也多次进入LLM模型排行榜前几名。我在《Claude 3 Opus超越GPT-4登顶LMSYS Leaderboard排行榜!通义大模型榜上有名!》一文中就提到过。在目前最新的LMSYS Chatbot Arena Leaderboard排行榜中,Qwen-Max-0428目前位列第10名,Qwen1.5-110B-Chat则为第13名,这在竞争极其激烈的AI大模型领域是非常不错的排名了。可以说,阿里把通义这个我国本土大模型做到了全球知名。

通义大模型的toB之路

AI设计的初衷就是提高效率,对于B端企业来说是绝配。今年4月,阿里就官宣了新东方已经接入通义大模型改善在线教学体验,提升学员满意度。

今天北京站的AI智领者峰会上,阿里官方表示通义服务的企业数量已超过9万家,而通过钉钉服务的企业更是突破了220万家,覆盖领域包括PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等。

同时,小米公司旗下的人工智能助手“小爱同学”宣布与通义大模型合作,目的是提升小爱同学在图片生成和理解方面的多模态AI能力。合作成果预计将在小米的汽车和手机等多种设备上得到应用。此外,微博、众安保险和完美世界在内的多家企业也已开始利用通义大模型。

如何使用通义千问?

通义千问支持网页端、app(我并未在微信搜索到阿里官方出的通义千问小程序)。其中,通义千问app现已更名为“通义”app。

网页端地址:https://tongyi.aliyun.com/qianwen/

App:在各大手机应用商店搜索“通义”下载安装即可。

注册登录后,即可免费使用。


通义千问相关的文章推荐

  1. 盘点那些免费的AI对话工具(国内篇):国内TOP3 AI聊天机器人产品介绍

  2. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(一)

  3. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(二)

  4. 用真实数据告诉你前10大AI对话工具排行!(国内+国外篇)

  5. Claude 3 Opus超越GPT-4登顶LMSYS Leaderboard排行榜!通义大模型榜上有名!

  6. Claude 3有点东西!这个看似简单的问题只有GPT-4和Claude 3回答正确!通义千问和讯飞星火表现同样亮眼!

  7. 谷歌Gemini 1.5 Pro向所有人开放,无需waitlist!阿里通义千问升级1000万字长文档处理功能!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/834666.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

就业班 第三阶段(zabbix) 2401--5.9 day1 普通集zabbix 5.0部署 nginx部署+agent部署

文章目录 环境一、zabbix 5.0 部署1、安装yum源2、安装相关软件3、数据库安装和配置mariaDB数据库mysql57数据库 安装mysql万能卸载mysql代码:启动mysql并初始化4、数据表导入5、修改配置,启动服务6、配置 web GUI7、浏览器访问注意数据加密的选项不要勾…

分享四种免费获取SSL的方式

SSL证书目前需要部署安装的网站很多,主要还是基于国内目前对证书的需求度在不断的升高,网站多了、服务器多了之后。网络安全问题就成为了大家不得不面对的一个重要的问题了。SSL证书的作用有很多,这里就不一一详述了,本期作品主要…

一次消谐器适用于各种电压等级的电力系统

你知道什么是一次消谐器吗?它是一种保护装置,用于消除电力系统中的谐振过电压,保护设备的安全可靠运行。那么一次消谐器有什么作用呢?接下来我会为你详细介绍一下。 一次消谐器的设计原理是利用其非线性电阻特性,在谐振…

RSAC 2024现场:谷歌展望大模型在网络安全领域的前景

人类距离将网络安全的控制权交给生成式AI还有多远? 前情回顾RSAC2024动态 伪造内容鉴别厂商Reality Defender斩获2024 RSAC创新沙盒冠军 RSAC 2024上值得关注的10款网络安全产品 RSAC 2024创新沙盒十强出炉,谁能夺冠? 安全内参5月8日消息…

table表格 如何加卡片 实现?

实现非常简单 代码 const columnsinsu [{dataIndex: nowdate,key: nowdate,render: (text, record) ><Cardhoverablestyle{{width: 97%,height: 90,}}// cover{<img alt"example" src"https://os.alipayobjects.com/rmsportal/QBnOOoLaAfKPirc.png&…

浅析安全用电监控系统在工厂的研究与应用论述

摘 要&#xff1a;随着社会时代的发展&#xff0c;人们的安全意识越来越强烈&#xff0c;在人们生活和工作中离不开各种用电设备&#xff0c;用电设备的安全使用是保障人们生命安全的重要内容。工厂因自身厂内工作环境的特殊性&#xff0c;用电设备的种类多且复杂&#xff0c;如…

指针的奥秘(二):指针与数组的联系+字符指针+二级指针+指针数组+《剑指offer》笔试题

指针 一.指针与数组的联系1.数组名的理解2.使用指针访问数组3.一维数组传参的本质 二.字符指针1.字符指针隐藏秘密2.常量字符串3.《剑指offer》笔试题 三.二级指针四.指针数组1.指针数组模拟二维数组 一.指针与数组的联系 1.数组名的理解 也许大部分人认为数组名就是一个名称&…

分页PageHelper、PageInfo

PageHelper是一个基于MyBatis的分页插件&#xff0c;可以帮助开发者快速、方便地实现分页功能。PageHelper支持多种数据库&#xff08;包括MySQL、Oracle、SQL Server、PostgreSQL等&#xff09;&#xff0c;可以通过简单的配置即可使用。 使用PageHelper&#xff0c;只需要在…

TL-WN826N无线网卡连接电脑蓝屏,提示rtl8188gu.sys

TL-WN826N无线网卡插电脑就蓝屏&#xff0c;提示rtl8188gu.sys 处理方法&#xff1a; 设备管理器中卸载其他的2.0无线网卡程序和功能中卸载网卡驱动TPlink官网下载 TL-WN826N V1.0_1.0.0&#xff08;https://www.tp-link.com.cn/product_572.html?vdownload&#xff09;&…

【Osek网络管理测试】[TG4_TC3]LimpHome状态下的睡眠中断

🙋‍♂️ 【Osek网络管理测试】系列💁‍♂️点击跳转 文章目录 1.环境搭建2.测试目的3.测试步骤4.预期结果5.测试结果1.环境搭建 硬件:VN1630 软件:CANoe 2.测试目的 验证DUT在LimpHome状态下的睡眠中断是否正确 分析:在跛脚运行状态下,满足睡眠条件后,进入到NM…

欧盟MDR法规对医疗器械网络安全都有哪些要求?

MDR&#xff0c;欧盟医疗器械法规&#xff08;Medical Device REGULATION (EU) 2017/745&#xff0c;简称“MDR”&#xff09;&#xff0c;当医疗器械办理欧盟CE认证时&#xff0c;需满足新法规 MDR (EU) 2017/745要求。 M DR符合性评估 医械网络安全咨询与相关文件出具&#x…

【Linux】项目自动化构建工具make/makefile

&#x1f389;博主首页&#xff1a; 有趣的中国人 &#x1f389;专栏首页&#xff1a; Linux &#x1f389;其它专栏&#xff1a; C初阶 | C进阶 | 初阶数据结构 小伙伴们大家好&#xff0c;本片文章将会讲解Linux中项目自动化构建工具make/makefile的相关内容。 如果看到最后…

【知识碎片】2024_05_09

本篇记录了关于C语言的一些题目&#xff08;puts&#xff0c;printf函数的返回值&#xff0c;getchar&#xff0c;跳出多重循环&#xff09;&#xff0c;和一道关于位运算的代码&#xff3b;整数转换&#xff3d;。 C语言碎片知识 如下程序的功能是&#xff08; &#xff09; #…

从古代故事中领悟高情商回话

页面 页面代码 <% layout(/layouts/default.html, {title: 故事管理, libs: [dataGrid]}){ %> <div class"main-content"><div class"box box-main"><div class"box-header"><div class"box-title">&l…

FPGA+MCU+SDRAM方案,用于服装厂生产过程中以及设计过程中制作样板,剪裁布料

FPGAMCUSDRAM方案&#xff0c;用于服装厂生产过程中以及设计过程中制作样板&#xff0c;剪裁布料 客户应用&#xff1a;服装厂制衣 主要功能&#xff1a; 1.支持步进电机、直流电机 2.支持同时3轴电机协调工作 3.支持以太网/USB联机控制 4.支持LCD 屏显示状态 5.支持HP11/…

Rust多线程交叉打印+Send Sync特征讲解

导航 Rust多线程交叉打印Send Sync特征讲解 一、Rust多线程交叉打印二、Send Sync 特征讲解 Rust多线程交叉打印Send Sync特征讲解 一、Rust多线程交叉打印 先说背景有两个线程&#xff0c;分别为0号线程和1号线线程两个线程交叉打印共享值&#xff0c;并将共享值1当标志为fa…

基于STM32的云端灌溉系统毕业设计

基于STM32的云端灌溉系统毕业设计 一、项目背景与意义 随着全球气候的变化和水资源短缺问题的日益严峻&#xff0c;传统的灌溉方式已不能满足现代农业发展的需求。智能灌溉系统以其节水、高效的特点逐渐成为研究的热点。本项目旨在设计一款基于STM32微控制器的云端灌溉系统&a…

Qt:网页嵌入与应用集成

这个专栏&#xff0c;主要用来记录分享一些使用Qt进行嵌入网页以及第三方应用相关技术的文章。本篇作为此专栏的快速导航。后续随着技术的不断研究和深入&#xff0c;会持续更新。 《QCefView&#xff08;1&#xff09;—— CMAKE项目、库文件生成和项目测试》 《QCefView&…

制鞋5G智能工厂数字孪生可视化平台,推进行业数字化转型

制鞋5G智能工厂数字孪生可视化平台&#xff0c;推进行业数字化转型。随着科技的飞速发展&#xff0c;5G技术与智能制造的结合正成为推动制鞋行业数字化转型的重要力量。制鞋5G智能工厂数字孪生可视化平台&#xff0c;不仅提高了生产效率&#xff0c;还优化了资源配置&#xff0…

2024.5.9 作业 xyt

1. 创建一对父子进程&#xff1a; 父进程负责向文件中写入 长方形的长和宽 子进程负责读取文件中的长宽信息后&#xff0c;计算长方形的面积 #include <stdio.h> #include <string.h> #include <stdlib.h> #include <unistd.h> #include <…