阿里巴巴通义实验室周畅:让大模型率先在PC上“跑起来”

12月7日,以“AI新生态 智启新元年”为主题的首届AI PC产业创新论坛在北京联想集团总部举办。阿里巴巴-通义实验室、通义千问大模型负责人周畅受邀出席分享关于端侧大模型的技术进展,以及终端设备与AI结合的发展前景。

周畅表示,大模型技术的快速迭代已经让其具备理解世界的基本能力,接下则需要想办法让大模型能力在各种环境和场景下被充分使用起来。“让大模型在PC等终端设备上跑起来,正是普惠终端用户的第一步,阿里巴巴-通义实验室将与联想集团携手合作,在AI PC生态领域共同探索端云协同的解决方案,为个人和企业提供更加精准的AI服务。”

(阿里巴巴-通义实验室,通义千问大模型负责人周畅)

“我们看《流浪地球2》《钢铁侠》这类科幻片的时候,可能人人都会幻想自己要有一个人工智能助手。自ChatGPT出现后,特别是今年,AI发展特别快,很多功能都开始从幻想慢慢变成现实。”他说,开发者社区现在也非常关注大模型在端侧的具体表现。

而从端侧落地出发,在周畅看来需要做好两件事。第一,模型水平的提升。端侧通用AI助手需要能够理解用户的语言语义、并具备图像理解能力,同时也要能够使用各种常用软件的API,即可以使用各种各样的工具来帮助用户完成任何事情,这需要不断提升模型的水平。第二,发挥这类助手的能力,既可以通过端云协同结合云侧模型的强大功能,也可以通过在端侧灵活便捷的部署,使得大模型能力在离线的状态下也能使用。

他介绍说,从8月份到10月份,通义千问已陆续开放从18亿到720亿参数的语言模型,并达到千亿参数模型全尺寸、全模态开源。阿里云希望通过开源不同尺寸的模型,助力业界大模型的生态发展,也希望通过全尺寸的开源来助力模型的落地。

经过压缩和微调的AI模型适合在端侧进行部署。“当前,端侧的开发者群体比较关心的是主流7B或14B这类小尺寸模型的表现和云端大模型的差异。”周畅称,端侧助手关心的核心能力是工具使用,而通义千问小尺寸系列的语言模型,在推出时就非常重视这类能力的优化。

其数据显示,18亿参数的通义千问小模型在简单工具的使用上,可以达到大模型85%的水平,70亿和140亿的模型在这方面的表现与720亿大模型可以十分接近。毫无疑问,通义千问模型的实测为AI大模型的端侧应用铺平了道路,将加速AI能力的普及。

针对模型的任务分解和工具调用能力,周畅在论坛上分享了一系列演示案例,来说明通用大模型已经能够胜任在离线的PC等终端上运行,并可对基础数字、图标、公式以及图片等内容进行轻度处理。

识别数字、图表等能力,对于AI PC的发展十分重要,周畅进一步强调。联想前不久率先对外展示的全球首款AI PC及其高水准的能力,进一步印证了在AI普惠的道路上,AI PC将成为首选终端。

值得一提的是,在AI PC产业创新论坛上发布的业内首份《AI PC产业(中国)白皮书》,已经将AI PC产业生态范围参与方扩大到了5个,包括用户、终端厂商、AI技术(模型)厂商、应用厂商和算力(芯片)厂商。其中,AI技术(模型)厂商是新引入者。

面对即将开启的AI PC元年,周畅认为,端云协同发展的解决方案在未来拥有巨大想象空间。人工智能已经在云端跑了许久,而未来应是云端大模型和端侧大模型的双向奔赴,AI PC的时代已经来临。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/208379.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Python百宝箱】Python与移动应用开发:框架对比与交互全指南

一站式指南:如何用Python打造移动应用的完美体验 前言 随着移动应用市场的不断扩大,开发者们寻求更便捷、灵活的方式来构建跨平台的应用。本文将带领读者深入探讨Python在移动应用开发中的应用,聚焦于几个主要框架,并详细介绍它…

Python django-xadmin:构建强大的 Django 后台管理系统

概要 Django作为一款强大的Web框架,其后台管理系统提供了便捷的数据管理和操作方式。而 django-xadmin 则为Django的后台管理系统提供了更加强大的功能和灵活的定制选项。在本文中,我们将深入研究如何使用django-xadmin,并通过详细的示例代码…

企业博客SEO:优化SOP,助您提升搜索引擎可见性

企业博客是互联网时代企业与用户沟通的重要渠道之一,引流成本也比较低。然而,依然有企业会处在3种状态: 1. 有博客,但内容更新不积极或搁置 2. 有博客,但内容散乱 3. 根本就没有博客 如果是这几种状态,…

Java网络编程-深入理解BIO、NIO

深入理解BIO与NIO BIO BIO 为 Blocked-IO(阻塞 IO),在 JDK1.4 之前建立网络连接时,只能使用 BIO 使用 BIO 时,服务端会对客户端的每个请求都建立一个线程进行处理,客户端向服务端发送请求后,…

3接上篇 我的自定义GPTs的改进优化 与物理世界连接成功 GPTs的创建与使用定义和执行特定任务的功能模块 通过API与外部系统或服务的交互

https://blog.csdn.net/chenhao0568/article/details/134875067?spm1001.2014.3001.5502 从服务器日志里看到请求多了一个“location” 23.102.140.123 - - [08/Dec/2023:14:02:20 0800] "GET /getWeather.php?location&locationNewYork HTTP/1.1" 200 337 &…

2024年甘肃省职业院校技能大赛信息安全管理与评估赛项一阶段样题一

2024年甘肃省职业院校技能大赛高职学生组电子与信息大类信息安全管理与评估赛项样题一 竞赛需要完成三个阶段的任务,分别完成三个模块,总分共计 1000分。三个模块内容和分值分别是: 1.第一阶段:模块一 网络平台搭建与设备安全防…

【K8S】微服务不香了?单体化改造悄然兴起!!

微服务一直以来是服务治理的基本盘之一,落地到云原生上,往往是每个 K8s pods 部署一个服务,独立迭代、独立运维。 但是在快速部署的时候,有时候,我们可能需要一些宏服务的优势。有没有一种方法,能够 “既要又要” 呢?本文基于 tRPC-Go 服务,提出并最终实践了一种经验证…

从互联网到云计算再到 AI 原生,百度智能云数据库的演进

1 数据库行业发展概述 如果说今年科技圈什么最火,我估计大家会毫不犹豫选择 ChatGPT。ChatGPT 是 2022 年 11 月 30 日由 OpenAI 发布的聊天应用。它创造了有史以来用户增长最快的纪录:自 11 月 30 日发布起,5 天就拥有了 100 万活跃用户&am…

静态HTTP和动态HTTP的混合使用:最佳实践

在当今的互联网环境中,静态HTTP和动态HTTP各有其优势和局限。静态HTTP具有速度快、安全性高和易于维护的特点,而动态HTTP则能够实现动态交互和处理大量动态数据。为了充分利用两者的优势,越来越多的网站开始采用静态HTTP和动态HTTP混合使用的…

计算机的存储规则

计算机存储 计算机采用二进制来存储数据和程序 原因主要有: (1) 物理上容易实现 (2) 运算规则非常简单 (3) 可靠性强 (4) 易于实现逻辑运算和逻辑判断 计算机中存储器的分类及特点 根据存储器在计算机系统中所起的作用 分为内存储器和外存储器 (1) 内存用来…

大数据毕业设计之前端02:架构布局和aside的设计

前言 上一篇主要讲了我学习前端的一个经历,以及为什么选择BuildAdmin作为深入前端学习的原因.同事也大致聊了一下学习前端需要使用哪些技术栈。 本篇文章来拆解一下BuildAdmin的前端代码结构,和布局实现的细节。 前端代码结构 必须先了解项目的结构&…

leetcode每日一题37

92.反转链表II 这道题需要1.找到位置left 2.在位置left开始,一前一后两个指针反转链表,代码同206.反转链表,直到后一个指针指向right 3.把反转后的头节点链接到left-1后面,把反转后的链表尾节点指向right1位置的节点 因为可能会反…

数据结构——二叉树的链式结构

个人主页:日刷百题 系列专栏:〖C语言小游戏〗〖Linux〗〖数据结构〗 〖C语言〗 🌎欢迎各位→点赞👍收藏⭐️留言📝 ​ 一、二叉树的创建 这里我们使用先序遍历的思想来创建二叉树,这里的内容对于刚接触二…

iClient3D 加载天地图服务

1 对国家天地图,通过TiandituImageryProvider影像服务提供者加载地图; var TiandituimageryLayernew Cesium.TiandituImageryProvider({ mapStyle: Cesium.TiandituMapsStyle[value],token: "4a00a1dc5387b8ed8adba3374bd87e5e"})viewer.imag…

nginx 的概念、高并发处理及详细参数配置

NGINX是一个开源的高性能Web服务器,负载均衡器和反向代理服务器。它特别适用于高并发的Web应用,能够有效地处理数千并发连接,同时具备低资源消耗和高性能的特点。在这里,我将重点介绍NGINX的高并发处理能力和参数配置。 高并发处…

云原生(Cloud Native)——概念,技术,背景,优缺点,实践例子

云原生(Cloud Native)是一种构建和运行应用程序的方法,这些应用程序充分利用云计算的优势。云原生应用程序通常设计为在现代、动态的环境中运行,如公共云、私有云和混合云。这种方法强调微服务架构、容器化、自动化、易于管理和可…

QT 信号与槽 connect 三种写法

先看下示例: QPushButton *btn new QPushButton;// 方式一:老式写法connect(btn, SIGNAL(clicked()), this, SLOT(close()));// 方式二:Qt5后新写法connect(btn, &QPushButton::clicked, this, &MainWindow::close);// 方式三&#…

Word插件-好用的插件-一键设置字体--大珩助手

常用字体 整理了论文、公文常用字体 整理了常用的论文字体,可一键设置当前节或选择的文字的字体 字体设置 包含字体选择、字体颜色 特殊格式 包含首字下沉、段落分栏、统一宽度、双行合一、上标切换、下标切换、转为全角、转为半角、挖词填空、当前日期、大写金…

LabVIEW开发远程结构健康监测系统

LabVIEW开发远程结构健康监测系统 工程师依赖于振动监测来评估建筑物、桥梁和其他大型结构的完整性。传统的振动监测工具在数据收集上存在限制,无法长时间收集高保真波形。随着内存存储、处理器速度和宽带无线通信技术的进步,出现了对能够长时间收集并实…

Navicat 技术指引 | 适用于 GaussDB 分布式的查询功能

Navicat Premium(16.3.3 Windows 版或以上)正式支持 GaussDB 分布式数据库。GaussDB 分布式模式更适合对系统可用性和数据处理能力要求较高的场景。Navicat 工具不仅提供可视化数据查看和编辑功能,还提供强大的高阶功能(如模型、结…