阿里巴巴通义实验室周畅:让大模型率先在PC上“跑起来”

12月7日,以“AI新生态 智启新元年”为主题的首届AI PC产业创新论坛在北京联想集团总部举办。阿里巴巴-通义实验室、通义千问大模型负责人周畅受邀出席分享关于端侧大模型的技术进展,以及终端设备与AI结合的发展前景。

周畅表示,大模型技术的快速迭代已经让其具备理解世界的基本能力,接下则需要想办法让大模型能力在各种环境和场景下被充分使用起来。“让大模型在PC等终端设备上跑起来,正是普惠终端用户的第一步,阿里巴巴-通义实验室将与联想集团携手合作,在AI PC生态领域共同探索端云协同的解决方案,为个人和企业提供更加精准的AI服务。”

(阿里巴巴-通义实验室,通义千问大模型负责人周畅)

“我们看《流浪地球2》《钢铁侠》这类科幻片的时候,可能人人都会幻想自己要有一个人工智能助手。自ChatGPT出现后,特别是今年,AI发展特别快,很多功能都开始从幻想慢慢变成现实。”他说,开发者社区现在也非常关注大模型在端侧的具体表现。

而从端侧落地出发,在周畅看来需要做好两件事。第一,模型水平的提升。端侧通用AI助手需要能够理解用户的语言语义、并具备图像理解能力,同时也要能够使用各种常用软件的API,即可以使用各种各样的工具来帮助用户完成任何事情,这需要不断提升模型的水平。第二,发挥这类助手的能力,既可以通过端云协同结合云侧模型的强大功能,也可以通过在端侧灵活便捷的部署,使得大模型能力在离线的状态下也能使用。

他介绍说,从8月份到10月份,通义千问已陆续开放从18亿到720亿参数的语言模型,并达到千亿参数模型全尺寸、全模态开源。阿里云希望通过开源不同尺寸的模型,助力业界大模型的生态发展,也希望通过全尺寸的开源来助力模型的落地。

经过压缩和微调的AI模型适合在端侧进行部署。“当前,端侧的开发者群体比较关心的是主流7B或14B这类小尺寸模型的表现和云端大模型的差异。”周畅称,端侧助手关心的核心能力是工具使用,而通义千问小尺寸系列的语言模型,在推出时就非常重视这类能力的优化。

其数据显示,18亿参数的通义千问小模型在简单工具的使用上,可以达到大模型85%的水平,70亿和140亿的模型在这方面的表现与720亿大模型可以十分接近。毫无疑问,通义千问模型的实测为AI大模型的端侧应用铺平了道路,将加速AI能力的普及。

针对模型的任务分解和工具调用能力,周畅在论坛上分享了一系列演示案例,来说明通用大模型已经能够胜任在离线的PC等终端上运行,并可对基础数字、图标、公式以及图片等内容进行轻度处理。

识别数字、图表等能力,对于AI PC的发展十分重要,周畅进一步强调。联想前不久率先对外展示的全球首款AI PC及其高水准的能力,进一步印证了在AI普惠的道路上,AI PC将成为首选终端。

值得一提的是,在AI PC产业创新论坛上发布的业内首份《AI PC产业(中国)白皮书》,已经将AI PC产业生态范围参与方扩大到了5个,包括用户、终端厂商、AI技术(模型)厂商、应用厂商和算力(芯片)厂商。其中,AI技术(模型)厂商是新引入者。

面对即将开启的AI PC元年,周畅认为,端云协同发展的解决方案在未来拥有巨大想象空间。人工智能已经在云端跑了许久,而未来应是云端大模型和端侧大模型的双向奔赴,AI PC的时代已经来临。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/208379.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python django-xadmin:构建强大的 Django 后台管理系统

概要 Django作为一款强大的Web框架,其后台管理系统提供了便捷的数据管理和操作方式。而 django-xadmin 则为Django的后台管理系统提供了更加强大的功能和灵活的定制选项。在本文中,我们将深入研究如何使用django-xadmin,并通过详细的示例代码…

企业博客SEO:优化SOP,助您提升搜索引擎可见性

企业博客是互联网时代企业与用户沟通的重要渠道之一,引流成本也比较低。然而,依然有企业会处在3种状态: 1. 有博客,但内容更新不积极或搁置 2. 有博客,但内容散乱 3. 根本就没有博客 如果是这几种状态,…

Java网络编程-深入理解BIO、NIO

深入理解BIO与NIO BIO BIO 为 Blocked-IO(阻塞 IO),在 JDK1.4 之前建立网络连接时,只能使用 BIO 使用 BIO 时,服务端会对客户端的每个请求都建立一个线程进行处理,客户端向服务端发送请求后,…

3接上篇 我的自定义GPTs的改进优化 与物理世界连接成功 GPTs的创建与使用定义和执行特定任务的功能模块 通过API与外部系统或服务的交互

https://blog.csdn.net/chenhao0568/article/details/134875067?spm1001.2014.3001.5502 从服务器日志里看到请求多了一个“location” 23.102.140.123 - - [08/Dec/2023:14:02:20 0800] "GET /getWeather.php?location&locationNewYork HTTP/1.1" 200 337 &…

2024年甘肃省职业院校技能大赛信息安全管理与评估赛项一阶段样题一

2024年甘肃省职业院校技能大赛高职学生组电子与信息大类信息安全管理与评估赛项样题一 竞赛需要完成三个阶段的任务,分别完成三个模块,总分共计 1000分。三个模块内容和分值分别是: 1.第一阶段:模块一 网络平台搭建与设备安全防…

【K8S】微服务不香了?单体化改造悄然兴起!!

微服务一直以来是服务治理的基本盘之一,落地到云原生上,往往是每个 K8s pods 部署一个服务,独立迭代、独立运维。 但是在快速部署的时候,有时候,我们可能需要一些宏服务的优势。有没有一种方法,能够 “既要又要” 呢?本文基于 tRPC-Go 服务,提出并最终实践了一种经验证…

从互联网到云计算再到 AI 原生,百度智能云数据库的演进

1 数据库行业发展概述 如果说今年科技圈什么最火,我估计大家会毫不犹豫选择 ChatGPT。ChatGPT 是 2022 年 11 月 30 日由 OpenAI 发布的聊天应用。它创造了有史以来用户增长最快的纪录:自 11 月 30 日发布起,5 天就拥有了 100 万活跃用户&am…

静态HTTP和动态HTTP的混合使用:最佳实践

在当今的互联网环境中,静态HTTP和动态HTTP各有其优势和局限。静态HTTP具有速度快、安全性高和易于维护的特点,而动态HTTP则能够实现动态交互和处理大量动态数据。为了充分利用两者的优势,越来越多的网站开始采用静态HTTP和动态HTTP混合使用的…

大数据毕业设计之前端02:架构布局和aside的设计

前言 上一篇主要讲了我学习前端的一个经历,以及为什么选择BuildAdmin作为深入前端学习的原因.同事也大致聊了一下学习前端需要使用哪些技术栈。 本篇文章来拆解一下BuildAdmin的前端代码结构,和布局实现的细节。 前端代码结构 必须先了解项目的结构&…

数据结构——二叉树的链式结构

个人主页:日刷百题 系列专栏:〖C语言小游戏〗〖Linux〗〖数据结构〗 〖C语言〗 🌎欢迎各位→点赞👍收藏⭐️留言📝 ​ 一、二叉树的创建 这里我们使用先序遍历的思想来创建二叉树,这里的内容对于刚接触二…

Word插件-好用的插件-一键设置字体--大珩助手

常用字体 整理了论文、公文常用字体 整理了常用的论文字体,可一键设置当前节或选择的文字的字体 字体设置 包含字体选择、字体颜色 特殊格式 包含首字下沉、段落分栏、统一宽度、双行合一、上标切换、下标切换、转为全角、转为半角、挖词填空、当前日期、大写金…

LabVIEW开发远程结构健康监测系统

LabVIEW开发远程结构健康监测系统 工程师依赖于振动监测来评估建筑物、桥梁和其他大型结构的完整性。传统的振动监测工具在数据收集上存在限制,无法长时间收集高保真波形。随着内存存储、处理器速度和宽带无线通信技术的进步,出现了对能够长时间收集并实…

Navicat 技术指引 | 适用于 GaussDB 分布式的查询功能

Navicat Premium(16.3.3 Windows 版或以上)正式支持 GaussDB 分布式数据库。GaussDB 分布式模式更适合对系统可用性和数据处理能力要求较高的场景。Navicat 工具不仅提供可视化数据查看和编辑功能,还提供强大的高阶功能(如模型、结…

深入了解对象与内置构造函数

1. 深入对象 1.1 创建对象的三种方式 1.2 构造函数 语法约定: 总结 构造函数可以快速创建多个对象大写字母开头的函数使用new关键字将对象实例化构造函数不需要返回值自动返回新的对象 new实例化的执行过程 创建空对象this指向对象执行代码,追加新…

使用wire重构商品微服务

一.wire简介 Wire 是一个轻巧的Golang依赖注入工具。它由Go Cloud团队开发,通过自动生成代码的方式在编译期完成依赖注入。 依赖注入是保持软件 “低耦合、易维护” 的重要设计准则之一。 此准则被广泛应用在各种开发平台之中,有很多与之相关的优秀工…

使用pyftpdlib组件实现FTP文件共享

目录 一、引言 二、技术背景 三、实现逻辑 1、创建FTP服务器: 2、实现文件共享: 3、设置用户权限: 4、处理异常: 5、优化与扩展: 四、代码实现 五、测试与评估 测试用例: 评估方法:…

React/Vue/Svelte 前端项目中开始使用TailwindCSS

背景 TailwindCSS 近年来在前端圈非常流行,它摆脱了原有的CSS限制,以灵活实用为卖点,用户通过各种class组合即可构建出漂亮的用户界面。对于初学者而言,可能需要一些上手成本,一旦掌握实用技巧后,Tailwind…

Unity中Batching优化的GPU实例化整理总结

文章目录 前言一、GPU Instancing的支持1、硬件支持2、Shader支持3、脚本支持 二、我们来顺着理一下GPU实例化的使用步骤1、GPU实例化前的C#代码准备2、在 appdata 和 v2f 中定义GPU实例化ID3、在顶点着色 和 片元着色器 设置GPU Instance ID,使实例化对象顶点位置正…

Docker的资源控制

Docker的资源控制: 对容器使用宿主机的资源进行限制。 CPU 内存 磁盘I/O(读写性能) docker使用linux自带的功能cgroup control groups是linux内核系统提供的一种可以限制,记录,隔离进程组所使用的物理资源的一种机制。 docker借助这个机制…

go grpc高级用法

文章目录 错误处理常规用法进阶用法原理 多路复用元数据负载均衡压缩数据 错误处理 gRPC 一般不在 message 中定义错误。毕竟每个 gRPC 服务本身就带一个 error 的返回值,这是用来传输错误的专用通道。gRPC 中所有的错误返回都应该是 nil 或者 由 status.Status 产…