(杂文)参加WAIC 2024 所思所感

受华为广办的邀请,在领导要求下, 我还是在这个炎热的暑假通过一个接近凌晨两点落地的飞机连夜从北京来到了上海,去“睁眼看世界”。

区别于纯学术会议和CCF类的会议,WAIC 更加的平易近人,有更多的工业界同行,有更多的产品宣传。

自2018年起,来到了第7届,我是第一次来到现场。 第一场论坛,去了昇腾的论坛,第一场演进就有幸听到了郑院士的演讲 《人工智能大模型的计算系统》。 郑老师的演讲 从 大模型生命周期的算力需求展开,以鹏城实验室的算力中心搭建为例,娓娓道来,提出了设计大模型计算机系统需要考虑的五个问题以及国产AI计算系统需要做好的10件事情:
1)多种精度运算性能的平衡。 是啊,我们在标准的FP16算力可观,FP64呢,混合精度,BF16,FP8 和英伟达还有多大的距离呢?
2) 网络平衡设计
3)内存平衡设计
4)IO子系统平衡设计
国产的芯片在追赶国外,但是配套的软件生态,差距可能并不比硬件差。我经历的每一个国产芯片厂家,哪怕是兼容CUDA生态已经非常好的芯片,对于新模型,也需要至少1-2周的调优,而这个调优又通常又没有构成一个良好的开源生态,使得难以快速适应全球大模型本身的高速演进。
5)国产AI计算系统需要做好的事情:
a) 编程框架
b)并行加速
c) 通信库
d) 算子库
e) AI 编译器
f) 编程语言
g) 调度器
h) 内存分配系统
i) 容错系统
j) 存储系统

从系统工程角度去看待大模型的全生命周期,是郑老的核心观点。大模型远远不是发布一个垂类的llama微调模型,而是一套完整的系统。 上述的各个环节,其实国内和美国头部是有差异,这个差异最大的体现是创新和生态上。 以编程框架为例,适配昇腾的时候我们一度因为NLP算子的成熟度问题,用mindspore重构了我们在之前用tensorflow和pytorch下写的CNN、RNN和PLM的一些模型。可以当昇腾过程中,逐步自己就对pytorch生态兼容了起来,然后喜欢乐见,大家愉快的拥抱了pytorch,迅速对接了学术圈和开源社区的成果。 这也反应了一个非常大的问题,国内的开源到底生命力在哪? 激烈的商业竞争,价格战最为底牌的惨烈厮杀,对于开源,对于行业,对于生态 主流厂商的心态到底如何。以为铸就了技术护城河,开源社区国内贡献最好的阿里,被拼多多用商业模式而不是创新技术反超的现象还在不断发生,企业创新就永远落在商业策略之后不止一个身位。 更遑论小厂,不管怎么重视研发,市场 或者 售前从客户那一个随机的想法,就可以让研发头破血流的投入。 专注技术的论证可能连声音都发不出,就被具备市场思维的研发大领导以没有市场观念给毙掉。 各种企业有各种企业的挣扎求生,KPI 或者 OKI 束缚我们的创新和 美团束缚快递小哥其实也没有本质的区别。

希望大模型的发展,我们的创新公司,靠着技术的先进性,不是拼补贴不是拼政策的赢一次。想想都热血沸腾。

讲座之后,我们和昇腾产品线有一个闭门会议,略过内容不谈,双方对对于大规模推理的性价比思考,达成了共识

因为临时决定参加,大部分论坛没法参加,特别遗憾的因果科学的论坛。我看到受邀嘉宾,大神云集,很想去听听Pearl 和 Rubin的演讲,毕竟今年在EMNLP也投了这方面的paper,去沾沾神运

大会的最后一天,我独自去看了展区。整个WAIC的主基调产品也是大模型,基本上各行各业都在讲一个和大模型的故事。从工业界的施耐德电气到金融的蚂蚁、中信到娱乐的B站,算力从云上到国产芯片,琳琅满目。 我的感觉就两点,一 AI时代确实来了,即时人工智能再一次陷入周期性低潮,也改变不了这些技术已经走入生活,而不是像之前一样停留在paper和实验室中。 二,这个时代才开始。 大家同质化而且稚嫩,像极互联网起家时候,门户网站称王的时代,商业模式简单粗暴,满口都是赋能和考虑用户价值,但实际考虑投入产出比,就买铲子和买培训的在赚钱。 哪怕是具身智能,也没法让我兴奋。反倒是一个做XR的现场体验,让我动了去京东购买的念头,尽管他的功能也就是个灵活的投影仪。 比较可惜的是我好不容易看到个web3的,发现展厅的人吃饭去了,场地规模也小,也是币圈链圈口碑不佳。 但是没有看到A/V/XR 以及web3和大模型的精彩结合的产品,让我有点失望,也对未来有一些期待。

露天有个站台,我听了 合合的多模态抽取以及RAG方案,金山的WPSAI,百度的文心编程。但最让我喜欢的其实是rwkv的坚持,这也许就是科研创新最原始的魅力吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/41799.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【学术会议征稿】2024年工业自动化与机器人国际学术会议(IAR 2024)

2024年工业自动化与机器人国际学术会议(IAR 2024) 2024 International Conference on Industrial Automation and Robotics 2024年工业自动化与机器人国际学术会议(IAR 2024)将于2024年10月18-20日在新加坡隆重召开。会议将围绕…

三丰云评测:免费虚拟主机与免费云服务器的全面对比

三丰云是一家知名的互联网服务提供商,专注于虚拟主机和云服务器的服务。在互联网技术日新月异的今天,选择一个优质的云服务提供商至关重要。本次评测将重点对比三丰云的免费虚拟主机和免费云服务器,帮助用户更好地选择适合自己需求的服务。首…

0 TMS320F28379D 开坑

开坑原因 最近开始做实验,实验室的主控采用的是F2812FPGA,属于够用但不好用的状态。FPGA用于生成调制信号,DSP完成采样和控制。师兄师姐研究拓扑及调制策略,对驱动数量以及驱动逻辑有比较高的要求,因此不好脱离FPGA&a…

CVE-2023-30212(xss漏洞)

简介 OURPHP版本<7.2.0存在XSS漏洞&#xff0c;攻击路径为/client/manage/ourphp_out.php。 过程 打开靶场 访问攻击路径/client/manage/ourphp_out.php 得到flag{354c7c41-cc23-4de5-be73-79cbbf384aba}

Multisim仿真-交流数字电压表

下图为整体的原理框图&#xff0c;交流电源经过整流滤波电路转换后&#xff0c;送入模数转换电路&#xff0c;经译码给到显示电路&#xff0c;由其显示交流电源的有效值。 信号发生器XFG1输出正弦波信号(峰峰值)&#xff0c;XMM1测量有效值&#xff0c;U6数码管显示有效值。仿真…

Linux下python抓取动态网页内容

一、背景 现在大部分网站的数据都是异步加载的&#xff0c;直接抓取是没办法获取到你想要的数据。必须要借助浏览器(无头浏览器,下面会搭建这个环境)来加载其javascript渲染数据后&#xff0c;你所需要的数据这时才呈现。 二、环境搭建 1、Centos7 默认有 python2.7版本 查…

[BJDCTF 2nd]简单注入

sqlsqlsqlsqlsql又来喽 过滤了单双引号&#xff0c;等于符号&#xff0c;还有select等&#xff0c;但是这里没有二次注入 。扫描发现hint.txt 看出题人的意思是&#xff0c;得到密码即可获得flag。 select * from users where username$_POST["username"] and passw…

二叉树的顺序存储

目录 顺序存储&#xff1a; 简介&#xff1a; 节点的位置关系&#xff1a; 优缺点&#xff1a; 优点&#xff1a; 缺点&#xff1a; 二叉树顺序存储的模拟实现&#xff1a; 向上调整算法&#xff1a; 向下调整算法&#xff1a; 二叉树的初始化&#xff1a; 直接初始化…

spdlog一个非常好用的C++日志库(五): 源码分析之registry类

目录 1.registry类意义 2.registry类实现 2.1.registry数据成员 2.2.registry函数成员 2.2.1.构造与析构 2.2.2.单例模式 2.2.3.全局注册表 2.2.4.initialize_logger初始化logger对象 2.2.5.全局格式器 2.2.6.预置日志等级 2.2.7.flush日志等级 2.2.8.默认logger …

合并区间(python3)

合并区间 题目描述解题思路代码实现复杂度 题目描述 以数组 intervals 表示若干个区间的集合&#xff0c;其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间&#xff0c;并返回 一个不重叠的区间数组&#xff0c;该数组需恰好覆盖输入中的所有区间 。 示…

认识流式处理框架Apache Flink

目录 一、Apache Flink 的基础概念 1.1 Apache Flink是什么&#xff1f; 1.2 Flink的定义 二、Apache Flink 的发展史 2.1 Flink前身Stratosphere 2.2 Flink发展时间线及重大变更 三、Flink核心特性 3.1 批流一体化 3.2 同时支持高吞吐、低延迟、高性能 3.3 支持事件时…

Git 运用小知识

1.Git添加未完善代码的解决方法 1.1 Git只是提交未推送 把未完善的代码提交到本地仓库 只需点击撤销提交&#xff0c;提交的未完善代码会被撤回 代码显示未提交状态 1.2 Git提交并推送 把未完善的代码提交并推送到远程仓库 点击【未完善提交并推送】的结点选择还原提交&#x…

指定版本ceph-common安装

如&#xff0c;安装15.2.13的ceph-common PACKAGE_NAMEceph-common CEPH_VERSION15.2.13 wget -q -O- https://download.ceph.com/keys/release.asc | sudo apt-key add - echo deb http://download.ceph.com/debian-${CEPH_VERSION}/ $(lsb_release -sc) main | sudo tee …

关于学习方法的优化

这是一种新的学习方法&#xff0c;一种新的学习形式&#xff0c;可以通过歌唱的方式&#xff0c;运用&#xff0c;把自己每天要进行的内容进行一个复习&#xff0c;进行一个重复&#xff0c;这样可以实现随时随地进行一个学习&#xff0c;这样可以帮助快速走出来&#xff01; 您…

面试记录总结

es6新特性 --------------------------------------------------------------------------------------- let 1.变量不能重复声明 2.块儿级作用域 3.不存在变量提升 4.不影响作用域链 const 1.一定要赋初始值 2.一般常量使用大写(潜规则) 3.常量的值不能修改 4.块儿级作用域 5…

MinIO - 从 环境搭建 -> SpringBoot实战 -> 演示,掌握 Bucket 和 Object 操作

目录 开始 Docker 部署 MinIO 中的基本概念 SpringBoot 集成 MinIO 依赖 配置 MinIO 时间差问题报错 The difference between the request time and the servers time is too large MinIO 中对 Bucket&#xff08;文件夹&#xff09; 的操作 是否存在 / 创建 查询所有…

如何产生一个有价值的观点

今天看了黄执中的一个课叫如何产生有价值的观点收获挺大的。 有价值指的是能让人听完有“哦”的提壶灌顶的感觉。而观点是指具有浅负担&#xff0c;深触动&#xff0c;可迁移属性的一个想法。 黄执中说这样的观点不是灵机一现&#xff0c;而是可以量产的。他给我举了三个计算…

Apache Seata 源码分析Seata-XID传递 Dubbo篇

本文来自 Apache Seata官方文档&#xff0c;欢迎访问官网&#xff0c;查看更多深度文章。 本文来自 Apache Seata官方文档&#xff0c;欢迎访问官网&#xff0c;查看更多深度文章。 源码分析 Seata-XID 传递 Dubbo 篇 本文作者&#xff1a;FUNKYE(陈健斌),杭州某互联网公司主…

TQ15EG开发板教程:MPSOC创建fmcomms8工程

链接&#xff1a;https://pan.baidu.com/s/1jbuYs9alP2SaqnV5fpNgyg 提取码&#xff1a;r00c 本例程需要实现在hdl加no-OS系统中&#xff0c;通过修改fmcomms8/zcu102项目&#xff0c;实现在MPSOC两个fmc口上运行fmcomms8项目。 目录 1 下载文件与切换版本 2 编译fmcomms8项…

超越YOLO! RT-DETR 实时目标检测技术介绍

《博主简介》 小伙伴们好&#xff0c;我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源&#xff0c;可关注公-仲-hao:【阿旭算法与机器学习】&#xff0c;共同学习交流~ &#x1f44d;感谢小伙伴们点赞、关注&#xff01; 《------往期经典推…