大模型日报-20240126

「think step by step」还不够,让模型「think more steps」更有用

在这里插入图片描述
https://mp.weixin.qq.com/s/3mdDYQI0WYgIpctyK6q2PA

如今,大型语言模型(LLM)及其高级提示策略的出现,标志着对语言模型的研究取得了重大进展,尤其是在经典的 NLP 任务中。这其中一个关键的创新是思维链(CoT)提示技术,该技术因其在多步骤问题解决中的能力而闻名。这项技术遵循了人类的顺序推理,在各种挑战中表现出了优秀的性能,其中包括跨域、长泛化和跨语言的任务。CoT 及其富有逻辑的、循序渐进的推理方法,在复杂的问题解决场景中提供了至关重要的可解释性。来自美国西北大学、利物浦大学和新泽西理工大学等的研究者们,进一步探讨了推理步骤的长度与结论准确性之间的关系,帮助人们加深关于如何有效解决 NLP 问题的理解。下面这篇文章探索了推理步骤是否是促使 CoT 发挥作用的 prompt 中最关键的部分(见图 1)。本文实验中严格的控制变量,特别是在加入新的推理步骤时,研究者会确保不会引入额外的知识。在零样本实验中,研究者将初始 prompt 从「请逐步思考」调整为「请逐步思考,并且尽可能思考出更多的步骤」。对于小样本问题,研究者设计了一个实验,在保持所有其他因素不变的情况下,扩展基础推理步骤。

汤晓鸥弟子带队:免调优长视频生成,可支持512帧!任何扩散模型都能用

在这里插入图片描述

https://mp.weixin.qq.com/s/AO6f_-rnUwwkNVEWGq1rag

现在,有人提出了一个效果很不错的免调优方法,直接就能作用于预训练好的视频扩散模型。它最长可支持512帧(假设帧率按30fps算,理论上那就是能生成约17秒长的作品了)。可应用于任何视频生成模型,比如AnimateDiff、LaVie等等。以及还能支持多文本生成,比如可以让骆驼一会跑一会停。这项成果来自腾讯AI Lab、南洋理工大学以及港科大,入选了ICLR 2024。

未来五年AI如何改变各学科?从LLM到AI蛋白设计、医疗保健…

在这里插入图片描述

https://mp.weixin.qq.com/s/-saF-4mVE8jdvZei-w2RWQ

五年前(2019 年 1 月),《Nature Machine Intelligence创刊。当然,就人工智能(AI)而言,五年前似乎是一个不同的时代。1 月 24 日,Nature Machine Intelligence 杂志在《Anniversary AI reflections(周年人工智能反思)专题中,再次联系并采访了近期在期刊发表评论和观点文章的作者,请他们从各自所在领域中举例说明人工智能如何改变科学过程。想知道,他们对人工智能领域的哪些其他主题感到兴奋、惊讶或担忧,以及他们对 2024 年以及未来五年的人工智能的希望和期望是什么。一个反复出现的主题是大型语言模型和生成人工智能的持续发展、它们对科学过程的变革性影响以及对伦理影响的担忧。

Hinton、LeCun、Bengio三巨头,马维英、陈海波等华人入选,2023 ACM Fellow公布

在这里插入图片描述

https://mp.weixin.qq.com/s/MQLIE06WNYWTm7eqb04u9Q

今天,美国计算机协会 ACM(Association for Computing Machinery)公布了最新一届 Fellow 名单。ACM 创立于 1947 年,是全世界计算机领域影响力最大的专业学术组织之一。ACM Fellow 是由该组织授予资深会员的荣誉,目的为表彰会员中对于计算机相关领域贡献前 1% 的学者,其审查过程十分严格,每年遴选一次,研究员由同行提名,提名由委员会审查。本年度新入选科学家中共有 68 人,他们的贡献涉及网络安全、人机交互、移动计算和推荐系统等领域。令人惊奇的是,曾获得 ACM 图灵奖的深度学习三巨头 Geoffrey Hinton、Yoshua Bengio、Yann LeCun,今年全部入选 ACM Fellow。今年入选者还包括马维英、陈海波等多名华人学者。

全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步

在这里插入图片描述

https://mp.weixin.qq.com/s/qiuvFBoGorFJ3FakjIzfAQ

过去一年,生成式人工智能发展的核心关键词,就是「大」。人们逐渐接受了强化学习先驱 Rich Sutton 充分利用算力「大力出奇迹」的思潮,庞大的数据量是 AI 模型展现出惊人智慧的核心原因。数据规模越大、质量越高、标注越细,模型就能了解到更全面的世界知识,从而拟合出更加智能的结果。那么,为什么人工智能的进展还没有转化成科幻片中那种全能管家机器人呢?能清理桌子、叠衣服、做早餐的机器人在哪里?一个重要的原因是机器人领域很难「大力出奇迹」,生成式 AI 的文字或图片训练数据在网络上就能轻松获取,而机器人的训练数据通常是由研究人员在实验室里根据具体的任务一个一个地创建的。这个过程往往漫长而又乏味。为了得到问题的答案,由谷歌 Deepmind 发起,来自北美、欧洲、亚洲的 34 个机器人实验室共同启动了 RT-X 项目。RT-X 项目的目标是汇集数据、资源和代码,让通用机器人走进现实。该项目的主要参与者加州大学伯克利分校的 Sergey Levine 教授和 Google DeepMind 的资深科学家 Karol Hausman 联合撰写了「THE GLOBAL PROJECT TO MAKE A GENERAL ROBOTIC BRAIN(打造通用机器人大脑的全球合作项目)」一文,总结了 RT-X 项目取得的进展。

【2.1 万字实录】Rabbit 创始人&CEO 吕骋最新对谈|R1 更像是 AI + iPod,而不是 iPhone 杀手

在这里插入图片描述
https://mp.weixin.qq.com/s/DdS_KPhGCCt4y7Ak4SY-Eg

这是 Rabbit CEO 吕骋(Jesse Lyu)在 CES 后在《This Week Startup》节目上与硅谷知名天使投资人 Jason Calacanis 最新对话,长达 90 分钟的对谈详细描述了他最新的产品思考。吕骋强调了技术的演进是为了解决相同的问题,但以更直观的方式。他详细介绍了 LAM (Large Action Model)的工作原理, LAM 旨在提高效率、节省时间,这是一个真正的时间节省装置,让用户更多地专注于其他事情,这一理念是公司的核心驱动力。

美国家AI研究资源试点项目上线,NASA、英伟达、OpenAI等捐赠关键基础资源

https://mp.weixin.qq.com/s/oNdAc2N6BYo_Qmy2_DccdQ

美国国家科学基金会(NSF)启动了国家人工智能研究资源试点项目(NAIRR),旨在通过共享国家研究基础设施,确保广泛的研究和教育界能够公平获取AI基础资源和工具。该项目得到了包括NASA、英伟达、OpenAI等在内的多家政府机构和私营企业的资源捐赠。NAIRR将提供数据集、AI模型、软件和培训资源,以支持AI研究,特别是对资源有限的小型机构和代表性不足的群体。项目预算每年8亿美元,为期三年,旨在保持美国在AI技术领域的国际竞争力。

Adept AI分享新模型Fuyu-Heavy:世界上第三强大的多模态模型

https://x.com/AdeptAILabs/status/1750215532597665849?s=20

介绍Fuyu-Heavy,我们的新型多模态模型。Fuyu-Heavy是世界上第三强大的多模态模型,仅次于体量是其10到20倍的GPT4-V和Gemini Ultra。特别是,在MMLU和MMMU两个方面,它都超越了Gemini Pro…

Szegedy分享:我越来越相信检索增强生成是强大通用人工智能最核心的问题

https://x.com/ChrSzegedy/status/1750196565409701979?s=20

在过去几年里(自2016年以来),我越来越相信检索增强生成是强大通用人工智能最核心的问题。尽管在过去7年里已经完成了惊人的工作,但它仍然是最核心的问题。

看看科学是关于什么的:发现越来越多的、在看似越来越不明显的领域之间的隐晦联系。这种“侦探工作”涉及到长的联想链和心智建模,与彻底的信息收集交织在一起。

即便对于人类来说,执行这种任务也不容易,我们需要几十年的训练才能学会做得好。

这个复杂的过程就是真正的RAG,而迄今为止发布的任何东西都还没有接近于好好地解决它。

DeepLearning 新课程《自动化测试LLMOps》by Rob Zuber

https://x.com/AndrewYNg/status/1750200384600309872?s=20

新的短期课程:由CircleCI的首席技术官Rob Zuber开设的《自动化测试LLMOps》!这个课程将教你如何将CI(持续集成)的一些核心理念——它一直是高效软件工程的支柱——适用于构建基于LLM(大型语言模型)的应用。

微调基于LLM的应用程序以改进它——比如通过修改提示语——可能会产生意想不到的副作用。例如,如果一个团队成员更新提示语试图使LLM输出看起来更有趣,但这却导致它产生了更多幻觉怎么办?自动化测试作为你的LLMOps(LLM操作)方法的一部分,有助于避免这些问题,并让你更快且更有信心地发布产品。

在这个课程中,你将学到:

(i)编写LLM评估,以涵盖常见问题,如幻觉、数据偏移,以及有害或冒犯性输出。

(ii)构建CI工作流,以自动评估你的应用程序的每一个变更。

(iii)安排你的CI工作流,在开发的不同阶段运行特定评估。

鉴于AI开发的迭代性质,CI对AI应用来说尤其重要,这意味着我们经常希望进行许多渐进式的变更。

Hannun分享:在Apple Silicon上只需3步使用MLX运行RAG应用

https://x.com/awnihannun/status/1750188633297166842?s=20

在Apple Silicon上使用MLX运行RAG应用,只需3步

python3 -m pip install -r requirements.txt

python3 create_vdb.py --pdf flash_attention.pdf --vdb vdb.npz

python3 query_vdb.py --question “what is flash attention?”

https://github.com/vegaluisjose/mlx-rag/tree/main

Ollama Python和JavaScript库推出:可以将新的和现有的应用程序与Ollama集成,并共享Ollama REST API的特性和感觉

在这里插入图片描述

https://x.com/ollama/status/1750200451205939392?s=20

Ollama Python和JavaScript库现已推出!

这两个库使得仅需几行代码就能将新的和现有的应用程序与Ollama集成,并共享Ollama REST API的特性和感觉。

了解更多:

https://ollama.ai/blog/python-javascript-libraries

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/649843.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript 生成器(Generator)、高级 iteration用法详解

🧑‍🎓 个人主页:《爱蹦跶的大A阿》 🔥当前正在更新专栏:《VUE》 、《JavaScript保姆级教程》、《krpano》、《krpano中文文档》 ​ 目录 ✨ 前言 ✨ 正文 一、生成器(Generator) 什么是生成器 生成器函数 nex…

Unity 代理模式(实例详解)

文章目录 实例1:资源加载代理(Asset Loading Proxy)实例2:网络请求代理(Network Request Proxy)实例3:性能优化代理(Performance Optimization Proxy)实例4:权…

Docker容器部署OpenCV,打造高效可移植的计算机视觉开发环境

推荐 海鲸AI-ChatGPT4.0国内站点:https://www.atalk-ai.com 前言 在计算机视觉领域,快速部署和测试算法是研究和开发的关键。OpenCV作为一个强大的开源计算机视觉库,广泛应用于各种图像处理和视频分析任务。然而,配置OpenCV环境可…

光纤接口类型

光纤接口 网络设备基础知识 文章目录 光纤接口前言一、光纤接口二、光纤接口的优缺点总结前言 不同的接口类型适用于不同的光纤传输系统和应用需求。在选择光纤设备时,需要根据实际需求和系统要求选择适当的光纤接口类型。 一、光纤接口

计算机基础之微处理器简介

微处理器 微处理器定义 微型计算机的CPU也被称为微处理器,是将运算器、控制器和高速缓存集成在一起的超大规模集成电路芯片,是计算机的核心部件。能完成取指令、执行指令,以及与外界存储器和逻辑部件交换信息等操作。 微处理器发展 CPU从…

[C++]使用纯opencv部署yolov8旋转框目标检测

【官方框架地址】 https://github.com/ultralytics/ultralytics 【算法介绍】 YOLOv8是一种先进的对象检测算法,它通过单个神经网络实现了快速的物体检测。其中,旋转框检测是YOLOv8的一项重要特性,它可以有效地检测出不同方向和角度的物体。…

安全小记-ngnix负载均衡

目录 一.配置ngnix环境二.nginx负载均衡 一.配置ngnix环境 本次实验使用的是centos7,首先默认yum源已经配置好,没有配置好的自行访问阿里云镜像站 https://developer.aliyun.com/mirror/ 接着进行安装工作 1.首先创建Nginx的目录并进入: mkdir /soft &…

【七、centos要停止维护了,我选择Almalinux】

搜索镜像 https://developer.aliyun.com/mirror/?serviceTypemirror&tag%E7%B3%BB%E7%BB%9F&keywordalmalinux dvd是有界面操作的,minimal是最小化只有命里行 镜像下载地址 安装和centos基本一样的,操作命令也是一样的,有需要我…

openlayers+vue实现缓冲区

文章目录 前言一、准备二、初始化地图1、创建一个地图容器2、引入必须的类库3、地图初始化4、给地图增加底图 三、创建缓冲区1、引入需要的工具类库2、绘制方法 四、完整代码总结 前言 缓冲区是地理空间目标的一种影响范围或服务范围,是对选中的一组或一类地图要素(点、线或面…

C++面试:散列表

目录 1. 散列表的基本概念 散列表的定义 散列函数 哈希冲突 2. 处理冲突的方法 链地址法(Separate Chaining) 开放地址法 再散列 3. 散列表的性能分析 1. 平均查找长度(ASL) 2. 负载因子(Load Factor&#…

【Linux】-cp模型

💖作者:小树苗渴望变成参天大树🎈 🎉作者宣言:认真写好每一篇博客💤 🎊作者gitee:gitee✨ 💞作者专栏:C语言,数据结构初阶,Linux,C 动态规划算法🎄 如 果 你 …

IS-IS:04 DIS

IS-IS 协议只支持两种网络类型,即广播网络和点到点网络。与 OSPF 协议相同, IS-IS 协议在广播网络中会将网络视为一个伪节点 ( Pesudonde,简称 PSN),并选举出一台DIS (Designated IS&#xff09…

ASP.NET Core 7 Web 使用Session

ASP.NET Core 好像不能像20年前那样直接使用Session函数,我使用如下方法 1、在NuGet安装以下2个包 2、在Program.cs注册 //注册Session builder.Services.AddSession(options > {options.IdleTimeout TimeSpan.FromMinutes(60);options.Cookie.HttpOnly fals…

CAN相关寄存器

1. CAN_ MCR:CAN主控制寄存器。主要负责CAN工作模式的配置。 CAN_BTR:位时序寄存器。用来设置分频/TBs1/TBs2/Tsw等参数,设置测试模式。 CAN_(T/R)IxR:标识符寄存器。存放(待发送/接收)的报文ID、扩展ID、IDE位及RTR…

如何快速搭建实用的爬虫管理平台

目录 一、前言 二、选择合适的爬虫框架 三、搭建数据库 步骤1 步骤2 步骤3 四、搭建Web服务器 步骤1 步骤2 步骤3 步骤4 五、管理爬虫 六、总结 一、前言 爬虫是互联网数据采集的关键工具,但是随着数据量的增加和需求的多样化,手动运行和管…

SIFT图像特征表述

SIFT(尺度不变特征变换)是一种用于图像处理和计算机视觉领域的特征提取算法。其目的是检测和描述图像中的局部特征。SIFT特征对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也具有一定的稳健性。下面是SIFT特征提取的基本…

计算机网络体系架构认知--网络协议栈

文章目录 一.计算机网络分层架构各协议层和计算机系统的联系从整体上理解计算机网络通信计算机网络通信的本质 二.Mac地址,IP地址和进程端口号三.局域网通信与跨局域网通信局域网通信跨局域网通信全球互联的通信脉络 四.网络编程概述 一.计算机网络分层架构 实现计算机长距离网…

12.Golang中类的表示与封装

目录 概述类的表示代码结果 类的封装代码结果 结束 概述 Golang中类的表示与封装 类的表示 代码 注释掉的代码,并不能拿来当赋值或获取值来使用。 package mainimport "fmt"// 类大写则代表,可以被其它包使用 type Hero struct {// 属性方法大…

RHCE作业

1.写一个脚本,完成如下功能 传递一个参数给脚本,此参数为gzip、bzip2或者xz三者之一 (1) 如果参数1的值为gzip,则使用tar和gzip归档压缩/etc目录至/backups目录中,并命名为/backups/etc-20160613.tar.gz; (2) 如果参…

临紧光五行护盾

临紧光五行护盾基础名词解释 粒子系统仿真,离散事件系统设计临紧光五行护盾(云藏山鹰临近光五行散射)V-ATPase道装,意气实体过程光效集聚模拟器荀况数论云藏山鹰类型物粒子系统导引云藏山鹰类型物与冯诺依曼爆炸学物品分类表杨米尔…