科研上新 | 第6期:优化LLM数学推理;深度学习建模基因表达调控;基于深度学习的近实时海洋碳汇估算

编者按:欢迎阅读“科研上新”栏目!“科研上新”汇聚了微软亚洲研究院最新的创新成果与科研动态。在这里,你可以快速浏览研究院的亮点资讯,保持对前沿领域的敏锐嗅觉,同时也能找到先进实用的开源工具。

本期内容速览

01. CoT-Influx:突破少样本学习极限,提升LLM数学推理能力
02. CREaTor:通过自注意力机制建模细胞特异的基因表达调控
03. CMO-NRT:近实时监测全球海洋碳汇

CoT-Influx:突破少样本学习极限,提升LLM数学推理能力

new-arrival-in-research-1

论文链接:https://arxiv.org/abs/2312.08901

项目链接(将于近日上线):https://github.com/microsoft/CoT-Influx

大语言模型(LLMs)在各种任务中都展现出了卓越的能力,然而,对于推理任务,尤其是数学推理,提升 LLMs 性能仍然是一个挑战。尽管微调和思维链(CoT)有效提升了 LLMs 的数学推理,但作为与其相辅相成的方法——少样本学习在提升推理能力的边界尚未充分验证。

受人类推理过程启发,如果 LLMs 在解答数学问题前见过更多的解题思路示例(如与问题属于同一类型的 CoT 样本),那么将有望激发其推理能力以生成正确解决方案。而新问题也随之而来:通过输入更多的样本,LLMs 在数学推理方面的性能提升上限是多少?

微软亚洲研究院的研究员们观察发现:1. 增加 CoT 样本可提升 LLMs 推理能力,但受 LLMs 上下文窗口限制存在上界。2. CoT 样本选择至关重要,随机添加更多样本无法提升推理能力。3. CoT 样本存在冗余,通过对 token 进行剪枝可有效节省上下文窗口空间。

基于上述发现,研究员们提出了 CoT-Influx,专注于剪枝冗余的 CoT 样本和 token,为更具信息性的上下文腾出 token 空间, 以拓展少样本学习的极限。作为即插即用的插件,CoT-Influx 旨在适用于各种基础和微调的 LLMs, 通过输入尽可能多的高质量、不含冗余 token 的思维链样本,可显著提高各类 LLMs 解决数学问题的能力。

具体来说, 研究员们设计了一个轻量级的两阶段剪枝模块:(1) 第一阶段 shot pruner 从大量输入样本中选择关键 CoT 样本,(2)第二阶段对于第一阶段中选择的 CoT 样本中的冗余 token 进行剪枝。为了有效训练剪枝模块,研究员们首先设计了一个专用于数学推理的奖励函数,同时考虑剪枝后的少样本 token 总数及其对于 LLMs 数学推理的有效性。其次,研究员们利用 GPT-4 构建了一个高质量的 CoT 样本数据集 MRD3,并利用强化学习来优化该奖励函数。

图1:(上)CoT-Influx 算法; (下)CoT-Influx 进行少样本和 token 剪枝示例

图1:(上)CoT-Influx 算法; (下)CoT-Influx 进行少样本和 token 剪枝示例

实验结果表明,CoT-Influx 在多个 LLMs 和不同数学数据集上均显著提升推理能力,明显优于各种基于 prompting 的方法。例如,在 GSM8K 数据集上,通过剪枝长度是 LLaMA2 上下文窗口两倍的大量样本,CoT-Influx 带来了4.55%的绝对准确率提升。LLaMA2-70B 在 CoT-Influx 的增强下,在 GSM8K 上表现优越,超越了更大的 LLMs (PaLM 540B、Minerva 540B 等),比 GPT-3.5 高出2.5%个绝对准确率。未来,研究团队将进一步探索 CoT-Influx 对于指令微调大模型(如 WizardMath)和 GPT-4 的性能提升。

CREaTor:通过自注意力机制建模细胞特异的基因表达调控

new-arrival-in-research-3

论文链接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-023-03103-8

项目链接:https://github.com/DLS5-Omics/CREaTor

通过基因表达调控机制,具有相同基因组的细胞可以产出不同数量的基因产物(RNA 或蛋白质),并呈现不同的转录组与蛋白组状态。因此,基因调控与随之产生的细胞特异基因表达是生物体应对环境变化、执行生理功能、进行生长发育等生命活动的关键。构建不同细胞类型的基因调控网络,能够帮助人们理解细胞行为,改变细胞状态,推动生物工程与治疗工程的发展。

然而,由于基因调控的层级性、动态性与细胞特异性,通过实验方法系统性观测基因表达规律面临许多挑战。机制复杂与数据缺失的矛盾加剧了通过计算方法建模基因调控程序的难度,使得计算方法的有效性与泛化性成为瓶颈。

为了更有效地建模细胞特异的基因调控网络,发现跨细胞类型的通用表达调控机制,微软研究院科学智能中心的研究员们提出了一套基于自注意力机制的深度学习模型 CREaTor(Cis-Regulatory Element auto Translator)。该模型将细胞特异的基因表达作为模型预测目标,使用多层自注意力机制建模基因调控规律,从而同时解决了数据缺失与调控机制表征复杂的问题。

图2:CREaTor 模型框架

图2:CREaTor 模型框架

CREaTor 的训练策略是利用目标基因近邻的功能基因组学特征与 DNA 功能元件预测目标基因的表达水平。由于相同目标基因会在不同细胞中表现出不同表达水平,这一策略能够迫使模型学习通用基因调控机制(网络参数),建立细胞当前调控状态(模型输入)与基因调控结果(模型输出)之间的联系。高通量测序技术的发展让功能基因组学与转录组学数据飞速积累,为模型训练提供了海量而多样的样本。

研究员们通过两组顺式基因调控(一类基于 DNA 序列相互作用的基因调控模式)预测任务验证了这套方法的可行性。实验表明,CREaTor 生成的自注意力矩阵可以有效捕捉顺式调控元件与靶基因间的相互作用关系,区分实验证实的正负样本。其预测准确度优于经典的基于元件-基因距离的预测方法与 ABC score 方法,以及两种最先进的深度学习方法 Enformer (DeepMind, 2021)和 GraphReg (2022)。同时,CREaTor 还具有优秀的泛化能力与零样本学习能力,即使在模型从未见过的细胞类型中也能展现出优越的性能。此外,研究员们发现,CREaTor的多层自注意力矩阵还能够捕获元件间相互作用,并表征更高层次的基因调控模式与基因组组织特性。

该研究展示了利用深度学习模型模拟细胞基因调控网络的可行性,并表明 CREaTor 可以作为基因调控规律研究的有力工具,用于系统性预测各类细胞(包括正常发育过程和与疾病相关的细胞)的基因调控模式。

CMO-NRT:近实时监测全球海洋碳汇

new-arrival-in-research-5

论文链接:https://arxiv.org/abs/2312.01637

海洋能够吸收大气中的二氧化碳,从而在调节气候变化中发挥至关重要的作用。及时且具有地理详细性的全球海洋-大气二氧化碳通量估计能帮助人类深入认识全球碳循环的时间变化和区域差异,对全球碳预算有重要影响。然而,以往的这类通量估计存在1-2年的延迟,无法及时监测全球海洋碳汇的最新变化。

为了解决这个问题,微软亚洲研究院的研究员们推出了一个近实时的、基于月度网格的全球海洋二氧化碳浓度和海洋-大气二氧化碳通量数据集(Carbon Monitor Ocean,简称 CMO-NRT),该数据集覆盖了2022年1月至2023年7月的数据(随着时间推移,数据的区间也在不断更新中)。研究员们通过使用卷积神经网络和半监督学习方法学习模型估计或产品与观测预测因子之间的非线性关系,将10个全球海洋生物地球化学模型和8个全球碳预算2022年数据产品的估计更新到近实时框架。

图3:CMO-NRT 方法和数据来源示意图

图3:CMO-NRT 方法和数据来源示意图

具体来说,研究员们提出了一种基于深度学习的技术,旨在近实时估算海洋碳汇数据。该方法将年份、月份、纬度、经度及9种环境因子数据如风速、海面温度,CO2 浓度等作为输入,预测目标则是基于全球海洋生物地球化学模型(GOBM)和海洋数据产品。所有数据均被处理成180x360的网格格式。为了在保证模型质量的同时提高计算效率,研究员们将所有环境因素切割成更小的18x18区块进行模型训练。

该研究采用了卷积神经网络(CNN)和线性模型的混合架构。经过领域知识和实验结果的分析,研究员们发现 CNN 模型能够有效地捕获预测目标与各种特征以及周边环境数据之间的关系,从而得出最优的预测结果。在模型训练过程中,研究员们使用带标签的数据计算监督损失,同时利用所有数据计算无监督损失。最终的损失函数是这两种损失的加权和,通过反向传播更新模型参数。为了进一步提高模型的稳定性和可靠性,研究员们采取了 k-fold 交叉验证的方法,对五个预测模型的结果进行平均处理,从而得出最终的预测结果。这一方法大大提高了模型的稳健性,使得预测结果更为可靠。

该数据集的目标是通过提高海洋二氧化碳浓度和海洋-大气二氧化碳通量估计的及时性,使全球海洋碳汇的评估更加准确和即时。通过捕捉模型估计或产品与观测预测因子之间的非线性关系,CMO-NRT 提供了对全球海洋-大气二氧化碳通量更即时、精确和全面的理解。这一进步提高了科学家和政策制定者监控及有效应对海洋二氧化碳吸收变化的能力,从而对气候变化管理做出贡献。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/599493.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Namp扫描工具的使用

写在前面: Nmap是一款应用广泛的网络探测工具,它可以识别网络中计算机及操作系统、检测端口、识别协议指纹、检测文件传输以及执行安全扫描等功能,从而防止攻击行为的发生。 一、介绍 Nmap(Network Mapper)是一个网…

在 IDEA 中创建JavaWeb 项目的方式(超详细步骤教程和遇到的问题)

目录 0-1项目图片操作步骤链接0-2项目结构预览1.新建Project2.定义项目名称3.创建完成后项目结构4.创建config文件夹4.1 作用 5.在WEB-INF下创建lib文件夹5.1然后搞几个常用的jar包放入5.1.1jar包全选中后右键选择放入类库5.1.2jar包全选中后右键选择放入类库 6.创建src下文件夹…

软件测试金融项目经验总结,面试题都问什么?

1、APP端/客户端接口加解密介绍 加密方式(两种): 在TCP/IP四层模型中的应用层进行加密。类似密码本,当前项目使用的是这种,可以看到所有响应内容,只是看不懂。 在TCP/IP四层模型中的运输层和应用层之间进行…

「Vue3面试系列」Vue3 所采用的 Composition Api 与 Vue2 使用的 Options Api 有什么不同?

文章目录 开始之前正文一、Options Api二、Composition Api三、对比逻辑组织Options APICompostion API 逻辑复用 小结 开始之前 Composition API 可以说是Vue3的最大特点,那么为什么要推出Composition Api,解决了什么问题? 通常使用Vue2开…

网工内推 | 保险业网工,有绩效奖金,CISP认证优先,最高16K

01 华贵人寿保险股份有限公司 招聘岗位:系统管理岗(主机管理方向) 职责描述: 1.负责数据中心私有云平台的规划建设以及后期的运行维护; 2.负责公司操作系统的规划、部署与日常维护; 3.负责操作系统运维相关…

rime中州韵小狼毫 help lua Translator 帮助消息翻译器

lua 是 Rime中州韵/小狼毫输入法强大的武器,掌握如何在Rime中州韵/小狼毫中使用lua,你将体验到什么叫 随心所欲。 先看效果 在 rime中州韵 输入效果一览 中的 👇 help效果 一节中, 我们看到了在Rime中州韵/小狼毫输入法中输入 h…

算法第十一天-组合总和Ⅳ

组合总和Ⅳ 题目要求 解题思路 来自[负雪明烛] 题目有个明显的提示:求组合的个数,而不是每个组合。如果是要求出每个组合,那么必须使用回溯法,保存所有路径。但是如果是组合个数,一般都应该想到[动态规划]的解法。 直…

记录 搭载小车 运行激光slam lio-sam fast-lio2

用了将近一个月搭载了一台履带车 其中 主控:NUC i7-8559U 激光雷达为:velodyne16线和hesai64线 IMU为:轮趣N100 mini 对imu使用上位机进行调平矫正 设置输出400HZ 对外参标定 首先使用velodyne16线 安装驱动直接运行,没遇到啥…

人工智能_机器学习092_使用三维瑞士卷数据_利用分层聚类算法进行瑞士卷数据三维聚类---人工智能工作笔记0132

然后我们使用分层聚类算法来对我们导入的瑞士卷数据进行聚类 agg =AgglomerativeClustering(n_clusters = 6,linkage = ward) 可以看到这里我们使用的,聚类距离计算用的是,ward这种,最小化簇内方差的形式,l进行聚类对吧 可以看到这个linkage参数有好几个选择对吧,是之前我们讲过…

面试 Vue 框架八股文十问十答第二期

面试 Vue 框架八股文十问十答第二期 作者:程序员小白条,个人博客 相信看了本文后,对你的面试是有一定帮助的!关注专栏后就能收到持续更新! ⭐点赞⭐收藏⭐不迷路!⭐ 1)常见的事件修饰符及其作…

leetcode06-单调数组的判断

题目链接: https://leetcode.cn/problems/monotonic-array/description/?envTypestudy-plan-v2&envIdprogramming-skills 思路: 判断是否为单调数组只有两种情况: 1.单调递增时 遍历整个数组 若发现有递减的两项 则不为单调数组…

JavaScript中重排与重绘的区别及触发条件

重排(reflow)指的是浏览器计算元素的大小和位置,确定页面中每个元素的几何信息的过程。重排是一项昂贵的操作,会消耗大量的计算资源。 重绘(repaint)指的是在页面中的元素样式发生改变,但不会影…

网络通信理论-入门1

网口框架 100M 2. 物理层解读 2.1 同步的方法:编码 为了让接收方在没有外部时钟参考的情况也能确定每一位的起始、结束和中间位置,在传输信号时不直接采用二进制编码。在 10BASE-T 的传输方式中采用曼彻斯特编码,在 100BASE-T 中则采用 4B/…

一切皆文件有必要单独提出来说

引述 Unix/Linux操作系统血脉,一切皆文件的设计哲学被一直继承了下来。 以前多次很有疑问,为什么操作系统设计上会锚点到文件上呢? 图灵机 如果去刨根问底一切皆文件的设计哲学,就不得不提到图灵机理论。 在图灵机模型中&…

Java JDBC整合(概述,搭建,PreparedStatement和Statement,结果集处理)

一、JDBC的概述: JDBC:是一种执行sql语句的Java APL,可以为多种关系类型数据库提供统一访问,它由一组用Java语言编写的类和接口组成。有了JDBC,Java人员只需要编写一次程序就可以访问不同的数据库。 JDBC APL&#xf…

Xpath定位方法

Xpath定位方法 1.根据路径定位 #绝对路径:以/开头从html开始一级一级往下写 driver.find_element_by_xpath(路径) #选中元素->右击->copy full xpath #相对路径:以//开头 路径[第几个符合条件的元素]2.利用元素属性定位 //标签名[属性名属性值…

LCR 076. 数组中的第 K 个最大元素

LCR 076. 数组中的第 K 个最大元素 题目链接:LCR 076. 数组中的第 K 个最大元素 下面这个题与这个题一样: 题目链接:215. 数组中的第K个最大元素 这个代码只能通过第一个题,如下: class Solution { public:int fin…

Python+PyCharm的安装配置及教程(实用)

python and PyCharm 安装教程可参考:https://blog.csdn.net/wangyuxiang946/article/details/130634049 Pyhon 下载地址:https://www.python.org/downloads/ PyCharm 下载地址:https://www.jetbrains.com/pycharm/download/?sectionwindo…

AP9196 DC-DC升压恒流电源管理芯 3-40V 200W升降压线路图

产品说明 AP9196 是一系列电路简洁的宽调光比升压调光恒流驱动器,适用于 3-40V 输入电压范围的 LED照明领域。AP9196 采用我司专利算法,可以实现高精度的恒流效果,输出电流恒流精度≤3%,电压工作范围为5-40V&#xff0…

步进电机调速原理

/*----------------------------------------------- 内容:本程序用于测试4相步进电机常规驱动 2个按键 调节速度 使用1-2相励磁 数码管显示 1-5速度等级,数字越大,速度越小 --------------------------------------------…