Talk|CityU 助理教授马佳葳: CVPR 2024, 基于多模态理解的混合数据专家模型

本期为TechBeat人工智能社区第604期线上Talk。

北京时间6月27日(周四)20:00香港城市大学助理教授—马佳葳的Talk已经准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “基于多模态理解的混合数据专家模型”,他向大家介绍了混合数据专家模型MoDE,在理解数据的基础上,通过分治法来指导多个小模型的训练,提升下游任务表现并降低训练成本。该工作已入选CVPR 2024 Oral & ICLR 2024 Spotlight。

Talk·信息

 主题:基于多模态理解的混合数据专家模型

嘉宾:香港城市大学助理教授 马佳葳

时间:北京时间 6月27日(周四)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=883

Talk·介绍

本次Talk主要介绍混合数据专家模型MoDE:在理解数据的基础上,通过分治法来指导多个小模型的训练,提升下游任务表现并降低训练成本。同时,MoDE强调数据专家的概念,每一个专家模型的训练都完全独立(异步),并在语义层次结构的启发下提出层次聚类,用数据分布来解释模型的能力,实现动态集成,即从系统宽度的角度重新审视模型的尺度。最后,从效率及表现上讨论并展示数据的合理分割为模型训练带来的的优势和以及在不同任务类型下的应用潜能。

Talk大纲

1. CLIP训练简介;

2. 数据角度下大模型训练的挑战;

3. 数据专家;

4. 混合数据专家模型(MoDE);

5. MoDE的实验论证和灵活性介绍;

6. 未来工作展望

Talk·预习资料

项目名称:

MoDE: CLIP Data Experts via Clustering

项目链接:

https://github.com/facebookresearch/MetaCLIP/tree/main/mode

图片

论文链接:  

https://arxiv.org/abs/2404.16030

图片

论文链接:  

https://arxiv.org/abs/2309.16671

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

马佳葳

香港城市大学 · 助理教授

马佳葳博士毕业于美国哥伦比亚大学,并将于2024年秋季加入香港城市大学计算机科学系担任助理教授。他的主要研究方向为多模态表征学习、终身学习以及去中心化的学习机制。他曾入选CVPR 2024 Doctoral Consortium, 并获得NAACL 2021 Best Demo Paper Award,以及哥伦比亚大学Tesla Scholars & Honors Students 荣誉称号。

个人主页: 

https://www.techbeat.net/grzytrkj?id=39843


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/862344.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【合作ACM出版,稳定EI、Scopus稳定检索】第五届城市工程与管理科学国际会议(ICUEMS 2024,8月2-4)

第五届城市工程与管理科学国际会议(ICUEMS 2024)将于2024年8月2-4日在天津举行。 会议的目的是为从事城市工程、管理科学相关领域的专家、学者、工程师和技术研究人员提供一个平台,分享科研成果和前沿技术,了解学术发展趋势&…

航空电子制造业企业数字化转型:智能工厂建设

引言 航空电子制造业是航空工业的重要组成部分,涵盖了飞机的电子系统、导航设备、通信系统、自动驾驶仪等关键组件。自20世纪中期以来,航空电子技术经历了快速发展,从最初的机械和模拟设备逐步过渡到数字化、网络化和智能化系统。现代航空电子…

中国高分辨率土壤质地数据(1KM)

土壤中各粒级占土壤重量的百分比组合,叫做土壤质地。土壤质地是土壤的最基本物理性质之一,对土壤的各种性状,如土壤的通透性、保蓄性、耕性以及养分含量等都有很大的影响是评价土壤肥力和作物适宜性的重要依据。 中国土壤质地空间分布数据是根…

搭建ragflow的步骤

前提条件 CPU > 4 核 RAM > 16 GB Disk > 50 GB Docker > 24.0.0 & Docker Compose > v2.26.1 如果你并没有在本机安装 Docker(Windows、Mac,或者 Linux), 可以参考文档 Install Docker Engine 自行安装。 启动服务器 …

C盘太满怎么办

C盘红了怎么办,最常见的问题是微信装在了C盘,需要通过设置来更换缓存文件位置。 此外,如果是工作电脑,钉钉、企业微信等都有可能产生和微信同样的问题,解决方式也相同,通过设置更换文件位置。 此外&…

Linux创建目录——mkdir命令,du命令,touch用法,创建tree拓扑图

1. mkdir 命令 格式 mkdir - 参数 路径 / 目录名 参数 -p :快速创建多级目录(递归目录) -v :显示创建目录的详细过程 例: [rootserver ~] # mkdir t1 [rootserver ~] # mkdir t2 t3 t4 [rootserver ~] # mk…

什么是GPIO口,GPIO口最简单的input/output

目录 一,什么是GPIO口 二,GPIO内部结构 三,GPIO口工作模式 一,什么是GPIO口 1.GPIO口是通用输入输出端口(General-purpose input/output)的英文缩写,是所有的微控制器必不可少的外设之一&…

每日一题系列-把字符串转换成整数

🌈个人主页:羽晨同学 💫个人格言:“成为自己未来的主人~” 题目 题目分析 对于这道题目而言,我们需要做到的是将字符串转换成整数。 这里我们需要注意几个点 首先我们需要保证下标在这个范围之内,所以我们会在每…

【Python】已解决:(SqlServer报错)SQL错误(208):对象名‘string_split’无效

文章目录 一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项 已解决:(SqlServer报错)SQL错误(208):对象名‘string_split’无效 一、分析问题背景 在使用Python连接SqlSe…

第二证券:股票盘口是什么?股票盘口基础知识?

股票的盘口是指在生意过程中实时盘面数据窗口。 盘口信息有:托付份额、生意生意五档挂单数据、股票开盘价、股票收盘价、股票涨跌幅、股票最高价、股票最低价、股票价、股票的量比、股票的表里盘数据、股票的总成交量、股票的换手率、股票的总股本、股票的流通股本…

python笔记----少儿编程课程

第1课: 认识新朋友-python 知识点: 1、在英文状态下编写Python语句。 2、内置函数print()将结果输出到标准的控制台上,它的基本语法格式如下: print("即将输出的内容") #输出的内容要用引号引起来,可…

主播美颜工具开发全攻略:美颜SDK从基础到进阶的技术指南

今天,笔者将为你详细介绍美颜SDK的基础知识以及如何进行进阶开发。 一、美颜SDK基础知识 什么是美颜SDK? 美颜SDK是一种软件开发工具包,包含了一系列用于图像处理的算法和功能,主要用于实时视频处理和图像优化。开发者可以将美…

CentOS安装Docker教程(包含踩坑的经验)

目录 一.基础安装 ▐ 安装Docker 二.启动Docker服务 三.配置Docker镜像加速 一.基础安装 在安装Docker之前可能需要先做以下准备 首先如果系统中已经存在旧的Docker,则先卸载: yum remove docker \docker-client \docker-client-latest \docker-…

FastGPT 手动部署错误:MongooseServerSelectionError: getaddrinfo EAI_AGAIN mongo

在运行 FastGPT 时,mongodb 报如下错误: MongooseServerSelectionError: getaddrinfo EAI_AGAIN mongo 这是因为 mongo 没有解析出来,在 hosts 文件中添加如下信息: 127.0.0.1 mongo 重新运行 FastGPT 即可。 参考链接&#xff…

昇思25天学习打卡营第4天|网络构建

文章目录 网络构建 网络构建 在打卡第一天就简单演示了网络构建,一个神经网络模型表示为一个Cell,由不同的子Cell构成。使用这样的嵌套结构可以简单地使用面向对象编程的思维,对神经网络结构进行构建和管理。 继承nn.Cell类来定义神经网络&…

【MTK平台】连接蓝牙耳机播放音乐>插入有线耳机>再拔掉有线耳机,声音会从设备中播放一秒,再切到蓝牙耳机

一般这类情况优先考虑Audio的问题 修改如下这个BTA2DP_MUTE_CHECK_DELAY_MS 参数值既可,比如增加delay 把BTA2DP_MUTE_CHECK_DELAY_MS * 4改成 BTA2DP_MUTE_CHECK_DELAY_MS *8 frameworks/base/services/core/java/com/android/server/audio/AudioDeviceBroker.j…

Harris角点检测原理及其在python-opencv的调用

文章目录 原理测试 原理 Harris 角点检测的基本思路如下:考虑一个局部的区域,将其作为一个窗口四处移动,若窗口灰度发生了较大的变化,那么,就认为窗口内存在角点,否则窗口内就不存在角点。 对于图像 I ( …

力扣随机一题 位运算/滑动窗口/数组

博客主页:誓则盟约系列专栏:IT竞赛 专栏关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ 3191.使二进制数组全部等于1的最少操作次数I【中等】 题目: 给…

bable 【实用教程】

简介 bable 用于将 ES6 的语法编译为 ES5 只关心语法,不关心 API 是否正确。不处理模块化(webpack 会处理) 搭建开发环境 安装相关的包 npm i babel/cli babel/core babel/preset-env新建文件 .babelrc,内容为 { "presets…

盛水问题解决

力扣上承水问题有11和42题 一、承最多水的容器 解决思路: 要得到存储最大水量,得到max(长度 * 高度),使用双指针解决这类问题 先判断左指针还是右指针谁大,找最大值,保留最大值,让最小值向中间移动&#…