【论文阅读】Vlogger: Make Your Dream A Vlog

Vlogger:把你的梦想变成Vlog

paper:https://arxiv.org/abs/2401.09414

code:https://github.com/zhuangshaobin/vlogger

看起来挺有意思的,有空读一下

本文提出Vlogger,一种用于生成用户描述的分钟级视频博客(即vlog)的通用人工智能系统。与几秒钟的短视频不同,vlog通常包含复杂的故事情节和多样化的场景,这对大多数现有的视频生成方法来说是一个挑战。为突破这一瓶颈,该Vlogger巧妙地利用大型语言模型(LLM)作为导演,并将vlog的长视频生成任务分解为四个关键阶段,调用各种基础模型来发挥vlog专业人员的关键作用,包括(1)脚本,(2)演员,(3)ShowMaker和(4)Voicer。通过这种模仿人类的设计,我们的Vlogger可以通过自上而下的规划和自下而上的拍摄的可解释的合作来生成vlog。提出了一种新的视频扩散模型ShowMaker,在视频博主中充当摄像师,生成每个拍摄场景的视频片段。通过融合脚本和演员注意力作为文本和视觉提示,可以有效增强片段的时空连贯性。为ShowMaker设计了一种简洁的混合训练范式,提高了其生成T2V和预测的能力。广泛的实验表明,所提出方法在零样本T2V生成和预测任务上取得了最先进的性能。更重要的是,Vlogger可以从开放世界的描述中生成超过5分钟的vlog,而不会损失脚本和演员的视频连贯性。

 图1所示。Vlogger概述。基于用户故事,所提出的Vlogger利用大型语言模型(LLM)作为指导,将一分钟长的vlog生成任务分解为四个关键阶段,有剧本,演员,制作人和配音。此外,ShowMaker是一种新的视频扩散模型,用于生成视频片段。每个拍摄场景,与剧本和演员一致。

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/654644.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python实现时间序列分析自回归模型(AutoReg算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 时间序列分析中的自回归模型(AutoRegressive Model,简称AR模型)是一…

Intel Processor Trace(三)

文章目录 前言一、Packet Relationships and Ordering1.1 Packet Blocks 二、Packet Definitions2.1 Taken/Not-taken (TNT) Packet2.2 Target IP (TIP) Packet2.2.1 IP Compression2.2.2 Indirect Transfer Compression for Returns (RET) 2.3 Deferred TIPs2.4 Packet Genera…

拼接url - 华为OD统一考试

OD统一考试 分值: 100分 题解: Java / Python / C 题目描述 给定一个 url 前缀和 url 后缀, 通过 “,” 分割, 需要将其连接为一个完整的 url 。 如果前缀结尾和后缀开头都没有 /,需要自动补上 / 连接符; 如果前缀结…

单调栈最后一天

目录 84.柱状图中最大的矩形 看到题目时的第一想法 看到代码随想录的想法 实现时出现的困难 84.柱状图中最大的矩形 力扣题目链接(opens new window) 给定 n 个非负整数,用来表示柱状图中各个柱子的高度。每个柱子彼此相邻,且宽度为 1 。 求 在该…

XML详细介绍

文章目录 一、XML二、XML基本语法三、XML常见问题四、XML和HTML有什么区别和优缺点五、热门文章 一、XML XML(可扩展标记语言)是一种标记语言,用于描述数据的结构和含义。它被设计用来存储和传输数据,并可以用于创建自定义的标记…

03 Verilog HDL 语法

Verilog HDL(Hardware Description Language)是在 C 语言的基础上发展起来的一种硬件描述语言(用它可以表示逻辑电路图、逻辑表达式、数字逻辑系统所完成的逻辑功能等)具有灵活性高、易学易用等特点。Verilog HDL 可以在较短的时间…

【DeepLearning-10】yolo.py文件关键代码parse_model(d, ch)函数

这段代码功能是根据提供的配置字典(d)和输入通道列表(ch)来解析并构建一个YOLOv5模型。函数的核心工作是遍历模型的每一层,并根据配置创建相应的神经网络层。 我们可以在函数中为新增模块配置构造参数设置。 函数中 f…

响应式Web开发项目教程(HTML5+CSS3+Bootstrap)第2版 例5-3 getBoundingClientRect()

代码 <!doctype html> <html> <head> <meta charset"utf-8"> <title>getBoundingClientRect()</title> </head> <script>function getRect(){var obj document.getElementById(example); //获取元素对象var objR…

【数据结构1-3】集合

有时候&#xff0c;我们并不关心数据之间的前后关系&#xff0c;也不关心数据的层次关系。一些确定元素只是单纯的聚集在一起&#xff0c;这样的元素聚集体被称为集合。 当希望知道某个数据是否存在一个集合中&#xff0c;或者两个元素是否在同一个集合中时&#xff0c;就需要使…

IP关联是什么?有什么后果?如何防止电商账号因IP关联被封?

在跨境电商的世界里&#xff0c;IP关联给多账号运营的商家带来了挑战。比如&#xff0c;亚马逊IP关联规则的执行对于那些经营多个店铺的卖家来说可能是一个不小的障碍。IP关联的影响不只是限于亚马逊&#xff0c;其他平台如Instagram、Facebook也有类似的机制&#xff0c;在之前…

web架构师编辑器内容-添加自动保存的功能

对于频繁改动的应用&#xff0c;自动保存的功能是一个非常有用的功能&#xff0c;可以避免用户在没有保存的情况下丢失自己保存过的数据。 对于自动保存&#xff0c;一般有两种实现&#xff0c;参考语雀和石墨&#xff1a; 语雀采用的是定时保存的方式&#xff0c;大约在3分半…

PHP语法

#本来是在学命令执行&#xff0c;所以学了学&#xff0c;后来发现&#xff0c;PHP语法和命令执行的关系好像没有那么大&#xff0c;不如直接学php的一些命令执行函数了。# #但是还是更一下&#xff0c;毕竟还是很多地方都要求掌握php作为脚本语言&#xff0c;所以就学了前面的…

HR:年底了如何分钱,比亏钱更可怕的是“亏”员工

年底了&#xff0c;很多企业家朋友在聊一个话题&#xff1a;如何分钱&#xff0c;激励员工创造更大的价值&#xff1f;分钱很重要&#xff0c;但分钱也特别难。 钱分对了&#xff0c;管理的一大半问题就解决了。钱分得不对&#xff0c;一大堆新的问题就出现了。最坏的结果&…

514.自由之路

一个字符串 ring ,表示刻在外环上的编码;给定另一个字符串 key ,表示需要拼写的关键词。您需要算出能够拼写关键词中所有字符的最少步数。 最初,ring 的第一个字符与 12:00 方向对齐。您需要顺时针或逆时针旋转 ring 以使 key 的一个字符在 12:00 方向对齐,然后按下中心按…

docker真的好难用啊,为什么说它移植性好啊?

对于首次接触 Docker 新人来说&#xff0c;Docker 确实存在一定的门槛&#xff0c;主要可能需要适应的几个点如下&#xff1a; 1、 概念理解&#xff1a; Docker 自身引入了很多新概念&#xff0c;比如镜像&#xff08;Image&#xff09;、容器&#xff08;Container&#xff…

HTML新手教程

HTML入门 教程&#xff1a;【狂神说Java】HTML5完整教学通俗易懂_哔哩哔哩_bilibili 一.初识HTML HyperTextMarkupLanguage&#xff08;超文本标记语言&#xff09; 超文本包括&#xff1a;文字、图片、音频、视频、动画。 HTML5的优势 世界知名浏览器厂商对HTML5的支持市场的…

无人值守变电所运维在海南市某住宅区的应用

1 前言 随着国家电网改革政策的逐步推进和落实&#xff0c;AcrelCloud-1000变电所运维云平台运用互联网和大数据技术&#xff0c;为电力运维公司提供变电所运维云平台。该平台作为连接运维单位和用电企业的纽带&#xff0c;监视用户配电系统的运行状态和电量数据&#xff0c;为…

Vue3使用setup-extend简化组件名写法

如果我们在Vue3中要使用setup的语法糖&#xff0c;就需要使用两个script标签&#xff0c;一个用于设置组件的name属性&#xff0c;一个用于编写setup中的代码。如下&#xff1a; 但是我们有觉得光是因为一个name属性就多写一个script标签有点麻烦了。 因此我们可以使用插件来进…

【Python笔记-设计模式】抽象工厂模式

一、说明 (一) 解决问题 抽象工厂是一种创建型设计模式&#xff0c;主要解决接口选择的问题。能够创建一系列相关的对象&#xff0c;而无需指定其具体类。 (二) 使用场景 系统中有多于一个的产品族&#xff0c;且这些产品族类的产品需实现同样的接口。 例如&#xff1a;有…

AI对话软件哪个好?首选这3款堪称神器的AI工具!

在过去的一年里&#xff0c;AI对话软件无疑深度嵌入到了我们工作或生活的方方面面&#xff0c;成为了我们的得力助手。它们可以帮我们解决问题&#xff0c;提供信息&#xff0c;甚至陪伴我们度过孤独的时刻。 但是&#xff0c;面对市场上数量众多的AI对话软件&#xff0c;你是…