斯坦福大学提出电影剧本可视化工具ScriptViz:能够根据剧本中的文本和对话自动检索相关的电影画面,帮助剧作家更好地构思和调整剧情

title:斯坦福大学提出电影剧本可视化工具ScriptViz:能够根据剧本中的文本和对话自动检索相关的电影画面,帮助剧作家更好地构思和调整剧情

斯坦福大学的研究者们开发了一个电影剧本可视化工具ScriptViz工具,ScriptViz的工作原理可以简单地理解为一个智能助手,它帮助剧作家将文字变成生动的画面。

比如,如果剧作家写了一个在沙漠中的对话场景,ScriptViz会找到一些电影中在沙漠拍摄的镜头,并将这些镜头展示给剧作家。这样,剧作家就可以看到他们想要的场景是怎样的,并根据这些画面来调整和丰富他们的剧本。这种方法让剧作家在创作时不仅依赖想象,还能看到实际的视觉效果,从而更好地表达他们的故事。

下面来看一个例子:

一位编剧写了主角“戴夫”,他脾气暴躁,被困在沙漠中。她脑子里有几句话,如上图所示。她想在创作之初就为一天中的时间和其他角色的性别选择一个合适的设置。通过将这些设置为变体属性,她看到了三行不同的可视化效果,并更喜欢第三行。她看到的夜景更好地反映了角色们疲惫一整天的糟糕处境。背景中的枯树加强了这种紧张感,也通过在底部添加细节(粗体红色文字)改变了她的剧本。这些添加通过增强戴夫的个性创造了一个更好的主角。

|Stanford|ACM UIST 2024|⭐️⭐️

用户界面

ScriptViz 界面由四个组件组成。用户输入AMPAS标准的脚本(A),添加SQL格式的属性控制(B)组件,然后单击提交按钮(C)。 ScriptViz 提供来自不同电影场景的可视化输出 (D),其中每个场景都包含一个既定的镜头概述以及脚本中每一行对话的图像。

相关链接

论文地址:http://arxiv.org/abs/2410.03224v1

项目主页:https://virtualfilmstudio.github.io/projects/scriptviz

论文阅读

ScriptViz:基于大型电影数据库的辅助剧本创作的可视化工具

摘要

编剧通常依靠心理可视化来创作生动的故事,他们利用想象力去观察、感受和体验他们正在写的场景。除了心理可视化之外,他们还经常参考电影中现有的图像或场景,并分析视觉元素以创造特定的情绪或氛围。

本文提出了ScriptViz,为编剧过程提供基于大型电影数据库的外部可视化。它根据剧本的文本和对话从大型电影数据库中动态检索参考视觉效果。该工具提供了两种对视觉元素的控制,使编剧能够

  1. 准确地看到他们想要的固定视觉元素

  2. 看到不确定元素的变化。

15位编剧的用户评估表明,ScriptViz 能够为编剧提供一致但多样的视觉可能性,与他们的剧本紧密结合并帮助他们创作。

方法

ScriptViz 建立在 MovieNet 之上,这是一个包含 1、100 部电影的数据库,这些电影在不同级别上进行了注释,具有各种属性,例如电影级属标签、场景级位置标签、镜头级电影风格标签和帧级角色边界框注释。一个关键步骤是对数据库进行预处理并提高每个属性的可识别性。使用时,ScriptViz根据用户的输入检索场景。它基于对视觉属性的两种类型的控制,使作者能够通过固定的视觉元素准确地看到他们想要的内容,并看到不确定元素的变化。然后它检索每个脚本对话序列的图像。

数据库预处理过程中提高各属性可识别性的方法。左图显示,我们计算设置标签和视觉帧之间的CLIP视觉文本相似度,以获得每帧设置标签的可识别性分数,并检测正面以获得每帧中每个字符的可识别性分数。右图显示我们的预处理方法可以成功检索建立镜头和角色的清晰帧。

unsetunset实验unsetunset

编剧在卧室里写了一场“遗嘱讨论”场景,哈里森先生是一位 80 多岁的老人,睿智,举止温暖善良,而詹姆斯则是一位年轻人,哈里森先生的儿子或孙子,体贴而细心。在使用 ScriptViz 之前,编剧脑子里已经有了一些基本的对话,如图 6 顶部所示。通过指定固定位置属性“卧室”和角色属性“2 个男性角色,其中 Character1Age>70 且 Character2Age=Variable” ,ScriptViz 返回结果如图 6 所示,其中第一行 James 的年龄为 30 岁,第二行为 10 岁,第三行为 50 岁。在所有这些可视化中,编剧选择了第三种,因为它更符合詹姆斯深思熟虑、细心的性格。根据第三个老人与年轻人交谈的形象、他们的面部表情和邀请的气氛,编剧放慢了对话的节奏,用较长的句子和诸如“我的孩子”和“充足的时间”之类的词。这种缓慢的节奏更能体现出哈里森先生温暖善良的性格编剧用较长的句子和诸如“我的孩子”和“充足的时间”之类的词语减慢了对话的节奏。这种缓慢的节奏更能体现出哈里森先生温暖善良的性格编剧用较长的句子和诸如“我的孩子”和“充足的时间”之类的词语减慢了对话的节奏。这种缓慢的节奏更能体现出哈里森先生温暖善良的性格

编剧编写了爱丽丝和鲍勃夫妇之间的争论场景。最初,她将场景设定在夜间的一家“餐厅”。她想写鲍勃,他的特点是自信且有点自以为是,正如他与爱丽丝的互动所表明的那样。然而,她对这场冲突的气氛仍然不满意。然后她意识到,由于爱丽丝和鲍勃已经互相认识,因此在更亲密或更随意的环境(例如家里)中引发冲突可能更合适。她把它改成了夜间的“餐厅”。于是,她将第一句的对话从“点菜”改为“做饭”比喻鲍勃入侵爱丽丝的厨房。在第三句话中,爱丽丝直接通过强调“厨房”来表达她的不高兴情绪。

编剧首先在约翰和斯黛拉的“客厅”中创造一段对话,以营造约翰在工作中面临的紧张局势。将地点更改为移动的“汽车”后,约翰变得更加忙碌,他的注意力分散在道路和谈话上,这给他的处境增添了更多的紧张感。因此,约翰的讲话断断续续地较短。在汽车场景中,约翰和斯特拉呈线性排列,约翰专注于驾驶,斯特拉作为乘客。这会产生一种分离感。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/56421.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于java SpringBoot和Vue校园食堂网站管理系统设计

摘要 本文旨在探讨一种基于Java Spring Boot和Vue框架的校园食堂网站管理系统的设计。首先,介绍了系统开发的背景及意义,即为了提高校园食堂的管理效率和改善学生的就餐体验。接着,详细阐述了系统的技术选型,包括后端采用Spring …

vue+ElementUI—实现基础后台管理布局(sideBar+header+appMain)(附源码)

后台管理的模板很多,vue本身就提供了完整的vue-template-admin,vue-admin-beautiful等后台管理系统化框架,但是这些框架正是因为成体系而显得繁重。假如你想搭建一个静态的后台管理模板页面和几个单独的菜单页面,直接就上框架是否…

C#源码安装ZedGraph曲线显示组件

在软件开发里,数据的显示,已经是软件开发的大头。 如果让数据更加漂亮地、智能地显示,就是软件的核心价值了。 因为不管数据千万条,关键在于用户看到图。因为一个图表,就可以表示整个数据的趋势, 或者整个数据的走向,数据频度和密码。所以图表显示是软件的核心功能,比如…

【计网】从零开始理解UDP协议 --- 理解端口号和UDP结构

我依旧敢和生活顶撞, 敢在逆境里撒野, 直面生活的污水, 永远乐意为新一轮的月亮和日落欢呼。 --- 央视文案 --- 从零开始理解UDP协议 1 再谈端口号2 理解UDP 报头结构3 UDP 的特点4 UDP 的缓冲区5 UDP 使用注意事项 1 再谈端口号 之前我…

Ubuntu 24.04 在 BPI-F3 上通过 SD 卡安装并从 NVME 运行

github 代码: https://github.com/rcman/BPI-F3 Ubuntu 24.04 现在正在我的 BPI-F3 上运行。很快会为 YouTube 制作一个视频。 这应该适用于任何版本的 Linux,仅在 Ubuntu 24.04 上测试过 入门 下载 Bianbu映像并使用您最喜欢的工具将其映像到微型 SD 卡…

【win10】VMware Workstation 16安装win10专业版及安装VMware Tools操作说明

参考链接 VMware虚拟机安装win10系统教程(巨细)_vmware安装win10-CSDN博客https://blog.csdn.net/gdidea/article/details/129523700 win10专业版安装说明 下载win10安装包 百度网盘 链接: https://pan.baidu.com/s/1kf4ORdXYgcqwAz2j86LSZw?pwdk4…

MySQL-数据库的基础操作 o(´^`)o

文本目录: ❄️一、数据库操作: ☑ 1、查看所有的数据库: ☑ 2、创建数据库: ☑ 3、使用数据库: ☑ 4、删除数据库: ❄️二、常用的数据类型: ➷ 1、数值类型: ➷ 2、字符串类型&a…

【2D/3D-Lidar-SLAM】 Cartographer详细解读

【2D/3D-Lidar-SLAM】 Cartographer详细解读 1. 摘要2. Cartographer系统数据处理流程2.1. 数据获取(Input Sensor Data)2.2 姿态外推器(PoseExtrapolator)2.3 局部建图(Local SLAM) 3. 关键模块实现 3.1 局…

MyBatis XML映射文件

XML映射文件 XML映射文件的名称与Mapper接口名称一致,并且将XML映射文件和Mapper接口放置在相同包下(同包同名)XML映射文件的namespace属性为Mapper接口全限定名一致XML映射文件中SQL语句的id与Mapper接口中的方法名一致,并保持返…

某知名国企面试题

引言 金九银十,求职热潮再度来袭。最近,有位同学去一家知名国企应聘,回来后带回了一套面试题。这套面试题非常典型,其中包含了许多供应链金融方面的典型问题。这些问题很有分享的价值,大家也可以先自己独立思考一下&a…

Chromium cookies数据存储位置介绍c++

一、cookies数据库存储位置: C:\Users\Administrator\AppData\Local\Chromium\User Data\Default\Network\Cookies 二 、数据库操作类: net\extras\sqlite\sqlite_persistent_cookie_store.cc net\extras\sqlite\sqlite_persistent_cookie_store.h …

003 Springboot操作RabbitMQ

Springboot整合RabbitMQ 文章目录 Springboot整合RabbitMQ1.pom依赖2.yml配置3.配置队列、交换机方式一:直接通过配置类配置bean方式二:消息监听通过注解配置 4.编写消息监听发送测试5.其他类型交换机配置1.FanoutExchange2.TopicExchange3.HeadersExcha…

4D-fy: Text-to-4D Generation Using Hybrid Score Distillation Sampling技术路线

这篇文章分为四部分,首先从2021年的CLIP说起。 这篇论文的主要工作是提出了一种名为 CLIP(Contrastive Language-Image Pre-training) 的模型,它通过自然语言监督学习视觉模型,以实现视觉任务的零样本(zer…

20 Shell Script输入与输出

标出输入、标准输出、错误输出 一、程序的基本三个IO流 一)文件描述符 ​ 任何程序在Linux系统中都有3个基本的文件描述符 ​ 比如: ​ cd/proc/$$/fd ​ 进入当前shell程序对于内核在文件系统的映射目录中: [rootlocalhost ~]# cd /proc/$$/fd [rootlocalhos…

Web集群服务-代理和负载均衡

1. 概述 1. 用户----->代理--->Web节点,后面只有一个节点,一般使用的是nginx代理功能即可 2. 后面如果是集群需要使用nginx负载均衡功能 2. 代理分类 代理分类方向应用正向代理用户(服务器)-->代理--->外部(某网站)服务器通过代理实现共享上网/访问公网反向代理用…

Linux:进程控制(三)——进程程序替换

目录 一、概念 二、使用 1.单进程程序替换 2.多进程程序替换 3.exec接口 4.execle 一、概念 背景 当前进程在运行的时候,所执行的代码来自于自己的源文件。使用fork创建子进程后,子进程执行的程序中代码内容和父进程是相同的,如果子进…

Python基础语法条件

注释 注释的作用 通过用自己熟悉的语言,在程序中对某些代码进行标注说明,这就是注释的作用,能够大大增强程序的可读性。 注释的分类及语法 注释分为两类:单行注释 和 多行注释。 单行注释 只能注释一行内容,语法如下…

跟着小土堆学习pytorch(一)——Dataset

文章目录 一、前言二、dataset三、代码展示 一、前言 pytorch也是鸽了很久了,确定了下,还是用小土堆的教程。 kaggle获取数据集 二、dataset dateset:数据集——提供一种方式去获取数据及其标签 如何获取数据及其标签以及总共多少个数据…

PostgreSQL学习笔记六:模式SCHEMA

模式(Schema) PostgreSQL中的模式(Schema)是一个命名的数据库对象集合,包括表、视图、索引、数据类型、函数、存储过程和操作符等。模式的主要作用是组织和命名空间数据库对象,使得同一个数据库中可以包含…

基于gewechat制作第一个微信聊天机器人

Gewe 个微框架 GeWe(个微框架)是一个创新性的软件开发框架,为个人微信号以及企业信息安全提供了强大的功能和保障。GeWe的设计旨在简化开发过程,使开发者能够高效、灵活地构建和定制通信协议,以满足不同应用场景的需求…