OpenAI最新发布的文生视频模型Sora到底强在哪?

文章目录

    • 1.Sora到底强在哪?
    • 2. 不足
    • 3. 结尾

在这里插入图片描述
2024年2月16日,当大家沉浸在过年的喜庆氛围中,OpenAI发布首款文生成视频大模型 Sora ,其炸裂登场让人感到惊艳。

Sora官网介绍:https://openai.com/sora
在这里插入图片描述

说起文生视频工具,比如Runway、Pika,用户输入文字就能得到一段几秒到十几秒的视频内容,但因为效果一般,并未被广泛使用。

1.Sora到底强在哪?

此次Sora能够爆火出圈,实在是因为它过于优秀。同样是用户输入提示文字,Sora生产的视频不仅质量高,场景还很逼真丝滑、细节丰富。

其一,Sora可生成60s超长视频。相较于Runway MLGen-2、Pika等文生视频大模型,Sora可生成一镜到底的逻辑顺畅视频,主人物及背景人物均非常稳定,文生视频大模型能力突出。

其二,Sora多角度视频一致性。Sora可以在单个生成视频中创建多个镜头,以准确保留角色和视觉风格。OpenAI官网发布的Demo视频中,有多角度镜头,且主人物保持了完美的一致性。

其三,Sora在尝试理解物理世界。根据OpenAI官网披露,Sora不仅可以理解用户的描述要求,同时亦尝试理解描述的事物在物理世界中的存在方式(即物理规律)。根据OpenAI官网Demo视频中,汽车在山路行驶中的颠簸等动作符合物理世界规律,视频逼真程度进一步提升。
Sora可以用简单的方式模拟影响世界状态的行为。例如,随着时间的推移画家可以在画布上留下新的笔触,或者一个人吃汉堡时留下咬痕。

其四,图像生成功能。Sora还能生成图像,通过在一个时间范围为一帧的空间网格中排列高斯噪声块来实现这一点。该模型可以生成可变大小的图像,最高可达2048 × 2048分辨率。

其五,模拟数字世界。Sora还能够模拟人工过程,比如视频游戏。Sora可以在高保真度渲染世界及其动态的同时,用基本策略控制《我的世界》中的玩家。

2. 不足

Sora官方也指出自己的模型存在的不足和局限性

它不能准确地模拟许多基本相互作用的物理过程,比如玻璃破碎。

可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。

还会混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的摄像机轨迹。

3. 结尾

从Runway MLGen-2、Pika到Sora,文生视频大模型频出,视频长度从3~4秒到60秒,模型对物理世界的理解愈加接近现实,已经具备商业化落地价值,创作内容产业革命来临,AIGC新时代已至。

这意味着什么?以后哪怕普通人,只要具有丰富的想象力,能够将脑海里的画面准确地描述出来,那么就能生成相应的画面视频,甚至是独立创作出一部电影。想想都很震撼!!!
在这里插入图片描述

每次技术的革新,总是惊喜与恐惧并存

恐慌无用的话,不如尽力拥抱

”与时俱进“不应该是一句口号,”拥抱变化“也不应该是一句鸡汤

你可以不屠龙,但不能不磨刀。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/708675.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Python笔记-设计模式】备忘录模式

一、说明 备忘录模式是一种行为设计模式,允许在不暴露对象实现细节的情况下保存和恢复对象之前的状态。 (一) 解决问题 主要解决在不破坏封装性的前提下,捕获一个对象的内部状态,并在对象之外保存这个状态,以便在需要时恢复对象…

log4j 基础使用入门教程

一、Log4j介绍 在项目中,不管是开发人员写代码还是测试人员写的测试代码一般都需要做一些日志来记录项目的行为,以便更好的跟踪项目中的一些交互和问题。 Log4j ( Logger For Java ) , Java 日志的记录包。 官方网站 。Log4j 是 Apache 的一个开源项目…

SRC漏洞挖掘思路手法

这段时间挖掘了挺多的SRC漏洞,虽然都是一些水洞,也没有一些高级的漏洞挖掘利用手法,但是闲下来也算是总结一下,说说我对SRC漏洞挖掘的思路技巧。 很多人可能都挖过很多漏洞其中包括一些EDU或者别的野战,但是对于SRC往…

QQ录屏会录到外界声音吗?这篇文章告诉你答案

在现代网络科技快速发展的今天,屏幕录制已成为人们日常办公、学习、娱乐的重要工具。qq作为国内最受欢迎的社交软件之一,其内置的屏幕录制功能受到很多人的青睐。可是使用的过程中,很多人会有疑问:qq录屏会录到外界声音吗&#xf…

单片机烧录方式 -- IAP、ISP和ICP

目录 背景 1 什么是ICP 2 什么是ISP 3 什么是IAP 4 总结 背景 对于51单片机,我们使用STC-ISP上位机软件通过串口进行程序的烧写;对于STM32系列单片机,我们既可以通过串口烧写程序,也能通过JLink或是STLink进行程序的烧写&am…

如何保护服务器的安全

互联网的迅速发展,让很多企业都很重视网络技术的使用,但是网络的传播速度比较快,同时容易造成数据、隐私方面的泄露现在每个企业基本有自己的服务器。有几点需要注意,可以参考: 1.基础密码安全 最基本的安全就是密码安…

车载电子电器架构 —— 基础技术开发概述

车载电子电器架构 —— 基础技术开发概述 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗…

【element-ui】el-select multiple多选,表单校验问题解决方法

在项目开发过程中发现,el-select设置了multiple支持多选属性之后,el-select赋值之后,表单校验不通过 解决思路及解决方法: 1、首先看看v-model 、prop属性、rules校验是否正确,这里注意el-select的rules校验的trigger…

【Go语言】Go语言中的指针

Go语言中的指针 变量的本质是对一块内存空间的命名,我们可以通过引用变量名来使用这块内存空间存储的值,而指针则是用来指向这些变量值所在内存地址的值。 注:变量值所在内存地址的值不等于该内存地址存储的变量值。 Go语言中,…

42.do...while语句

目录 一.什么是do...while语句 二.语法 三.执行流程图 四.举例 五.视频教程 一.什么是do...while语句 do...while语句也是循环语句,和while语句的区别是,while语句是先判断表达式,如果表达式成立才会执行循环体中的内容,否则…

新书速览|Python数据分析快速上手

从零开始,小白轻松入手,一步一步教你学数据分析,让数据分析变得简单易懂 本书内容 《Python数据分析快速上手》通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行数据分析应该掌握的各方面技术。本书内容包括Python基…

区块链游戏解说:什么是 Arcade Champion

作者:lesleyfootprint.network 编译:cicifootprint.network 数据源:Arcade Champion Dashboard 什么是 Arcade Champion Arcade Champion 代表了移动游戏世界的重大革新。它将经典街机游戏的怀旧与创新元素结合在一起,包括 NF…

自学Python笔记总结(2——了解)

网络了解 网络调试助手 NetAssist.exe NetAssist.exe 使用方法请自行寻找 UDP协议 (只能一来一回的的发消息,不可连续发送) UDP 是User Datagram Protocol的简称, 中文名是用户数据报协议。在通信开始之前,不需要建…

计算机网络体系结构

本篇博客是基于谢希仁编写的《计算机网络》和王道考研视频总结出来的知识点,本篇总结的主要知识点是第一章的计算机网络概述。 计算机网络概述 整体介绍 概念 计算机网络:是一个将分散的。具有独立功能的计算机系统,通过通信设备和线路连…

Zookeeper基础入门-1【集群搭建】

Zookeeper基础入门-1【集群搭建】 一、Zookeeper 入门1.1.概述1.2.Zookeeper工作机制1.3.Zookeeper特点1.4.数据结构1.5.应用场景1.5.1.统一命名服务1.5.2.统一配置管理1.5.3.统一集群管理1.5.4.服务器动态上下线1.5.5.软负载均衡 1.6.Zookeeper官网1.6.1.Zookeeper下载1.6.2.历…

day01-HTML-CSS

一、Web 开发 1. 什么是 Web ? Web:全球广域网,也称为万维网(www,World Wide Web),能够通过浏览器访问的 网站。 2. Web 网站的开发模式 3. Web 标准 Web 标准也称为网页标准,由一系列的标准组成&#xff…

REVERSE-COMPETITION-VNCTF-2024

REVERSE-COMPETITION-VNCTF-2024 前言TBXObaby_c2yunobfuseko 前言 ko的随机数算法没看出来,可惜~ 这里给自己打个广告:东南网安研二在读,求实习,求内推,求老板们多看看我QAQ TBXO 通过字符串定位到main函数汇编视…

【Algorithms 4】算法(第4版)学习笔记 13 - 番外篇:二叉查找树的几何应用(下篇)

文章目录 前言参考目录学习笔记4:区间搜索树(interval search trees)4.1:一维区间搜索4.2:区间搜索树定义4.3:区间搜索树 demo 演示4.3.1:插入4.3.2:搜索命中4.3.3:搜索未…

[RCTF2015]EasySQL1 题目分析与详解

一、题目介绍: 1、题目来源: BUUCTF网址 2、题目介绍: 拿到flag。 二、解题思路: 我们发现题目首页有登录和注册账号两个选项,我们首先尝试注册账号,尝试注册username为admin的账号,输入密码…

如何更改虚拟机服务端口

如何更改虚拟机服务端口 背景internet information services开启/安装 IIS打开IIS管理器 修改端口 背景 今天我们来讲一下如何更改我们服务所占用的端口号,假设我们在虚拟机或者本地计算机上部署了一个服务,然后这个服务呢,我们默认安装了&a…