Sora是否能颠覆视频制作行业?一文带你了解

一个月前OpenAI宣布了一款名为Sora的新生成式人工智能系统,该系统可以根据文本提示生成短视频。虽然Sora尚未向公众开放,但迄今为止发布的高质量样本已经引起了兴奋和担忧的反应。

536f7fae581576258d8317f9654aff27.jpeg

OpenAI发布的样本视频(该公司称这些视频是由Sora直接制作,未经修改)显示了提示的输出,例如“两艘海盗船在一杯咖啡内航行时互相战斗的逼真特写视频”和“加利福尼亚州的历史镜头”淘金热期间”。乍一看,由于视频、纹理、场景动态、摄像机运动的高质量以及良好的一致性,通常很难看出它们是由人工智能生成的。OpenAI首席执行官Sam Altman还在X(以前的Twitter)上发布了一些根据用户建议的提示生成的视频,以展示Sora的功能。

一、Sora如何运作?

Sora在所谓的“扩散变压器模型”中结合了文本和图像生成工具的功能。

Transformer是Google于2017年首次推出的一种神经网络。它们因在ChatGPT和Google Gemini等大型语言模型中的使用而闻名。另一方面,扩散模型是许多人工智能图像生成器的基础。他们的工作原理是从随机噪声开始,迭代到适合输入提示的“干净”图像。一系列图像显示了静态中出现的城堡图片。

Sora使用变压器架构来处理帧之间的关系。虽然Transformer最初被设计为在表示文本的标记中查找模式,但Sora相反使用表示小块空间和时间的标记。

Sora并不是第一个文本转视频模型。早期的模型包括Meta的Emu、Runway的Gen-2、Stability AI的Stable Video Diffusion以及最近Google的Lumiere。几周前发布的Lumiere声称可以制作比其前身更好的视频。但至少在某些方面,Sora似乎比卢米埃更强大。

Sora可以生成分辨率高达1920×1080像素和多种宽高比的视频,而Lumiere仅限于512×512像素。Lumiere的视频长度约为5秒,而Sora的视频长达60秒。Lumiere无法制作由多个镜头组成的视频,而Sora可以。据报道,与其他模型一样,Sora也能够执行视频编辑任务,例如从图像或其他视频创建视频、组合不同视频的元素以及及时扩展视频。

这两种模型都会生成大致真实的视频,但可能会产生幻觉。卢米埃尔的视频可能更容易被认为是人工智能生成的。Sora的视频看起来更有活力,元素之间有更多的互动。然而,在许多示例视频中,仔细检查后就会发现不一致之处。

二、Sora的发展前景

目前,视频内容是通过拍摄现实世界或使用特效来制作的,这两种方式都可能成本高昂且耗时。如果Sora以合理的价格上市,人们可能会开始使用它作为原型设计软件,以更低的成本将想法可视化。根据我们对Sora功能的了解,它甚至可以用于为娱乐、广告和教育领域的某些应用程序创建短视频。

OpenAI关于Sora的技术论文的标题是“视频生成模型作为世界模拟器”。该论文认为,像Sora这样的更大版本的视频生成器可能是“物理和数字世界以及生活在其中的物体、动物和人的有效模拟器”。如果这是正确的,未来的版本可能会在物理、化学甚至社会实验方面具有科学应用。例如,人们也许能够测试不同规模的海啸对不同类型的基础设施以及附近人们的身心健康的影响。实现这种水平的模拟非常具有挑战性,一些专家表示像Sora这样的系统根本无法做到这一点。

一个完整的模拟器需要计算宇宙最详细水平的物理和化学反应。然而,在未来几年内,模拟世界的粗略近似并制作人眼逼真的视频可能是可以实现的。

三、Sora存在的问题

人们对Sora这样的工具的主要担忧是其社会和道德影响。在一个已经被虚假信息困扰的世界中,像Sora这样的工具可能会让事情变得更糟。很容易看出,生成您可以描述的任何场景的逼真视频的能力如何可以用来传播令人信服的假新闻或对真实镜头提出质疑。它可能会危及公共卫生措施,被用来影响选举,甚至可能因潜在的虚假证据而给司法系统带来负担。视频生成器还可能通过深度伪造(尤其是色情内容)对目标个人造成直接威胁。这些可能会对受影响个人及其家人的生活产生可怕的影响。

除了这些问题之外,还存在版权和知识产权问题。生成式人工智能工具需要大量数据进行训练,而OpenAI尚未透露Sora的训练数据来自何处。大型语言模型和图像生成器也因此受到批评。在美国,一群著名作家因可能滥用他们的材料而起诉OpenAI。该案认为,大型语言模型和使用它们的公司正在窃取作者的作品来创建新内容。

近年来,技术超越法律已经不是第一次了。例如,社交媒体平台审核内容的义务问题在过去几年引发了激烈的争论——其中大部分围绕《美国法典》第230条展开。虽然这些担忧是真实存在的,但根据过去的经验,我们预计它们不会停止视频生成技术的开发。OpenAI表示,在向公众开放Sora之前,它正在“采取几项重要的安全措施”,包括与“错误信息、仇恨内容和偏见”领域的专家合作,以及“构建帮助检测误导性内容的工具”。

本文来源:www.sora008.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/781684.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python学习笔记-简单案例实现多进程与多线程

Python 的多进程与多线程是并发编程的两种重要方式,用于提高程序的执行效率。它们各自有不同的特点和适用场景。 多进程(Multiprocessing) 概念: 多进程是指操作系统中同时运行多个程序实例,每个实例称为一个进程。…

表单元素使用

表单元素使用 要完成的效果:代码实现: 要完成的效果: 代码实现: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0">…

完整部署一套k8s-v.1.28.0版本的集群

一、系统情况 虚拟机版本&#xff1a;esxi 6.7 系统版本&#xff1a;centos7.9_2009_x86 配置&#xff1a;4核8G&#xff08;官网最低要求2核2G&#xff09; 192.168.0.137 master节点 192.168.0.139 node2节点 192.168.0.138 node1节点&#xff08;节点扩容练习&#xf…

Spring Cloud_Spring Cloud Alibaba_00000

版本选择 Spring Boot版本选择 Spring Boot github源码地址&#xff1a;https://github.com/spring-projects/spring-boot/releases/ Spring Boot github地址&#xff1a;https://github.com/spring-projects/spring-boot/wiki/Spring-Boot-3.0-Release-Notes Spring Cloud g…

DataX 源码改造支持Mysql 8.X

文章目录 DataX 源码改造支持Mysql 8.X问题背景克隆源代码并修改重新打包生产环境发布DataX 源码改造支持Mysql 8.X 问题背景 今天在使用DataX同步数据的时候遇到一个问题,报错如下 错误信息为:java.sql.SQLException: No suitable driver found for ["jdbc:mysql://…

Java-常见面试题收集(七)

十四 MySQL 1 MySQL 支持的存储引擎 MySQL 支持多种存储引擎&#xff0c;常见的有2种&#xff0c;你可以通过 show engines 命令来查看 MySQL 支持的所有存储引擎。MySQL 当前默认的存储引擎是 InnoDB。并且&#xff0c;所有的存储引擎中只有 InnoDB 是事务性存储引擎&#xf…

==和equals的区别【大白话Java面试题】

和equals的区别 大白话回答 的作用&#xff1a;   基本类型&#xff1a;比较的就是值是否相同   引用类型&#xff1a;比较的就是地址值是否相同 equals 的作用:   引用类型&#xff1a;默认情况下&#xff0c;比较的是地址值。 注&#xff1a;不过&#xff0c;我们可以…

在axios中设置方法防止http重复请求

可以在封装的 Axios 中设置方法来防止 HTTP 的重复请求。一种常见的方法是通过设置一个标识符&#xff0c;在发送请求前检查该标识符&#xff0c;如果之前已经有相同的请求正在进行&#xff0c;则取消当前请求或者等待上一个请求完成后再发送新请求。这种方式可以有效地避免重复…

CCF考级 1-8级考纲知识点

CCF考级 C 一级考纲知识内容计算机基础知识集成开发环境结构化程序设计程序的基本语句程序的基本概念基本运算基本数据类型 C 二级考纲知识内容计算机存储与网络程序设计语言流程图ASCII 编码数据类型转换多层分支/循环结构数学函数 C 三级考纲知识内容数据编码进制转换位运算算…

On Java8读书笔记

Housekeeping Unsafe programming is one of the major culprits that makes programming expensive 使用构造器确保初始化 初始化数据是一个相当重要但是常常容易忘记的事&#xff0c;但是作为一个程序员&#xff0c;你也不想跨过千山万水的Debug&#xff0c;最后与变量未初始…

P8715 [蓝桥杯 2020 省 AB2] 子串分值

一、题目描述 P8715 [蓝桥杯 2020 省 AB2] 子串分值 二、问题简析 记录字符串 s s s 的 第 i i i 个字符 s i s_i si​&#xff08; 0 ≤ i < s . s i z e 0\leq i<s.size 0≤i<s.size&#xff09;上一次出现的位置 p r e i pre_i prei​、下一次出现的位置 n…

模型部署实战:从训练到上线

目录 1.前言 2.RESTful API设计 3.使用Flask/Django开发后端服务 4.使用TensorFlow Serving部署模型 5.性能监控与服务维护要点 6.总结 1.前言 在机器学习的全周期中&#xff0c;模型部署是至关重要的一环。经过长时间的训练、验证和优化&#xff0c;当模型准备就绪时&am…

【Leetcode】top 100 栈

基础知识补充 1.栈是一种运算受限的线性表&#xff0c;仅允许在一端进行插入和删除操作&#xff1b; 2.可用列表实现&#xff0c;list.append(val) // list.pop() 题目 20 有效的括号 给定一个只包括 (&#xff0c;)&#xff0c;{&#xff0c;}&#xff0c;[&#xff0c;] 的…

Linux:详解TCP报头类型

文章目录 温习序号的意义序号和确认序号报文的类型 TCP报头类型详解ACK: 确认号是否有效SYN: 请求建立连接; 我们把携带SYN标识的称为同步报文段FIN: 通知对方, 本端要关闭了PSH: 提示接收端应用程序立刻从TCP缓冲区把数据读走RST: 对方要求重新建立连接; 我们把携带RST标识的称…

如何在ArcGIS中查看栅格数据的值类型(整数或浮点数)

在 ArcGIS 中查看栅格数据的值类型&#xff08;整数或浮点数&#xff09;&#xff0c;您可以按照以下步骤操作&#xff1a; 1. **点击栅格单元格**&#xff1a; - 使用“信息”工具&#xff08;Identify Tool&#xff0c;通常是一个带放大镜和一个字母 i 的图标&#xff09…

python--os和os.path模块

>>> import os >>> #curdir #获取当前脚本的绝对路径 >>> os.curdir . >>> import os.path >>> #获取绝对路径 >>> os.path.abspath(os.curdir) C:\\Users\\GUOGUO>>> #chdir #修改当前目录 >&g…

JAVA面试大全之数据库篇

目录 1、原理和SQL 1.1、什么是事务?事务基本特性ACID? 1.2、数据库中并发一致性问题? 1.3、事务的隔离等级? 1.4、ACID靠什么保证的呢?

创建一个vue3 + ts + vite 项目

vite 官网&#xff1a; https://cn.vitejs.dev/guide/ 兼容性注意 Vite 需要 Node.js 版本 18&#xff0c;20。然而&#xff0c;有些模板需要依赖更高的 Node 版本才能正常运行&#xff0c;当你的包管理器发出警告时&#xff0c;请注意升级你的 Node 版本。 安装项目 1. 使用n…

Linux:TCP协议的三次握手和四次挥手

文章目录 三次握手四次挥手为什么要进行三次握手&#xff1f;三次握手也不安全 本篇解析的主要是TCP的三次握手和四次挥手的过程 三次握手 如图所示&#xff0c;在TCP要进行链接的时候&#xff0c;其实是要进行三次握手的 第一次握手是指&#xff0c;此时客户端要给服务器发送…