Sora是否能颠覆视频制作行业?一文带你了解

一个月前OpenAI宣布了一款名为Sora的新生成式人工智能系统,该系统可以根据文本提示生成短视频。虽然Sora尚未向公众开放,但迄今为止发布的高质量样本已经引起了兴奋和担忧的反应。

536f7fae581576258d8317f9654aff27.jpeg

OpenAI发布的样本视频(该公司称这些视频是由Sora直接制作,未经修改)显示了提示的输出,例如“两艘海盗船在一杯咖啡内航行时互相战斗的逼真特写视频”和“加利福尼亚州的历史镜头”淘金热期间”。乍一看,由于视频、纹理、场景动态、摄像机运动的高质量以及良好的一致性,通常很难看出它们是由人工智能生成的。OpenAI首席执行官Sam Altman还在X(以前的Twitter)上发布了一些根据用户建议的提示生成的视频,以展示Sora的功能。

一、Sora如何运作?

Sora在所谓的“扩散变压器模型”中结合了文本和图像生成工具的功能。

Transformer是Google于2017年首次推出的一种神经网络。它们因在ChatGPT和Google Gemini等大型语言模型中的使用而闻名。另一方面,扩散模型是许多人工智能图像生成器的基础。他们的工作原理是从随机噪声开始,迭代到适合输入提示的“干净”图像。一系列图像显示了静态中出现的城堡图片。

Sora使用变压器架构来处理帧之间的关系。虽然Transformer最初被设计为在表示文本的标记中查找模式,但Sora相反使用表示小块空间和时间的标记。

Sora并不是第一个文本转视频模型。早期的模型包括Meta的Emu、Runway的Gen-2、Stability AI的Stable Video Diffusion以及最近Google的Lumiere。几周前发布的Lumiere声称可以制作比其前身更好的视频。但至少在某些方面,Sora似乎比卢米埃更强大。

Sora可以生成分辨率高达1920×1080像素和多种宽高比的视频,而Lumiere仅限于512×512像素。Lumiere的视频长度约为5秒,而Sora的视频长达60秒。Lumiere无法制作由多个镜头组成的视频,而Sora可以。据报道,与其他模型一样,Sora也能够执行视频编辑任务,例如从图像或其他视频创建视频、组合不同视频的元素以及及时扩展视频。

这两种模型都会生成大致真实的视频,但可能会产生幻觉。卢米埃尔的视频可能更容易被认为是人工智能生成的。Sora的视频看起来更有活力,元素之间有更多的互动。然而,在许多示例视频中,仔细检查后就会发现不一致之处。

二、Sora的发展前景

目前,视频内容是通过拍摄现实世界或使用特效来制作的,这两种方式都可能成本高昂且耗时。如果Sora以合理的价格上市,人们可能会开始使用它作为原型设计软件,以更低的成本将想法可视化。根据我们对Sora功能的了解,它甚至可以用于为娱乐、广告和教育领域的某些应用程序创建短视频。

OpenAI关于Sora的技术论文的标题是“视频生成模型作为世界模拟器”。该论文认为,像Sora这样的更大版本的视频生成器可能是“物理和数字世界以及生活在其中的物体、动物和人的有效模拟器”。如果这是正确的,未来的版本可能会在物理、化学甚至社会实验方面具有科学应用。例如,人们也许能够测试不同规模的海啸对不同类型的基础设施以及附近人们的身心健康的影响。实现这种水平的模拟非常具有挑战性,一些专家表示像Sora这样的系统根本无法做到这一点。

一个完整的模拟器需要计算宇宙最详细水平的物理和化学反应。然而,在未来几年内,模拟世界的粗略近似并制作人眼逼真的视频可能是可以实现的。

三、Sora存在的问题

人们对Sora这样的工具的主要担忧是其社会和道德影响。在一个已经被虚假信息困扰的世界中,像Sora这样的工具可能会让事情变得更糟。很容易看出,生成您可以描述的任何场景的逼真视频的能力如何可以用来传播令人信服的假新闻或对真实镜头提出质疑。它可能会危及公共卫生措施,被用来影响选举,甚至可能因潜在的虚假证据而给司法系统带来负担。视频生成器还可能通过深度伪造(尤其是色情内容)对目标个人造成直接威胁。这些可能会对受影响个人及其家人的生活产生可怕的影响。

除了这些问题之外,还存在版权和知识产权问题。生成式人工智能工具需要大量数据进行训练,而OpenAI尚未透露Sora的训练数据来自何处。大型语言模型和图像生成器也因此受到批评。在美国,一群著名作家因可能滥用他们的材料而起诉OpenAI。该案认为,大型语言模型和使用它们的公司正在窃取作者的作品来创建新内容。

近年来,技术超越法律已经不是第一次了。例如,社交媒体平台审核内容的义务问题在过去几年引发了激烈的争论——其中大部分围绕《美国法典》第230条展开。虽然这些担忧是真实存在的,但根据过去的经验,我们预计它们不会停止视频生成技术的开发。OpenAI表示,在向公众开放Sora之前,它正在“采取几项重要的安全措施”,包括与“错误信息、仇恨内容和偏见”领域的专家合作,以及“构建帮助检测误导性内容的工具”。

本文来源:www.sora008.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/781684.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python学习笔记-简单案例实现多进程与多线程

Python 的多进程与多线程是并发编程的两种重要方式,用于提高程序的执行效率。它们各自有不同的特点和适用场景。 多进程(Multiprocessing) 概念: 多进程是指操作系统中同时运行多个程序实例,每个实例称为一个进程。…

表单元素使用

表单元素使用 要完成的效果:代码实现: 要完成的效果: 代码实现: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0">…

完整部署一套k8s-v.1.28.0版本的集群

一、系统情况 虚拟机版本&#xff1a;esxi 6.7 系统版本&#xff1a;centos7.9_2009_x86 配置&#xff1a;4核8G&#xff08;官网最低要求2核2G&#xff09; 192.168.0.137 master节点 192.168.0.139 node2节点 192.168.0.138 node1节点&#xff08;节点扩容练习&#xf…

Linux:详解TCP报头类型

文章目录 温习序号的意义序号和确认序号报文的类型 TCP报头类型详解ACK: 确认号是否有效SYN: 请求建立连接; 我们把携带SYN标识的称为同步报文段FIN: 通知对方, 本端要关闭了PSH: 提示接收端应用程序立刻从TCP缓冲区把数据读走RST: 对方要求重新建立连接; 我们把携带RST标识的称…

python--os和os.path模块

>>> import os >>> #curdir #获取当前脚本的绝对路径 >>> os.curdir . >>> import os.path >>> #获取绝对路径 >>> os.path.abspath(os.curdir) C:\\Users\\GUOGUO>>> #chdir #修改当前目录 >&g…

创建一个vue3 + ts + vite 项目

vite 官网&#xff1a; https://cn.vitejs.dev/guide/ 兼容性注意 Vite 需要 Node.js 版本 18&#xff0c;20。然而&#xff0c;有些模板需要依赖更高的 Node 版本才能正常运行&#xff0c;当你的包管理器发出警告时&#xff0c;请注意升级你的 Node 版本。 安装项目 1. 使用n…

Linux:TCP协议的三次握手和四次挥手

文章目录 三次握手四次挥手为什么要进行三次握手&#xff1f;三次握手也不安全 本篇解析的主要是TCP的三次握手和四次挥手的过程 三次握手 如图所示&#xff0c;在TCP要进行链接的时候&#xff0c;其实是要进行三次握手的 第一次握手是指&#xff0c;此时客户端要给服务器发送…

【Qt】QMainWindow

目录 一、概念 二、菜单栏 2.1 创建菜单栏 2.2 在菜单栏中添加菜单 2.3 创建菜单项 2.4 在菜单项之间添加分割线 三、工具栏 3.1 创建工具栏 3.2 设置停靠位置 3.3 设置浮动属性 3.4 设置移动属性 四、状态栏 4.1 状态栏的创建 4.2 显示实时消息 4.3 显示永久消…

Vue性能优化--gZip

一、gZip简单介绍 1.1 什么是gzip gzip是GNUzip的缩写&#xff0c;最早用于UNIX系统的文件压缩。HTTP协议上的gzip编码是一种用来改进web应用程序性能的技术&#xff0c;web服务器和客户端&#xff08;浏览器&#xff09;必须共同支持gzip。目前主流的浏览器&#xff0c;Chro…

【并发】第二篇 ThreadLocal详解

导航 一. ThreadLocal 简介二. ThreadLocal 源码解析1. get2. set3 .remove4. initialValue三. ThreadLocalMap 源码分析1. 构造方法2. getEntry()3. set()4. resize()5. expungeStaleEntries()6. cleanSomeSlots()7. nextIndex()8. remove()9. 总结ThreadLocalMap四. 内存泄漏…

超文本传输协议HTTP

HTTP协议 在网络通信中&#xff0c;我们可以自己进行定制协议&#xff0c;但是也有许多已经十分成熟的应用层协议&#xff0c;比如我们下面说的HTTP协议。 HTTP协议简介 HTTP&#xff08;Hyper Text Transfer Protocol&#xff09;协议又叫做超文本传输协议&#xff0c;是一…

带你学习现代C++并发编程

通过对C并发编程的理解&#xff0c;我总结了相关的文档&#xff0c;有需要的可以关注我公众号&#xff0c;并给我留言&#xff01; 这是目录

Cookie/Session

1.Cookie HTTP 协议自身是属于 "无状态" 协议. "无状态" 的含义指的是: 默认情况下 HTTP 协议的客户端和服务器之间的这次通信, 和下次通信之间没有直接的联系. 但是实际开发中, 我们很多时候是需要知道请求之间的关联关系的. 例如登陆网站成功后, 第二…

创建数据库管理账户以及授权

一、创建数据酷管理账户命令 为了保障数据库系统的安全性&#xff0c;以及让 其他用户协同管理数据库&#xff0c;可以在MariaDB数据库管理系统中为他们创建多个专用的数据库管理账户&#xff0c;然后再分配合理的权限&#xff0c;以满足他们的工作需求. 使用root管理员 登录…

自定义类型(二)结构体位段,联合体,枚举

这周一时兴起&#xff0c;想写两篇文章来拿个卷吧&#xff0c;今天也是又来写一篇博客了&#xff0c;也是该结束自定义类型的学习与巩固了。 常常会回顾努力的自己&#xff0c;所以要给自己的努力留下足迹。 为今天努力的自己打个卡&#xff0c;留个痕迹吧 2024.03.30 小闭…

LInux|命令行参数|环境变量

LInux|命令行参数|环境变量 命令行参数main的参数之argc&#xff0c;argv几个小知识<font color#0099ff size 5 face"黑体">1.子进程默认能看到并访问父进程的数据<font color#4b0082 size 5 face"黑体">2.命令行创建的程序父进程都是bash 环…

微分方程错题本

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

【Qt】:信号与槽(二)

信号与槽 一.带参数的信号和槽二.信号与槽的多对多连接三.信号与槽的断开四.lamda表达式定义槽函数 一.带参数的信号和槽 Qt的信号和槽也⽀持带有参数,同时也可以⽀持重载.此处我们要求,信号函数的参数列表要和对应连接的槽函数参数列表⼀致.&#xff08;一致指的是类型一致&a…

mysql安装遇到的问题

最近mysql安装遇到了许多问题 这个界面是下载器界面&#xff0c;reconfigure是重新配置这个版本&#xff0c;要新安装要点add 进入这个界面选择对应的版本下载