OpenAI 的 Sora AI 视频生成器太疯狂了

毫不夸张地说,当我第一次看到 Sora 生成的前几个视频时,我的下巴都惊掉了。

Sora是什么?

Sora 是一种人工智能模型,可以根据简单的文本提示生成视频。它能够生成一分钟的高保真视频。

v2-9ba2322943906fc09a420aa701f90985.jpg

Sora 是一种扩散模型,一种先进的人工智能技术,具有独特的“学习”方式。扩散模型从清晰的数据开始,例如图像或视频。然后他们逐渐添加噪音,直到原始内容被掩盖。

它们的核心在于逆转这个过程——逐步学习去除噪声,直到恢复原始数据。这创建了一个可以生成现实结果的人工智能系统。

为了引导 Sora,它使用 GPT(ChatGPT 背后的技术)将简单的文本提示扩展为为视频生成量身定制的详细描述。这确保即使您简短的想法也能转化为视觉丰富、准确的结果。

这是几个例子

让我们切入正题——这里有一些提示和示例视频,展示了 Sora 的非凡能力。

提示:镜头跟随一辆带有黑色车顶行李架的白色老式SUV,它在陡峭的山坡上一条被松树环绕的陡峭土路上加速行驶,轮胎扬起灰尘,阳光照射在SUV上行驶土路,给整个场景投射出温暖的光芒。土路缓缓地蜿蜒延伸至远方,看不到其他汽车或车辆。道路两旁都是红杉树,零星散落着一片片绿意。从后面看,这辆车轻松地沿着曲线行驶,看起来就像是在崎岖的地形上行驶。土路周围是陡峭的丘陵和山脉,上面是清澈的蓝天和缕缕云彩。

v2-323843ca42f2d154a04aa8b3439164ba.gif

提示:一个 60 多岁、头发花白、留着胡须的男人的极端特写,他坐在巴黎的一家咖啡馆里,沉思着思考宇宙的历史,他的目光聚焦在银幕外的人们身上。走路时他几乎一动不动,穿着羊毛大衣西装外套,搭配纽扣衬衫,戴着棕色贝雷帽,戴着眼镜,一副非常教授的样子,最后他露出一个微妙的闭嘴微笑,仿佛他找到了生命之谜的答案,灯光非常电影化,金色的光芒,背景是巴黎的街道和城市,景深,电影化的35mm胶片。

v2-87f9255542cef60d0af9310cd25a0019.gif

这些例子已经比竞争对手的能力要好得多。

请记住,这些都不是精心挑选的。 OpenAI 的首席执行官 Sam Altman 正在积极接受并分享 X 上的即时请求。

Sora 可以为 DALL-E 图像制作动画

除了根据文本描述生成视频之外,Sora 还能够以图像作为输入生成视频。

提示:一只戴着贝雷帽、穿着黑色高领毛衣的柴犬。

v2-15e5784a11999d376596d2b90e7c56e3.gif

有了这个功能,我们可以预期 Sora 将来会集成到 ChatGPT 中。

Sora可以生成图像

我注意到没有很多人在谈论这个功能。 Sora 还能够生成图像

它的工作原理是在时间范围为一帧的空间网格中排列高斯噪声块。该模型可以生成各种尺寸的图像,分辨率高达 2048 x 2048。

这里有些例子:

提示:雪山村庄,拥有舒适的小屋和北极光显示屏,高细节和逼真的数码单反相机,50mm f/1.2

v2-4c3b711d77cc2f88926b3846c509a97a.jpg

示例图像看起来甚至比 Dall-E 3 生成的图像还要好。

更多 Sora 功能

当进行大规模训练时,视频模型可以生成有趣的新兴功能,如下所示:

  1. 3D 一致性: Sora 可以生成具有动态摄像机运动的视频。
  2. 远程连贯性和物体持久性: Sora 可以在单个样本中生成同一角色的多个镜头,并在整个视频中保持其外观。
  3. 与世界互动: Sora 有时可以用简单的方式模拟影响世界状态的动作。
  4. 模拟数字世界: Sora 还能够模拟人工过程;电子游戏就是一个例子。

您可以使用 Sora 进行的另一个有趣的实验是从视频生成 3D 模型。 X 用户metamike通过使用Poly.cam工具将圣托里尼岛视频转换为 3D 场景来演示这一点。

此外,与许多人工智能模型一样,Sora 反映了其大量人类生成的训练数据的偏见和局限性。

哦,说到训练模型,人工智能行业目前的一个争论是,人工智能公司是否应该对那些工作用于训练的人给予认可和补偿。

技术正在飞速发展,而法规却滞后。

谁有麻烦了?

如果有人应该害怕人工智能,那就是电影制片厂的高管和股东。当任何能够访问互联网的人只需在人工智能中输入提示即可创建并分享整部电影时,电影和电视行业的看门人几乎肯定会完全过时。

虽然他们目前的目标是利用人工智能取代人类创造力,但这可能会给他们带来适得其反的效果。俗话说,种的是风,收获的是旋风。

你也应该担心吗?

不惧怕变化、抓住机遇的聪明人永远不会被取代。

最后的想法

随着 Google 的 Gemini 1.5 和 OpenAI 的 Sora 的发布,这是人工智能世界中最疯狂的一周。

如果继续以这种惊人的速度取得进展,我们可能很快就能获得仅受我们想象力限制的逼真视频模拟器。这些应用程序可能在电影、游戏、内容创作等许多行业中具有开创性和颠覆性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/692934.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿赵UE学习笔记——15、灯光的移动性概念和构建光照信息

阿赵UE学习笔记目录   大家好,我是阿赵。   继续学习虚幻引擎,这次来学习一下UE里面灯光的移动性概念和构建光照信息。 1、灯光移动性 打开一个带有灯光的场景 在大纲面板里面找到其中一个灯光: 会发现灯光的细节面板里面,…

智慧环卫建设方案

三、软件工程的总体构架 3.1框架构建基准 3.2框架设计 四、业务应用层主要功能模块 4.1数据字典管理模块 数据字典主要包含有(GIS)地理信息管理系统、信息安全管理系统、平台接口管理系统等三个方面的管理应用; 1).(GIS&#…

「Python系列」Python字典

文章目录 一、Python字典创建字典访问字典中的元素修改字典删除字典中的元素遍历字典字典推导式 二、Python字典内置函数&方法内置函数字典方法 三、Python简介四、相关链接 一、Python字典 在Python中,字典(dict)是一个无序的键值对集合…

springboot/ssmHome F家居系统Java家居商城购物管理系统

springboot/ssmHome F家居系统Java家居商城购物管理系统 开发语言:Java 框架:springboot(可改ssm) vue JDK版本:JDK1.8(或11) 服务器:tomcat 数据库:mysql 5.7&…

package.json文件详解

packages.json文件里面配置的属性的含义 name和version 以上两个是最重要的两个属性,否则模块无法被安装,一起形成了它的唯一标识符 模版中内容变化,版本也要随之一起变化 description 描述,方便别人理解模块作用 main 程序…

3、windows环境下vscode开发c/c++环境配置(二)

前言:上一篇文章写了windows环境下,配置vscode的c/c开发环境,这一篇讲vscode开发c/c的配置文件,包括c_cpp_propertues.json,task.json及launch.json。 一、总体流程 通过c/c插件我们就可以来编写c/c程序了&#xff0c…

【ArcGIS微课1000例】0104:二位面状数据转三维多面体(建筑物按高度拉伸)

文章目录 一、加载数据二、添加高度字段三、三维拉伸显示四、生成三维体数据五、注意事项一、加载数据 打开ArcScene,加载配套实验数据(0104.rar中的二维建筑物矢量数据,订阅专栏,获取专栏所有文章阅读权限及配套数据),如下图所示: 二、添加高度字段 本实验将二维数据…

3、电源管理入门之CPU热插拔详解

目录 简介 1. 省电技术概览 (1)、cpu hotplug和idle的区别? 2. 热插拔代码介绍 (1)、为什么以cpu1为例? 3. ATF中处理 简介 之前介绍了电源的开机和关机重启,本小节开始介绍省电的技术,其中最暴力的省电方法就是直接拔核hotplug处理,就像需要…

什么是 Wake-on-LAN?如何使用 Splashtop 远程喊醒电脑

在当今数字互联的世界里,远程访问电脑已不仅仅是一种便利,而是许多人的需要。无论是远程工作、IT 支持,还是管理整个网络中的计算机群,我们都必须掌握正确的工具和技术。 其中一项在远程访问中发挥关键作用的技术是 Wake-on-LAN …

带你了解SMTP,POP3,IMAP协议

电子邮件(email)是一种电子通信方式,可以通过网络传输文本、图像、音频和视频等信息。在发送和接收电子邮件时,需要使用一种称为“邮件协议”的标准化协议。常用的电子邮件协议有SMTP、POP3和IMAP。 SMTP(Simple Mail…

【LeetCode周赛】第 384 场周赛

目录 3033. 修改矩阵 简单3034. 匹配模式数组的子数组数目 I 中等3035. 回文字符串的最大数量 中等3036. 匹配模式数组的子数组数目 II 困难 3033. 修改矩阵 简单 3033. 修改矩阵 分析: 获取每一列的最大元素,将矩阵中的 -1 替换成每一列的最大元素。 …

java开源xml工具类介绍

在Java中处理XML的常用开源工具有很多,以下是一些流行的库以及简单的示例代码: DOM4J DOM4J 是一个非常流行的Java库,用于处理XML,DOM4J 易于使用,并且提供了很好的性能。 Maven 依赖 …

游戏物理引擎+特效系统

原文链接:游戏开发入门(六)游戏物理引擎_游戏开发物理引擎-CSDN博客 游戏开发入门(七)特效系统_csdn 游戏效果开发-CSDN博客 1.游戏应用物理的目的就是为了真实 2.物理引擎: 可以认为属于游戏引擎的一个…

挑战杯 基于LSTM的天气预测 - 时间序列预测

0 前言 🔥 优质竞赛项目系列,今天要分享的是 机器学习大数据分析项目 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/po…

Stable Diffusion——基础模型、VAE、LORA、Embedding各个模型的介绍与使用方法

前言 Stable Diffusion(稳定扩散)是一种生成模型,基于扩散过程来生成高质量的图像。它通过一个渐进过程,从一个简单的噪声开始,逐步转变成目标图像,生成高保真度的图像。这个模型的基础版本是基于扩散过程…

论文精读--word2vec

word2vec从大量文本语料中以无监督方式学习语义知识,是用来生成词向量的工具 把文本分散嵌入到另一个离散空间,称作分布式表示,又称为词嵌入(word embedding)或词向量 Abstract We propose two novel model architec…

白银交易新手指南:怎样选择可靠的现货交易平台?

在投资市场上,白银作为一种贵金属,具有较高的投资价值和风险防范功能。对于白银交易新手来说,选择一个可靠的现货交易平台是至关重要的。那么,如何挑选一个适合自己的现货交易平台呢? 1. 平台资质 一个正规的现货交易…

Spring最新核心高频面试题(持续更新)

1 什么是Spring框架 Spring框架是一个开源的Java应用程序开发框架,它提供了很多工具和功能,可以帮助开发者更快地构建企业级应用程序。通过使用Spring框架,开发者可以更加轻松地开发Java应用程序,并且可以更加灵活地组织和管理应…

【软考高项】【英语知识】-- 单词积累

目录 一、常见计算机技术词汇 二、项目管理词汇 2.1 十大知识域 2.2 五大过程组 2.3 49个子过程 2.4 工具和技术汇总 2.5 输入和输出汇总 一、常见计算机技术词汇 序号中文英文1云计算Cloud computing2云存储Cloud storage3云服务Cloud service4软件即服务SaaS5平台即服…

[leetcode M] 105. 从前序与中序遍历序列构造二叉树

给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一棵树的中序遍历,请构造二叉树并返回其根节点。 示例 1: 输入: preorder [3,9,20,15,7], inorder [9,3,15,20,7] 输出: [3,9,20,null,null,15,7]…