OpenAI 的 Sora AI 视频生成器太疯狂了

毫不夸张地说,当我第一次看到 Sora 生成的前几个视频时,我的下巴都惊掉了。

Sora是什么?

Sora 是一种人工智能模型,可以根据简单的文本提示生成视频。它能够生成一分钟的高保真视频。

v2-9ba2322943906fc09a420aa701f90985.jpg

Sora 是一种扩散模型,一种先进的人工智能技术,具有独特的“学习”方式。扩散模型从清晰的数据开始,例如图像或视频。然后他们逐渐添加噪音,直到原始内容被掩盖。

它们的核心在于逆转这个过程——逐步学习去除噪声,直到恢复原始数据。这创建了一个可以生成现实结果的人工智能系统。

为了引导 Sora,它使用 GPT(ChatGPT 背后的技术)将简单的文本提示扩展为为视频生成量身定制的详细描述。这确保即使您简短的想法也能转化为视觉丰富、准确的结果。

这是几个例子

让我们切入正题——这里有一些提示和示例视频,展示了 Sora 的非凡能力。

提示:镜头跟随一辆带有黑色车顶行李架的白色老式SUV,它在陡峭的山坡上一条被松树环绕的陡峭土路上加速行驶,轮胎扬起灰尘,阳光照射在SUV上行驶土路,给整个场景投射出温暖的光芒。土路缓缓地蜿蜒延伸至远方,看不到其他汽车或车辆。道路两旁都是红杉树,零星散落着一片片绿意。从后面看,这辆车轻松地沿着曲线行驶,看起来就像是在崎岖的地形上行驶。土路周围是陡峭的丘陵和山脉,上面是清澈的蓝天和缕缕云彩。

v2-323843ca42f2d154a04aa8b3439164ba.gif

提示:一个 60 多岁、头发花白、留着胡须的男人的极端特写,他坐在巴黎的一家咖啡馆里,沉思着思考宇宙的历史,他的目光聚焦在银幕外的人们身上。走路时他几乎一动不动,穿着羊毛大衣西装外套,搭配纽扣衬衫,戴着棕色贝雷帽,戴着眼镜,一副非常教授的样子,最后他露出一个微妙的闭嘴微笑,仿佛他找到了生命之谜的答案,灯光非常电影化,金色的光芒,背景是巴黎的街道和城市,景深,电影化的35mm胶片。

v2-87f9255542cef60d0af9310cd25a0019.gif

这些例子已经比竞争对手的能力要好得多。

请记住,这些都不是精心挑选的。 OpenAI 的首席执行官 Sam Altman 正在积极接受并分享 X 上的即时请求。

Sora 可以为 DALL-E 图像制作动画

除了根据文本描述生成视频之外,Sora 还能够以图像作为输入生成视频。

提示:一只戴着贝雷帽、穿着黑色高领毛衣的柴犬。

v2-15e5784a11999d376596d2b90e7c56e3.gif

有了这个功能,我们可以预期 Sora 将来会集成到 ChatGPT 中。

Sora可以生成图像

我注意到没有很多人在谈论这个功能。 Sora 还能够生成图像

它的工作原理是在时间范围为一帧的空间网格中排列高斯噪声块。该模型可以生成各种尺寸的图像,分辨率高达 2048 x 2048。

这里有些例子:

提示:雪山村庄,拥有舒适的小屋和北极光显示屏,高细节和逼真的数码单反相机,50mm f/1.2

v2-4c3b711d77cc2f88926b3846c509a97a.jpg

示例图像看起来甚至比 Dall-E 3 生成的图像还要好。

更多 Sora 功能

当进行大规模训练时,视频模型可以生成有趣的新兴功能,如下所示:

  1. 3D 一致性: Sora 可以生成具有动态摄像机运动的视频。
  2. 远程连贯性和物体持久性: Sora 可以在单个样本中生成同一角色的多个镜头,并在整个视频中保持其外观。
  3. 与世界互动: Sora 有时可以用简单的方式模拟影响世界状态的动作。
  4. 模拟数字世界: Sora 还能够模拟人工过程;电子游戏就是一个例子。

您可以使用 Sora 进行的另一个有趣的实验是从视频生成 3D 模型。 X 用户metamike通过使用Poly.cam工具将圣托里尼岛视频转换为 3D 场景来演示这一点。

此外,与许多人工智能模型一样,Sora 反映了其大量人类生成的训练数据的偏见和局限性。

哦,说到训练模型,人工智能行业目前的一个争论是,人工智能公司是否应该对那些工作用于训练的人给予认可和补偿。

技术正在飞速发展,而法规却滞后。

谁有麻烦了?

如果有人应该害怕人工智能,那就是电影制片厂的高管和股东。当任何能够访问互联网的人只需在人工智能中输入提示即可创建并分享整部电影时,电影和电视行业的看门人几乎肯定会完全过时。

虽然他们目前的目标是利用人工智能取代人类创造力,但这可能会给他们带来适得其反的效果。俗话说,种的是风,收获的是旋风。

你也应该担心吗?

不惧怕变化、抓住机遇的聪明人永远不会被取代。

最后的想法

随着 Google 的 Gemini 1.5 和 OpenAI 的 Sora 的发布,这是人工智能世界中最疯狂的一周。

如果继续以这种惊人的速度取得进展,我们可能很快就能获得仅受我们想象力限制的逼真视频模拟器。这些应用程序可能在电影、游戏、内容创作等许多行业中具有开创性和颠覆性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/692934.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿赵UE学习笔记——15、灯光的移动性概念和构建光照信息

阿赵UE学习笔记目录   大家好,我是阿赵。   继续学习虚幻引擎,这次来学习一下UE里面灯光的移动性概念和构建光照信息。 1、灯光移动性 打开一个带有灯光的场景 在大纲面板里面找到其中一个灯光: 会发现灯光的细节面板里面,…

智慧环卫建设方案

三、软件工程的总体构架 3.1框架构建基准 3.2框架设计 四、业务应用层主要功能模块 4.1数据字典管理模块 数据字典主要包含有(GIS)地理信息管理系统、信息安全管理系统、平台接口管理系统等三个方面的管理应用; 1).(GIS&#…

3、windows环境下vscode开发c/c++环境配置(二)

前言:上一篇文章写了windows环境下,配置vscode的c/c开发环境,这一篇讲vscode开发c/c的配置文件,包括c_cpp_propertues.json,task.json及launch.json。 一、总体流程 通过c/c插件我们就可以来编写c/c程序了&#xff0c…

【ArcGIS微课1000例】0104:二位面状数据转三维多面体(建筑物按高度拉伸)

文章目录 一、加载数据二、添加高度字段三、三维拉伸显示四、生成三维体数据五、注意事项一、加载数据 打开ArcScene,加载配套实验数据(0104.rar中的二维建筑物矢量数据,订阅专栏,获取专栏所有文章阅读权限及配套数据),如下图所示: 二、添加高度字段 本实验将二维数据…

3、电源管理入门之CPU热插拔详解

目录 简介 1. 省电技术概览 (1)、cpu hotplug和idle的区别? 2. 热插拔代码介绍 (1)、为什么以cpu1为例? 3. ATF中处理 简介 之前介绍了电源的开机和关机重启,本小节开始介绍省电的技术,其中最暴力的省电方法就是直接拔核hotplug处理,就像需要…

什么是 Wake-on-LAN?如何使用 Splashtop 远程喊醒电脑

在当今数字互联的世界里,远程访问电脑已不仅仅是一种便利,而是许多人的需要。无论是远程工作、IT 支持,还是管理整个网络中的计算机群,我们都必须掌握正确的工具和技术。 其中一项在远程访问中发挥关键作用的技术是 Wake-on-LAN …

挑战杯 基于LSTM的天气预测 - 时间序列预测

0 前言 🔥 优质竞赛项目系列,今天要分享的是 机器学习大数据分析项目 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/po…

Stable Diffusion——基础模型、VAE、LORA、Embedding各个模型的介绍与使用方法

前言 Stable Diffusion(稳定扩散)是一种生成模型,基于扩散过程来生成高质量的图像。它通过一个渐进过程,从一个简单的噪声开始,逐步转变成目标图像,生成高保真度的图像。这个模型的基础版本是基于扩散过程…

论文精读--word2vec

word2vec从大量文本语料中以无监督方式学习语义知识,是用来生成词向量的工具 把文本分散嵌入到另一个离散空间,称作分布式表示,又称为词嵌入(word embedding)或词向量 Abstract We propose two novel model architec…

白银交易新手指南:怎样选择可靠的现货交易平台?

在投资市场上,白银作为一种贵金属,具有较高的投资价值和风险防范功能。对于白银交易新手来说,选择一个可靠的现货交易平台是至关重要的。那么,如何挑选一个适合自己的现货交易平台呢? 1. 平台资质 一个正规的现货交易…

Spring最新核心高频面试题(持续更新)

1 什么是Spring框架 Spring框架是一个开源的Java应用程序开发框架,它提供了很多工具和功能,可以帮助开发者更快地构建企业级应用程序。通过使用Spring框架,开发者可以更加轻松地开发Java应用程序,并且可以更加灵活地组织和管理应…

【Azure 架构师学习笔记】- Azure Databricks (8) --UC架构简介

本文属于【Azure 架构师学习笔记】系列。 本文属于【Azure Databricks】系列。 接上文 【Azure 架构师学习笔记】- Azure Databricks (7) --Unity Catalog(UC) 基本概念和组件 前言 UC 简单来说,就是管理两样东西:用户和元存储。 用户管理 所有Databri…

C#,笛卡尔树(Cartesian Tree)的构造、遍历算法与源代码

Ren Descartes 一、笛卡尔(Ren Descartes) 勒内笛卡尔(Ren Descartes,1596年3月31日-1650年2月11日),1596年3月31日生于法国安德尔-卢瓦尔省的图赖讷(现笛卡尔,因笛卡尔得名&#…

Day 30 标准IO

文章目录 1.什么是标准IO1.1 概念1.2 特点1.3 操作 2.缓存区3.函数接口3.1 打开文件fopen3.2 关闭文件 fclose3.3 读写文件操作3.3.1 每次读写一个字符:fgetc()、fputc()每次读一个字符fgetc()每次写一个字符fputc()(1)针对文件(2)针对终端feof和ferror 3.3.2 每次一…

击败.helper勒索病毒:恢复被加密的数据文件的方法

导言: 近年来,勒索病毒成为网络安全领域的一大威胁,其中.helper勒索病毒更是备受关注。该类型的勒索软件以其高效的加密算法,能够将用户的文件加密,迫使用户支付赎金才能解密数据。本文将介绍.helper勒索病毒的特点、恢复被加密数…

集成使用 GitHub Copilot 提升 IDEA 开发效率

集成使用 GitHub Copilot 提升 IDEA 开发效率 在现代软件开发中,集成开发环境(IDE)如IntelliJ IDEA已经成为开发人员不可或缺的工具。它们提供了代码编辑、调试、版本控制等一系列功能,极大地提高了开发效率。而GitHub Copilot作…

【Docker】Linux主机部署Docker

Docker部署 1.二进制文件部署 到如下地址,下载二进制包。 Docker官网:https://docs.docker.com/engine/install/binaries/ 网易镜像源:https://mirrors.163.com/docker-ce/linux/static/stable/x86_64/ 下载好的二进制包上传到主机&#xf…

Java之获取Nginx代理之后的客户端IP

Java之获取Nginx代理之后的客户端IP Nginx代理接口之后,后台获取的IP地址都是127.0.0.1,解决办法是需要配置Nginx搭配后台获取的方法,获得设备的真实地址。我们想要获取的就是nginx代理日志中的这个IP nginx配置 首先在nginx代理的对应lo…

【笔记】APN 配置参数 bitmask 数据转换(Android KaiOS)

一、参数说明 &#xff08;一&#xff09;APN配置结构对比 平台AndroidKaiOS文件类型xmljson结构每个<apn>标签是一条APN&#xff0c;包含完成的信息层级数组结构&#xff0c;使用JSON格式的数据。最外层是mcc&#xff0c;其次mnc&#xff0c;最后APN用数组形式配置&am…

【漏洞复现-通达OA】通达OA video_file.php 任意文件下载漏洞

一、漏洞简介 通达OA video_file.php文件存在任意文件下载漏洞&#xff0c;攻击者通过漏洞可以读取服务器敏感文件。 二、影响版本 ● 通达OA2011 三、资产测绘 ● hunterapp.name"通达 OA" ● 特征 四、漏洞复现 GET /general/mytable/intel_view/video_file.…