Sora 原理与技术实战笔记一

b 站视频合集
【AI+X组队学习】Sora原理与技术实战:Sora技术路径详解
Sora 技术报告(OpenAI)
huggingsd 文生图视频系列的一个开源项目
最强视频生成模型Sora相关技术解析
https://github.com/lichao-sun/SoraReview

惊艳效果:

  • 长视频
  • 高清
  • 视频融合能力
  • 同一场景的多角度/镜头的生成能力

TeText-to-video: 文生视频
Image-to-video: 图生视频
Video-to-video: 改变源视频风格or场景
Extending video in time: 视频拓展(前后双向)
Create seamless loops: Tiled videos that seem like they never endImage generation: 图片生成 (size最高达到 2048 x 2048)
Generate video in any foformat: From 1920 x 1080 to 1080 x 1920 视频输出比例自定义
Simulate virtual worlds: 链接虚拟世界,游戏视频场景生成Create a video: 长达60s的视频并保持人物、场景一致性

要做世界模拟器。
在这里插入图片描述

DDPM 扩散模型
ViT 把完整的图片 Patch 化,把单个图片的patch 序列化。

为了处理视频,提出了 ViViT,用 Transformers 来处理视频的一个模型.
在这里插入图片描述
包含时空信息的patch。
如何进行样本取样?

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

Sora, 通过 patch,预测下一个patch,构建一个自回归的方式来进行的。而不是之前那种预测关键帧,插帧的方式。
DALLE 2 也是通过文本的方式。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/712088.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】screen

文章目录 一、screen二、功能三、使用3.1 安装3.2 常用参数3.3 状态3.4 使用3.4.1 终端列表3.4.2 新建screen3.4.3 detached3.4.4 回到终端3.4.5 清除终端 一、screen screen为多视窗管理程序。在服务器上搭建一些服务的时候,经常要用到screen命令。例如某些服务开…

云呐智能运维包含哪些内容?运维未来的发展方向是什么?

智能运维(AIOps)是一种使用人工智能应用程序来调节IT操作和维护的实践方式。它结合了大数据和机器学习技术,旨在自动化和改进IT操作和维护任务,如故障检测、因果分析和自动故障修复。以下是智能操作和维护的具体内容、挑战和解决方…

使用Node.js构建一个简单的聊天机器人

当谈到人工智能,我们往往会想到什么?是智能语音助手、自动回复机器人等。在前端开发领域中,我们也可以利用Node.js来构建一个简单而有趣的聊天机器人。本文将带你一步步实现一个基于Node.js的聊天机器人,并了解其工作原理。 首先…

文生图项目总结

文生图 功能点 页面进来获取背景图url和图片宽高(根据比例和手机屏幕处理过的宽高)渲染图片(背景图最后生成图片模糊,换成img展示解决)添加多个文字,编辑文字内容,拖拽改变文字位置&#xff0c…

上云还是下云,最大挑战是什么?| 对话章文嵩、毕玄、王小瑞

近半年来,公有云领域频频发生阿里云、滴滴等平台崩溃事件,与此同时,马斯克的“X 下云省钱”言论引起了广泛关注,一时间,“上云”和“下云”成为热议话题。在最近举办的 AutoMQ 云原生创新论坛上,AutoMQ 联合…

大数据可视化python01

import pandas as pd import matplotlib.pyplot as plt# 设置中文改写字体 plt.rcParams[font.sans-serif] [SimHei]# 读取数据 data pd.read_csv(C:/Users/wzf/Desktop/读取数据进行数据可视化练习/实训作业练习/瓜果类单位面积产量.csv ,encoding utf-8)#输出 print(data)…

springcloud alibaba组件简介

一、Nacos 服务注册中心/统一配置中心 1、介绍 Nacos是一个配置中心,也是一个服务注册与发现中心。 1.1、配置中心的好处: (1)配置数据脱敏 (2)防止出错,方便管理 (3&#xff…

一本通 1403:素数对

在判断素数对的两个数是否都为素数时可以只判断数的一半 #include<bits/stdc.h> using namespace std; bool su(int a,int b){ for(int i2;i<sqrt(a);i){ if(a%i0){ return 0; } } for(int i2;i<sqrt(b);i){ if(…

AI大预言模型——ChatGPT在地学、GIS、气象、农业、生态、环境等应用

原文链接&#xff1a;AI大预言模型——ChatGPT在地学、GIS、气象、农业、生态、环境等应用 一开启大模型 1 开启大模型 1)大模型的发展历程与最新功能 2)大模型的强大功能与应用场景 3)国内外经典大模型&#xff08;ChatGPT、LLaMA、Gemini、DALLE、Midjourney、Stable Di…

Java底层自学大纲_中间件原理篇

中间件原理专题_自学大纲所属类别学习主题建议课时&#xff08;h&#xff09; A Web服务器Tomcat8原理分析001 Tomcat8底层架构模式2.5 A Web服务器Tomcat8原理分析002 Tomcat8底层源码深度分析2.5 A Web服务器Tomcat8原理分析003 站在微服务架构角度优化Tomcat82.5 B 分布…

SpringMVC基础概述

目录 MVC核心组件RequestMapping注解域对象共享数据视图RESTful请求与响应HttpMessageConverter请求响应 拦截器配置异常处理基于配置的异常处理基于注解的异常处理 配置类与注解配置MVC执行流程 Spring MVC是Spring Framework提供的Web组件&#xff0c;全称是Spring Web MVC&a…

ConcurrentHashMap的演进:从Java 8之前到Java 17的实现原理深度剖析

目录 一、引言二、Java 8之前的ConcurrentHashMap1、内部结构与初始化2、Segment类3、并发控制4、扩容与重哈希5、总结 三、Java 8中的ConcurrentHashMap1、数据结构2、并发控制2.1. CAS操作2.2. synchronized同步块 3、哈希计算与定位4、扩容与重哈希5、总结 四、Java 17中的C…

广汽埃安工厂:蔚来汽车的造车工厂有哪些?

具体来说&#xff0c;理想汽车目前在常州仅有一家汽车制造工厂。 一期项目于2017年12月竣工&#xff0c;2019年12月投产&#xff0c;年产能10万辆/年。 同时&#xff0c;正在规划二期工程。 产能将增至20万辆/年。 此外&#xff0c;理想还计划接管现代汽车在北京顺义的第一家工…

抖音小店怎么开店注册?别在全网找教程了,2024年最新开店教程来了

大家好&#xff0c;我是电商糖果 想开一家抖音小店&#xff0c;不会开&#xff0c;也不懂需要准备哪些材料。 在网上扒拉了一堆教程&#xff0c;不知道应该听哪个&#xff1f; 害怕店铺开错了&#xff0c;后续还要关店。 有这些担心的朋友&#xff0c;看到这篇文章的时候&a…

工业现场网络性能评估方案

最近要去一个工厂排查网络和电脑卡顿的问题,为此&#xff0c;我准备了以下的方案&#xff0c;在现场以抓包和网络监控的方式来排查。 1.评估流程 为了评估Linux系统的网络负荷&#xff0c;并使用tcpdump来捕获数据包进行分析&#xff0c;您需要遵循以下几个步骤&#xff1a; …

自动化搭建---环境搭建与配置

1. 确定所需环境 与项目团队和开发人员详细沟通&#xff0c;了解项目的具体环境需求。这可能包括操作系统版本、数据库类型&#xff08;如MySQL、PostgreSQL等&#xff09;、Web服务器&#xff08;如Apache、Nginx等&#xff09;以及其他依赖软件。 2. 安装操作系统 根据项目…

数据仓库与数据挖掘概述

目录 一、数据仓库概述 &#xff08;一&#xff09;从传统数据库到数据仓库 &#xff08;二&#xff09;数据仓库的4个特征 &#xff08;三&#xff09;数据仓库系统 &#xff08;四&#xff09;数据仓库系统体系结构 &#xff08;五&#xff09;数据仓库数据的粒度与组织…

论文阅读_代码生成模型_CodeGeeX

英文名称: CodeGeeX: A Pre-Trained Model for Code Generation with Multilingual Evaluations on HumanEval-X 中文名称: CodeGeeX&#xff1a;一种用于代码生成的预训练模型&#xff0c;并在HumanEval-X上进行多语言评估 链接: https://arxiv.org/abs/2303.17568 代码: http…

无处不在的智慧:嵌入式系统引领智能生活

无处不在的智慧&#xff1a;嵌入式系统引领智能生活 嵌入式系统作为智能生活的重要组成部分&#xff0c;正逐渐渗透到我们的日常生活中&#xff0c;引领着智能生活的发展。以下将从多个方面对嵌入式系统在智能生活中的引领作用进行详细论述。 智能家居中的嵌入式系统应用 嵌…

训练1 : 老头

以前用blender做的特效 总结 头发很费时间, 需要参考和练习眼窝周边结构还有些待准确把握从光与影中揣摩轮廓形状 从少量面掌握大体, 从多数面雕刻细节