AI界一夜变天

图片

没有丝毫预热和剧透,Open AI深夜直接丢下核弹炸了街,从业者深感要变天。

2月16日凌晨,Open AI发布了首个“文生视频”模型Sora。官方介绍,Sora能根据文字指令创造出包含丰富细节的逼真场景、角色,且能用多角度镜头,生成一镜到底的60秒长视频

目前官网上已经更新了48个样片,视频中人物、背景都具有惊人的一致性。并且借助于对语言的深刻理解,Sora创造出的角色能表达丰富的情感。

更令业内惊叹的是,Sora身上似乎开始出现“世界模型”的雏形通过大量观察训练,它学会了许多关于真实世界的物理规律。

要知道,原先动画影视公司为让动物的数百万根毛发、皮肤纹理、衣物等细节在3D建模中表现得如现实场景般真实,为此专门成立研究部门,且投入了不菲的成本和时间才得以实现。而如今,Sora只需要一行描述、几次提示便能自动完成。

虽然Open AI坦言Sora仍有一些效果上的瑕疵,也因潜在的风险暂未对公众开放。但凭借着极度真实的视觉效果,这一足以“模糊虚实”的王炸级技术,正粗暴地冲击着大众心智。

事实上,文生视频并非Open AI的独门,赛道早已涌入大量玩家。去年下半年开始,谷歌、Meta及部分AI创业公司相继下场试水,国内的字节跳动也于11月推出了文生视频模型Pixel Dance,阿里云的Animate Anyone以及百度文心大模型的类似功能同样在内测。

入局者众多,但各家效果却未达预期当Runway Gen2、Pika、PixVerse等AI视频工具还在突破数秒内的连贯性时,Sora已经将时长拉至1分钟,大幅度拉高生成视频的可用性。影眸科技CTO张启煊评价道,Sora跟Pika、Runway及同类玩家已拉开代差。

颠覆性的效果,伴随的是颠覆性的思路。360董事长周鸿祎指出,现在所有文生图、视频的模型都是在2D平面上对图形元素进行操作,并未适用物理定律。

而Open AI利用了其大语言模型优势,将LLM和Diffusion结合训练,通过学习视频,理解现实世界的动态变化规律,并模拟、创造出新的视觉内容,由此产生的视频真实感十足。

回溯来看,文生视频能蔚然成风,成为全球新一轮AIGC竞赛的焦点,因为大家都嗅到了短视频在全球直播电商、内容创作等新兴行业的巨大机遇。周鸿祎就认为,Sora可能给广告业、电影预告片、短视频行业带来巨大颠覆,成为激发创作力的工具。

AI从业者更一叶知秋地感受到,Sora在展示视频制作能力外,更多暗含的是大模型逐渐掌握对真实世界的理解及模拟能力后,可能会带来更惊叹的突破和成果。

有强劲大模型的底座、基于对人类语言的解析、对人类知识和世界模型的了解,再叠加其他技术,周鸿祎认为这便可以创造各个领域的超级工具。因为这种“先记忆,再预测”,正是人类理解并与世界交互的方式。

他举例称 ,Sora对物理世界的模拟,就会对智能驾驶领域产生巨大影响。原先智驾“重感知”却“轻认知”,他认为人在驾驶时的很多判断,是基于对这个世界的理解,缺乏这一点很难做出真正的无人驾驶。

行业专家普遍认为,应用层面衍化的终局,便是真正通用人工智能(AGI)时代的到来。

Sora的技术文档就写道,“我们的结果表明,视频生成模型是有希望向构建通用物理世界模拟器迈进的路径”。

“一旦人工智能接上摄像头,把所有电影、视频都看一遍,其对世界的理解将远超文字学习。AGI真的就不远了,不是10-20年的问题,可能一两年就能实现。”周鸿祎如是说道。

“我相信Open AI手里或许还藏着一些秘密武器,无论是GPT-5,还是机器学习自动产生内容。”周鸿祎称,“奥特曼是个营销大师,知道怎样掌握节奏”。

这与Sam Altman要筹集7万亿美元,塑全球AI芯片基础设施的野心形成闭环,因为通往通用人工智能的道路上,需要极为庞大的算力。

近期有投资界人士透露,Open AI正讨论新一轮融资,估值高达千亿美元。作为头羊,有着独霸AI行业、重塑全球AI芯片行业的庞大野心的Open AI,势必要借助资本的助推不断滚雪球。

回溯来看,在这场AI公司、资本交织的游戏中,技术迭代一直是跳跃式的,并不会给大家慢慢来的时间。

未来的世界和AI行业究竟会驶向何方?还难以断言,但眼下的2024,必将又是刺激的一年。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/689061.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python print函数

在Python编程中,print()函数是一个非常基础但也非常重要的函数,用于将文本或其他对象输出到控制台或文件中。本文将深入探讨Python中的print()函数,包括基本用法、格式化输出、输出重定向、实际应用场景,并提供丰富的示例代码来帮…

栈的应用(表达式求值)C++(Acwing)

代码&#xff1a; #include <iostream> #include <cstring> #include <algorithm> #include <stack> #include <unordered_map>using namespace std;stack<int> num; stack<char> op;void eval()//求值 {auto b num.top(); num.po…

echarts图表中的基本设置参数

取消显示坐标值 axisLabel: { show: false} 取消坐标轴刻度线 axisTick: { show: false} 取消网格线 splitLine: { show: false } 去除y轴的线 //写在yAxis里面 axisLine:{show:false},axisTick:{show:false},去除y轴轴线&#xff08;背景线&#xff09; splitLine…

java生成pdf

1.pdf预览 2.maven <!--pdf--><dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.9</version></dependency><dependency><groupId>com.itextpdf</groupId>…

51_蓝桥杯_数码管静态显示

一 电路 二 数码管静态显示工作原理 三 代码 代码1 实现第一个数码管显示数字6的功能 #include "reg52.h"unsigned char code SMG_Duanma[18] {0xc0,0xf9.0xa4,0x99,0x92,0x82,0xf8,0x80,0x90,0x88,0x80,0xc0,0x86,0x8e,0xbf,0x7f};void Delay(unsignde int t) {wh…

创建Maven项目

目录 创建新项目配置Maven配置资源地址下载资源 测试代码 创建新项目 创建一个新项目。 创建包&#xff0c;选择Maven&#xff0c;JDK选择1.8 。 点击创建。 创建完成。 配置Maven 点击设置图标&#xff0c;点击Settings. 搜索maven&#xff0c;点击Builde&#xff0c;…

【STM32 CubeMX】GPIO_HAL库源码分析

文章目录 前言一、GPIO_HAL库源码分析1.1 初始化GPIO1.2 HAL_GPIO_Init源码分析GPIO_InitTypeDef初始化结构体HAL_GPIO_Init函数 总结 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 例如&#xff1a;随着人工智能的不断发展&#xff0c;机器学习这门技…

05.QT坐标系

1. 坐标系原点 坐标系原点就是屏幕/窗口的左上角&#xff0c;X向右增长&#xff0c;Y向下增长。 2.设置控件位置 设置控件位置&#xff0c;就相当于是需要指定控件的坐标&#xff0c;对于该控件来说&#xff0c;其坐标原点是其父窗口/父控件的左上角。 设置方法就是通过控件的…

C++ Webserver从零开始:配置环境(九)——下载github的项目进行测试

前言 大家好&#xff0c;我又来更新Webserver的博客了。上一次更新这个专栏时2024.2.5号&#xff0c;离现在已经13天了。非常抱歉&#xff0c;中间隔了那么久。一方面是基础知识学完之后&#xff0c;就要开始自己写代码了。看基础知识和写代码是两回事&#xff0c;理论和实践的…

BUGKU-WEB 变量1

题目描述 题目截图如下&#xff1a; 进入场景看看&#xff1a; flag In the variable !<?php error_reporting(0); include "flag1.php"; highlight_file(__file__); if(isset($_GET[args])){$args $_GET[args];if(!preg_match("/^\w$/",$args…

数据库概述、部署MySQL服务、必备命令 、密码管理、安装图形软件、SELECT语法 、筛选条件

目录 1 案例1&#xff1a;构建MySQL服务器 1.1 问题 1.2 方案 1.3 步骤 2 案例2&#xff1a;密码管理 2.1 问题 2.2 步骤 3 案例3&#xff1a;安装图形软件 3.1 问题 3.2 方案 3.3 步骤 4 案例4&#xff1a;筛选条件 4.1 问题 4.2 方案 4.3 步骤 1 案例1&#x…

AcWing 1050 鸣人的影分身(复杂DP ——整数划分问题)

[题目概述] 在火影忍者的世界里&#xff0c;令敌人捉摸不透是非常关键的。 我们的主角漩涡鸣人所拥有的一个招数——多重影分身之术——就是一个很好的例子。 影分身是由鸣人身体的查克拉能量制造的&#xff0c;使用的查克拉越多&#xff0c;制造出的影分身越强。 针对不同的作…

【Linux】进程的初步认识(二)

进程的初步认识 前言查看进程通过系统调用创建进程关于创建进程的几点补充 前言 之前的一篇文章(文章链接)已经初步对于进程有了一个认识&#xff0c;这篇文章主要是介绍如何去查看进程的相关信息以及创建一个进程的相关知识 查看进程 查看进程的信息可以在/proc系统文件夹中查…

代码随想录刷题笔记-Day19

1. 二叉搜索树的最小绝对差 530. 二叉搜索树的最小绝对差https://leetcode.cn/problems/minimum-absolute-difference-in-bst/ 给你一个二叉搜索树的根节点 root &#xff0c;返回 树中任意两不同节点值之间的最小差值 。 差值是一个正数&#xff0c;其数值等于两值之差的绝…

ZigBee学习——基于AF的数据通信

文章目录 一、简单描述符1.1 简单介绍1.2 简单描述结构体介绍1.3 结构体中的簇1.4 应用场景 二、AF通信原理2.1 通信过程2.2 端点号分类2.3 通信方式2.4 注册简单描述符 三、数据发送API简介3.1 AF层数据发送API3.2 基于AF层封装的通信API3.2.1 点对点通信API3.2.2 广播通信API…

数据库管理-第151期 Oracle Vector DB AI-03(20240218)

数据库管理151期 2024-02-18 数据库管理-第151期 Oracle Vector DB & AI-03&#xff08;20240218&#xff09;1 向量数据库应用场景2 Oracle Vector DB3 Vector数据类型4 Vector运算5 Vector DML插入向量获取向量 总结 数据库管理-第151期 Oracle Vector DB & AI-03&am…

LeetCode 热题 100 Day01

哈希模块 哈希结构&#xff1a; 哈希结构&#xff0c;即hash table&#xff0c;哈希表|散列表结构。 图摘自《代码随想录》 哈希表本质上表示的元素和索引的一种映射关系。 若查找某个数组中第n个元素&#xff0c;有两种方法&#xff1a; 1.从头遍历&#xff0c;复杂度&#xf…

【Spring】三级缓存

目录标题 触发所有未加载的实例a - 开始getBean&#xff08; doGetBean&#xff09; - 获取单例beangetSingleton() - 获取单例beancreateBean&#xff08;doCreateBean&#xff09; - 创建beancreateBeanInstance - 创建并返回beanaddSingletonFactory -放三级缓存populateBea…

序列发生器

一开始想直接FSM&#xff0c;划分出6状态依次输出对应的。但其实只要6比特的移位寄存器&#xff0c;每次输出高位。复位后的默认值时6’b001_011。这样就可以实现循环&#xff0c;这种移位寄存器也叫barrel_shifter。循环移位。也可以使用循环计数器&#xff0c;然后case计数器…

<爬虫Error篇>:乱码问题

前言: 当涉及到网页编码问题时&#xff0c;经常会遇到不同页面使用不同编码方式的情况。这可能导致在解析页面时出现乱码&#xff0c;使我们无法正确获取页面内容 正文: 网页的编码问题: 在处理网页编码问题之前&#xff0c;我们需要了解一些基础知识。网页中的编码方式通常…