AI界一夜变天

图片

没有丝毫预热和剧透,Open AI深夜直接丢下核弹炸了街,从业者深感要变天。

2月16日凌晨,Open AI发布了首个“文生视频”模型Sora。官方介绍,Sora能根据文字指令创造出包含丰富细节的逼真场景、角色,且能用多角度镜头,生成一镜到底的60秒长视频

目前官网上已经更新了48个样片,视频中人物、背景都具有惊人的一致性。并且借助于对语言的深刻理解,Sora创造出的角色能表达丰富的情感。

更令业内惊叹的是,Sora身上似乎开始出现“世界模型”的雏形通过大量观察训练,它学会了许多关于真实世界的物理规律。

要知道,原先动画影视公司为让动物的数百万根毛发、皮肤纹理、衣物等细节在3D建模中表现得如现实场景般真实,为此专门成立研究部门,且投入了不菲的成本和时间才得以实现。而如今,Sora只需要一行描述、几次提示便能自动完成。

虽然Open AI坦言Sora仍有一些效果上的瑕疵,也因潜在的风险暂未对公众开放。但凭借着极度真实的视觉效果,这一足以“模糊虚实”的王炸级技术,正粗暴地冲击着大众心智。

事实上,文生视频并非Open AI的独门,赛道早已涌入大量玩家。去年下半年开始,谷歌、Meta及部分AI创业公司相继下场试水,国内的字节跳动也于11月推出了文生视频模型Pixel Dance,阿里云的Animate Anyone以及百度文心大模型的类似功能同样在内测。

入局者众多,但各家效果却未达预期当Runway Gen2、Pika、PixVerse等AI视频工具还在突破数秒内的连贯性时,Sora已经将时长拉至1分钟,大幅度拉高生成视频的可用性。影眸科技CTO张启煊评价道,Sora跟Pika、Runway及同类玩家已拉开代差。

颠覆性的效果,伴随的是颠覆性的思路。360董事长周鸿祎指出,现在所有文生图、视频的模型都是在2D平面上对图形元素进行操作,并未适用物理定律。

而Open AI利用了其大语言模型优势,将LLM和Diffusion结合训练,通过学习视频,理解现实世界的动态变化规律,并模拟、创造出新的视觉内容,由此产生的视频真实感十足。

回溯来看,文生视频能蔚然成风,成为全球新一轮AIGC竞赛的焦点,因为大家都嗅到了短视频在全球直播电商、内容创作等新兴行业的巨大机遇。周鸿祎就认为,Sora可能给广告业、电影预告片、短视频行业带来巨大颠覆,成为激发创作力的工具。

AI从业者更一叶知秋地感受到,Sora在展示视频制作能力外,更多暗含的是大模型逐渐掌握对真实世界的理解及模拟能力后,可能会带来更惊叹的突破和成果。

有强劲大模型的底座、基于对人类语言的解析、对人类知识和世界模型的了解,再叠加其他技术,周鸿祎认为这便可以创造各个领域的超级工具。因为这种“先记忆,再预测”,正是人类理解并与世界交互的方式。

他举例称 ,Sora对物理世界的模拟,就会对智能驾驶领域产生巨大影响。原先智驾“重感知”却“轻认知”,他认为人在驾驶时的很多判断,是基于对这个世界的理解,缺乏这一点很难做出真正的无人驾驶。

行业专家普遍认为,应用层面衍化的终局,便是真正通用人工智能(AGI)时代的到来。

Sora的技术文档就写道,“我们的结果表明,视频生成模型是有希望向构建通用物理世界模拟器迈进的路径”。

“一旦人工智能接上摄像头,把所有电影、视频都看一遍,其对世界的理解将远超文字学习。AGI真的就不远了,不是10-20年的问题,可能一两年就能实现。”周鸿祎如是说道。

“我相信Open AI手里或许还藏着一些秘密武器,无论是GPT-5,还是机器学习自动产生内容。”周鸿祎称,“奥特曼是个营销大师,知道怎样掌握节奏”。

这与Sam Altman要筹集7万亿美元,塑全球AI芯片基础设施的野心形成闭环,因为通往通用人工智能的道路上,需要极为庞大的算力。

近期有投资界人士透露,Open AI正讨论新一轮融资,估值高达千亿美元。作为头羊,有着独霸AI行业、重塑全球AI芯片行业的庞大野心的Open AI,势必要借助资本的助推不断滚雪球。

回溯来看,在这场AI公司、资本交织的游戏中,技术迭代一直是跳跃式的,并不会给大家慢慢来的时间。

未来的世界和AI行业究竟会驶向何方?还难以断言,但眼下的2024,必将又是刺激的一年。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/689061.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

爬虫工作量由小到大的思维转变---<第四十七章 Scrapy 随机请求头(补)>

前言: 之前漏了一篇关于随机请求头的文章,现在补上; 日后,大家伙遇到请求头问题,直接拿就是了!! 正文: 在Scrapy中,使用随机请求头是一种常见的反爬虫策略,可以帮助你的爬虫模拟不同用户的请求,以降低被目标网站识别和封锁的风险。要在Sc…

Python print函数

在Python编程中,print()函数是一个非常基础但也非常重要的函数,用于将文本或其他对象输出到控制台或文件中。本文将深入探讨Python中的print()函数,包括基本用法、格式化输出、输出重定向、实际应用场景,并提供丰富的示例代码来帮…

探索前端框架的世界:一场前端之旅

在网络世界中,网页开发领域的一颗明星是前端框架。这些框架为开发者提供了丰富的工具和技术,帮助他们构建出漂亮、高效的网页应用。现在,让我们随着小明的故事一起来探索一下吧。 小明的梦想 小明是一位年轻有为的前端开发者,他…

栈的应用(表达式求值)C++(Acwing)

代码&#xff1a; #include <iostream> #include <cstring> #include <algorithm> #include <stack> #include <unordered_map>using namespace std;stack<int> num; stack<char> op;void eval()//求值 {auto b num.top(); num.po…

mysql3.7之触发器

1.触发器的定义 触发器是由事件来触发某个操作&#xff0c;这些事件包括INSERT、UPDATE、DELETE事件。所谓事件就是指用户的动作或者触发某项行为。如果定义了触发程序&#xff0c;当数据库执行这些语句时候&#xff0c;就相当于事件发生了&#xff0c;就会自动激发触发器执行…

echarts图表中的基本设置参数

取消显示坐标值 axisLabel: { show: false} 取消坐标轴刻度线 axisTick: { show: false} 取消网格线 splitLine: { show: false } 去除y轴的线 //写在yAxis里面 axisLine:{show:false},axisTick:{show:false},去除y轴轴线&#xff08;背景线&#xff09; splitLine…

阿里云香港服务器是cn2线路吗?

阿里云服务器是CN2线路吗&#xff1f;云服务器BGP多线精品网络线路是cn2&#xff0c;香港轻量应用服务器不是cn2。 如何测试是不是中国电信cn2网络线路&#xff1f;可以本地公网 mtr 该公网IP地址看下是否走的CN2线路&#xff1a; 163骨干网出国的最后一跳IP开头是202.97CN2 …

java生成pdf

1.pdf预览 2.maven <!--pdf--><dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.9</version></dependency><dependency><groupId>com.itextpdf</groupId>…

day33打卡

day33打卡 1005. K 次取反后最大化的数组和 解法&#xff0c;贪心&#xff1a;局部最优&#xff1a;让绝对值大的负数变为正数&#xff0c;当前数值达到最大-》整体最优&#xff1a;整个数组和达到最大。 class Solution {static bool cmp(int a, int b) {return abs(a) >…

51_蓝桥杯_数码管静态显示

一 电路 二 数码管静态显示工作原理 三 代码 代码1 实现第一个数码管显示数字6的功能 #include "reg52.h"unsigned char code SMG_Duanma[18] {0xc0,0xf9.0xa4,0x99,0x92,0x82,0xf8,0x80,0x90,0x88,0x80,0xc0,0x86,0x8e,0xbf,0x7f};void Delay(unsignde int t) {wh…

001:自动驾驶概述

摘要&#xff1a;本文介绍国内外自动驾驶的发展历程及现状、汽车制造商、技术公司、传感器制造商、芯片制造商、地图供应商、软件开发商以及汽车零部件供应商。 国 外 一、发展历程及现状 起步阶段&#xff08;1990年-2005年&#xff09;&#xff1a;在这个阶段&#xff0c;自…

创建Maven项目

目录 创建新项目配置Maven配置资源地址下载资源 测试代码 创建新项目 创建一个新项目。 创建包&#xff0c;选择Maven&#xff0c;JDK选择1.8 。 点击创建。 创建完成。 配置Maven 点击设置图标&#xff0c;点击Settings. 搜索maven&#xff0c;点击Builde&#xff0c;…

【STM32 CubeMX】GPIO_HAL库源码分析

文章目录 前言一、GPIO_HAL库源码分析1.1 初始化GPIO1.2 HAL_GPIO_Init源码分析GPIO_InitTypeDef初始化结构体HAL_GPIO_Init函数 总结 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 例如&#xff1a;随着人工智能的不断发展&#xff0c;机器学习这门技…

05.QT坐标系

1. 坐标系原点 坐标系原点就是屏幕/窗口的左上角&#xff0c;X向右增长&#xff0c;Y向下增长。 2.设置控件位置 设置控件位置&#xff0c;就相当于是需要指定控件的坐标&#xff0c;对于该控件来说&#xff0c;其坐标原点是其父窗口/父控件的左上角。 设置方法就是通过控件的…

C++ Webserver从零开始:配置环境(九)——下载github的项目进行测试

前言 大家好&#xff0c;我又来更新Webserver的博客了。上一次更新这个专栏时2024.2.5号&#xff0c;离现在已经13天了。非常抱歉&#xff0c;中间隔了那么久。一方面是基础知识学完之后&#xff0c;就要开始自己写代码了。看基础知识和写代码是两回事&#xff0c;理论和实践的…

BUGKU-WEB 变量1

题目描述 题目截图如下&#xff1a; 进入场景看看&#xff1a; flag In the variable !<?php error_reporting(0); include "flag1.php"; highlight_file(__file__); if(isset($_GET[args])){$args $_GET[args];if(!preg_match("/^\w$/",$args…

数据库概述、部署MySQL服务、必备命令 、密码管理、安装图形软件、SELECT语法 、筛选条件

目录 1 案例1&#xff1a;构建MySQL服务器 1.1 问题 1.2 方案 1.3 步骤 2 案例2&#xff1a;密码管理 2.1 问题 2.2 步骤 3 案例3&#xff1a;安装图形软件 3.1 问题 3.2 方案 3.3 步骤 4 案例4&#xff1a;筛选条件 4.1 问题 4.2 方案 4.3 步骤 1 案例1&#x…

AcWing 1050 鸣人的影分身(复杂DP ——整数划分问题)

[题目概述] 在火影忍者的世界里&#xff0c;令敌人捉摸不透是非常关键的。 我们的主角漩涡鸣人所拥有的一个招数——多重影分身之术——就是一个很好的例子。 影分身是由鸣人身体的查克拉能量制造的&#xff0c;使用的查克拉越多&#xff0c;制造出的影分身越强。 针对不同的作…

【Linux】进程的初步认识(二)

进程的初步认识 前言查看进程通过系统调用创建进程关于创建进程的几点补充 前言 之前的一篇文章(文章链接)已经初步对于进程有了一个认识&#xff0c;这篇文章主要是介绍如何去查看进程的相关信息以及创建一个进程的相关知识 查看进程 查看进程的信息可以在/proc系统文件夹中查…

C# Newtonsoft.Json解析json到自定义实体类

使用Newtonsoft.Json解析json到自定义实体类也很方便&#xff0c;关键点在于实体类定义属性的时候加上JsonProperty标签。最简单的一种形式可以形如这样&#xff1a; public class BloodInfo {/// <summary>/// 输血品种/// </summary>[JsonProperty("bld_ca…