【每周AI简讯】OpenAI推出王炸文生视频模型Sora

ChatGPT中文版icon-default.png?t=N7T8https://ai7.pro

OpenAI推出王炸文生视频模型Sora

OpenAI 宣布推出名为 Sora 的新型文本到视频模型。Sora 能根据用户的文本提示,生成长达一分钟的逼真视频。它可以创造出细节丰富的场景、复杂的摄影机运动以及表情丰富的多个角色。Sora 是一种扩散模型,能从类似静态噪声的序列开始,通过多次迭代去除噪声,制作完整视频。Sora目前小范围开放给AI专家,以测试其安全性,未对公众开放。

tokyo-walk

Google推出Gemini 1.5 模型

Google 推出新的 Gemini 1.5 模型,以对抗 OpenAI 的 GPT 4 Turbo。这款模型采用新的专家混合(MoE)架构,提升了计算效率,能以较低的计算功率运行。Gemini 1.5 Pro 拥有 128,000 个令牌的标准上下文窗口,并为部分用户和企业客户提供高达 100 万令牌的上下文窗口。此外,该模型在处理大型数据集方面表现出色,如一小时视频、11小时音频、超过 30,000 行代码的代码库或超过 700,000 字的文档。Gemini 1.5 Pro 还通过了“海底捞针”测试,显示出在大型数据集中准确检索文本的能力。

图片

Stability AI 发布图像生成模型 Stable Cascade

Stability AI 推出了新型图像生成模型 Stable Cascade,这是开源模型 Stable Diffusion 的继任者。Stable Cascade 拥有多种新特性,如改变已创建图像、提高现有图像分辨率、内部填充和外部延伸。它使用三种基于 Würstchen 架构的大型语言模型,分阶段处理文本提示,并将其转换为紧凑的代码片段,进而生成图像。与 Stable Diffusion 相比,它能在更短的时间内(仅需10秒)生成图像,而且更准确、更吸引人。

图片

OpenAI 推出新型网络搜索产品,挑战 Google

OpenAI 正在开发一款新型网络搜索引擎产品,旨在挑战 Google 在搜索引擎市场的地位。这款产品可能部分依赖于 Microsoft 的 Bing 搜索引擎,考虑到 Microsoft 是 OpenAI 的最大投资者。目前,OpenAI 的 ChatGPT 通过提炼网页内容为约 100 字的摘要来进行网络搜索,但这种方式在捕捉页面完整信息方面存在性能慢和不可靠的问题。OpenAI 正考虑推出专门的搜索服务,以实现更快速、更准确的搜索能力,可能成为 Google 先进的生成型 AI 搜索工具的竞争对手。此外,OpenAI 正在探索将其网络搜索技术与其他创新项目整合的可能性。

图片

GPT-5 将更快更智能,具备多模态功能

OpenAI 的 CEO Sam Altman 在世界政府峰会上透露,即将推出的 GPT-5 模型将比 GPT-4 在所有方面都表现更好。GPT-5 将更智能、更快速,并且可能具备多模态功能。这意味着 AI 将来可以接收更多类型的输入。Altman 强调了这款模型广泛应用性是其最迷人的特点,它在众多任务中都有细微的改进,而非仅在某单一领域突出。尽管 Altman 没有具体说明发布时间表,但他之前已经指出预测 GPT-5 将带来的进步存在挑战。此外,有传言称 GPT-5 可能被命名为 "Gobi",它是一款正在开发中的多模态 AI 模型,预计将于 2024 年春季亮相。

图片

Nvidia 推出可本地运行的 AI 聊天机器人 Chat with RTX

Nvidia 推出了一款名为 Chat with RTX 的新 AI 聊天机器人,可以在设备上本地运行,无需互联网连接。这款产品面向拥有 GeForce RTX 30 系列和 40 系列显卡的用户。Chat with RTX 允许用户定制生成 AI 模型,类似于 OpenAI 的 ChatGPT,可以与用户的文档、文件和笔记集成以检索信息。此外,它支持 Mistral 的开源 AI 模型和 Meta 的大型语言模型 Llama 2。Chat with RTX 能处理多种文件格式,包括文本、PDF、.doc、.docx 和 .xml,甚至可以导入 YouTube 播放列表的视频转录。但是,它无法像 ChatGPT 那样保留上下文信息,这可能限制了其某些用途的有效性。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/691834.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

提取游戏音频文件.bnk

提取游戏音频文件.bnk 什么是.bnk准备Wwise-Unpacker工具使用Wwise-Unpacker工具总结 什么是.bnk .bnk其实是一种对音频的加密方式,一个.bnk文件中通常包含了多个语音文件,一般可以使用Wwise-Unpacker来解码.bnk格式文件 准备Wwise-Unpacker工具 Wwis…

计算机网络常考面试题——PING命令

1.PING命令的作用 PING命令是一种常用的网络诊断工具,经常用来测试网络中主机之间的连通性和网络延迟。返回的信息包括目的主机的域名和IP地址、往返时间、丢包率等信息。 2.PING命令的工作原理 PING的原理基于网络层的ICMP互联网控制报文协议,主要原…

网络原理 - HTTP/HTTPS(3)

HTTP请求 认识请求"报头" header的整体的格式也是"键值对"的结构. 每个键值对占一行,键和值之间使用分号进行分割. 报头的种类有很多,此处仅介绍几个常见的. Host 表示服务器主机的地址和端口.(Host和URL中的ip地址端口啥的,绝大部分情况下都是一样的,少…

解决Ubuntu中vscode右键没有create catkin package

右键发现没有这个create catkin package 解决方案: 查了一会发现安装个拓展就可以了 效果:

xilinx除法器的使用

平台:Vivado2018.3. 芯片:xcku115-flva1517-2-i (active) 最近学习使用了xilinx除法器,在使用过程中出现了很多次除法器的结果和我预计的结果不一致,特此记录学习一下。 参考文件:pg151.下载地址 pg151-div-gen.pdf …

【linux】查看openssl程序的安装情况

【linux】查看openssl程序的安装情况 1、查看安装包信息 $ rpm -qa |grep openssl 2、安装路径 $ rpm -ql openssl $ rpm -ql openssl-libs $ rpm -ql openssl-devel 3、相关文件和目录 /usr/bin/openssl /usr/include/openssl /usr/lib64/libssl.so.* /usr/lib64/libcrypto…

一键抓取淘宝/天猫商品主图并获取商品链接的方法(API)

淘宝/天猫获得淘宝商品详情 API 返回值说明 item_get-获得淘宝商品详情 API测试工具 taobao.item_get 公共参数 名称类型必须描述keyString是调用key(必须以GET方式拼接在URL中)secretString是调用密钥api_nameString是API接口名称(包括…

WhisperFusion:具有超低延迟无缝对话功能的AI系统

WhisperFusion 基于 WhisperLive 和 WhisperSpeech 的功能而构建,在实时语音到文本管道之上集成了大型语言模型 Mistral (LLM)。 LLM 和 Whisper 都经过优化,可作为 TensorRT 引擎高效运行,从而最大限度地提高性能和实时处理能力。WhiperSpe…

uniapp项目准备工作

1.封装请求 export const baseUrl function getHeaders () {let token uni.getStorageSync(token)let header {"access-token":token,// X-Requested-With: XMLHttpRequest,Content-Type: application/json; charsetUTF-8}return header } function reLogin(){/…

Filezilla 银河麒麟桌面操作系统V10(sp1)与Windows主机数据传输问题

银河麒麟桌面操作系统V10(sp1)与Windows主机数据传输问题 1. 关闭Windows主机的防火墙和KylinOS V10的防火墙 如果不知道怎么关闭的参考这两篇文章: https://blog.csdn.net/m0_70885101/article/details/127271517 https://blog.csdn.net/w…

扫盲:什么是webGPU,和webGL对比哪些优点?

web端的3D图像渲染,大都采用webGL,不过其性能让大家很崩溃,webGPU的出现,让大家看到了访问加速的可能,本文通过对比webGPU与webGL,给老铁们普及一下。老铁们如有数据可视化的设计和开发需求,可以…

算法之力扣数青蛙

题目连接 文章目录 题目解析算法原理第一步第二步第三步第三步第四步指向o 代码讲解代码实现 题目解析 先给大家来讲解一下这个题目的意思吧,这个题目是说呢给你一个蛙叫的字符串让你去设计一个算法求出发出这种蛙叫最少需要几只青蛙。比如说第一个样例发出这种叫声…

DAY55:动态规划(买卖股票的最佳时机3)

Leetcode: 309 最佳买卖股票时机含冷冻期 这道题比上面状态更多,是因为卖出股票后,你无法在第二天买入股票 (即冷冻期为1天)。 状态 状态一:持有股票状态(今天买入股票,或者是之前就买入了股票然后没有操作&#xf…

【C/C++】实现Reactor高并发服务器 完整版

代码结构 文件介绍 InetAddress.h InetAddress类 ip和端口设置 Socket.h Socket类 设置fd Epoll.h epollfd 管理类 Channel.h Channel类 管理epoll以及对应回调函数实现 EventLoop.h EventLoop事件循环类 TcpServer.h 服务器类 tcpepoll.cpp 主函数 InetAddress.h #if…

esbuild的介绍、使用及配置

esbuild的介绍、使用及配置 「esbuild」是一个「JavaScript」打包和压缩工具,核心目标是开创构建工具性能的新时代, 同时创建一个易于使用的现代构建工具。 主要特性: 极快的速度,无需缓存支持 ES6 和 CommonJS 模块支持对 ES6…

桌面便签怎么设置提醒,哪个备忘录便签好?

2024年终于开工了,第一天上班比较迷茫,不知道做什么比较好,这个时候如果有一款简单好用且可提醒的桌面便签软件该多好。那么,桌面便签怎么设置提醒,哪个备忘录便签好? 桌面便签怎么设置提醒,哪个…

SpringBoot项目嵌入RabbitMQ

在Spring Boot中嵌入RabbitMQ可以通过添加相应的依赖来完成。首先需要在pom.xml文件中引入spring-boot-starter-amqp依赖&#xff1a; <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-amqp</a…

216961-98-7,BODIPY 493/503 SE,具有相对较长的激发状态寿命

文章关键词&#xff1a;216961-98-7&#xff0c;BODIPY 493/503 NHS 活化酯&#xff0c;BODIPY 493/503 NHS ester&#xff0c;BODIPY 493/503 SE 一、基本信息 产品简介&#xff1a;BODIPY染料是一种独特的荧光染料&#xff0c;由于其具有疏水性&#xff0c;特别适合用于染色…

骑砍战团MOD开发(45)-卡拉迪亚无敌舰队称霸海上

一.玩家船只航行 (0, 0, 0, [(eq, "$g_player_warship_drive_mode", 1)],[(init_position, pos1),(init_position, pos2),(get_player_agent_no, ":player_agent"),(call_script, "script_get_warship_instance_no_by_index", 0),(assign, "…

基于芯驰 X9HP PTG4.1 在 yocto 中添加 Linux 应用

1.参考例程并添加应用 1.1 参考例程 &#xff08;1&#xff09;查看自带的串口测试例程 uart_test &#xff0c;查看 bb 文件怎么写的。 1.2 添加 printf-test 应用 &#xff08;1&#xff09;在 yocto/meta-semidrive/recipes-bsp/ 目录中 copy 自带例程 uart-test 改名为 …