OpenBayes 一周速览|1分钟生成完整音乐,DiffRhythm人声伴奏一键搞定; Stable Virtual Camera重塑3D视频创作

公共资源速递

5 个数据集:

* 302 例罕见病病例数据集

* DRfold2 RNA 结构测试数据集

* NaturalReasoning 自然推理数据集

* VenusMutHub 蛋白质突变小样本数据集

* Bird Vs Drone 鸟类与无人机图像分类数据集

2 个模型:

* Qwen2.5-0mni

* Llama-4-Scout-17B-16E-Instruct

4 个教程:

* CSM 双人对话语音生成 Demo

* 一键部署 Qwen2.5-VL-32B-lnstruct

* Stable Virtual Camera 图像秒变 3D 视频

* 谛韵 DiffRhythm:1 分钟即可生成完整音乐 Demo

访问官网立即使用:openbayes.com

公共数据集

1. 302 例罕见病病例数据集

该数据集包含 302 种罕见病,这些罕见病是从 Orphanet 数据库中 33 种类型的 7k+ 种罕见病中选出的,Orphanet 数据库是欧盟委员会共同资助的综合罕见病数据库。

* 直接使用:

https://go.openbayes.com/JreTB

2. DRfold2 RNA 结构测试数据集

该数据集是为了客观评估研究中 DRfold2 的性能而构建的独立测试数据集。其中包含 28 种 RNA 结构,它们的序列长度均小于 400 nts,并来源于以下 3 个类别:最新的 RNA-Puzzles 目标序列、CASP15 竞赛中的 RNA 目标序列、截至 2024 年 8 月 1 日,Protein Data Bank (PDB) 数据库中最新发布的 RNA 结构。

* 直接使用:

https://go.openbayes.com/pN0Oi

3. NaturalReasoning 自然推理数据集

该数据集包含 280 万个挑战性问题,这些问题覆盖了多个领域,如 STEM 领域(例如物理、计算机科学)、经济学、社会科学等。该数据集旨在通过利用预训练语料库和大型语言模型 (LLMs) 来生成多样化且具有挑战性的推理问题及其参考答案,而无需额外的人工标注。

* 直接使用:

https://go.openbayes.com/KAQyB

图片

数据集构建示意图

4. VenusMutHub 蛋白质突变小样本数据集

VenusMutHub 是首个针对真实应用场景蛋白质突变小样本数据集,含 905 个真实应用场景的小样本实验突变数据,覆盖 527 种蛋白质(其中 98% 的蛋白的突变数量在 5-200 个之间),涵盖了稳定性、活性、结合亲和力与选择性等多种功能测量数据。所有数据均采用直接生化测量,而非替代性荧光读数,确保了评估的准确性。

* 直接使用:

https://go.openbayes.com/Y4B73

5. Bird Vs Drone 鸟类与无人机图像分类数据集

数据集包含来自 Pexel 网站的多种图像集合,代表运动中的鸟类和无人机。这些图像是从视频帧中捕获的,经过分割、增强和预处理以模拟不同的环境条件,从而增强模型的训练过程。

* 直接使用:

https://go.openbayes.com/2tCNM

公共模型

1. Qwen2.5-0mni

* 发布机构:阿里巴巴通义千问团队

Qwen2.5-Omni 是阿里巴巴通义千问团队发布的最新端到端多模态旗舰模型,专为全面的多模式感知设计,无缝处理包括文本、图像、音频和视频在内的各种输入,同时支持流式的文本生成和自然语音合成输出。

* 直接使用:

https://go.openbayes.com/EIpHB

图片

模型应用

2. Llama-4-Scout-17B-16E-Instruct

* 发布机构:Meta

Llama-4-Scout-17B-16E-Instruct 是由 Meta 于 2025 年 4 月开发的一款混合专家 (MoE) 语言模型,属于 Llama 4 系列模型的一部分,支持文本和多模态体验。该模型利用专家的混合架构,在文本和图像理解方面提供行业领先的性能。

* 直接使用:

https://go.openbayes.com/EsnVz

公共教程

1. CSM 双人对话语音生成 Demo

CSM (Conversational Speech Model) 旨在通过自然、连贯的语音生成技术提升语音助手的情感交互能力。该模型基于多模态学习框架,结合文本和语音数据,采用端到端的 Transformer 架构直接生成自然且富有情感的语音,可根据文本和音频输入生成 RVQ 音频代码。

该教程使用 CSM-1B 模型即可实现两人对话生成,算力资源采用 RTX 4090。

* 在线运行:

https://go.openbayes.com/zrpWM

图片

模型界面示例

2. 一键部署 Qwen2.5-VL-32B-lnstruct

Qwen2.5-VL-32B-Instruct 是阿里巴巴通义千问团队于 2025 年 3 月 24 日开源的多模态大模型,基于 Apache 2.0 协议发布。该模型在 Qwen2.5-VL 系列的基础上,通过强化学习技术优化,以 32B 参数规模实现了多模态能力的突破。

进入官网克隆并启动容器,打开 API 地址即可体验模型。

* 在线运行:

https://go.openbayes.com/bOYvX

图片

模型示例

3. Stable Virtual Camera 图像秒变 3D 视频

Stable Virtual Camera 能够根据任意数量的输入视图和目标相机,生成场景的新视图。其设计克服了现有方法在生成大视角变化或时间上平滑样本方面的局限性,同时无需依赖特定的任务配置。该模型的一个显著特点是无需额外的 3D 表示学习,即可保持高一致性的样本生成,从而简化了实际应用中的视角合成流程。

相关代码已配置完成,克隆容器进入 API 地址即可生成 3D 视频。

* 在线运行:

https://go.openbayes.com/qBENf

图片

模型示例

4. 谛韵 DiffRhythm:1 分钟即可生成完整音乐 Demo

DiffRhythm 是首个能够创作完整歌曲的基于扩散的歌曲生成模型。它能够在短时间内生成长达 4 分 45 秒的完整歌曲,包含人声和伴奏。

只需为模型提供歌词和风格提示,DiffRhythm 就能自动生成与歌词匹配的旋律和伴奏,还支持多语言输入。

* 在线运行:

https://go.openbayes.com/uK2X2

图片

模型工作流程

 


以上就是小贝上周在 OpenBayes 的全部更新内容啦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/901304.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PostgreSQL 实例运行状态全面检查

PostgreSQL 实例运行状态全面检查 PostgreSQL 实例的健康检查是数据库运维的核心工作,以下是系统化的状态检查方法和关键指标解读。 一 基础健康检查 1.1 实例可用性检查 # 快速连接测试 pg_isready -h localhost -p 5432 -U postgres -d postgres# 返回状态说明…

利用 Python 进行股票数据可视化分析

在金融市场中,股票数据的可视化分析对于投资者和分析师来说至关重要。通过可视化,我们可以更直观地观察股票价格的走势、交易量的变化以及不同股票之间的相关性等。 Python 作为一种功能强大的编程语言,拥有丰富的数据处理和可视化库&#xf…

时序约束高级进阶使用详解二:Set_Min_Delay

目录 一、前言 二、设计示例 2.1 示例代码 2.2 时序约束 三、Set_min_delay 3.1 start points 3.1.1 对象有效性 3.1.2 边沿有效性 3.1.3 start point非有效起点 3.2 Through points 3.2.1 约束对象为Cells 3.2.2 约束对象为Cell pin/Net 3.3 to points 3.4 rise…

2025-4-12-C++ 学习 XOR 三元组 异或 急转弯问题

C的学习必须更加精进一些,对于好多的函数和库的了解必须深入一些。 文章目录 3513. 不同 XOR 三元组的数目 I题解代码 3514. 不同 XOR 三元组的数目 II题解代码 晚上,10点半,参加了LC的竞赛,ok了一道,哈哈~   第二道…

图像形态学操作对比(Opencv)

形态学基于图像的形状进行操作,用于处理二值化图像,主要包括腐蚀和膨胀两种基本操作。这些操作通常用于去除噪声、分隔或连接相邻的元素以及寻找图像中显著的最大点和最小点。 1. 形态学操作 import cv2 import numpy as np import matplotlib.pyplot …

sql 向Java的映射

优化建议,可以在SQL中控制它的类型 在 MyBatis 中,如果返回值类型设置为 java.util.Map,默认情况下可以返回 多行多列的数据

excel中的VBA指令示例(一)

示例注释: Sub 宏1() sub是宏开头,宏1是宏的名称,自定义,在按钮中可指定用某个宏 后面是注释 Sheets("装配材料").Select ‘选择表 装配材料 Ce…

【Linux C】简单bash设计

主要功能 循环提示用户输入命令(minibash$)。创建子进程(fork())执行命令(execlp)。父进程等待子进程结束(waitpid)。关键问题 参数处理缺失:scanf("%s", buf)…

【vue】基础

一、vi-if 1.1基本使用 必须绑定大盒子包住的代码,使用id或者class都可以进行绑定 new Vue({ el:"#id" el:".class" }) 1.2v-if和v-show的区别 v-show会渲染,但是不显示,v-if不渲染不显示 1.3vue实例的作用范围 必须包…

【数据结构_5】链表(模拟实现以及leetcode上链表相关的题目)

书接上文,继续编写链表的功能 4.链表的中间插入 在链表中,本身是没有下标这样的概念的,不像顺序表,顺序表根据下标访问元素,O(1)复杂度。链表需要遍历之后找到正确的位置才能进行插入,为O(N&a…

C语言的发展史

一、起源 C语言的起源可以追溯到20世纪60年代末期。其前身是BCPL(Basic Combined Programming Language)语言,由剑桥大学的Martin Richards于1967年在CPL语言的基础上简化而来。1970年,美国贝尔实验室的Ken Thompson以BCPL语言为…

深入解析栈式虚拟机与反向波兰表示法

1.1 什么是虚拟机? 虚拟机(Virtual Machine, VM)是一种软件实现的计算机系统,提供与物理计算机相类似的环境,但在软件层面运行。虚拟机的存在简化了跨平台兼容性、资源管理以及安全隔离等问题。 1.2 栈式虚拟机的架构…

ubuntu 系统安装Mysql

安装 mysql sudo apt update sudo apt install mysql-server 启动服务 sudo systemctl start mysql 设置为开机自启 sudo systemctl enable mysql 查看服务状态 (看到类似“active (running)”的状态信息代表成功) sudo systemctl status mysql …

《前端面试题之 CSS篇(第一集)》

目录 1、CSS的盒模型2、CSS选择器及其优先级3、隐藏元素的方法有那些4、px、em、rem的区别及使用场景5、重排、重绘有什么区别6、水平垂直居中的实现7、CSS中可继承与不可继承属性有哪些8、Sass、Less 是什么?为什么要使用他们?9、CSS预处理器/后处理器是…

HTTP:四.HTTP连接

HTTP(Hypertext Transfer Protocol)是一种用于传输超文本数据的应用层协议。它是互联网上最常用的协议,用于在客户端和服务器之间传输数据。HTTP协议通常用于从Web服务器传输网页和文件到客户端浏览器,并支持其他用途,如传输API数据和传输文件。 HTTP连接是指客户端向服务…

opencv 识别运动物体

import cv2 import numpy as npcap cv2.VideoCapture(video.mp4) try:import cv2backSub cv2.createBackgroundSubtractorMOG2() except AttributeError:backSub cv2.bgsegm.createBackgroundSubtractorMOG()#形态学kernel kernel cv2.getStructuringElement(cv2.MORPH_REC…

要查看 ​​指定 Pod 的资源限制(CPU/内存)

要查看 指定 Pod 的资源限制&#xff08;CPU/内存&#xff09;&#xff0c;可以通过以下 kubectl 命令实现&#xff1a; 1. 快速查看某个 Pod 的资源限制 kubectl get pod <pod-name> -o jsonpath{.spec.containers[*].resources} | jq输出示例&#xff1a; {"lim…

信息安全管理与评估广东省2023省赛正式赛题

任务1&#xff1a;网络平台搭建(60分) 题号 网络需求 1 根据网络拓扑图所示&#xff0c;按照IP地址参数表&#xff0c;对DCFW的名称、各接口IP地址进行配置。&#xff08;10分&#xff09; 2 根据网络拓扑图所示&#xff0c;按照IP地址参数表&#xff0c;对DCRS的名称进…

IBM Rational Software Architect安装感受及使用初体验

1 安装感受 最近准备用UML 2.0绘制模型图。在读UML创始人之一Grady Booch写的书《Object-Oriented Analysis and Design with Applications》&#xff08;第3版&#xff09;1时&#xff0c;发现书中用的UML工具之一为IBM Rational Software Architect&#xff08;RSA&#xff…

接听电话,手机靠近耳朵后拿开,挂断电话,设备自动锁屏

目录 一、问题分析/需求分析 二、解决方案 一、问题分析/需求分析 先说一下大致流程: 首先是打电话过程会启动PROXIMITY(接近光传感器)用于监听手机是否到耳边,当手机到耳边时进行灭屏处理,灭屏过程中会调用到锁屏,所以最终会导致锁屏 详细流程分析: 首先根据日志看…