AI日报|文生语音大模型国内外均有突破,Pika完成6亿新融资,视频大模型也不远了!

文章推荐

AI搜索哪家强?16款产品实战测评,效率飙升秘籍!

AI日报|智谱AI再降价,同时开源9B系列模型;国内外气象大模型竞逐升级

字节推出文本到语音模型家族Seed-TTS:擅长情感表达,与真人几乎无异

字节跳动推出文本到语音模型家族——SEED TTS,其核心亮点在于生成的语音音色高度接近人类,在相似度与自然流畅度方面,可以与真声媲美。

在技术层面有以下创新:

  • Seed-TTS是一系列大规模自回归文本到语音(TTS)模型,它通过学习语音上下文、说话人相似度和自然度等方面的特征,生成与人类语音难以区分的高质量语音。此外,Seed-TTS还具有优越的情感控制能力,可以根据需求生成具有不同情感和语音属性的语音
  • Seed-TTS还提供了自蒸馏方法用于语音分解,可以更好地理解语音的特征,以及增强模型鲁棒性、说话人相似度和控制性的强化学习方法。
  • Seed-TTS还展示了非自回归(NAR)变体Seed-TTSDiT,它采用完全基于扩散的架构,不依赖于预先估计的音素持续时间,通过端到端处理进行语音生成。

https://bytedancespeech.github.io/seedtts_tech_report/

Stability AI发布Stable Audio Open文本至音频模型,时间可长达47秒

Stability AI宣布推出生成声音和歌曲的开放式人工智能模型—Stable Audio Open。该公司声称,该模型仅接受免版税录音训练。用户只需输入文本描述,模型就能生成最长47秒的声音片段,

Stable Audio Open能够创造鼓点、乐器旋律、环境音效及视频、电影、电视节目的制作元素,还能“编辑”现有歌曲或融合不同曲风,例如将柔和爵士风格应用于另一首歌。

并且Stable Audio Open一大亮点是用户可基于个人音频资料微调模型,让生成的内容更加个性化。

然而,这款开源模型存在局限:无法生成完整歌曲、旋律或人声,对此类需求,Stability AI推荐使用其付费服务Stable Audio。

此外,Stable Audio Open禁止商业用途。

https://techcrunch.com/2024/06/05/stability-ai-releases-a-sound-generator/

Pika完成全新6亿融资,即将发布全新视频生成大模型

AI视频生成初创公司Pika日前已完成总额8000万美元的B轮融资,由Spark Capital领投,Greycroft、Lightspeed Venture Partners以及Jared Leto参投,公司估值超过4.7亿美元,较上一轮翻了一倍。

截至目前,Pika总融资额已达1.35亿美元。Pika用户数达到数百万,每周生成数百万个视频。同时,Pika已租用数百个量级的GPU(图形处理器)芯片,用于模型训练和推理计算。

创始人郭文景表示:“我们正在努力打造最好的视频模式,同时也在努力打造真正服务于创作者的产品。”据悉,Pika将在今年下半年发布一个全新关键的基础模型以及配套产品更新。

https://mp.weixin.qq.com/s/fJtcza5MB9rmFRmLT2bI9g

Cartwheel提供文字生成3D动画,为创作者提供支持

从头开始制作3D角色动画通常既费力又费钱,需要使用复杂的软件和动作捕捉工具。Cartwheel希望让基本动画变得简单,只需用文字描述动画,就可以用AI生成基本动作。

因此用户在使用Cartwheel时,可以从文本框时输入任何内容,一两分钟后就可以得到一个流畅的基本动作动画,然后可以将其导出到3D编辑软件中。

Cartwheel表示,动画师无需在迈步,拍打,坐下等基本动作上花费太多时间,Cartwheel可以自动生成基本动作,用户可以自己对其进行关键帧处理,制作过程会更加快捷。

https://techcrunch.com/2024/06/05/cartwheel-generates-3d-animations-from-scratch-to-power-up-creators/

苹果发布会前iOS ChatGPT迎来重大更新,支持后台交互

距离类似ChatGPT的智能功能引入iOS 18仅剩几天时间。ChatGPT 官方 iOS 应用迎来重大更新(1.2024.150),用户现在可以在使用其他应用的同时继续与ChatGPT进行对话。
ChatGPT的这项全新多任务功能默认处于关闭状态,需要手动开启。

开启后台对话功能后,用户可以启动与ChatGPT的语音对话,然后离开应用并继续交谈。即使用户在使用其他应用,也能继续与ChatGPT语音助手进行对话。

https://www.ithome.com/0/773/429.htm

Nvidia 市值突破 3 万亿美元,超越苹果

得益于AI芯片的需求激增,英伟达今年股价飙升约147%,市值增加约1.8万亿美元,周三,该公司股价上涨5.2%,收于创纪录的1224.40美元,市值超过3万亿美元,超越苹果公司。

周三股价上涨使英伟达CEO黄仁勋在彭博亿万富翁指数上的财富增加了50多亿美元,达到1074亿美元。

英伟达没有放缓脚步的迹象,CEO黄仁勋表示计划每年升级其AI加速器。黄仁勋在台湾大学的演讲中提到,生成式AI的兴起是一场新的工业革命,随着AI技术渗透到个人电脑领域,英伟达将继续扮演重要角色。

https://es-us.finanzas.yahoo.com/news/nvidia-tops-3-trillion-market-191513270.html

“可信 AI 进展 “ 公众号致力于最新可信人工智能技术的传播和开源技术的培育,覆盖大规模图学习,因果推理,知识图谱,大模型等技术领域,欢迎扫码关注,解锁更多 AI 资讯~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/23994.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

短视频矩阵系统----可视化剪辑独立开发(采用php)

短视频矩阵系统源头技术开发: 打磨短视频矩阵系统的开发规则核心框架可以按照以下几个步骤进行: 明确系统需求:首先明确系统的功能需求,包括短视频的上传、编辑、发布、播放等环节。确定系统的目标用户和主要的使用场景&#xff…

C++三大特性之继承,详细介绍

阿尼亚全程陪伴大家学习~ 前言 每个程序员在开发新系统时,都希望能够利用已有的软件资源,以缩短开发周期,提高开发效率。 为了提高软件的可重用性(reusability),C提供了类的继承机制。 1.继承的概念 继承: 指在现有…

鸢尾花分类和手写数字识别(K近邻)

鸢尾花分类 from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split import pandas as pd import mglearn# 加载鸢尾花数据集 iris load_iris() X_train, X_test, y_train, y_test train_test_split(iris.data,iris.target,test_siz…

免费分享一套SpringBoot+Vue校园论坛(微博)系统【论文+源码+SQL脚本】,帅呆了~~

大家好,我是java1234_小锋老师,看到一个不错的SpringBootVue校园论坛(微博)系统,分享下哈。 项目视频演示 【免费】SpringBootVue校园论坛(微博)系统 Java毕业设计_哔哩哔哩_bilibili【免费】SpringBootVue校园论坛(微博)系统 Java毕业设计…

数据中心网络架构设计与优化

数据中心是现代企业和组织的核心基础设施,它们用于存储、处理和传输大量的数据和信息。为了满足不断增长的数据需求和提供可靠的服务,设计和优化数据中心网络架构至关重要。 首先,数据中心网络架构设计需要考虑可扩展性。随着业务的增长&…

[Bug]使用Transformers 微调 Whisper出现版本不兼容的bug

错误的现象 ImportError Traceback (most recent call last) <ipython-input-20-6958d7eed552> in () from transformers import Seq2SegTrainingArguments training_args Seq2SeqTrainingArguments( output_dir"./whisper-small-…

【全开源】防伪溯源一体化管理系统源码(FastAdmin+ThinkPHP+Uniapp)

&#x1f50d;防伪溯源一体化管理系统&#xff1a;守护品质&#xff0c;追溯无忧 一款基于FastAdminThinkPHP和Uniapp进行开发的多平台&#xff08;微信小程序、H5网页&#xff09;溯源、防伪、管理一体化独立系统&#xff0c;拥有强大的防伪码和溯源码双码生成功能&#xff0…

从零开始学JAVA

一、编写Hello world程序 public class JavaMain1 {//主程序执行入口&#xff0c;main方法public static void main(String[] args){System.out.println("Hello world!");} } 运行结果 Hello world! java编写主程序常见错误&#xff1a; 1、System ---首字母没有…

使用Aspose技术将Excel转换为PDF

简介&#xff1a;本文将介绍如何使用Aspose技术将Excel文件转换为PDF格式。我们将使用Aspose-Cells-8.5.2.jar包&#xff0c;并演示Java代码以及进行测试。 一、Aspose技术概述 Aspose是一款强大的文档处理库&#xff0c;支持多种编程语言&#xff0c;如Java、C#、Python等。…

工程力学 - 课程导论

工程力学是工程学科中的核心基础课程&#xff0c;专注于研究物体在外力作用下的运动规律和受力情况。它涵盖了静力学、运动学、动力学和材料力学等关键领域&#xff0c;为工程结构的安全性、稳定性和功能性提供理论支撑。通过理论分析、实验测定和计算机模拟等方法&#xff0c;…

MyEclipse新手使用介绍

目录 1.MyEclipse诞生背景 2.作用 3.版本历史 4.优缺点 5.应用场景 6.如何使用 6.1.下载与安装 6.2.MyEclipse 菜单及其菜单项 7.创建和发布一个 Java 程序 7.1.创建 Java 程序 7.2.发布 Java 程序 8.示例 8.1. Hello World 示例 8.2. 简单Spring Boot 应用 8.3…

SpringBoot实现发送邮件功能

目录 一、开启邮件服务 二、导入pom依赖 三、配置yml文件 四、发送邮件 4.1、发送文字邮件 4.2、发送html邮件 4.3、发送附件邮件 4.4、发送图片邮件 一、开启邮件服务 这里拿QQ邮箱举例。 翻到下面进行开启,之后获取授权码。 二、导入pom依赖 <dependency><…

问题:明朝统辖西域的主要措施有( )(2.0分) (多选题) #学习方法#微信#经验分享

问题&#xff1a;明朝统辖西域的主要措施有( )(2.0分) (多选题) A.设立哈密卫 B.册封各地的首领 C.都护统领 D.布局要地 参考答案如图所示

为什么说国产大模型的野心,都藏在 MaaS 的生态中

2016 年 4 月&#xff0c;在一场由 IDG 主办的行业峰会上。 IDG 创始董事长熊晓鸽&#xff0c;刚刚盘点完 IDG 深耕中国企业服务多年的成果&#xff0c;台下&#xff0c;GE 中国公司 CEO 便发出了不合时宜的灵魂一问&#xff1a; 「中国有很多伟大的公司&#xff0c;也有很多…

用大模型实现PPT可视化几种思路

https://zhuanlan.zhihu.com/p/700685802 背景 前面一篇文章已经介绍了如何根据用户输入&#xff0c;用大模型实现内容检索、分析、脑图可视化的链路。然而往往投研团队需要针对重要新闻做组内分析解读&#xff0c;需要用ppt的方式来展现&#xff1b;那么优美可能让大模型直…

[office] 如何才能用EXCEL打开dat文件- #微信#学习方法

如何才能用EXCEL打开dat文件? 方法&#xff1a; 1、打开EXCEL软件&#xff1b; 2、文件&#xff0c;打开&#xff0c;选择要转化的DAT文件&#xff1b; 3、在弹出的向导文件&#xff08;步骤1&#xff09;中&#xff0c;选择合适的文件类型&#xff08;按预览选择&#xf…

充电桩,未来出行的绿色引擎

随着新能源时代的到来&#xff0c;充电桩早已不再是一个陌生的词汇&#xff0c;它正在成为我们生活中不可或缺的一部分。 它不仅仅是一个简单的充电设备&#xff0c;更是未来出行的绿色引擎&#xff0c;驱动着我们的汽车&#xff0c;也驱动着这个时代的绿色梦想。 想象一下&am…

人工智能术语

1、人工智能的概念 人工智能概念&#xff0c;在1956年召开的达特茅斯会议上正式被提出。该会议是由信息学鼻祖克劳德.艾尔伍德.香农(ClaudeElwoodShannon)以及马文.明斯基(Marvin Minsky)、约翰.麦卡锡(JohnMcCarthy)等十位信息学、数学、计算机学的科学先驱&#xff0c;在美国…

智谱AI 发布最新开源模型GLM-4-9B,通用能力超Llama-3-8B,多模态版本比肩GPT-4V

自 2023 年 3 月 14 日开源 ChatGLM-6B 以来&#xff0c;GLM 系列模型受到广泛关注和认可。特别是 ChatGLM3-6B 开源以后&#xff0c;开发者对智谱AI 第四代模型的开源充满期待。 为了使小模型&#xff08;10B 以下&#xff09;具备更加强大的能力&#xff0c;GLM 技术团队进行…

如何从微软官方下载Edge浏览器的完整离线安装包

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 正文内容 📒🚀 官方直链下载🚬 手动选择下载🎈 获取方式 🎈⚓️ 相关链接 ⚓️📖 介绍 📖 在网上搜索Microsoft Edge浏览器的离线安装包时,很多用户都会发现大部分都是在线安装包,无法满足他们在无网络环境下进…