每周编辑精选|希尔贝壳语音数据集系列上线、中国学者建立乳腺癌预后评分系统 MIRS

🏮新春佳节,归程千里为团圆
🏮人间烟火,年味浓浓阖家欢

辞别玉兔,金龙迎春。明晚就是大年三十除夕夜了!HyperAI超神经在这里提前祝大家新春快乐~龙行龘龘(dá)!本周 hyper.ai 官网上线了希尔贝壳开源的数千小时中文语音数据库,打开你的语音之门。

2 月 5 日-2 月 8 日,hyper.ai 官网更新速览

  • 优质公共数据集:8 个

  • AI4S 论文案例:2 篇

  • 热门百科词条:8 条

访问官网:hyper.ai

公开数据集精选

1.AISHELL-1 开源中文语音数据库

该数据集由 400 名来自中国不同口音地区的人参与录制。经过专业语音校对人员转写标注,并通过严格质量检验,此数据库文本正确率在 95% 以上。分为训练集、开发集、测试集。

直接使用

https://hyper.ai/datasets/29344

2. AISHELL-2 中文语音数据库

希尔贝壳中文普通话语音数据库 AISHELL-2 包含 1,000 小时的语音时长。录音文本涉及唤醒词、语音控制词、智能家居、无人驾驶、工业生产等 12 个领域。

直接使用

https://hyper.ai/datasets/29347

3. AISHELL-3 高保真中文语音数据库

该数据集由 218 名来自中国不同口音区域的人员参与录制。由专业语音校对人员进行拼音和韵律标注,并通过严格质量检验,此数据库音字准确率在 98% 以上。

直接使用

https://hyper.ai/datasets/29352

4. AISHELL-4 多通道中文会议语音数据库

AISHELL-4 是由 211 个录制的会议会议组成,每个会议会议包含 4 至 8 名发言者,总时长为 120 小时,可用于语音前端处理、语音识别等单独任务。

直接使用

https://hyper.ai/datasets/29375

5. AISHELL-WakeUp-1 中英文唤醒词语音数据库

该数据集邀请了 254 名发言人参与录制,共有唤醒词语音近 400 万条,1561.12 小时。录音文本为「你好,米雅」、「hi, mia」唤醒词。此数据库经过专业语音校对人员转写标注,并通过严格质量检验,可用于声纹识别、语音唤醒识别等研究使用。

直接使用

https://hyper.ai/datasets/29186

6. AISHELL-DMASH 中文普通话麦克风阵列家居场景语音数据库

AISHELL-DMASH 数据集是在两个不同房间的真实智能家居场景中记录的,该数据集包含 30,000 小时的语音数据。数据集由专业语音标注人员转录,单词准确率达 98%,可用于声纹识别、语音识别、唤醒词识别等研究。

直接使用

https://hyper.ai/datasets/29380

7.DeepSymNet 深度符号网数据集

这是中国科学院半导体研究所的研究人员提出的一种名为 DeepSymNet 的全新符号网络来表示符号表达式,用于符号回归的符号网络。

直接使用

https://hyper.ai/datasets/29321

8. Evol Instruct Chinese GPT4 文本数据集

该数据集是通过以下方式创建的:

(1) 将 Evol-instruct-70k 的英文问题翻译成中文;

(2) 请求 GPT4 生成中文答案。

直接使用

https://hyper.ai/datasets/29318

ScienceAI 论文案例精选

1. 剑指全球第一大癌症,中国学者建立乳腺癌预后评分系统 MIRS

近日,中国学者采用神经网络模型,建立了一个预测乳腺癌预后和治疗的评分系统 MIRS,可用于指导乳腺癌患者治疗策略的制定。相关论文已发表于「iScience」期刊。

查看完整报道

https://hyper.ai/news/29304

2. 中科院深圳先进院提出 SBeA,基于少样本学习框架进行动物社会行为分析

动物行为研究急需通过技术创新提升研究效率和准确性。基于此,SBeA (Social Behavior Atlas) 应运而生,由中国科学院深圳高新技术研究院开发,能够全面量化自由群居动物的行为,使用较少的标记帧数(约 400 帧)进行多动物三维姿态估计,通过双向迁移学习策略,在多动物身份识别方面的准确率超过 90% 。相关成果已发表于「Nature」期刊。

查看完整报道

https://hyper.ai/news/29353

热门百科词条精选

  1. 每秒浮点运算次数 FLOPS

  2. 随机漫步 Random Walk

  3. 虚拟筛选 Virtual Screening

  4. 音乐信息检索 MIR

  5. 量子神经网络 Quantum Neural Network

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki


以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们!

新春到来之际,HyperAI超神经再次祝大家龙行大运,万事兴龙,合不龙嘴,其乐龙龙!新的一年,我们会给大家带来更多惊喜!

让我们龙年再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1200+ 公开数据集提供国内加速下载节点

  • 收录 300+ 经典及流行在线教程

  • 解读 100+ AI4Science 论文案例

  • 支持 500+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅

https://hyper.ai/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/674027.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Lua协程-coroutine

lua也有协程这个机制,用以完成非抢占式的多任务处理。 协程与线程 协程和线程类似,有自己的堆栈、局部变量、指令指针等等。但同时也有不一致的地方,其中最重要的地方在于多线程程序可以同一时间运行多个线程,而协程同一时间只能…

Vue前端框架--Vue工程项目问题总结{脚手架 Vue-cli}

Vue脚手架部署问题总结 我所遇到的一共两大问题 只有先执行npm install之后 才能run serve 否则会报错 vue-cli-serve不是内部或者外部的命令,也不是可运行的程序或者批处理文件的错误 1. 运行npm install会报错 2. 运行npm run serve报错 nodejs官网为 https://no…

C#中实现串口通讯和网口通讯(使用SerialPort和Socket类)

仅作自己学习使用 1 准备部份 串口通讯需要两个调试软件commix和Virtual Serial Port Driver,分别用于监视串口和创造虚拟串口。网口通讯需要一个网口调试助手,网络上有很多资源,我在这里采用的是微软商店中的TCP/UDP网络调试助手&#xff0…

【leetcode热题100】删除排序链表中的重复元素

难度: 简单通过率: 41.5%题目链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 题目描述 给定一个排序链表,删除所有重复的元素,使得每个元素只出现一次。 示例 1: 输入: 1->1->…

cleanmymacX和腾讯柠檬哪个好用

很多小伙伴在使用Mac时,会遇到硬盘空间不足的情况。遇到这种情况,我们能做的就是清理掉一些不需要的软件或者一些占用磁盘空间较大的文件来腾出空间。我们可以借助一些专门的清理工具,本文中我们来推荐几款好用的Mac知名的清理软件。并且将Cl…

C语言:亲密数对

题目描述 在自然数中有一种这样的数:它自身是一个完全平方数,加上1之后是一个素数,这一对数被称为亲密数对,请编程找出指定区域内的所有亲密数对。 例如在[10,100]之间的亲密数对有:(16,17)&am…

SQL在云计算中的新角色:重新定义数据分析

文章目录 1. 云计算与数据分析的融合2. SQL在云计算中的新角色3. 分布式SQL查询引擎4. SQL-on-Hadoop解决方案5. SQL与其他数据分析工具的集成6. 实时数据分析与SQL7. SQL在云数据仓库中的角色8. 安全性与隐私保护9. SQL的未来展望《SQL数据分析实战(第2版&#xff…

SQL笔记-2024/01/31

cross join 两个表的笛卡尔积 例如: select s.name student_name,s.age student_age,s.class_id class_id,c.name class_name from student s cross join class c; 子查询 select s.name name,s.score score,s.class_id class_id from student s where s.class_id …

14.scala隐式转换

目录 概述实践代码执行结果 结束 概述 隐式转换:偷偷的(隐式)对现有功能进行增强(转换) 实践 代码 package com.fun.scalaimport java.io.File import scala.io.Sourceobject ImplicitApp {def main(args: Array[String]): Unit {// implicit 2 to 等价 &…

vuecli3 执行 npm run build 打包命令报错:TypeError: file.split is not a function

问题 今天有个项目在打包的时候遇到了一个问题,就是执行 npm run build 命令的时候报错了,如下: 解决 我排查了一下,模拟代码如下:在打包的时候用了 MinChunkSizePlugin const webpack require("webpack"…

LabVIEW多任务实时测控系统

LabVIEW多任务实时测控系统 面对现代化工业生产的复杂性和多变性,传统的测控系统已难以满足高效、精准、可靠的监控和控制需求。因此,开发一种基于LabVIEW的智能测控系统,能够提高生产效率,保证生产安全,是解决现代工…

ubuntu 没有屏幕安装QT(SSH远程登陆下)

1背景说明 需要在SSH登陆的ubuntu远程上安装QT,但是远程电脑没有屏幕,报了这个错误“QXcbConnection: Could not connect to display”。 2网上搜索有2种解决方案 由于远程服务器没有配置屏幕,都失败了 2.1配置屏幕关闭 vim ~/.bashrc …

打卡今天学习的命令 (linux

1.1 cp - 复制文件或目录 cp source destination cp -r source_directory destination # 递归复制目录及其内容1.2 rm - 删除文件或目录 rm file rm -r directory # 递归删除目录及其内容1.3 mv - 移动/重命名文件或目录 mv source destination mv old_name new_name # 重…

怎么清理电脑内存?详细图文教程分享!

“我的电脑用了才不到一年,现在内存总是不足。想问问大家平常遇到电脑内存不足的情况时有什么好用的清理方法吗?” 随着电脑使用时间的增长,内存占用可能会不断增加,导致电脑运行缓慢。为了保持电脑的良好性能,定期清理…

手把手教你实现Kmeans聚类,不使用MATLAB工具箱,纯手写matlab代码免费获取,UCI数据集为例...

K均值(K-means)是一种常用的聚类算法,用于将数据集划分为K个不同的组(簇),使得每个数据点属于与其最近的均值点所代表的簇。K均值算法的基本思想是通过迭代优化,将数据点分配到K个簇中&#xff…

C语言的联合体:一种节省内存的数据结构

在C语言中,联合体(union)是一种特殊的数据结构,它允许我们在相同的内存位置存储不同的数据类型。这意味着联合体中的所有成员都共享同一块内存空间,因此它们不能同时存储其各自的值。联合体的主要目的是节省内存&#…

【RT-DETR有效改进】重参数化模块DiverseBranchBlock助力特征提取(附代码 + 修改教程)

👑欢迎大家订阅本专栏,一起学习RT-DETR👑 一、本文介绍 本文给大家带来的是改进机制是一种替换多元分支模块(Diverse Branch Block),Diverse Branch Block (DBB) 是一种用于增强卷积神经网络性能的结构…

Duplicate entry ‘1xx-2xx-3xx-4xx‘ for key ‘uniq_index‘的解决方法

我在往sql数据库新增数据的时候,碰到报错类似标题。 意思大概是插入的数据重复了,下面分享两种解决办法。 第一种 找到某一节对应的字段,然后在原sql语句里改动这一节的数据,重新执行新增操作。 比如ABC20240208-aaa-yangguang-…

牛客网SQL进阶137:第二快/慢用时之差大于试卷时长一半的试卷

官网链接: 第二快慢用时之差大于试卷时长一半的试卷_牛客题霸_牛客网现有试卷信息表examination_info(exam_id试卷ID, tag试卷类别,。题目来自【牛客题霸】https://www.nowcoder.com/practice/b1e2864271c14b63b0df9fc08b559166?tpId240 0 问题描述 试…

基于tomcat的https(ssl)双向认证

一、背景介绍 某个供应商服务需要部署到海外,如果海外多个地区需要部署多个服务,最好能实现统一登录,这样可以减轻用户的使用负担(不用记录一堆密码)。由于安全问题(可能会泄露用户数据)&#x…