语音研究方向学术和工作资源清单

  • Speech-Resource
    • 国内高校
      • 清华大学
      • 北京大学
      • 上海交通大学
      • 中国科学院
      • 中国科学技术大学
      • 西北工业大学
      • 天津大学
      • 厦门大学
      • 昆山杜克大学
      • 浙江大学
      • 哈尔滨工业大学
      • 香港中文大学
      • 香港科技大学
      • 香港理工大学
      • 台湾大学
    • 海外高校
      • 剑桥大学
      • 牛津大学
      • 爱丁堡大学
      • 谢菲尔德大学
      • 蒙特利尔大学
      • 麻省理工大学
      • 卡耐基梅隆大学
      • 约翰霍普金斯大学
      • 南加州大学
      • 德克萨斯州大学达拉斯分校
      • 罗切斯特大学
      • 布尔诺理工大学
      • 俄亥俄州立大学
      • 新加坡国立大学
      • 南洋理工大学
      • 新加坡科技设计大学
      • 国立情报学研究所(Tokyo)
    • 国内企业
    • 期刊&会议
    • 竞赛
    • 公众号
    • 知乎专栏
    • 常用资源

Speech-Resource

语音方向实验室/公司/资源/实习等,欢迎推荐或自荐(排名不分先后)

国内高校

清华大学

电子工程系

  • 吴及:电子工程系副系主任,研究方向侧重于语音语言智能与医学结合
  • 张超:加入清华前为谷歌语音组Senior Research Scientist

电子工程系语音与音频技术实验室(SATLab)

  • 刘加:原实验室主任
  • 张卫强:实验室主任,语音识别、音频识别、音乐与声学信号处理

电子工程系语音处理与机器智能实验室(SPMI lab)

  • 欧志坚

清华大学信息技术研究院语音和语言技术研究中心(CSLT)

该实验室以声纹识别为特色,对应北京得意音通公司。

  • 郑方
  • 周强
  • 王东

计算机系

  • 贾珈:人机语音交互,偏向多媒体方向

清华大学人机语音交互实验室(THUHCSI)

  • 吴志勇

北京大学

计算机科学技术研究所数字音频实验室

该实验室以多媒体音视频内容的检索与挖掘为主,很多内容涉及音频方向。

  • 陈晓鸥
  • 杨德顺

深圳研究生院现代信号与数据处理实验室(ADSPLAB)

  • 邹月娴

上海交通大学

计算机系跨媒体语言智能实验室(现X-Lance,前SpeechLab)

对应思必驰公司。

  • 俞凯:实验室主任,思必驰首席科学家,语音识别与合成,语音软硬件协同
  • 钱彦旻:实验室副主任,鲁棒性、多语言、低资源语音识别,Kaldi唯一的亚洲作者
  • 吴梦玥:语音感知与生成、多模态语音
  • 陈谐:端到端语音识别,加入交大前为微软语音组Principal Researcher

电子系未来媒体协同创新中心

  • 王钰

中国科学院

自动化所模式识别国家重点实验室

  • 徐波
  • 陶建华
  • 刘文举
  • 刘斌

声学所

  • 颜永红

中国科学技术大学

语音及语言信息处理国家工程实验室

对应科大讯飞,国内领先水平。

  • 刘庆峰

  • 胡郁

  • 戴礼荣

  • 王仁华

  • 陈恩红

  • 凌震华

  • 杜俊

西北工业大学

音频语音与语言处理研究组(ASLP)

  • 谢磊

智能声学与临境通信研究中心(CIAIC)

  • 陈景东:前贝尔实验室资深研究员,信号和信息处理做的很好

天津大学

智能与计算学部

  • 党建武
  • 王龙标

厦门大学

智能科学与技术系

  • 洪青阳:天聪智能创始人,主要研究语音识别、声纹识别

昆山杜克大学

大数据研究中心(SMIIPLab)

  • 李明

浙江大学

计算机科学与技术学院

  • 赵洲

哈尔滨工业大学

计算机科学与技术学院听觉智能研究中心

  • 韩纪庆

香港中文大学

Human-Computer Communications Laboratory (HCCL)

  • Helen Meng
  • 刘循英
  • Xixin Wu

香港中文大学电子工程系

  • Tan Lee
  • Qiuqiang Kong

香港中文大学(深圳)数据科学学院

  • 李海洲
  • 武执正

香港科技大学

计算机科学与工程系

  • Brain Mak

香港理工大学

电子信息工程系

  • Man-Wai Mak

台湾大学

Speech Processing and Machine Learning Laboratory

  • 李琳山
  • 李宏毅

海外高校

剑桥大学

Machine Intelligence Laboratory - Speech Research Group

  • Steve Young: The HTK book 一作

  • Phil Woodland

  • Mark Gales

牛津大学

Visual Geometry Group

  • Andrew Zisserman

爱丁堡大学

The Centre for Speech Technology Research

  • Simon King
  • Steve Renals
  • Peter Bell
  • Hao Tang

谢菲尔德大学

Speech and Hearing Group

  • Thomas Hain
  • Jon Barker
  • Heidi Christensen
  • Roger K. Moore

蒙特利尔大学

Mila - Quebec AI Institute

  • Yoshua Bengio

麻省理工大学

MIT CSAIL

  • James Glass
  • Antonio Torralba

卡耐基梅隆大学

  • Shinji Watanabe

约翰霍普金斯大学

Center for Language and Speech Processing

  • Sanjeev Khudanpur

南加州大学

  • Shrikanth (Shri) Narayanan

德克萨斯州大学达拉斯分校

  • John Hansen

罗切斯特大学

  • Zhiyao Duan

布尔诺理工大学

Faculty of Information Technology

  • Lukas Burget
  • Jan Cernocky

俄亥俄州立大学

  • DeLiang Wang

新加坡国立大学

Human Language Technology Laboratory

  • Haizhou Li

南洋理工大学

  • Eng-Siong Chng

新加坡科技设计大学

  • Berrak Sisman

国立情报学研究所(Tokyo)

  • Junichi Yamagishi

国内企业

  • MSRA-NLC组
  • MSRA-ML组
  • 腾讯AILAB语音技术中心
  • 腾讯天籁实验室
  • 阿里达摩院智能语音实验室
  • 阿里天猫精灵
  • 字节跳动SAMI组
  • 科大讯飞
  • 搜狗
  • 百度小度
  • 小米小爱
  • 小米k2
  • 思必驰
  • 云知声
  • 出门问问WeNet
  • 标贝科技

期刊&会议

  • TPAMI(IEEE Trans on Pattern Analysis and Machine Intelligence)
  • TASLP(IEEE Transactions on Audio, Speech, and Language Processing)
  • TSLP(ACM Transactions on Speech and Language Processing)
  • ICASSP(IEEE International Conference on Acoustics, Speech and Signal Processing)
  • INTERSPEECH(Conference of the International Speech Communication Association)
  • ASRU(IEEE Automatic Speech Recognition and Understanding Workshop)
  • SLT(IEEE Spoken Language Technology Workshop)
  • SPL(IEEE Signal Processing Letters)
  • ISCSLP(International Symposium on Chinese Spoken Language Processing)
  • JSLHR(Journal of Speech, Language, and Hearing Research)
  • Computer Speech and Language
  • Speaker Odyssey
  • JASA(Journal of the Acoustical Society of America)
  • Signal Processing
  • Speech Communication

竞赛

  • CHiME
  • VCC
  • DCASE
  • NIST SRE
  • Blizzard Challenge
  • OLR东方语种识别
  • VoxSRC

公众号

  • 语音杂谈

  • 谈谈语音技术

  • WeNet步行街

  • CCF语音对话与听觉专委会

  • 语音之家

  • 智能语音青年

  • 低调奋进

  • 新一代Kaldi

知乎专栏

谈谈语音技术

自监督语音识别

Kaldi源码解析

espnet–一个端到端语音识别工具箱

新一代Kaldi

常用资源

语音识别数据集汇总

语音识别 benchmark

语音预训练 paper list

语音合成 paper list

语音增强 paper list

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/26146.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《Brave New Words 》5.1 传递真相:偏见和虚假信息现状

Part V: Keeping Kids Safe 第五部分:确保孩子安全 Never travel faster than your guardian angel can fly. —Mother Teresa 永远不要比你的守护天使飞得更快。 ——特蕾莎修女 Distrust and caution are the parents of security. —Benjamin Franklin 不信任和谨…

数据结构基础(基于c++)

数据结构基础(基于c) 文章目录 数据结构基础(基于c)前言1. 递归、迭代、时间复杂度、空间复杂度2. 数据结构 数组与链表1. 数组2. 链表3. 动态数组4. 数组与链表对比 前言 参考资料:Hello 算法 (hello-algo.com) 1. 递…

假期已结束,大家都开始上班了吗

千行赏金APP:一站式悬赏任务平台详解 一、功能特点 千行赏金APP,作为一个综合性的悬赏任务平台,其功能特点突出,为用户提供了丰富的体验。首先,用户可以在平台上发布各类任务,如填写问卷、参与调研、试玩游…

MySQL高性能(MySQL锁)

MySQL性能系列 MySQL锁 前言1. 死锁机制2. 思维导图与锁划分介绍3. 粒度划分锁3.1. 全局锁3.2. 页级锁(Page-level locking)3.3. 表级锁(Tables-level lock)○ 共享锁(表级)○ 排他锁(表级&…

【perl】环境搭建

1、Vscode Strawberry Perl 此过程与tcl环境搭建很类似,请参考我的这篇文章: 【vscode】 与 【tclsh】 联合搭建tcl开发环境_tclsh软件-CSDN博客 perl语言的解释器可以选择,strawberry perl。Strawberry Perl for Windows - Releases。 …

如何在Linux虚拟机服务器上配置和部署Java项目?

在Linux虚拟机上配置和部署Java项目,通常涉及以下步骤: 1. 准备Linux虚拟机 选择合适的Linux发行版 :根据项目需求和个人熟悉程度,选择如Ubuntu LTS、CentOS Stream或Debian等发行版。 安装虚拟机软件 :在宿主机&#…

VS 2019 @ Win10 C++ MFC 安装实践

1 打开卸载窗口: 选择Windwos 卸载 ,笔者有多个版本,选择VS1019 现在算正式打开了VS 1019的卸载,注意千万别点确认,点击,取消,进入安装配置 点击,取消后,进入VS 的安装配…

[图解]建模相关的基础知识-08

1 00:00:01,650 --> 00:00:04,950 如果说,A乘BB乘A的话 2 00:00:06,350 --> 00:00:07,140 意味着什么 3 00:00:07,560 --> 00:00:08,420 A就等于B了 4 00:00:09,500 --> 00:00:10,680 只有两个相等 5 00:00:10,690 --> 00:00:13,360 它们的笛卡尔…

docker回顾--docker compose详细解释,安装,与常用命令

文章目录 Docker compose简介什么是Docker compose核心概念优势 安装常用命令总结 Docker compose简介 什么是Docker compose Docker Compose 是一个用于定义和运行多容器 Docker 应用的工具。它使得开发者可以使用一个单独的 YAML 文件来定义应用所需的所有服务、网络和卷&a…

行为树BehaviorTree

主要依托于BehaviorTree.CPP进行介绍。 1 基本概念 1.1 是什么与用来做什么 官网 https://www.behaviortree.dev/docs/learn-the-basics/BT_basics Unlike a Finite State Machine, a behavior Tree is a tree of hierarchical nodes that controls the flow of execution o…

乡村振兴的乡村基础设施建设:完善基础设施,提升乡村生活品质,打造宜居宜业的美丽乡村

摘要:乡村振兴是新时代中国特色社会主义“三农”工作的重要内容,而乡村基础设施建设作为乡村振兴的基石,对于提升乡村生活品质、打造宜居宜业的美丽乡村具有至关重要的意义。本文从乡村基础设施建设的必要性出发,分析了当前乡村基…

用GAN网络生成彩票号码

本文将详细解析如何使用生成对抗网络(GAN)来生成彩票号码。我们将介绍代码的每个部分,并给出详细注释,帮助读者理解整个过程。效果如下: 导入依赖 首先,我们需要导入所需的库。 import numpy as np import pandas as pd import torch import torch.nn as nn import t…

14年后 苹果终于推出iPad原生计算器应用

迄今为止,在WWDC 2024大会上,新增的计算器应用获得了最热烈的掌声。iOS 官方计算器应用程序终于要登陆大屏幕了。该功能利用额外的屏幕空间带来了公司无法在 iPhone 上实现的新功能。其中最大的亮点是新增了"数学笔记"功能。新增的功能可以帮你…

黑豹程序员 堆和栈

简单变量及作用域 main()   int x1; show ()   int x2 执行步骤: 第1步:main()函数是程序入口,JVM先执行,在栈内存中开辟一个空间,存放int类型变量x,同时附值1。 第2步:JVM执行show()函…

ZDH-智能营销-标签模块

目录 主题 项目源码 预览地址 安装包下载地址 标签模块 什么是标签 标签场景分类 标签设计 标签按照场景做了分类,但是运营人员需要感知到吗 标签按照场景做了分类,底层的计算引擎是否需要划分? 标签模块,是否需要涉及…

最新thinkphp5内核全开源女神赢口红H5公众号版第五版(100%可经营)

最新thinkphp5内核全开源女神赢口红H5公众号版第五版(100%可经营) 搭建教程 1、程序为thinkPHP5开发 php版本要求5.6!不支持虚拟主机! 2、上传程序到您的根目录!导入m213.sql文件!修改数据库配置文件app…

WordPress模板推荐

WordPress外贸主题 wordpress跨境电商独立站主题,wordpress外贸建站模板。 手机配件wordpress外贸网站模板 充电器、移动电源、手机膜、手机电池、手机壳、手机转接头等手机配件wordpress外贸网站模板。 毛巾WordPress外贸主题 毛巾、面巾、婴童毛巾、浴巾、方巾、…

2024 AEE | 风丘科技将亮相日本爱知国际会展中心——共同创造!

2024年名古屋汽车工程博览会(Automotive Engineering Exposition 2024 NAGOYA)将于7月17-19日在日本爱知县国际展示场(Aichi Sky Expo)开展。本展会是专门为活跃在汽车行业的工程师和研究人员举办的汽车技术展览,汇聚了…

Python办公MySQL(一):安装MySQL以及Navicat可视化工具(附送Navicat到期解决方法)

目录 专栏导读1、下载 MySQL Community Server2、安装3、安装Navicat4、连接刚刚安装的MySQL5、创建一个数据库方法1方法2 6、创建一张表方法1:准备一个test文件方法2: Navicat到期解决总结 专栏导读 🌸 欢迎来到Python办公自动化专栏—Pytho…

干货 | 2024元宇宙技术融合与新质生产力的创新实践(免费下载)

【1】关注本公众号,转发当前文章到微信朋友圈 【2】私信发送 【3】获取本方案PDF下载链接,直接下载即可。 如需下载本方案PPT/WORD原格式,请加入微信扫描以下方案驿站知识星球,获取上万份PPT/WORD解决方案!&#xff…