语音研究方向学术和工作资源清单

  • Speech-Resource
    • 国内高校
      • 清华大学
      • 北京大学
      • 上海交通大学
      • 中国科学院
      • 中国科学技术大学
      • 西北工业大学
      • 天津大学
      • 厦门大学
      • 昆山杜克大学
      • 浙江大学
      • 哈尔滨工业大学
      • 香港中文大学
      • 香港科技大学
      • 香港理工大学
      • 台湾大学
    • 海外高校
      • 剑桥大学
      • 牛津大学
      • 爱丁堡大学
      • 谢菲尔德大学
      • 蒙特利尔大学
      • 麻省理工大学
      • 卡耐基梅隆大学
      • 约翰霍普金斯大学
      • 南加州大学
      • 德克萨斯州大学达拉斯分校
      • 罗切斯特大学
      • 布尔诺理工大学
      • 俄亥俄州立大学
      • 新加坡国立大学
      • 南洋理工大学
      • 新加坡科技设计大学
      • 国立情报学研究所(Tokyo)
    • 国内企业
    • 期刊&会议
    • 竞赛
    • 公众号
    • 知乎专栏
    • 常用资源

Speech-Resource

语音方向实验室/公司/资源/实习等,欢迎推荐或自荐(排名不分先后)

国内高校

清华大学

电子工程系

  • 吴及:电子工程系副系主任,研究方向侧重于语音语言智能与医学结合
  • 张超:加入清华前为谷歌语音组Senior Research Scientist

电子工程系语音与音频技术实验室(SATLab)

  • 刘加:原实验室主任
  • 张卫强:实验室主任,语音识别、音频识别、音乐与声学信号处理

电子工程系语音处理与机器智能实验室(SPMI lab)

  • 欧志坚

清华大学信息技术研究院语音和语言技术研究中心(CSLT)

该实验室以声纹识别为特色,对应北京得意音通公司。

  • 郑方
  • 周强
  • 王东

计算机系

  • 贾珈:人机语音交互,偏向多媒体方向

清华大学人机语音交互实验室(THUHCSI)

  • 吴志勇

北京大学

计算机科学技术研究所数字音频实验室

该实验室以多媒体音视频内容的检索与挖掘为主,很多内容涉及音频方向。

  • 陈晓鸥
  • 杨德顺

深圳研究生院现代信号与数据处理实验室(ADSPLAB)

  • 邹月娴

上海交通大学

计算机系跨媒体语言智能实验室(现X-Lance,前SpeechLab)

对应思必驰公司。

  • 俞凯:实验室主任,思必驰首席科学家,语音识别与合成,语音软硬件协同
  • 钱彦旻:实验室副主任,鲁棒性、多语言、低资源语音识别,Kaldi唯一的亚洲作者
  • 吴梦玥:语音感知与生成、多模态语音
  • 陈谐:端到端语音识别,加入交大前为微软语音组Principal Researcher

电子系未来媒体协同创新中心

  • 王钰

中国科学院

自动化所模式识别国家重点实验室

  • 徐波
  • 陶建华
  • 刘文举
  • 刘斌

声学所

  • 颜永红

中国科学技术大学

语音及语言信息处理国家工程实验室

对应科大讯飞,国内领先水平。

  • 刘庆峰

  • 胡郁

  • 戴礼荣

  • 王仁华

  • 陈恩红

  • 凌震华

  • 杜俊

西北工业大学

音频语音与语言处理研究组(ASLP)

  • 谢磊

智能声学与临境通信研究中心(CIAIC)

  • 陈景东:前贝尔实验室资深研究员,信号和信息处理做的很好

天津大学

智能与计算学部

  • 党建武
  • 王龙标

厦门大学

智能科学与技术系

  • 洪青阳:天聪智能创始人,主要研究语音识别、声纹识别

昆山杜克大学

大数据研究中心(SMIIPLab)

  • 李明

浙江大学

计算机科学与技术学院

  • 赵洲

哈尔滨工业大学

计算机科学与技术学院听觉智能研究中心

  • 韩纪庆

香港中文大学

Human-Computer Communications Laboratory (HCCL)

  • Helen Meng
  • 刘循英
  • Xixin Wu

香港中文大学电子工程系

  • Tan Lee
  • Qiuqiang Kong

香港中文大学(深圳)数据科学学院

  • 李海洲
  • 武执正

香港科技大学

计算机科学与工程系

  • Brain Mak

香港理工大学

电子信息工程系

  • Man-Wai Mak

台湾大学

Speech Processing and Machine Learning Laboratory

  • 李琳山
  • 李宏毅

海外高校

剑桥大学

Machine Intelligence Laboratory - Speech Research Group

  • Steve Young: The HTK book 一作

  • Phil Woodland

  • Mark Gales

牛津大学

Visual Geometry Group

  • Andrew Zisserman

爱丁堡大学

The Centre for Speech Technology Research

  • Simon King
  • Steve Renals
  • Peter Bell
  • Hao Tang

谢菲尔德大学

Speech and Hearing Group

  • Thomas Hain
  • Jon Barker
  • Heidi Christensen
  • Roger K. Moore

蒙特利尔大学

Mila - Quebec AI Institute

  • Yoshua Bengio

麻省理工大学

MIT CSAIL

  • James Glass
  • Antonio Torralba

卡耐基梅隆大学

  • Shinji Watanabe

约翰霍普金斯大学

Center for Language and Speech Processing

  • Sanjeev Khudanpur

南加州大学

  • Shrikanth (Shri) Narayanan

德克萨斯州大学达拉斯分校

  • John Hansen

罗切斯特大学

  • Zhiyao Duan

布尔诺理工大学

Faculty of Information Technology

  • Lukas Burget
  • Jan Cernocky

俄亥俄州立大学

  • DeLiang Wang

新加坡国立大学

Human Language Technology Laboratory

  • Haizhou Li

南洋理工大学

  • Eng-Siong Chng

新加坡科技设计大学

  • Berrak Sisman

国立情报学研究所(Tokyo)

  • Junichi Yamagishi

国内企业

  • MSRA-NLC组
  • MSRA-ML组
  • 腾讯AILAB语音技术中心
  • 腾讯天籁实验室
  • 阿里达摩院智能语音实验室
  • 阿里天猫精灵
  • 字节跳动SAMI组
  • 科大讯飞
  • 搜狗
  • 百度小度
  • 小米小爱
  • 小米k2
  • 思必驰
  • 云知声
  • 出门问问WeNet
  • 标贝科技

期刊&会议

  • TPAMI(IEEE Trans on Pattern Analysis and Machine Intelligence)
  • TASLP(IEEE Transactions on Audio, Speech, and Language Processing)
  • TSLP(ACM Transactions on Speech and Language Processing)
  • ICASSP(IEEE International Conference on Acoustics, Speech and Signal Processing)
  • INTERSPEECH(Conference of the International Speech Communication Association)
  • ASRU(IEEE Automatic Speech Recognition and Understanding Workshop)
  • SLT(IEEE Spoken Language Technology Workshop)
  • SPL(IEEE Signal Processing Letters)
  • ISCSLP(International Symposium on Chinese Spoken Language Processing)
  • JSLHR(Journal of Speech, Language, and Hearing Research)
  • Computer Speech and Language
  • Speaker Odyssey
  • JASA(Journal of the Acoustical Society of America)
  • Signal Processing
  • Speech Communication

竞赛

  • CHiME
  • VCC
  • DCASE
  • NIST SRE
  • Blizzard Challenge
  • OLR东方语种识别
  • VoxSRC

公众号

  • 语音杂谈

  • 谈谈语音技术

  • WeNet步行街

  • CCF语音对话与听觉专委会

  • 语音之家

  • 智能语音青年

  • 低调奋进

  • 新一代Kaldi

知乎专栏

谈谈语音技术

自监督语音识别

Kaldi源码解析

espnet–一个端到端语音识别工具箱

新一代Kaldi

常用资源

语音识别数据集汇总

语音识别 benchmark

语音预训练 paper list

语音合成 paper list

语音增强 paper list

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/26146.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《Brave New Words 》5.1 传递真相:偏见和虚假信息现状

Part V: Keeping Kids Safe 第五部分:确保孩子安全 Never travel faster than your guardian angel can fly. —Mother Teresa 永远不要比你的守护天使飞得更快。 ——特蕾莎修女 Distrust and caution are the parents of security. —Benjamin Franklin 不信任和谨…

数据结构基础(基于c++)

数据结构基础(基于c) 文章目录 数据结构基础(基于c)前言1. 递归、迭代、时间复杂度、空间复杂度2. 数据结构 数组与链表1. 数组2. 链表3. 动态数组4. 数组与链表对比 前言 参考资料:Hello 算法 (hello-algo.com) 1. 递…

假期已结束,大家都开始上班了吗

千行赏金APP:一站式悬赏任务平台详解 一、功能特点 千行赏金APP,作为一个综合性的悬赏任务平台,其功能特点突出,为用户提供了丰富的体验。首先,用户可以在平台上发布各类任务,如填写问卷、参与调研、试玩游…

MySQL高性能(MySQL锁)

MySQL性能系列 MySQL锁 前言1. 死锁机制2. 思维导图与锁划分介绍3. 粒度划分锁3.1. 全局锁3.2. 页级锁(Page-level locking)3.3. 表级锁(Tables-level lock)○ 共享锁(表级)○ 排他锁(表级&…

安徽京准-时间源设备(时间源服务器)助力医疗信息化建设

安徽京准-时间源设备(时间源服务器)助力医疗信息化建设 安徽京准-时间源设备(时间源服务器)助力医疗信息化建设 医院时钟系统主要为全医院提供提供统一的准确时间,其主要作用是为整个医院的计算机系统及呼叫系统、BA系…

【perl】环境搭建

1、Vscode Strawberry Perl 此过程与tcl环境搭建很类似,请参考我的这篇文章: 【vscode】 与 【tclsh】 联合搭建tcl开发环境_tclsh软件-CSDN博客 perl语言的解释器可以选择,strawberry perl。Strawberry Perl for Windows - Releases。 …

如何在Linux虚拟机服务器上配置和部署Java项目?

在Linux虚拟机上配置和部署Java项目,通常涉及以下步骤: 1. 准备Linux虚拟机 选择合适的Linux发行版 :根据项目需求和个人熟悉程度,选择如Ubuntu LTS、CentOS Stream或Debian等发行版。 安装虚拟机软件 :在宿主机&#…

VS 2019 @ Win10 C++ MFC 安装实践

1 打开卸载窗口: 选择Windwos 卸载 ,笔者有多个版本,选择VS1019 现在算正式打开了VS 1019的卸载,注意千万别点确认,点击,取消,进入安装配置 点击,取消后,进入VS 的安装配…

[图解]建模相关的基础知识-08

1 00:00:01,650 --> 00:00:04,950 如果说,A乘BB乘A的话 2 00:00:06,350 --> 00:00:07,140 意味着什么 3 00:00:07,560 --> 00:00:08,420 A就等于B了 4 00:00:09,500 --> 00:00:10,680 只有两个相等 5 00:00:10,690 --> 00:00:13,360 它们的笛卡尔…

旅游卡免费旅游的使用条件有哪些?

随着旅游业的繁荣发展和消费者需求的多样化,各种旅游促销活动层出不穷。其中,旅游卡免费旅游以其独特的吸引力,成为了不少消费者关注的焦点。 然而,正如任何促销活动都有其限制条件一样,旅游卡免费旅游也不例外。在享…

计算机专业英语Computer English

计算机专业英语 Computer English 高等学校计算机英语教材 Contents 目录 Part One Computer hardware and software 计算机硬件和软件----------盖金曙 生家峰 Unit 1 the History of Computers计算机的历史 Unit 2 Computer System计算机系统 Unit 3 Di…

docker回顾--docker compose详细解释,安装,与常用命令

文章目录 Docker compose简介什么是Docker compose核心概念优势 安装常用命令总结 Docker compose简介 什么是Docker compose Docker Compose 是一个用于定义和运行多容器 Docker 应用的工具。它使得开发者可以使用一个单独的 YAML 文件来定义应用所需的所有服务、网络和卷&a…

行为树BehaviorTree

主要依托于BehaviorTree.CPP进行介绍。 1 基本概念 1.1 是什么与用来做什么 官网 https://www.behaviortree.dev/docs/learn-the-basics/BT_basics Unlike a Finite State Machine, a behavior Tree is a tree of hierarchical nodes that controls the flow of execution o…

探索正则表达式的神奇魅力

正则表达式 正则表达式,如同一位技艺精湛的艺术家,能够以极致的精准和优雅,雕刻出你想要的文本形态。它的魅力在于其简练而灵活的语法,让你得以轻松地在庞杂的文字丛林中捕捉目标。 无论是验证数据格式的合法性、从复杂文本中提…

AWS概述

AWS概述EMR Serverless Aamzon Web Services提供了一系列全球范围的云产品,包括计算、存储、数据库、分析、网络、移动、开发工具、管理工具、IoT、安全和企业应用:按需交付、及时可用、采用随用随付的定价模式。你可以畅享200多种服务,从数据…

乡村振兴的乡村基础设施建设:完善基础设施,提升乡村生活品质,打造宜居宜业的美丽乡村

摘要:乡村振兴是新时代中国特色社会主义“三农”工作的重要内容,而乡村基础设施建设作为乡村振兴的基石,对于提升乡村生活品质、打造宜居宜业的美丽乡村具有至关重要的意义。本文从乡村基础设施建设的必要性出发,分析了当前乡村基…

用GAN网络生成彩票号码

本文将详细解析如何使用生成对抗网络(GAN)来生成彩票号码。我们将介绍代码的每个部分,并给出详细注释,帮助读者理解整个过程。效果如下: 导入依赖 首先,我们需要导入所需的库。 import numpy as np import pandas as pd import torch import torch.nn as nn import t…

区分POJO、DTO、DO、VO、BO、PO、Entity

简述: VO 用于后端向前端传输数据; DTO用于前端向后端传输数据; BO用于微服务之间传输数据; PO等同于Entity,DO是Entity的一种,三者用于表示数据库的一条记录,通常用Entity。 (…

14年后 苹果终于推出iPad原生计算器应用

迄今为止,在WWDC 2024大会上,新增的计算器应用获得了最热烈的掌声。iOS 官方计算器应用程序终于要登陆大屏幕了。该功能利用额外的屏幕空间带来了公司无法在 iPhone 上实现的新功能。其中最大的亮点是新增了"数学笔记"功能。新增的功能可以帮你…

酶酵母展示技术简介

酵母展示技术(Yeast Display Technology)是指将酶序列/酶突变文库序列与凝集素Aga2p融合表达,Aga2p蛋白亚基通过两个二硫键与固定在酵母细胞壁上的Aga1p 蛋白亚基结合(即载体蛋白将蛋白酶(带有特定标签)以活…