文献阅读:Semantic Communications for Speech Signals

目录

    • 论文简介
    • 动机:为什么作者想要解决这个问题?
    • 贡献:作者在这篇论文中完成了什么工作(创新点)?
    • 规划:他们如何完成工作?
    • 自己的看法(作者如何得到的创新思路)


论文简介

  • 作者
    Zhenzi Weng
    Zhijin Qin
    Geoffrey Ye Liy

  • 发表期刊or会议
    《ICC》

  • 发表时间
    2021.6


动机:为什么作者想要解决这个问题?

  • 对语音信号传输的语义通信的研究没有开展
  • 论文里提到:分块设计系统已被证明是次优的,传统的线性信号处理算法无法捕获实际信道中的许多缺陷和非线性

贡献:作者在这篇论文中完成了什么工作(创新点)?

  • 首次提出了语音信号语义通信系统DeepSC-S,将整个收发器视为两个深度神经网络(speech encoder——注意力机制;channel encoder——CNN),并联合设计语音编码和信道编码来处理信源失真和信道效应。
  • DeepSC-S基于squeeze and excitation (SE) networks (就是找了一个那时候比较火的网络罢了)
  • 通过在固定衰落信道和信噪比下训练 DeepSC-S,然后在动态信道(AWGN,瑞丽,莱斯)环境下测试,所提出的 DeepSC-S 具有高度鲁棒性,无需网络调整和重新训练(这太扯了)

规划:他们如何完成工作?

  • 整体框架

    在这里插入图片描述
    在这里插入图片描述
    这结构真没什么好说的,需要的时候看论文II和III吧(和DeepSC一个套路,就在这encoder,decoder的)

  • 损失函数

    采用均方误差(MSE)作为损失函数,测量 s s s s ^ \hat s s^之间的差异
    L M S E ( θ T , θ R ) = 1 W ∑ w = 1 W ( s w − s ^ w ) 2 \mathcal{L}_{M S E}\left(\boldsymbol{\theta}^{\mathcal{T}}, \boldsymbol{\theta}^{\mathcal{R}}\right)=\frac{1}{W} \sum_{w=1}^W\left(s_w-\widehat{s}_w\right)^2 LMSE(θT,θR)=W1w=1W(sws w)2

  • 误差度量

    采用信号失真比(SDR)来测量 s s s s ^ \hat s s^之间的L2误差:
    S D R = 10 log ⁡ 10 ( ∥ s ∥ 2 ∥ s − s ^ ∥ 2 ) . S D R=10 \log _{10}\left(\frac{\|\boldsymbol{s}\|^2}{\|\boldsymbol{s}-\widehat{\boldsymbol{s}}\|^2}\right) . SDR=10log10(ss 2s2).


自己的看法(作者如何得到的创新思路)

这篇论文,一言难尽,大概就是找一个新场景(speech),再找一个那时候流行的网络结构(attention),然后套上语义的壳,就是一篇ICC 😭
选择大于努力


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/65752.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023 AZ900备考

文章目录 如何学习最近准备考AZ900考试,找了一圈文档,结果发现看那么多文档,不如直接看官方的教程https://learn.microsoft.com/zh-cn/certifications/exams/az-900/ ,简单直接,突然想到纳瓦尔宝典中提到多花时间进行思…

linux安装firefox

1.下载对应包 https://www.mozilla.org/en-US/firefox/all/#product-desktop-release 2. 挂载桌面链接(如果/usr/bin/firefox下有的话,先删除) ln -s /opt/firefox/firefox /usr/bin/firefox 3.执行以下命令,即可启动Firefox客户端: firefox

Windows 重新映射 CapsLock 大写锁定到 Ctrl

Windows 重新映射 CapsLock 大写锁定到 Ctrl 本要点中的这些方法适用于我的美国键盘布局。我不确定其他布局。如果出现问题,请恢复您的更改;删除您创建的注册表项(并重新启动)。 强烈推荐 方法5 ctrl2cap,因为不会影…

《开发实战》14 | Spring框架:IoC和AOP是扩展的核心

14 | Spring框架:IoC和AOP是扩展的核心 IOC、AOP IoC,其实就是一种设计思想,为什么要让容器来管理对象呢?或许你能想到的是,使用 IoC 方便、可以实现解耦。但在我看来,相比于这两个原因,更重要…

Linux 基础篇

很长时间,因为一些事情,没有更新我的文章这让我很惭愧,于是我将打算在今天更新下自己的文章,我发现一些事情,计算机并不是很难学到可以工作的水平,关键在于是否可以坚持下来,有很多时候我并不是…

java项目mysql转postgresql

特殊函数 : mysql: find_in_set(?, ancestors) postgresql: ? ANY (string_to_array(ancestors,,)) mysql: date_format(t1.oper_time, %Y-%m-%d) postgresql: rksj::date to_char(inDate,YYYY-MM-DD) mysql&am…

vue中的nextTick的作用

vue里面,常用的事件onMounted里,总喜欢用一个nextTick: onMounted(() > {nextTick(() > {init();}); });这个东西有啥用呢?我总搞不懂。 今天我忽然有点明白了。这是一个跟前面语句有关的方法。意思是,等前面的…

Linux 配置Java 环境变量

1.修改 profile vim /etc/profile2.增加环境变量 # java env start export JAVA_HOME{java安装目录}export PATH$JAVA_HOME/bin:$PATHexport CLASSPATH.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar # java env end3.刷新配置 source /etc/profile4.验证 echo $JAVA_H…

【Redis】Redis 的学习教程(七)之 SpringBoot 集成 Redis

在前几篇文章中,我们详细介绍了 Redis 的一些功能特性以及主流的 java 客户端 api 使用方法。 在当前流行的微服务以及分布式集群环境下,Redis 的使用场景可以说非常的广泛,能解决集群环境下系统中遇到的不少技术问题,在此列举几…

Vue.js安装步骤和注意事项

安装完node.js后开始安装和部署Vue在检查webpack的下载版本时出现错误出现错误的原因是之前下载时未指定对应的版本号导致版本不兼容先卸载掉之前下载的版本 cnpm uninstall webpack-cli -g cnpm install webpack-cli4.9.2 -g 最后检查版本是否对应

信息化发展19

数据结构模型 1 、数据结构模型是数据库系统的核心。数据结构模型描述了在数据库中结构化和操纵数据的方法, 模型的结构部分规定了数据如何被描述(例如树、表等)。模型的操纵部分规定了数据的添加、删除、显示、维护、打印、查找、选择、排序…

React:props说明

props是只读对象(readonly) 根据单项数据流的要求,子组件只能读取props中的数据,不能进行修改props可以传递任意数据 数字、字符串、布尔值、数组、对象、函数、JSX import FileUpdate from ./FileUpdate; export default class …

分数问题善用移项:0902T2

其实就是分数规划,但不完全是。 对于求 ∑ p i l i ∑ l i \Large\frac{\sum p_il_i}{\sum l_i} ∑li​∑pi​li​​ 在限定条件下的最大值,此类问题可以考虑二分答案并移项。 ∑ p i l i ∑ l i ≥ k \Large\frac{\sum p_il_i}{\sum l_i}\ge k ∑li​…

[dasctf]misc3 chrchrchr.pcapng

webshell 流量分析 php代码部分没啥看的,主要在标黄的部分,裁剪掉前面的字符可base解码 能看到在向a.txt中写入数据 wp # tshark.exe -r chrchrchr.pcapng -T fields -e urlencoded-form.value -Y "urlencoded-form.keyzd2ebbfb26dd" >…

【Linux】Libevent相关小知识总结

Libevent是基于事件的,也就是说,相当于去注册一个事件,当这个事件发生的话,那么就会调用回调函数。

8.(Python数模)马尔科夫链预测

Python实现马尔科夫链预测 马尔科夫链原理 马尔科夫链是一种进行预测的方法,常用于系统未来时刻情况只和现在有关,而与过去无关。 用下面这个例子来讲述马尔科夫链。 如何预测下一时刻计算机发生故障的概率? 当前状态只存在0(故…

windows环境装MailHog

背景:win10系统,windows 宝塔,laravel 项目,邮件相关需要装一个MailHog 下载地址:https://sourceforge.net/projects/mailhog.mirror/ 直接下载,下载后双击运行就可以了,系统可能提示”不信任“…

5.0: Dubbo服务导出源码解析

#Dubbo# 文章内容 Dubbo服务导出基本原理分析Dubbo服务注册流程源码分析Dubbo服务暴露流程源码分析服务导出的入口方法为ServiceBean.export(),此方法会调用ServiceConfig.export()方法,进行真正的服务导出。 1. 服务导出大概原理 服务导出的入口方法为ServiceBean.export…

Latex表格内换行

遇到表格内容太长,需要换行。 宏包: \usepackage{makecell}使用方法 \begin{center}\tabcaption{表格}\label{tab:2}\renewcommand\tabcolsep{7pt}%调整表格长度\begin{tabular} {cccccccccc}\toprule参数&参数&\makecell{最大\\数值} \\$a$&a…

【javaweb】学习日记Day8 - Mybatis入门 Mysql 多表查询 事务 索引

之前学习过的SQL语句笔记总结戳这里→【数据库原理与应用 - 第六章】T-SQL 在SQL Server的使用_Roye_ack的博客-CSDN博客 【数据库原理与应用 - 第八章】数据库的事务管理与并发控制_一级封锁协议_Roye_ack的博客-CSDN博客 目录 一、多表查询 1、概述 (1&#…