白话机器学习4:小波分解的原理与Python代码实现

        小波去噪可以想象成使用一把“筛子”来过滤信号。这个“筛子”能够根据信号的不同频率成分,将其分解成多个层次。在这个过程中,信号的重要信息通常包含在低频部分,而噪声则多分布在高频部分。

        将信号通过这个“筛子”分解后,我们可以对那些包含噪声的高频部分进行“削弱”或“切除”,然后再将剩下的部分重新组合起来。这样,经过处理的信号就会保留下重要的信息,同时去除了很多噪声。

一、数学原理详解

小波变换通过一系列可缩放(尺度变化)和平移的基函数来表示信号。这些基函数称为小波函数。

小波函数 \psi(t)具有一定的时间长度并集中在频率上,可以通过缩放(dilation)和平移(translation)来拟合信号的不同部分:

\psi_{a,b}(t) = \frac{1}{\sqrt{a}} \psi\left(\frac{t-b}{a}\right)

其中 a 是尺度参数,b 是平移参数。

分解:

信号f(t)可以通过小波函数的线性组合来分解:

f(t) = \sum_{a,b} c_{a,b} \psi_{a,b}(t)

其中c_{a,b}是小波系数。

在实际操作中,通过离散小波变换DWT,我们可以得到信号在不同尺度和位置的小波系数。

去噪

小波去噪的步骤通常包括:

  1. 选择小波基:选择一个适当的小波函数,比如Daubechies小波。

  2. 多尺度分解:将信号进行多层分解,得到不同尺度上的小波系数。

  3. 阈值处理:对小波系数应用阈值规则。系数小于某个阈值的被视为噪声并设置为零或减小其值。阈值的选择是一个关键步骤,常用的方法有软阈值和硬阈值。软阈值方法会对系数进行收缩,而硬阈值方法会直接将小于阈值的系数置为零。

    硬阈值

    软阈值:  d'{ij} = \text{sign}(d{ij}) \cdot (\max(|d_{ij}| - \lambda, 0)) 

    其中d_{ij}是分解得到的小波系数,\lambda是阈值,d'_{ij}是处理后的小波系数。

  4. 重构信号:使用阈值处理后的小波系数重构信号,这样得到的信号中噪声就会被减少。

二、Python代码实现

import matplotlib.pyplot as plt
import pywt
import seaborn as snssns.set(context='notebook', style='darkgrid', palette='deep', font='sans-serif', font_scale=1, color_codes=False, rc=None)
plt.rcParams['axes.unicode_minus'] = False  # 防止坐标为负时出现乱码
ecg = [......]  # 改成自己的数据index = []
data = []
for i in range(len(ecg) - 1):X = float(i)Y = float(ecg[i])index.append(X)data.append(Y)# Create wavelet object and define parameters
w = pywt.Wavelet('db4')  # 选用Daubechies4小波maxlev = pywt.dwt_max_level(len(data), w.dec_len)
print("maximum level is " + str(maxlev))
# threshold = 0.04  # Threshold for filtering
threshold = 0.08
# Decompose into wavelet components, to the level selected:
coeffs = pywt.wavedec(data, 'db4', level=maxlev)  # 将信号进行小波分解plt.figure()
for i in range(1, len(coeffs)):coeffs[i] = pywt.threshold(coeffs[i], threshold * max(coeffs[i]))  # 将噪声滤波datarec = pywt.waverec(coeffs, 'db4')  # 将信号进行小波重构mintime = 0
maxtime = mintime + len(data) + 1# plt.xkcd()  # 胆小勿入
# plt.figure()
plt.subplot(2, 1, 1)
plt.plot(index[mintime:maxtime], data[mintime:maxtime], linewidth=1.1, color='r')
plt.xlabel('time (s)')
plt.ylabel('microvolts (uV)')
plt.title("Raw signal")
plt.subplot(2, 1, 2)
plt.plot(index[mintime:maxtime], datarec[mintime:maxtime - 1], linewidth=1.1, color='r')
plt.xlabel('time (s)')
plt.ylabel('microvolts (uV)')
plt.title("De-noised signal using wavelet techniques")plt.tight_layout()
plt.show()

三、结果展示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/837406.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

leetcode-最长公共子序列(二)-103

题目要求 思路 step 1:优先检查特殊情况。 step 2:获取最长公共子序列的长度可以使用动态规划,我们以dp[i][j]dp[i][j]dp[i][j]表示在s1中以iii结尾,s2中以jjj结尾的字符串的最长公共子序列长度。 step 3:遍历两个字…

同为科技详解智能PDU所应用的通信协议与接口

现如今,信息服务、AI人工智能的飞速发展与增长,全球正经历信息数据的爆炸。不仅数据量以惊人的速度增长,而且全球社会各行业对数据的依赖的程度也在日益增加。这些趋势使数据中心在全球都享有关键基础架构的地位。假设某个数据中心发生严重的…

数据采集为什么会用到代理IP?

在数据采集中,代理IP是指通过使用代理服务器来隐藏或更改真实的IP地址,以访问目标网站或服务器。那么,数据采集为什么会用到代理IP呢?使用代理IP通常用于匿名地访问网站、绕过访问限制或提高数据采集的效率和安全性。 代理服务器作…

HCIA和HCIP区别大吗?小白请看这

华为认证以其专业性和实用性受到了业界的广泛认可。 HCIA、HCIP、HCIP这三个级别,你会选哪个?IE含金量不用多说,IA还是IP,你会纠结吗。 但面对这两个级别的认证,初学者或者“小白”们可能会感到困惑:两者…

以大开放促进大开发 | 陕西粮农集团携手开源网安引领新时代西部大开发

​5月13日,开源网安与陕西粮农集团成功签署战略合作协议。双方将在网络安全保障体系建设及人才培养领域展开深度合作,共同筑牢陕西省数字经济建设安全屏障。陕西省粮农信息技术有限公司总经理解玮峰、陕西省粮农信息技术有限公司安全事业部负责人马德君、…

易康001:易康多尺度分割结果异常

前言 易康是一种在遥感领域常用的数据处理软件,它主要是用于面向对象的分类,涵盖了分割、模糊分类、监督分类等流程。但是在进行多尺度分割时,往往会遇到一些问题,例如下面图片所示: 1 多尺度分割问题 这种问题一般是…

品鉴中的品鉴笔记:如何记录和分享自己的品鉴心得

品鉴云仓酒庄雷盛红酒的过程,不仅是品尝美酒,更是一次与葡萄酒深度对话的旅程。为了更好地记录和分享自己的品鉴心得,养成写品鉴笔记的习惯是十分必要的。 首先,选择一个适合的记录工具。可以是传统的笔记本,也可以是…

3DGS+3D Tiles融合已成 ,更大的场景,更细腻的效果~

最近国外同行Kieran Farr发布了一个他制作的3D GussianSplatting(高斯泼溅)Google Map 3D Tiles的融合叠加的demo案例(如下所示)。 准确来说这是一个数据融合的实景场景,该实景场景使用了倾斜三维和3D GussianSplatting两种实景表达技术&…

内存卡惊现0字节!数据丢失怎么办?

在日常使用电子设备的过程中,有时我们会遇到一个令人困惑的问题——内存卡突然变成了0字节。这意味着原本存储在内存卡中的数据似乎在一夜之间消失得无影无踪,给用户带来极大的困扰。本文将详细解析内存卡0字节现象,探究其原因,并…

【高阶数据结构】并查集 {并查集原理;并查集优化;并查集实现;并查集应用}

一、并查集原理 在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类…

构建NFS远程共享存储

目录 一. NFS介绍 二. 网络附加存储(NAS)设备 三. 远程过程调用 四. 实验测试 4.1 nfs-server操作 4.1.1 新建一个目录作为共享 4.1.2 新增一个磁盘作为共享 4.2 web1 客户端操作 一. NFS介绍 NFS(Network File System&#xff09…

UTONMOS探索元宇宙:开启未来数字世界的无限可能

在科技的浪潮中,元宇宙如同一颗璀璨的星辰,冉冉升起,吸引着无数人的目光。 元宇宙,一个超越现实的数字世界,它融合了虚拟现实、增强现实和互联网等多种技术,为人们打造了一个全新的沉浸式体验空间。在这里…

数据结构--顺序表和链表的区别

顺序表和链表之间各有优劣,我们不能以偏概全,所以我们在使用时要关注任务的注重点,以此来确定我们要使用两者中的哪一个。 不同点: 存储空间上: 顺序表在物理结构上是一定连续的,而链表(这里以带头双向循环…

面 试 题

过滤器和拦截器的区别 都是 Aop 思想的一种体现,用来解决项目中 某一类 问题的两种接口(工具),都可以对请求做一些增强 出身 过滤器来自 servlet 拦截器来自 spring 使用范围 过滤器 Filter 实现了 iavax.servlet.Filter 接口,也就是说…

CSS实现渐变色

渐变色分为线性渐变和径向渐变。 线性渐变linear-gradient(方向, 颜色1, 颜色2, … ,颜色n)径向渐变radial-gradient(颜色1 覆盖区域大小, 颜色2 覆盖区域大小, … ) 线性渐变的方向可以为: ​ 1、一个方向值时: to bottom 表示从上边到下边渐变 ​ 2、…

Spring AI多模态接口开发

文章目录 项目地址创建项目配置项目接口开发结果测试测试接口测试在线图片接口测试本地图片接口测试 项目地址 Spring AI项目开发 创建项目 打开IDEA创建一个新的spring boot项目,填写项目名称和位置,类型选择maven,组、工件、软件包名称可…

Android 11 输入系统之InputDispatcher和应用窗口建立联系

InputDispatcher把输入事件传给应用之前,需要和应用窗口建立联系,了解了这个过程,就清楚了APP进程和InputDispatcher线程也就是SystemServer进程之间是如何传输数据了 我们向窗口addView的时候,都会调用到ViewRootImpl的setView方…

Docker 部署 Nginx 实现一个极简的 负载均衡

背景: Nginx是异步框架的网页服务器,其常用作反向代理(负载均衡器)。在一般的小项目中, 服务器不多, 如果不考虑使用服务注册与发现, 使用Nginx 可以容易实现负载均衡。 在特此写一个快速入门 Nginx 的技术贴, 使用 Docker 部署 Nginx, 实现一个极简的加权轮询负载均…

现在的原创内容博客 SEO 最好就选谷歌和必应!

当我们在国内讨论搜索引擎优化的时候,我们经常讨论的是百度 SEO,很少提及 Bing 搜索与 Google 搜索,但随着跨境电商的崛起,在国内做外贸 SEO 的小伙伴越来越多,有效的了解 Bing 搜索与 Google 搜索的优化规则是很有必要…

开源aodh学习小结

1 介绍 aodh是openstack监控服务(Telemetry)下的一个模块,telemetry下还有一个模块ceilometer OpenStack Docs: 2024.1 Administrator Guides Get Started on the Open Source Cloud Platform - OpenStack Telemetry - OpenStack 1.1 代码仓…