怎样建设商城网站/百度seo优化方法

怎样建设商城网站,百度seo优化方法,网站怎么做才能赚钱,软件工程属于什么专业类别假设 部分多标签学习(PML)假设:假设样本的标签集合中存在伪正标签,即某些标签可能是错误的。目标是从候选标签集中识别出真实标签。特征与标签的关系假设:假设不同的标签对应的特征子空间可能是不同的,而不…

假设

  1. 部分多标签学习(PML)假设:假设样本的标签集合中存在伪正标签,即某些标签可能是错误的。目标是从候选标签集中识别出真实标签。
  2. 特征与标签的关系假设:假设不同的标签对应的特征子空间可能是不同的,而不是所有标签共享相同的特征空间。

技术路线

论文提出了一种新的基于标签置信度的特征选择方法(LCFS-PML),其核心技术路线包括:

  1. 计算标签置信度:通过以下两个指标评估标签是否可靠:
    • 同标签样本的平均距离 d avg d_{\text{avg}} davg):同一标签的样本之间的平均距离,距离越小说明标签越可靠。
    • 到聚类中心的距离 d C d_C dC):样本到该标签的聚类中心的距离,距离越小说明标签置信度越高。
  2. 特征与标签的联合优化
    • 在每个标签的独特特征子空间中计算标签置信度,并去除低置信度的伪标签。
    • 通过优化特征子空间来进一步提升标签置信度,使特征和标签相互优化。
  3. 交替优化策略
    • 先优化特征子空间:去除冗余和歧义特征,提高分类能力。
    • 再优化标签置信度:基于优化后的特征重新计算标签置信度,并筛选掉伪正标签。
    • 不断循环迭代,直到达到收敛。

创新点

  1. 引入标签置信度评估方法
    • 结合 同标签样本的平均距离样本到聚类中心的距离,更准确地评估标签的真实性。
  2. 提出基于标签的特征选择策略
    • 不是所有标签共享相同的特征空间,而是为每个标签建立单独的最优特征子空间,提高了学习的精度。
  3. 采用特征-标签交替优化策略
    • 在特征优化和标签优化之间形成一个闭环,使两个过程相互促进,提高模型的稳定性和鲁棒性。

数学公式

  1. 标签置信度计算
    • 同标签样本的平均距离

d avg , i , l = 1 K ∑ j = 1 K d ( f i l , f j l ) d_{\text{avg}, i, l} = \frac{1}{K} \sum_{j=1}^{K} d(f_i^l, f_j^l) davg,i,l=K1j=1Kd(fil,fjl)
其中, f i l f_i^l fil 表示第 i i i 个样本在标签 l l l 对应的特征子空间中的表示, K K K 为最近邻样本数量。

  • 到聚类中心的距离

d C , i , l = min ⁡ c ∈ C l d ( f i l , c ) d_{C, i, l} = \min_{c \in C_l} d(f_i^l, c) dC,i,l=cClmind(fil,c)
其中, C l C_l Cl 是标签 l l l 的聚类中心集合。

  • 标签置信度公式

T i , l = exp ⁡ ( − ( 1 + λ ) ⋅ d avg ⋅ d C λ d avg + d C ) T_{i, l} = \exp\left( \frac{-(1 + \lambda) \cdot d_{\text{avg}} \cdot d_C}{\lambda d_{\text{avg}} + d_C} \right) Ti,l=exp(λdavg+dC(1+λ)davgdC)
其中, λ \lambda λ 是一个权重参数,用于平衡两种距离的影响。

  1. 优化目标函数
    • 联合优化特征和标签

min ⁡ W , S ∥ X ( W + S ) − L ∥ F 2 + α ∥ X W − L ∗ ∥ F 2 + β ∥ W ∥ 2 , 1 + γ ∥ S ∥ 1 \min_{\mathbf{W}, \mathbf{S}} \| \mathbf{X} (\mathbf{W} + \mathbf{S}) - \mathbf{L} \|_F^2 + \alpha \| \mathbf{X} \mathbf{W} - \mathbf{L}^* \|_F^2 + \beta \| \mathbf{W} \|_{2,1} + \gamma \| \mathbf{S} \|_1 W,SminX(W+S)LF2+αXWLF2+βW2,1+γS1
其中:
- W \mathbf{W} W 是特征-标签映射矩阵。
- S \mathbf{S} S 是用于去除冗余特征的稀疏矩阵。
- L \mathbf{L} L 是原始带噪声的标签矩阵,而 L ∗ \mathbf{L}^* L 是经过优化的真实标签矩阵。
- α , β , γ \alpha, \beta, \gamma α,β,γ 是超参数,用于平衡不同损失项的影响。


技术实现细节

  1. 初始化

    • 计算完整特征空间中的标签置信度矩阵 T T T
    • 设定特征选择比例 p p p,用于筛选出每个标签的关键特征子集。
  2. 交替优化过程

    • 优化特征选择矩阵 W W W
      • 通过梯度下降法优化 W W W,确保其稀疏性,降低特征冗余度。
    • 优化噪声标签矩阵 S S S
      • 采用 交替方向乘子法(ADMM) 解决优化问题,使 S S S 具有良好的稀疏性。
    • 更新标签置信度矩阵 T T T
      • 计算每个标签的最佳特征子空间,并在该子空间中重新评估标签置信度。
  3. 迭代收敛

    • 不断重复上述步骤,直到目标函数的损失值收敛。

实验与结论

  • 数据集:在多个真实世界数据集(如 Music_emotion, Mirflickr, YeastBP)和合成数据集上进行实验。

  • 对比方法

    • LSNRFS:基于标签-特征相关性的特征选择方法。
    • PML-FSSO:采用低维子空间来进行特征选择。
    • PML-LD:通过重构标签分布进行部分多标签预测。
    • PAMB:将 PML 问题转化为多个二分类问题进行优化。
    • ML-KNN:基于 K 近邻的方法进行多标签分类。
  • 实验结果

    • 在多个数据集上,LCFS-PML 的性能优于现有方法
      • Micro-F1、AP(平均精度)提高显著,表明分类质量更优。
      • HL(汉明损失)降低,说明减少了错误分类。
      • One-error 降低,表明该方法能更准确地预测最可能的正确标签。
  • 消融实验分析

    • 去除标签置信度计算后(LCFS-A),模型性能显著下降,说明标签置信度是关键因素。
    • 去除标签-特征映射后(LCFS-B),优化过程不稳定,验证了特征子空间优化的重要性。
  • 收敛性分析

    • 目标函数的损失值在 20-30 次迭代后趋于稳定,表明优化过程收敛快速。
  • 计算复杂度

    • 时间复杂度 约为 O ( n 2 d + n d l + l 2 d ) O(n^2d + ndl + l^2d) O(n2d+ndl+l2d),其中 n n n 是样本数, d d d 是特征维度, l l l 是标签数。

总结

  1. LCFS-PML 能够有效去除伪正标签,提高分类性能。
  2. 采用特征-标签交替优化策略,使特征子空间和标签置信度相互提升。
  3. 实验表明该方法优于已有 PML 方法,特别适用于高维数据和噪声标签数据。
  4. 计算复杂度较合理,收敛速度较快,适用于大规模数据集。

此方法为部分多标签学习提供了一种新的解决方案,在未来研究中可以拓展到更多实际应用,如文本分类、基因分析、图像标注等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/73767.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Lora微LLAMA模型实战

引言 本文介绍如何复现Alpaca-lora,即基于alpaca数据集用lora方法微调Llama模型。 环境准备 实验环境用的是lanyun,新用户点击注册可以送算力。 下载huggingface上的模型是一个令人头疼的问题,但在lanyun上可以通过在终端运行source /etc…

什么是站群服务器?站群服务器应该怎么选?

站群服务器是专门用于托管和管理多个网站的服务器。通常用于SEO优化、内容分发、广告推广等场景,用户可以通过一个服务器管理多个站点,提升效率并降低成本。选择站群服务器时,需根据业务需求、性能要求、IP资源等因素进行综合考虑。 什么是站…

【LInux进程六】命令行参数和环境变量

【LInux进程六】命令行参数和环境变量 1.main函数的两个参数2.利用main函数实现一个简单的计算器3.环境变量之一:PATH4.修改PATH5.在命令行解释器bash中查看所有环境变量6.用自己写的程序查看环境变量7.main函数的第三个参数8.本地的环境变量和环境变量9.环境变量具…

大语言模型的压缩技术

尽管人们对越来越大的语言模型一直很感兴趣,但MistralAI 向我们表明,规模只是相对而言的,而对边缘计算日益增长的兴趣促使我们使用小型语言获得不错的结果。压缩技术提供了一种替代方法。在本文中,我将解释这些技术,并…

大华HTTP协议在智联视频超融合平台中的接入方法

一. 大华HTTP协议介绍 大华HTTP协议是大华股份(Dahua Technology)为其安防监控设备开发的一套基于HTTP/HTTPS的通信协议,主要用于设备与客户端(如PC、手机、服务器)之间的数据交互。该协议支持设备管理、视频流获取、…

7、vue3做了什么

大佬认为有何优点: 组合式api----逻辑集中、对ts有更好的支持RFC–开放了一个讨论机制,可以看到每一个api的提案,方便源码维护,功能扩展,大家一起讨论 官方rfc响应式独立,new Proxy,天生自带来…

多人在线聊天系统,创建群,视频,语音,自带带授权码

多人在线聊天系统,创建群,视频,语音 带授权码,授权码限制 10 个网站,需要下载研究吧 在线聊天,创建群,表情,图片,文件,视频,语音,自…

NFC 碰一碰发视频源码搭建,支持OEM

一、引言 NFC(Near Field Communication)近场通信技术,以其便捷、快速的数据交互特性,正广泛应用于各个领域。其中,NFC 碰一碰发视频这一应用场景,为用户带来了新颖且高效的视频分享体验。想象一下&#x…

C++从入门到入土(八)——多态的原理

目录 前言 多态的原理 动态绑定与静态绑定 虚函数表 小结 前言 在前面的文章中,我们介绍了C三大特性之一的多态,我们主要介绍了多态的构成条件,但是对于多态的原理我们探讨的是不够深入的,下面这这一篇文章,我们将…

Linux目录理解

前言 最近在复习linux,发现有些目录总是忘记内容,发现有些还是得从原义和实际例子去理解会记忆深刻些。以下是个人的一些理解 Linux目录 常见的Linux下的目录如下: 1. 根目录 / (Root Directory) 英文含义:/ 是文件系统的根…

c++领域展开第十七幕——STL(vector容器的模拟实现以及迭代器失效问题)超详细!!!!

文章目录 前言vector——基本模型vector——迭代器模拟实现vector——容量函数以及push_back、pop_backvector——默认成员函数vector——运算符重载vector——插入和删除函数vector——实现过程的问题迭代器失效memcpy的浅拷贝问题 总结 前言 上篇博客我们已经详细介绍了vecto…

植物知识分享论坛毕设

1.这四个文件直接是什么关系?各自都是什么作用?他们之间是如何联系的? 关系与联系 UserController.java 负责接收外部请求,调用 UserService.java 里的方法来处理业务, 而 UserService.java 又会调用 UserMapper.jav…

Business processes A bridge to SAP and a guide to SAP TS410 certification

Business processes A bridge to SAP and a guide to SAP TS410 certification

算法 之 ST表

文章目录 区间最大值 ST表(Sparse Table)是一种高效处理静态数据区间查询的数据结构,主要的作用是用于快速查询区间的最值,区间GCD,区间按位与或 在这里以区间最大值为例子说明st表的模版 总体的思想就是定义dp[i][j]表示下标为i长度为2^j的区间的最大值…

Deepseek X 文心智能体:谐音梗广告创意大师

体验链接 飞书文档 一、引言 在当今竞争激烈的市场环境下,广告创意对于产品或服务的推广至关重要。谐音广告以其独特的语言魅力,能够迅速吸引受众的注意力并留下深刻印象。本智能体旨在利用 DeepSeek 模型强大的语言分析和推理能力,为用户…

TCP简单链接的编程实现

TCP简单链接的编程实现 本文主要介绍TCP应用层的编码实现。 TCP是一种面向连接的、可靠的、基于字节流的传输层协议,它是互联网协议套件(TCP/IP)中的核心协议之一,广泛应用于需要可靠数据传输的场景,如:网…

【RHCE实验】搭建主从DNS、WEB等服务器

目录 需求 环境搭建 配置nfs服务器 配置web服务器 配置主从dns服务器 主dns服务器 从dns服务器 配置客户端 客户端测试 需求 客户端通过访问 www.nihao.com 后,能够通过 dns 域名解析,访问到 nginx 服务中由 nfs 共享的首页文件,内容…

【HarmonyOS Next之旅】DevEco Studio使用指南(三)

目录 1 -> 一体化工程迁移 1.1 -> 自动迁移 1.2 -> 手动迁移 1.2.1 -> API 10及以上历史工程迁移 1.2.2 -> API 9历史工程迁移 1 -> 一体化工程迁移 DevEco Studio从 NEXT Developer Beta1版本开始,提供开箱即用的开发体验,将SD…

nodejs使用 mysql2 模块获取 mysql 中的 json字段,而不是 mysql

mysql 模块获取的 json 字段,是字符串mysql2 模块获取的 json 字段,是符合预期的 json 对象 mysql mysql2 最后编辑于:2025-02-24 22:16:53 © 著作权归作者所有,转载或内容合作请联系作者 喜欢的朋友记得点赞、收藏、关注哦!…

【网工第6版】第1章 计算机网络概论

目录 1计算机网络形成和发展 ■计算机网络 ■我国互联网发展 ■计算机网路分类 ■计算机网络应用 2 OSI和TCP/IP参考模型 ■网络分层的意义 ■OSI参考模型 ■TCP/IP参考模型 ■TCP/IP参考模型协议 3 数据封装与解封过程 ■封装 ■解封 1计算机网络形成和发展 ■计…