代价敏感多标签主动学习的代码开发跟踪

1 简介

代价敏感多标签主动学习目前是闵老师小组正在进行的一个开发项目,目的是将代价敏感和主动学习思想应用到多标签学习中。整个Java代码涵盖了很多技术:并行计算、batch处理。本文就是在学习这个代码后的一些总结。学习方法采用的至顶向下。

2 Cmale类

该类为测试的主类。

2.1 数据

  • dataset:保存整个多标签数据集
  • numInstances:样本的个数
  • numConditions:条件属性的个数
  • numLabels:标签的个数
  • outputFile:输出的文件
  • multiLabelAnn:用于分类的多标签神经网络
  • representativenessArray:保存所有实例的代表性
  • representativenessRankArray:所有实例代表性的排名

2.2 方法

  • (1)Cmale:构造方法
    step 1. 读数据文件构建dataset
    step 2. 计算实例的代表性
    step 3. 准备输出文件

  • (2)initializeMultiLabelAnn:初始化多标签神经网络
    利用dataset,全连接层节点,并行层节点构建多标签神经网络

  • (3)boundedTrain:给定轮数的上界、下界进行训练

  • (4)boundedEmphasizedTrain:给定训练轮数的上界, 进行针对性 (增量) 训练

  • (5)computeInstanceRepresentativeness:基于密度峰值来计算实例的代表性

  • (6)twoStageLearn:两阶段学习: 冷启动 (仅考虑对象代表性与标签稀少性) 与 正常训练 (考虑标签不确定性) 注意: 这里是算法的核心, 需要改策略

  • (7)randomSelectionLearn: 随机选择标签的学习, 作为对比算法. 如果我们的策略不比随机策略好, 就没有意义

3 MultiLabelData类:数据管理

本类读入 arff 文件, 存储成一个数据矩阵和标签矩阵

3.1 数据

  • dataMatrix: 数据矩阵
  • labelMatrix: 标签矩阵
  • predictedLabelMatrix: 预测的标签矩阵
  • labelQueriedMatrix: 记录哪些标签被查询
  • 查询代价、误分类代价等

3.2 方法

  • reset: 重置以支持多次训练
  • randomQuery: 随机查询给定数量的标签, 支持随机查询方案
  • getScareLabels: 找出哪些标签是稀少的
  • queryLabels: 查询某个对象的一组标签. 需要在内部保持数据的一致性, 出错影响大
  • computeAccuracy: 根据预测的标签矩阵计算准确率. 需要预先给出预测值
  • computeTrainingAccuracy: 计算在训练集中的准确率, 以支持训练结束的终止条件
  • computeTotalCost: 计算总代价, 包括查询代价与误分类代价
  • distance: 计算两个实例之间的距离 (Manhattan 或 Euclidean)

4. 分类器构建 MultiLabelAnn.java

本类的神经网络支持全连接层和并行连接层. 输入端口数为条件属性数, 输出端口数为标签数的 2 倍.

4.1 变量

dataset: 数据集

4.2 方法

  • train: 训练一轮, 仅使用被查询过的对象
  • emphasizedTrain: 训练一轮, 被强调的数据多次训练, 支持增量学习. 这是因为主动学习过程是增量学习
  • test: 使用所有数据测试
  • computeLabelUncertaintyMatrix: 计算标签不确定性矩阵 注意: 这是核心方法, 以后可能要修改策略
  • getMostUncertainLabelIndices: 获得不确定性最高的几个标签, 包括对象下标 (一个) 与标签下标 (多个) 注意: 以后可能修改, 以支持多个对象的批量选取, 缩短程序运行时间
  • getUncertainLabelBatch: 大家好, 我就是上一条说的 “以后”
  • forward: 神经网络标准的前向操作
  • backPropagation: 神经网络标准的回馈操作

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507635.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pb 打印html页面,用PB开发WEB应用

用PB开发WEB应用用PB开发WEB应用烟台教育学院网络中心 孙连三一、PB Window plug -in 的用途PowerBuilder Window plug -in 的用途是在HTML 页面中插入PowerBuilder 中定义的窗口对象,此窗口对象上定义的功能在浏览器中一样被执行&#xff0…

python上传文件接口_python程序的web接口:上传和下载文件

我正在尝试制作一个简单的web应用程序,其中可以上载一个文件并将该文件提供给python脚本。烧瓶似乎适合这种用途。然后,用户可以从脚本下载文件输出。请告诉我如何解析python脚本中的文件并获得输出。到目前为止,我成功地完成了以下上载文件的…

两列布局 html5,CSS两列布局的N种实现

原理:两个元素都设置dislpay:inline-block,为了消除html空格的影响,父元素的font-size需要设置为0,右侧自适应元素的宽度使用calc函数计算。如果两个元素的高度不一样,可以给元素设置vertical-align:top调整。缺点&…

python如何提取图片特征向量_在python中计算图像的特征向量

我正在尝试将二维高斯拟合到图像中。噪声很低,所以我试图旋转图像,使两个主轴不同时变化,算出最大值,然后计算两个维度的标准偏差。选择的武器是Python。。然而,我一直在寻找图像的特征向量——numpy.linalg.py假设离散…

2021年9月24日和学生隆兴的学术讨论

QRCode: (1)做实验 (2)了解它的基本原理 调包侠 语言: (1)程序设计语言(交流,不规范) (2)数学(语言) &#x…

html加上百度统计,vue单页面应用加入百度统计

版权声明:本文为CSDN博主「钟文辉」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/qq_39753974/article/details/80322643在单页面中,要是只加在head中的话那…

推荐系统:猜你喜欢

0 简介 网络的迅速发展带来了信息超载(information overload)问题。解决信息超载问题一个非常有潜力的办法是推荐系统,它根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户。推荐系统最典型应用领域是电子商务领…

量子计算机九章能否预测未来,张礼立 : 中国 “九章”量子计算机到底厉害在哪?...

原标题:张礼立 : 中国 “九章”量子计算机到底厉害在哪?【背景信息】12月4日,《科学》杂志公布了 中国 “九章” 的重大突破。 这台由中国科学技术大学潘建伟、陆朝阳等学者研制的76个光子的量子计算原型机,推动全球量…

python的继承用法_python中继承有什么用法?python继承的用法详解

本篇文章给大家带来的内容是关于python中继承有什么用法?python继承的用法详解,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。面向对象三大特征1.封装:根据职责将属性和方法封装到一个抽象的类中2.继…

利用GAN实现QR Code超分辨率的研究

文章目录1 传统方案2 基于CNN的实现方案2.1 SRCNN2.2 WeChat AI3 基于GAN的实现方案3.1 SRGAN3.2 ESRGAN3.3 Real-ESRGAN4 基于GAN的QR Code的实现方案1 传统方案 https://blog.csdn.net/caomin1hao/article/details/81092134?utm_mediumdistribute.pc_relevant.none-task-bl…

HTML5清除2个div标签的空白,DIV标签里面IMG图片下方留有空白怎么办

我们很多个人博客网站都会广告位投放一些图片广告,在网页设计中,图片是不可缺少的素材,但是在 div 标签里面放入 img 图片的话,有时候会在图片的下方出现一行空间的区域,如果单纯的图片不醒目或是图片所在的位置不重要…

python notebook软件_Jupyter notebook快速入门教程(推荐)

本文主要介绍了Jupyter notebook快速入门教程,分享给大家,具体如下:本篇将给大家介绍一款超级好用的工具:Jupyter notebook。为什么要介绍这款工具呢?如果你想使用Python学习数据分析或数据挖掘,那么它应该…

推荐系统国内外团队介绍

1 何向南团队 http://staff.ustc.edu.cn/~hexn/

如何用计算机截部分屏,电脑如何长屏幕的截图?电脑截取长屏的方法

新手用户对windows系统截取长屏的方法比较陌生,正常情况下,我们截取屏幕内容是登录QQ,按ctrlalta来截取屏幕的,只能截取部分内容,无法截图整个页面。日常的工作生活中,截图是经常会用到的,如果你…

Audio-based snore detection using deep neural networks解读

0 摘要 Background and Objective: 打鼾是一种普遍现象。 它可能是良性的,但也可能是阻塞性睡眠呼吸暂停 (OSA) 一种普遍存在的睡眠障碍的症状。 准确检测打鼾可能有助于筛查和诊断 OSA。 Methods: 我们介绍了一种基于卷积神经网络 (CNN) 和循环神经网络 (RNN) 组合…

python实战讲解_Python数据可视化实战讲解

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。开运张 | 作者知乎专栏 | 来源三个步骤:确定问题,选择图形转换数据,应用函数参数设置,一目了然首先对…

2018计算机专业考研报名人数,2018年全国考研报考人数、各省市考研报考人数、历年考研录取率、全日制及非全日制硕士研究生比例及考研动机分析【图】...

一、考研报考人数、录取率及报录比分析从上世纪末开始,研究生和本科生招生数量一样在逐步增多。本科扩招的同时,研究生也在扩招。1999年,全国报考研究生人数31.9万,录取人数7.3万,录取率22.8%。2008年,报考…

标记分布学习与标记增强

1 标记增强 标记增强是指将训练样本中的原始逻辑标记转化为标记分布的过程. 与基于嵌入 (embedding) 的 多标记分类方法相似, 标记增强也同样依赖于对隐含在训练样本中的标记相关信息的挖掘.

学python开发必须要会wsgi么_python Web开发你要理解的WSGI uwsgi详解

WSGI协议首先弄清下面几个概念:WSGI:全称是Web Server Gateway Interface,WSGI不是服务器,python模块,框架,API或者任何软件,只是一种规范,描述web server如何与web application通信…

用计算机怎样搜wifi网,笔记本电脑搜索不到无线网络(Wifi)怎么办

在使用Windows 10工作时会遇到形形色色的问题,比如笔记本电脑搜索不到无线网络。那么如何排除故障呢?下面小编与你分享具体步骤和方法。工具/材料Windows 10操作系统操作方法第1:启动Windows 10操作系统,如图所示。点击任务栏&quo…