语义分割中的类别不平衡的权重计算

这是5幅图,加上背景共5类。 

 

可以参考这篇文章https://blog.csdn.net/u012426298/article/details/81232386

对于一个多类别图片数据库,每个类别都会有一个class frequency, 该类别像素数目除以数据库总像素数目, 求出所有class frequency 的median 值,除以该类别对应的frequency 得到weight:

weight=median(weights)/weights

#coding:utf-8
from __future__ import print_function
import os
import numpy as np
import cv2
w,h=512,512
def find_pic(img,array_list,n_class,pixs):img_sum = np.sum(img == array_list, axis=-1)pix_numbers=img_sum.reshape(-1).tolist().count(3)if pix_numbers:pixs+=pix_numbersn_class+=1return pixs,n_class
def compute_class(pixs,n_class):return pixs/(n_class*w*h)
def frequence():# images_path = './trainannot_visual'images_path = './visual_example'red = np.array([0, 0, 128])yellow = np.array([0, 128, 128])green = np.array([0, 128, 0])blue = np.array([128, 0, 0])back_gro = np.array([0, 0, 0])images_list_path = [os.path.join(images_path,i) for i in os.listdir(images_path)]n_red=0red_pixs=0n_yellow = 0yellow_pixs = 0n_green= 0green_pixs = 0n_blue = 0blue_pixs = 0n_back = 0back_pixs = 0for count,image_path in enumerate(images_list_path):print('{}image'.format(count))img=cv2.imread(image_path)red_pixs, n_red=find_pic(img,red,n_red,red_pixs)yellow_pixs,n_yellow = find_pic(img, yellow,n_yellow,yellow_pixs)green_pixs,n_green = find_pic(img, green,n_green,green_pixs)blue_pixs,n_blue = find_pic(img, blue,n_blue,blue_pixs)#back_pixs,n_back = find_pic(img, back_gro,n_back,back_pixs)print(red_pixs, n_red)print(yellow_pixs,n_yellow)print(green_pixs, n_green)print(blue_pixs, n_blue)print(back_pixs, n_back)f_class_red=compute_class(red_pixs,n_red)f_class_yellow = compute_class(yellow_pixs, n_yellow)f_class_green = compute_class(green_pixs, n_green)f_class_blue = compute_class(blue_pixs, n_blue)f_class_back = compute_class(back_pixs, n_back)print(f_class_red,f_class_yellow,f_class_green,f_class_blue,f_class_back)f_class=[f_class_red,f_class_yellow,f_class_green,f_class_blue,f_class_back]f_class_median=np.median(np.array(f_class))print(f_class_median)print(f_class_median/np.array(f_class))
if __name__ == '__main__':frequence()

这样可以保证占比小的class, 权重大于1, 占比大的class, 权重小于1, 达到balancing的效果.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493373.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

盘点百度、阿里、腾讯、华为自动驾驶战略

来源:智车科技摘要:本文中盘点了百度、阿里、腾讯、华为四家巨头的自动驾驶事迹,以及从车路协同、车联网、高精度地图等方面对四家公司进行了梳理。今年阿里9 月云栖大会、华为10 月全联接大会、百度11 月世界大会、腾讯11 月合作伙伴大会可以…

计算机行业2019年度投资研究手册

来源:乐晴智库精选摘要:计算机服务于各行各业,担当各下游需求行业的重要工具,在技术上游电子元器件和通信的技术变迁中,计算机企业结合客户需求不断进行技术和模式创新以获取源源不断的成长动力。2014-2015年在4G及移动…

scikit-learn流形学习手写数字可视化

本文参考如下链接: https://www.jianshu.com/p/2542e0a5bdf8 from time import time import cv2 import numpy as np import matplotlib.pyplot as plt from matplotlib import offsetbox from sklearn import (manifold, datasets, decomposition, ensemble,disc…

世界上手速最快的仿人机器人诞生在韩国!魔术师也要失业了!

来源:机器人创新生态虽然夏天都过去了这么久,但谁能想到小编竟然还能深受蚊子的骚扰~~这只蚊子真的是很强啊,为了消灭这些蚊子,小编特意进口了一款专用的“拍蚊子机器人”经过小编亲自测试,这款机器人拍蚊子效果非常不…

从人工智能到物联网……这些公司如何改变农业与食品工业

来源:资本实验室目前,全球农业与食品工业产值约7.8万亿美元,占全球15%以上的GDP,并且雇佣了超过40%的人口。然而,农业与食品产业正面临着一些新的问题亟待解决,其中包括:消费者偏好和需求存在多…

pandas分析各国家交易情况

数据集来源: https://archive.ics.uci.edu/ml/datasets/Online%20Retail #coding:utf-8import pandas as pd import os import seaborn as sns import matplotlib.pyplot as pltRAW_DATA_FILE ./data/online_retail.xlsx CLN_DATA_FILE ./output/cln_online_ret…

Gartner 2019基础设施和运维十大趋势:Serverless、边缘计算、SaaS 变复杂等

来源:机器之心Gartner公司强调了基础设施和运维(I&O)领导者在2019年必须开始准备迎接的几大技术和趋势,以便支持数字化基础设施。Gartner的分析师们在Gartner IT基础设施、运维和云战略大会上介绍了研究结果。Gartner的高级研究主任罗斯•温瑟(Ross …

天池入门赛--蒸汽预测

首先查看数据 #coding:utf-8 """ Created on Wen Jan 9 2019author: fzh """ import warnings warnings.filterwarnings("ignore") import matplotlib.pyplot as plt plt.rcParams.update({figure.max_open_warning: 0}) import sea…

脑科学与AI要想融合发展,目前来说仍很困难

来源:人机与认知实验室摘要:AI要想进一步发展,需要从脑科学得到启发。业界普遍认为,AI未来的演进方向就是计算智能、感知智能和认知智能,在此期间,真正需要突破的就是让计算机理解、思考和进行自我学习&…

张首晟生前重磅演讲:要用第一性原理的思维方式来理解今天的世界

来源:经济学家圈摘要:本文为华裔科学家张首晟今年3月25日在IT领袖峰会上的演讲以下是张首晟教授演讲全文:谢谢大家的关注,在下午来听我的分享,今天大会是IT领袖峰会,所以我想讲的三个题目是「量子计算」、「…

Windows live writer插入代码图片Test

/*** 验证字符串text是不是ip地址,是返回true,否则返回false* param text* return*/ public static boolean isIPAddress(String text){StringBuilder regex new StringBuilder("^(1\\d{2}|2[0-4]\\d|25[0-5]|[1-9]\\d|[1-9])\\."); regex.a…

knn用于水果数据集分类

数据集地址:https://download.csdn.net/download/fanzonghao/10940440 knn算法流程: 若k取无穷大,那么测试数据就取决于每一类的占比,归属于占比最大的那一类。 首先观察数据集,利用mass,height&#xff…

人脸识别技术大起底,你了解多少?

来源:与非网这两年,随着科技的迅速发展,人脸识别已经逐渐成为了新时期生物识别技术应用的重要领域,忘记密码了?没事儿,咱还可以“刷脸”!今天,小编将带大家了解一下最新的人脸识别技术,看看这项…

深度学习时出现的一些安装问题+ubuntu apt的一些问题+github release文件加速

一.python用于深度学习时出现的一些安装问题 问题:raise ImportError, str(msg) , please install the python-tk package 解决:apt-get update apt-get install python-tk 问题:pip install pycocotools出现错误 pip instal…

Struts+Tomcat搭建

StrutsTomcat搭建tomcat使用(服务器端开发): 如果要安装Tomcat需要进行的配置:tomcat安装在c: \Tomcat CATALINA_HOME变量值设为: H:\Program Files (x86)\tomcat\apache-tomcat-7.0.27 CATALINA_BASE变量值设为: H:\Program Files (x86)\tomcat\apache-tomcat-…

AlphaZero登上《科学》封面:一个算法“通杀”三大棋,完整论文首次发布

来源:量子位作者:乾明 一璞 栗子 晓查不仅会下围棋,还自学成才横扫国际象棋和日本将棋的DeepMind AlphaZero,登上了最新一期《科学》杂志封面。同时,这也是经过完整同行审议的AlphaZero论文,首次公开发表。…

自编码器及相关变种算法简介

本文对自编码器(Auto-Encoder)算法及其相关变种算法进行简要介绍,其中包括 Regularized Auto-Encoder、Sparse Auto-Encoder、Denoising Auto-Encoder 和 Contractive Auto-Encoder,重点讨论各算法的基本思想及优化时所需目标函数…

pytorch数据预处理

一,数据加载 数据路径: #coding:utf-8 import torch as t from torch.utils import data import os from PIL import Image import numpy as npclass DogCat(data.Dataset):def __init__(self, path):imgs os.listdir(path)# 所有图片的绝对路径# 这里…

太阳系“首个星际访客”未被探测到人工信号

来源:新华网去年发现的雪茄形天体被认为是太阳系“首个星际访客”,其真实身份一直受到全球天文学家高度关注。美国搜索外星文明研究所(SETI)最新研究称,这个天体没有被探测出“人工”的无线电信号,但这不能…

协方差理解,PCA以及奇异值分解(SVD)

一.PCA PCA通过正交变换将一组由线性相关变量表示的数据转换为少数几个由线性无关变量表示的数据,这几个线性无关的变量就是主成分。PCA通过将高维数据维度减少到少数几个维度,本质上属于一种数据降维方法,也可以用来探索数据的内在结构。 …