MachineLearning(10)-聚类

聚类

  • 1.K-mean
  • 2.系统聚类
  • 3.DBSCAN聚类算法

聚类:无监督学习,将相似的样本聚为一类。核心如何定义相似。
分类:有监督学习,依据分类准则,将样本划分为不同的类。核心分类器的设计(KNN)

聚类:根据彼此不同的属性进行辨认,将具有相似属性的事物聚为一类,使得同一类的事物具有高度的相似性。

1.K-mean

  1. 随机选取k个类别中心
  2. 计算每个样本点到每个中心的距离,将样本归类到距离最近的类中。
  3. 依据每个类的样本更新类中心
  4. 重复2,3直至类中心变化小于某个阈值。

K-meas 算法的优点:简介快速,时间复杂度O(nkt)
K-meas 算法的缺点:需要预先知道/设定聚类数量k

2.系统聚类

自底向上的一种方法:初始时,各个样本自成一类,依据定义的相似度,每次合并一个类,不断向上合并直至到达设定了类别数

  1. 定义样本间距离和类间距离的计算方法,每个样本自成一类
  2. 计算任意两个类间距离,将距离最短的两个类合并
  3. 重复步骤2直至聚为k类

样本间距离:欧几里得距离、均方距离、曼哈顿距离(1范数)、余弦距离、最大距离(无穷范数)
类间距离:最大距离、最小距离、平均距离、离差平方和距离

系统聚类的优点:灵活定义的距离对昂使得他有广泛的适用性
系统聚类的缺点:时间复杂度高,一般为o(n3)o(n^3)o(n3)

3.DBSCAN聚类算法

DBSCAN:density-based spatial clustering of applications with noise
将类定义为:密度相连的点的最大集合,通过在样本空间中不断寻找最大集合从而完成聚类
有几个基本定义:ϵ\epsilonϵ领域,核心对象,直接密度可达,密度可达,密度相连

密度可达是直接密度可达的传递闭包

  1. 定义半径ϵ\epsilonϵ和MinPts
  2. 抽取未被访问的样本点q
  3. 检验是否为核心对象,是-进入步骤4,否-返回步骤2
  4. 找出该样本点所有密度可达的对象,构成聚类CqC_qCq.
  5. 重复步骤2,直至所有样本点都被访问过一遍

能在带噪声的样本空间中发现任意形状的聚类并排除噪声

DBSCAN聚类的优点:能够过滤低密度区域,发现稠密样本点。不需要制定聚类数,可以过滤噪声,时间复杂度o(nlog⁡n)o(n\log n)o(nlogn)

(概念稍微复杂点的一个聚类算法)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/444745.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

帧同步和状态同步(一)

帧同步 什么是帧同步:帧同步常被RTS(即时战略)游戏常采用。在游戏中同步的是玩家的操作指令,操作指令包含当前的帧索引。一般的流程是客户端上传操作到服务器, 服务器收到后并不计算游戏行为, 而是转发到所有客户端。这里最重要的…

帧同步和状态同步(二)案例分析

转自:http://www.gameres.com/489361.html 腾讯一下出了两款MOBA游戏,全民超神,王者荣耀,玩了一下,效果不错,就分析了一下它底层的一些技术,发现一个是采用的状态同步,TCP协议&#…

leetcode279 完全平方数

给定正整数 n,找到若干个完全平方数(比如 1, 4, 9, 16, ...)使得它们的和等于 n。你需要让组成和的完全平方数的个数最少。 示例 1: 输入: n 12 输出: 3 解释: 12 4 4 4. 示例 2: 输入: n 13 输出: 2 解释: 13 4 9. 思路&#xf…

推荐系统(1)-概述

推荐系统概述1.数据部分2.模型部分2.1模型的组成2.2模型的训练2.3模型评估《深度学习/推荐系统》读书笔记推荐系统要处理的问题:对于用户U(user),在特定的场景C(context),针对海量的“物品信息”,构建一个模型f(U,I,C)f(U,I,C)f(U…

(十七)深入浅出TCPIP之UDP打洞原理

专栏其他文章: 理论篇: (一)深入浅出TCPIP之理解TCP报文格式和交互流程 (二)深入浅出TCPIP之再识TCP,理解TCP三次握手(上) (三)深入浅出TCPIP之再识TCP,理解TCP四次挥手(上) (四)深入浅出TCPIP之TCP三次握手和四次挥手(下)的抓包分析 (五)深入浅出TCPIP之TCP流…

leetcode240. 搜索二维矩阵 II

编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target。该矩阵具有以下特性: 每行的元素从左到右升序排列。 每列的元素从上到下升序排列。 示例: 现有矩阵 matrix 如下: [ [1, 4, 7, 11, 15], [2, 5, 8, 12, 19], [3, 6…

NAT原理

网络地址转换(NAT,Network Address Translation)属接入广域网(WAN)技术,是一种将私有(保留)地址转化为合法IP地址的转换技术。下面介绍两类不同方式实现的NAT:NAT(Network Address Translators):称为基本的NAT在客户机…

推荐系统(2)-协同过滤1-UserCF、ItemCF

协同过滤1.CF概述2.数据表示3.衡量相似度4.共现矩阵5.UserCF6.ItemCF7.UserCF 与ItemCF 应用场景、主要缺陷8.基于UserCF 电影推荐demo《深度学习/推荐系统》读书笔记推荐系统的发展一日千里 传统的推荐模型(2010年前后):协同过滤、罗辑回归、因子分解、梯度提升树 …

sql查询实例1(学生表_课程表_成绩表_教师表)

表架构 Student(S#,Sname,Sage,Ssex) 学生表 Course(C#,Cname,T#) 课程表 SC(S#,C#,score) 成绩表 Teacher(T#,Tname) 教师表 建表语句 CREATE TABLE student ( s# INT, sname nvarchar(32), sage INT, ssex nvarchar(8) ) CREATE TABLE course ( c# INT, cname…

android 存储方式以及路径简介

存储分成了内部存储和外部存储。注意内部存储又叫做机身内存,而且内存又包含了两个部分RAM(运行时内存,这个和运行速度有关系,是手机运行时存储数据和指令的地方)、ROM(这个才算是真正存储东西的内部存储范围,是应用配置和其他数据的地方);而外部存储就很明确了,用户的外部挂…

MachineLearning(11)-关联规则分析

关联规则分析1.简单来说-关联规则2.经典关联规则挖掘-Apriori1.简单来说-关联规则 关联规则–通过量化的数字描述物品甲的出现 对 物品乙的出现 有多大影响。 最早是为了发现超市销售数据库中不同的商品之间的关联关系:哪组商品可能会在一次购物中同时购买。 广泛…

APK 安卓反编译

在学习Android开发的过程你,你往往会去借鉴别人的应用是怎么开发的,那些漂亮的动画和精致的布局可能会让你爱不释手,作为一个开发者,你可能会很想知道这些效果界面是怎么去实现的,这时,你便可以对改应用的A…

sql查询实例2(借书卡、图书、借书记录)

问题描述: 本题用到下面三个关系表: CARD 借书卡。 CNO 卡号,NAME 姓名,CLASS 班级 BOOKS 图书。 BNO 书号,BNAME 书名,AUTHOR 作者,PRICE 单价,QUANTITY 库存册数 BORROW 借书记录。 CNO 借…

开始学习Unity3D(一)

本人最近转行开始做海外独立游戏的发行,主要是负责服务器,开会注意到海外的服务越来越丰富越来越细分,对国内将会造成很大的冲击,比如AWS,Google,GameSparks等,这导致国内的所谓服务器开发将越来越简单,国内对服务器开发的需求越来越少,反而客户端的需求越来越多,所以…

List 流的使用

摘要 本文将介绍在 Java 1.8 中对 List 进行流操作的使用方法。引入的 java.util.stream 包为开发者提供了一种更为便捷和强大的方式来处理集合数据。通过使用流,我们能够以声明性的方式进行集合操作,减少了样板代码,提高了代码的可读性和可…

推荐系统(3)-协同过滤2-矩阵分解算法

协同过滤-矩阵分解算法1.奇异值分解2.梯度下降3.矩阵分解方法的优缺点《深度学习/推荐系统》读书笔记(其实矩阵分解和协同过滤已经没有特别大的联系了) 2006年,在Netfilx举办的推荐算法竞赛中Netflix Prize Challenge中,以矩阵分解…

leetcode141 环形链表

给定一个链表,判断链表中是否有环。 为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始)。 如果 pos 是 -1,则在该链表中没有环。 示例 1: 输入:head …

iPhoneX适配

目录(?)[-]核心代码自动化修改代码参考资料iPhoneX适配,比较搓的一种方式,在不修改分辨率(720 x 1280)的情况下适配iphone X 主屏尺寸: 5.8英寸 主屏分辨率: 2436 x 1125核心代码修改 工程目录/Classes/Un…

centos安装nginx,配置负载均衡

1、安装nginx安装教程,参照:http://mp.weixin.qq.com/s/RVaRlRpHqZRjCaXGmOlfKw 2、反向代理的配置修改部署目录下conf子目录的nginx.conf文件的内容[html]view plaincopylocation / { #设置主机头和客户端真实地…

leetcode142 环形链表II

给定一个链表,返回链表开始入环的第一个节点。 如果链表无环,则返回 null。 为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始)。 如果 pos 是 -1,则在该链表中没有…