常见统计学习方法特点总结

常见统计学习方法特点总结

news/2025/7/6 15:53:37/文章来源:https://blog.csdn.net/MusicDancing/article/details/134879508

1. 概述

	方法	适用问题	模型特点	模型类型	学习策略	损失函数	学习算法
1	感知机	二分类	分离超平面	判别模型	极小化误分点到超平面距离	误分点到超平面距离	SGD
2	KNN	多分类，回归	特征空间，样本点	判别模型	-	-	-
3	朴素贝叶斯	多分类	特征与类别的联合概率分布，条件独立假设	生成模型	极大似然估计，极大后验概率估计	对数似然损失	概率计算公式，EM算法
4	DT	多分类，回归	分类树，回归树	判别模型	正则化的极大似然估计	对数似然损失	特征选择，生成，剪枝
5	LR与最大熵模型	多分类	特征条件下类别的条件概率分布，对数线性模型	判别模型	极大似然估计，正则化的极大似然估计	逻辑斯蒂损失	改进的迭代尺度算法，梯度下降，拟牛顿法
6	SVM	二分类	分离超平面，核技巧	判别模型	极小化正则化合页损失，软间隔最大化	合页损失	序列最小最优算法SMO
7	提升方法	二分类	弱分类器的线性组合	判别模型	极小化加法模型的指数损失	指数损失	前向分布加法
8	EM算法	概率模型参数估计	含隐变量概率模型	-	极大似然估计，极大后验概率估计	对数似然损失	迭代算法
9	隐马尔可夫模型	标注	观测序列与状态序列的联合概率分布模型	生成模型	极大似然估计，极大后验概率估计	对数似然损失	概率计算公式，EM算法
10	条件随机场	标注	状态序列条件下观测序列的条件概率分布，对数线性模型	判别模型	极大似然估计，正则化极大似然估计	对数似然损失	改进的迭代尺度算法，GD，拟牛顿法

2. 适用问题

1. 分类问题是从实例的特征向量到类标记的预测问题；
2. 标注问题是从观测序列到标记序列(或状态序列)的预测问题，可以认为分类问题是标注问题的特殊情况；

分类问题与标注问题都可以写成条件概率分布P(Y|X)或决策函数Y=f(X)的形式，前者表示给定输入条件下输出的概率模型，后者表示输入到输出的非概率模型。有时模型更直接地表示为概率模型(如朴素贝叶斯、隐马尔可夫)，或非概率模型(如感知机，knn，SVM，提升方法)，有时模型兼有两种解释(如DT，LR与最大熵模型，条件随机场)。

3. 模型

直接学习条件概率分布P(Y|X)或决策函数Y=f(X)的方法为判别方法，对应的模型是判别模型，如感知机，knn，DT，LR与最大熵模型，SVM，提升方法，条件随机场。

首先学习联合概率分布P(Y|X)，从而求得条件概率分布P(Y|X)的方法是生成方法，对应的
模型是生成模型，如朴素贝叶斯、隐马尔可夫。可以用非监督学习的方法学习生成模型，朴素贝叶斯、隐马尔可夫可应用EM算法学习。

DT是定义在一般的特征空间上的，可以含有连续变量或离散变量；
感知机、svm、knn的特征空间是欧氏空间。

感知机模型是线性模型，而LR与最大熵模型、条件随机场是对数线性模型； knn、DT、SVM(包含核函数)、提升方法使用的是非线性模型。

4. 学习策略

概率模型的学习可以形式化为极大似然估计或贝叶斯估计的极大后验概率估计。这时，学习的策略是极小化对数似然损失或极小化正则化的对数似然损失 -logP(y|x) 。极大后验概率估计时，正则化项是先验概率的负对数。

统计学习的问题有了具体的形式后，就变成了最优化问题，最优化问题大多数时候没有解析解，需要用数值计算的方法或启发式的方法求解。SVM、LR与最大熵模型、条件随机场是凸优化问题，存在全局最优解；而其他学习问题则不是凸优化问题，不能保证全局最优解存在。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/212478.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【CMU 15-445】Proj2 Hash Index

【CMU 15-445】Proj2 Hash Index

EXTENDIBLE HASH INDEX 通关记录Task1 Read/Write Page Guards移动构造函数Drop方法移动赋值运算符析构函数UpgradeRead函数FetchPageBasic、FetchPageRead、FetchPageWrite、NewPageGuarded Task2 Extendible Hash Table PagesHeaderPageDirectoryPageBucketPage Task3 Extend…

阅读更多...

飞天使-linux操作的一些技巧与知识点5

飞天使-linux操作的一些技巧与知识点5

文章目录 roles批量替换文件 role 的依赖关系role 的实际案例 roles tasks 和 handlers ，那怎样组织 playbook 才是最好的方式呢？简单的回答就是：使用 Roles Roles 基于一个已知的文件结构，去自动的加载 vars，tasks 以…

阅读更多...

Python字典去重竟然比集合去重快速40多倍

Python字典去重竟然比集合去重快速40多倍

这里写目录标题对比代码结果图代码解析对比代码 from glob import glob from tqdm import tqdm import time path_listglob("E:/sky_150b/任务组_20231207_2023/*.jsonl") # for two in tqdm(path_list): onepath_list[0]with open(one,"r",encoding&q…

阅读更多...

【C++】POCO学习总结（十）：Poco::Util::Application（应用程序框架）

【C++】POCO学习总结（十）：Poco::Util::Application（应用程序框架）

【C】郭老二博文之：C目录 1、Poco::Util::Application 应用框架 1.1 应用程序基本功能 Poco::Util::Application是POCO实现的的应用程序框架，支持功能如下： 命令行参数处理配置文件初始化和关机日志 1.2 命令行程序和守护进程 POCO支持…

阅读更多...

Java架构师系统架构实现高内聚低耦合

Java架构师系统架构实现高内聚低耦合

目录 1 导语2 边界内聚耦合概述3 聚焦内聚4 关注耦合5 如何实现高内聚低耦合6 内聚耦合规划不当的效果7 总结想学习架构师构建流程请跳转：Java架构师系统架构设计 1 导语架构设计的核心维度，从系统的扩展性、高性能、高可用、高安全性和伸缩性五个维度进行了探讨，并介绍了…

阅读更多...

【Docker】进阶之路：（一）容器技术发展史

【Docker】进阶之路：（一）容器技术发展史

【Docker】进阶之路：（一）容器技术发展史什么是容器为什么需要容器容器技术的发展历程Docker容器是如何工作的什么是容器容器作为一种先进的虚拟化技术，已然成为了云原生时代软件开发和运维的标准基础设施。在了解容器技术之前…

阅读更多...

抖音本地生活服务商申请入口在哪里？具体流程是怎样的？

抖音本地生活服务商申请入口在哪里？具体流程是怎样的？

不论是抖音的本地生活业务，还是后来的支付宝、视频号的本地生活业务，因为市场体量足够庞大，市场前景广阔，一直很受各大创业者的追捧。那么，如此火热的本地生活项目，想要申请成为服务商，具体的申…

阅读更多...

列表标签的介绍与使用

列表标签的介绍与使用

列表的作用： 整齐、整洁、有序，它作为布局会更加自由和方便。根据使用情景不同，列表可以分为三大类：无序列表、有序列表和自定义列表无序列表 <ul> 标签表示 HTML 页面中项目的无序列表，一般会以项目符号呈…

阅读更多...

深入了解linux下网卡防火墙selinux

深入了解linux下网卡防火墙selinux

深入了解linux下网卡防火墙selinux 在Linux系统中，网络安全是非常重要的。为了保护系统免受恶意攻击和未经授权的访问，我们可以使用防火墙来限制网络流量。而在Linux下，我们可以使用SELinux（Security-Enhanced Linux）…

阅读更多...

Java调试技巧之垃圾回收机制解析

Java调试技巧之垃圾回收机制解析

Java作为一种高级编程语言，以其跨平台、面向对象、自动内存管理等特性而广受开发者的喜爱。其中，自动内存管理是Java的一大亮点，通过垃圾回收机制实现对内存的自动分配和释放，极大地简化了开发者的工作。本文将深入探讨Java的垃圾…

阅读更多...

mysql数据库文件丢失恢复---惜分飞

mysql数据库文件丢失恢复---惜分飞

客户服务器重启,mysql相关数据文件丢失通过底层工具进行分析,无法正确恢复数据库名字,一个个单个ibd文件(而且很多本身是错误的) 对于这种情况,通过mysql block扫描恢复出来page文件恢复出来客户需要数据这个客户出现该故障的原因大概率是由于文件系统损坏导致.最终…

阅读更多...

C语言进阶之路-数据结构篇

C语言进阶之路-数据结构篇

目录一、学习目标二、数据结构 1.基本概念线性关系： 非线性关系： 存储形式 2. 算法分析 2.1 时间复杂度 2.2 空间复杂度 2.3 时空复杂度互换总结一、学习目标了解数据结构的基本概念了解算法的分析方法二、数据结构 1.基本概念数据结…

阅读更多...

测试bug分析

测试bug分析

项目场景： 提示：这里简述项目相关背景： 例如：项目场景：示例:通过蓝牙芯片(HC-05)与手机 APP 通信，每隔 5s 传输一批传感器数据(不是很大) 问题描述提示：这里描述项目中遇到的问题&#xff1…

阅读更多...

Nacos源码解读11——客户端怎么读取最新的配置信息

Nacos源码解读11——客户端怎么读取最新的配置信息

项目启动怎么读取的配置信息自动装配 SpringBoot 自动装配机制加载 WEB/INF spring.factories 会将如下几个Bean加载到ioc 容器中 BeanConditionalOnMissingBeanpublic NacosConfigProperties nacosConfigProperties() {return new NacosConfigProperties();}BeanCondition…

阅读更多...

【算法Hot100系列】两数之和

【算法Hot100系列】两数之和

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学…

阅读更多...

【rabbitMQ】模拟work queue,实现单个队列绑定多个消费者

【rabbitMQ】模拟work queue,实现单个队列绑定多个消费者

上一篇： springboot整合rabbitMQ模拟简单收发消息 https://blog.csdn.net/m0_67930426/article/details/134904766?spm1001.2014.3001.5502 在这篇文章的基础上进行操作基本思路： 1.在rabbitMQ控制台创建一个新的队列 2.在publisher服务中定义一个…

阅读更多...

MySQL中的数据类型

MySQL中的数据类型

MySQL中的数据类型大家好，我是微赚淘客系统的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！今天我们将探讨MySQL中的数据类型，这是数据库设计中至关重要的一部分。数据库作为程序的底层支持，数据类型的选择…

阅读更多...

[python]利用whl轮子文件python3.12安装talib

[python]利用whl轮子文件python3.12安装talib

ta-lib目前很多人使用，网上也有很多人下载whl文件直接pip安装即可，但是最新版本3.12没有出来，因此本人独家制作python 3.12版本whl文件，从源码开始编译生成。TA-Lib-0.4.28-cp312-cp312-win-amd64.whl ，注意这个whl文件…

阅读更多...

Java 多线程下的单例模式

Java 多线程下的单例模式

单例对象（Singleton）是一种常用的设计模式。在Java应用中，单例对象能保证在一个JVM中，该对象只有一个实例存在。正是由于这个特点，单例对象通常作为程序中的存放配置信息的载体，因为它能保证其他对象读到一…

阅读更多...

JWT的原理

JWT的原理

在谈及jwt原理前,我们其实对jwt并不陌生,对于有经验的码农,大都听过或者实践过,对于一些初学者,凡是谈及安全方面的问题,总是觉得很复杂,感觉不是自己能搞得懂得,但其实无非也是加密解密的过程,不要想的太复杂,我们先说一说JWT在生产上的应用 JWT在生产上的应用传递用户身份信…

阅读更多...

最新文章