机器学习 基本概念,常用经典模型

1. 机器学习 明白一些基本概念

什么是机器学习
研究如何通过计算的手段,利用经验来改善系统自身的性能
通俗来讲,让代码学着干活

特征:自变量
标签:因变量

学习的种类
有监督学习:提供标签,分类、回归
无监督学习:无标签,聚类
增强学习:也称强化学习,马尔科夫决策过程(Markov Decision Processes,MDP)
主动学习:边学习边标注
迁移学习:从一个域(Domain)迁移(Transfer)到另一个域
集成学习:Ensemble,三个臭皮匠赛个诸葛亮,Boosting和Bagging

两大痛点
维度灾难:数据量和特征数
过拟合:模型泛化能力

学习的流程
预处理:数据重塑、缺失值处理(补全、统计为缺失特征)
特征工程:特征没做好,参数调到老。在已有的特征上生成新的特征,数值、类别
特征选择、降维:基于MIC、Pearson相关系数、正则化方法、模型,PCA、tSNE
训练模型、调参:单模型,多模型融合,集成
评估模型:正确率(Acurracy)、准确值(Pecision)、召回值(Recall)、F值、AUC

代码实现
你需要的都在这里:http://scikit-learn.org/

用机器学习来赌香港赛马
https://www.zhihu.com/question/35131866/answer/152880313
https://www.kaggle.com/lantanacamara/hong-kong-horse-racing

2. 机器学习 常用经典模型及其实现

常用经典模型
1.线性回归:有监督回归,y=WX+b,X为m维向量,y、b为n维向量,W为n*m维矩阵
2.Logistic回归:有监督回归,y=logit(WX+b)
3.贝叶斯:有监督分类,最可能的分类是概率最大的分类
4.k近邻:有监督分类,kNN,距离的定义
5.决策树:有监督分类,树形判断分支,非线形边界,+集成=随机森林
6.支持向量机:有监督分类,将原空间变换到另一空间,在新空间里寻找margin最大的分界面(hyperplane)
7.k-means:无监督聚类,初始化中心,不断迭代,EM算法
8.神经网络:有监督和无监督都有,详情参见下一章,深度学习

实现之前的准备
安装scikit-learn:http://scikit-learn.org/
sklearn、numpy
>>> from sklearn import svm
>>> X = [[0, 0], [1, 1]]
>>> y = [0, 1]
>>> clf = svm.SVC()
>>> clf.fit(X, y)
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',
max_iter=-1, probability=False, random_state=None, shrinking=True,
tol=0.001, verbose=False)
>>> clf.predict([[2., 2.]])
array([1])
一个简单的例子:http://scikit-learn.org/stable/auto_examples/svm/plot_iris.html#sphx-glr-auto-examples-svm-plot-iris-py

转载于:https://www.cnblogs.com/csj007523/p/7804144.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/354599.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

日常开发之重构

作为开发人员,应该让重构贯穿于你的开发日常的每一刻。 为什么这么说? 重构是为了改善软件的设计、结构和实现,同时保留其现有的功能。 重构的潜在优势包括提高代码的可读性和降低复杂度。 这些都可以提高源代码的可维护性,并创建…

摇钱树

题目描述 Cpg 正在游览一个梦中之城,在这个城市中有n棵摇钱树。。。这下,可让Cpg看傻了。。。可是Cpg只能在这个城市中呆K天,但是现在摇钱树已经成熟了,每天 每棵都会掉下不同的金币(不属于Cpg!&#xff09…

apache thrift_使用Java快速入门的Apache Thrift

apache thriftApache Thrift是由facebook创建的RPC框架,现在它是一个Apache项目。 Thrift允许您在不依赖语言的定义文件中定义数据类型和服务接口。 该定义文件用作编译器的输入,以生成用于构建通过不同编程语言进行通信的RPC客户端和服务器的代码。 您也…

前端八大灵感设计,代码变为现实

我们都知道掌握编程技术是一项很难的事情,没有捷径可走。需要我们在日复一日的工作中去锻炼。如果想要达到擅长甚至需要长年累月的积累。下面列举了一些可以给你带来编码灵感的例子,相信你看到会有想去写代码的冲动。因为一个好的工程师,是不…

Apple 公司开发者账号添加团队成员

Apple 公司开发者账号添加团队成员 简介 首先公司内部团队开发需要的账号类型为公司账号,可以添加团队成员协同开发。 账号下的团队成员有三种角色: Team Agent (代理) 代理: 就是注册开发者账号的那一个,权限最高,续费和创建开发…

相互问题

HTTPS协议是用于确保我们的连接安全的公认标准。 理解此协议的工作原理不是问题,并且从2000年起可以使用相应的RFC文档 。 尽管HTTPS的使用如此广泛,但您仍然可以找到一种无需不必要的复杂性就无法处理此协议的软件。 不幸的是,在使用该语言…

八个使前端工程师惊艳的效果设计,码否?

我们都知道掌握编程技术是一项很难的事情,没有捷径可走。需要我们在日复一日的工作中去锻炼。如果想要达到擅长甚至需要长年累月的积累。 下面列举了一些可以给你带来编码灵感的例子,相信你看到会有想去写代码的冲动。 因为一个好的工程师,…

OpenStack_I版 1.准备过程

openstack是一个开源云平台,python开发此次部署为实验环境, 采用扁平化简单的网络架构部署  优点:低耦合的,模块化Nova 计算资源池Glance 镜像服务Swift 对象存储Horizon 对计算资源,网络资源起别…

使用React和Tailwind CSS搭建项目框架

众所周知,Tailwind CSS框架越来越流行,所以我决定尝试学习并使用Tailwind CSS来搭建一个项目模板,一方面自己深入学习下,二来帮助新人更快地上手Tailwind CSS开发。 创建一个React项目 通过使用create-react-app命令创建一个新的…

快点,再快点!

现在看视频不来个两倍速(或者更快)都觉得在浪费生命。特别是在看视频教程的时候,文字我们可以做到一目十行,但是视频呢,如果有字幕,我们甚至不用听清,用3倍速或者4倍速完全没有问题,…

jetty eclipse_3个步骤实现Jetty和Eclipse集成

jetty eclipse本教程将引导您逐步了解如何集成Jetty和Eclipse,以及如何在Eclipse中的Jetty服务器上运行Web应用程序。 脚步: 安装Jetty Eclipse插件 建立网路应用程式 运行网络应用 1 –安装Jetty Eclipse插件 将服务器添加到“服务器”视图时&…

01jquey基础

1.html代码 <!doctype html> <html> <head> <meta charset"utf-8"> <title>无标题文档</title> <script type"text/javascript" src"jquery-3.2.1.min.js"></script> <script type"tex…

使用React和Tailwind CSS搭建项目模板

公众号关注 “太空编程”设为 “星标”&#xff0c;带你了解硬核的编程知识&#xff01;众所周知&#xff0c;Tailwind CSS框架越来越流行&#xff0c;所以我决定尝试学习并使用Tailwind CSS来搭建一个项目模板&#xff0c;一方面自己深入学习下&#xff0c;二来帮助新人更快地…

Java用Java编译

在上一篇文章中&#xff0c;我写了关于如何在运行时生成代理的信息&#xff0c;我们已经了解到生成Java源代码的程度。 但是&#xff0c;要使用该类&#xff0c;必须对其进行编译&#xff0c;并将生成的字节码加载到内存中。 那是“编译”时间。 幸运的是&#xff0c;从Java 1.…

PHP实现前台页面与MySQL的数据绑定、同步更新

今天我来给大家介绍一个PHP-MySQL的小项目。 使用 PHP和前台Ajax 实现在前台对MySQL数据库中数据的增、删等操作语句功能。 如果有问题&#xff0c;欢迎拍砖~ 有不懂的地方&#xff0c;提出来咱们一起探讨~ 首先&#xff0c;我们先做好前台HTML、CSS样式&#xff0c;代码如下&a…

如何用Vue实现简易的富文本编辑器,并支持Markdown语法

前端开发经常会用到富文本编辑器&#xff0c;比如CKEditor&#xff0c;动不动一个库几十M的代码量&#xff0c;其中涉及许多你可能用不到的功能特性和相关设置&#xff0c;CKEditor最新版本的代码仓库就有接近2000个JS文件&#xff0c;300,000行代码。 可是如果你只需要一个简…

互联网基建成果,快速实现一个clubhouse要多久

最近国外的一款基于语音的社交软件clubhouse掀起了一股热潮&#xff0c;尤其是在Eleon Musk的带动下&#xff0c;整个互联网圈内人都在第一时间抢先体验。不管它为什么会火&#xff0c;肯定不是技术上有什么特别的优势。随着整个互联网技术生态的不断发展&#xff0c;互联网基础…

阿里帝国到底有多庞大

马云&#xff0c;男&#xff0c;1964年9月10日生于浙江省杭州市&#xff0c;祖籍浙江省嵊州市谷来镇&#xff0c; 阿里巴巴集团主要创始人&#xff0c;现担任阿里巴巴集团董事局主席、日本软银董事、TNC中国理事会主席兼全球董事会成员、华谊兄弟董事、生命科学突破奖基金会董事…

resteasy 统一异常_RESTEasy教程第3部分:异常处理

resteasy 统一异常在开发软件应用程序时&#xff0c;异常处理是显而易见的要求。 如果在处理用户请求时发生任何错误&#xff0c;我们应该向用户显示一个错误页面&#xff0c;其中包含详细的异常消息&#xff0c;错误代码&#xff08;可选&#xff09;&#xff0c;更正输入和重…

哪些网站在+1s后有神奇的功能

1s 有些网站&#xff0c;当我们给它 1s 时&#xff0c;会有意想不到的奇效。 github 1s 在 GitHub 域名后面加 1s 可以直接使用 vscode online 打开仓库代码&#xff0c;例如 https://github1s.com/fantingsheng/front-end https://github1s.com/fantingsheng/front-end^^ …