【机器学习笔记四】分类算法 - 逻辑回归

参考资料

【1】    Spark MLlib 机器学习实践

【2】    统计学习方法

 

1、Logistic分布

 设X是连续随机变量,X服从Logistic分布是指X具有下列分布函数和密度函数

。其中u为位置参数,γ为形状参数。如下图:

分布函数以(u,1/2)为中心对称,满足:,其中形状参数γ越小,中心部分增加越快。

 

2、Logistic回归模型

 

二项logistic回归模型是一种分类模型,由条件概率P(Y|X)表示,这里随机变量X取实数,而Y取0或者1。定义:

Logistic回归比较两个条件概率,将x归为较大条件概率的那一类。本质上它是将一个线性函数wx + b的输出转换为了条件概率。

多项logistic回归模型是二项模型的扩展,支持多分类问题,模型如下:

 

3、逻辑回归Spark Mlib例子

 

package com.fredric.spark.logisticimport org.apache.spark.mllib.classification.LogisticRegressionWithSGD
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.LabeledPoint
import org.apache.spark.{SparkContext, SparkConf}/*-* 逻辑回归* Fredric 2017*/
object logistic {def main(args:Array[String]): Unit ={val conf = new SparkConf().setMaster("local").setAppName("logistic")val sc   = new SparkContext(conf)val Array = new Array[LabeledPoint](10)//构造训练数据,虚拟一个以5为值的分类//针对一元二项逻辑斯特回归分类for(i <- 0 to 9){if(i >= 5){Array(i) = new LabeledPoint(1,Vectors.dense(i))}else{Array(i) = new LabeledPoint(0,Vectors.dense(i))}}val data = sc.makeRDD(Array);val model = LogisticRegressionWithSGD.train(data, 50)//model.weights输出[0.20670127500478114]
    println(model.weights)var test = -2//当输入为-1时,返回概率为0.0//当输入为11时,返回概率为1.0val result = model.predict(Vectors.dense(test))println(result)//验证该方式//计算P(Y=1|X),测算输入x返回1的条件概率
val res1 = Math.exp(model.weights(0)*test)/(1 + Math.exp(model.weights(0)*test))//计算P(Y=0|X),测算输入x返回0的条件概率val res0 = 1/(1 + Math.exp(model.weights(0) * test))//输出:for target:-2 propalitity for 1 is : 0.3980965348017618 propalitity for 0 is : 0.6019034651982381//根据两个条件概率的比较可知-2属于分类0println("for target:" + test + " propalitity for 1 is : " + res1 + " propalitity for 0 is : " + res0)}
}

 

转载于:https://www.cnblogs.com/Fredric-2013/p/8496070.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/255340.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FPFH+ICP点云配准

A, UniformSampling降噪B, ISS计算关键点, FPFH特征在FeatureCloud::setInputCloud中读入点云,并调用processInput进行处理:processInput处理包括: 1, computeSurfaceNormals () 使用NormalEstimation计算得到表面法向量2, computeLocalFeatures () FPFHEstimationKdTreeIS…

【python 学习】——pycharm终端解释器和Python解释器配置

目录 1、pycharm终端运行的时候前面带有PS&#xff0c;是什么意思&#xff0c;怎么变成cmd? 1&#xff09;File——settings 2&#xff09;tools——terminal——shellPath 2、pycharm怎么切换不同的Python解释器&#xff1f; 1&#xff09;File——settings 2&#xff09…

在linux下实现mysql自动备份数据

使用的系统为CentOS&#xff0c;mysql版本为5.6 备份功能主要利用以下功能实现&#xff1a; mysql命令中的mysqldump命令 linux下脚本编写 linux下crontab定时任务的使用 首先确定你要存放脚本的目录和存放备份数据的目录 首先进行以下修改&#xff08;因为在命令行或者脚本中写…

面向未来编程

我们一直以来都知道面向对象编程&#xff0c;面向过程编程。大多数时候还是面向工资编程&#xff0c;面向生活编程。面向任务编程&#xff0c;面向公司编程&#xff0c;面向领导编程。 工资不给力&#xff0c;心里认为委屈&#xff1b;生活有压力。影响工作情绪。任务完毕就好…

Plotclock

调试程序&#xff0c;运行调试程序&#xff0c;舵机会移动两只悬臂分别停留在一只水平另一只垂直的位置上。如果差距非常大&#xff0c;可拆下悬臂调节&#xff0c;如果比较接近了&#xff0c;就修改程序第3~6行的四个参数 SERVOFAKTORLEFT 左悬臂垂直位置&#xff0c;SERVOFAK…

js性能优化--学习笔记

《高性能网站建设进阶指南》&#xff1a; 1.使用局部变量&#xff0c;避免深入作用域查找&#xff0c;局部变量是读写速度最快的&#xff1b;把函数中使用次数超过一次的对象属性和数组存储为局部变量是一个好方法&#xff1b;比如for循环中的.length通常可以保存为局部变量。 …

struct和typedef struct在C与C++中用法

struct和typedef struct 分三块来讲述&#xff1a;   1 首先&#xff1a;//注意在C和C里不同     在C中定义一个结构体类型要用typedef:     typedef struct Student    {    int a;    }Stu;     于是在声明变量的时候就可&#xff1a;Stu stu1;(如…

【数据库学习】——Python实现mysql数据库SQL文件生成和导入

目录 1、将mysql数据导出到SQL文件中&#xff08;数据库存在的情况&#xff09; 2、将现有的sql文件数据导入到数据库中&#xff08;前提数据库存在&#xff09; 3、利用Navicat导出SQL文件和导入SQL文件 1&#xff09;从数据库导出SQL文件 2&#xff09;导入SQL文件到数据…

lfcp——PB使用

场景&#xff1a;记录以备忘。 1 直接说明 pb连接说明&#xff1a;目前项目共有性能、功能、业务、联调四个环境。所以pb可以连接四个不同的数据库。1.copy一份pb程序&#xff0c;修改main.ini文件中的DBCONNECT/DBCONNECT2位new&#xff0c;DBNAME/DBNAME2为oracle数据源中的源…

【重磅】Google官方推出了免费的、中文的、机器学习初级课程。

2019独角兽企业重金招聘Python工程师标准>>> 机器学习(Machine Learning, ML)是一门多领域交叉学科&#xff0c;涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它是人工智能的核心&#xff0c;是使计算机具有智能的根本途径&#xff0c;其应用遍及…

市面上常见arduino版本比较

http://arduino.cc/en/Main/Products 详细链接 如果是入门&#xff0c;那么首选UNO R3&#xff0c;方便又省心 如果不是特殊要求&#xff0c;不建议购买2560&#xff0c;因为贵啊 nano是块很好的控制器&#xff0c;买不买随你咯 非特殊场合使用不建…

leetcode-114. Flatten Binary Tree to Linked List

Given a binary tree, flatten it to a linked list in-place. For example,Given 1/ \2 5/ \ \3 4 6The flattened tree should look like: 1\2\3\4\5\6思路&#xff1a;递归处理&#xff0c;引用二叉链表的思想&#xff0c;使用pre记录上一个分支的指针。Accepted Co…

HALCON示例程序autobahn高速公路车道识别程序剖析

HALCON示例程序autobahn高速公路车道识别程序剖析 小哥哥小姐姐觉得有用点个赞呗&#xff01; 示例程序源码&#xff08;加注释&#xff09; *关闭halcon窗口的实时更新 dev_update_window (‘off’) *关闭halcon图形窗口 dev_close_window () *打开图形窗口 *dev_open_win…

CSS中的未定义行为,浏览器的差异(一)

今天看了张鑫旭大佬的新书的有感吧&#xff0c;记录一下。 Web标准未对一些场景做出明确规范&#xff0c;所以各大浏览器厂家只能根据自己的理解和喜好去实现&#xff0c;表现差异不是浏览器的bug&#xff0c;用计算机领域的术语描述为"未定义行为"。 比如一个例子&a…

KVC 和 KVO

作者 冲破茧缚 2015.08.28 16:12* 写了3967字&#xff0c;被8人关注&#xff0c;获得了14个喜欢KVC 和 KVO 字数363 阅读32 评论0 喜欢0KVC (Key Value Coding)&#xff0c;键值编码&#xff0c;通过键值&#xff08;字符串&#xff09;来访问属性的机制&#xff0c;来间接修改…

Atmel megaAVR控制器 串行引导Bootloader

开始研究下Bootloader的代码结构 2015.1.9 粗略看了下&#xff0c;Bootloader主要做了下板卡的初始化 -----> 然后进入for( ; ; )死循环 -----> 循环刷新串口数据 -----> 根据数据做出不同应答 -----> 如果有写数据&#xff0c;则将数据存入buffer …

MapReduce入门2-流量监控

3、流量监控汇总&#xff08;使用LongWritable实现&#xff09; hdfs文件路径&#xff1a;/tmp/flow.txt 查看文件内容&#xff1a; 13770759991 50 100 25 400 13770759991 800 600 500 100 13770759992 400 300 250 1400 13770759992 800 1200 600 900字符串含义&#xff1a;…

【fiddler学习问题记录】——手机端证书下载页打不开、无法将此证书安装(已解决)

目录 1、手机端下载页打不开 解决方法1&#xff09;电脑端——将网络设置成公用&#xff08;亲测有效&#xff09; 解决方法2&#xff09;手机端将fiddler设置为信任应用&#xff0c;不被拦截 &#xff08;未试&#xff09; 2、无法将此证书安装 方法一&#xff1a;修改证书…

HALCON示例程序ball电路板焊点识别、检测、测量程序剖析

HALCON示例程序ball电路板焊点识别、检测、测量程序剖析 示例程序源码&#xff08;加注释&#xff09; 介绍&#xff1a; ball.hdev: Inspection of Ball Bonding *halcon窗口实时更新关闭 dev_update_window (‘off’) *halcon关闭所有窗口 dev_close_window () *halcon打开…

舵机的原理和控制

控制信号由接收机的通道进入信号调制芯片&#xff0c;获得直流偏置电压。它内部有一个基准电路&#xff0c;产生周期为20ms&#xff0c;宽度为1.5ms的基准信号&#xff0c;将获得的直流偏置电压与电位器的电压比较&#xff0c;获得电压差输出。最后&#xff0c;电压差的正负输出…