吴恩达机器学习作业(1):线性回归

目录

1)导入相关库和数据

2)代价函数

3)批量梯度下降

4)绘制线性模型

前阵子在网易云课堂学习了吴恩达老师的机器学习课程,今天结合网上资料,用Python实现了线性回归作业,共勉。建议大家使用Jupyter notebook来编写程序。

1)导入相关库和数据

导入相关库:numpy, pandas, matplotlib

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

拿到数据之后,建议大家先看看数据长什么样子,这样有助于我们进行之后的分析:

path = 'ex1data1.txt'
#指定了列名,header=None
data = pd.read_csv(path, header=None, names=['Population', 'Profit'])
data.head()data.describe()data.plot(kind='scatter', x='Population', y='Profit', figsize=(12,8))
plt.show()

2)代价函数J(\theta)

现在我们使用梯度下降来实现线性回归,以最小化成本函数。

首先,我们将创建一个以参数\theta为特征的代价函数:

                                              J(\theta)=\frac{1}{2m}\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})^2

其中:

                                           h_{\theta}(x)=\theta^TX=\theta_0x_0+\theta_1x_1+...+\theta_nx_n

def computeCost(X, y, theta):inner = np.power(((X * theta.T) - y), 2)return np.sum(inner) / (2 * len(X))

我们需要在训练集中添加一列,以便我们可以使用向量化解决方案来计算大家函数:

#在第0列插入1,列名为“Ones”
data.insert(0, 'Ones', 1)# set X (training data) and y (target variable)
#cols = 3
cols = data.shape[1]
X = data.iloc[:,0:cols-1] #X选取所有行,去掉最后一列,第一个分号前为行。
y = data.iloc[:,cols-1:cols]#y选取所有行,最后一列

代价函数应该是numpy矩阵,所以我们需要转换X和y,然后才能使用它们。我们还需要初始化参数theta。

X = np.matrix(X.values)
y = np.matrix(y.values)
#我们这里是单变量线性回归,故只需要两个参数
theta = np.matrix(np.array([0,0]))

现在我们计算代价函数(theta初始值为0)

computeCost(X, y, theta)
32.072733877455676

3)批量梯度下降

我们前面只是计算了初试theta为0时代价函数的值,我们现在要使用梯度下降算法来求我们的参数\theta

\dpi{200} \theta_j:=\theta_j-\alpha\frac{\partial}{\partial\theta_j}J(\theta)

\theta_0:=\theta_0-\alpha\frac{1}{m}\sum_{i=1}^{m}(h_\theta(x^{(i)})-y^{(i)})

\theta_1:=\theta_1-\alpha\frac{1}{m}\sum_{i=1}^{m}(h_\theta(x^{(i)})-y^{(i)})x^{(i)}

def gradientDescent(X, y, theta, alpha, iters):temp = np.matrix(np.zeros(theta.shape))    #theta.shape=(1,2)parameters = int(theta.ravel().shape[1])    #ravel()降维,parameters=2cost = np.zeros(iters)                      #iter维零向量for i in range(iters):                        #迭代iters次error = (X * theta.T) - yfor j in range(parameters):                #2个参数term = np.multiply(error, X[:,j])temp[0,j] = theta[0,j] - ((alpha / len(X)) * np.sum(term))theta = tempcost[i] = computeCost(X, y, theta)    #保存每次迭代后的cost值return theta, costalpha = 0.01
iters = 1000

现在我们运行梯度下降算法来求我们的参数theta并求出拟合后的代价函数值。

g, cost = gradientDescent(X, y, theta, alpha, iters)computeCost(X, y, g)
4.5159555030789118

4)绘制线性模型

现在我们来绘制线性模型以及数据,直观地看出它的拟合。

x = np.linspace(data.Population.min(), data.Population.max(), 100)
f = g[0, 0] + (g[0, 1] * x)fig, ax = plt.subplots(figsize=(12,8))
ax.plot(x, f, 'r', label='Prediction')
ax.scatter(data.Population, data.Profit, label='Traning Data')
ax.legend(loc=2)
ax.set_xlabel('Population')
ax.set_ylabel('Profit')
ax.set_title('Predicted Profit vs. Population Size')
plt.show()

由于梯度方程式函数也在每个训练迭代中输出一个代价的向量,所以我们也可以绘制。 请注意,代价总是降低 - 这是凸优化问题的一个例子。

fig, ax = plt.subplots(figsize=(12,8))
ax.plot(np.arange(iters), cost, 'r')
ax.set_xlabel('Iterations')
ax.set_ylabel('Cost')
ax.set_title('Error vs. Training Epoch')
plt.show()

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/440107.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【HDU - 5886】Tower Defence(树的直径,思维,dp)

题干: There was a civil war between two factions in Skyrim, a province of the Empire on the continent of Tamriel. The Stormcloaks, led by Ulfric Stormcloak, are made up of Skyrims native Nord race. Their goal is an independent Skyrim free from …

(1).数据结构概述

目录 数据结构概述 预备知识: 模块: 这篇笔记是根据郝斌老师的上课讲义整理而得: 数据结构概述 定义:如何把现实中大量复杂的问题以特定的数据类型和特定的存储结构保存到主存储器中(内存)中, 以及在此基础上为实…

ROS导航之参数配置和自适应蒙特卡罗定位

我们的机器人使用两种导航算法在地图中移动:全局导航(global)和局部导航(local)。这些导航算法通过代价地图来处理地图中的各种信息,导航stack使用两种costmaps http://www.cnblogs.com/zjiaxing/p/5543386.html存储环…

吴恩达机器学习作业(2):多元线性回归

目录 1)数据处理 2)代价函数 3)Scikit-learn训练数据集 4)正规方程 练习1还包括一个房屋价格数据集,其中有2个变量(房子的大小,卧室的数量)和目标(房子的价格&#…

【洛谷 - P2756】飞行员配对方案问题(网络流最大流,输出方案)

题干: 题目背景 第二次世界大战时期.. 题目描述 英国皇家空军从沦陷国征募了大量外籍飞行员。由皇家空军派出的每一架飞机都需要配备在航行技能和语言上能互相配合的2 名飞行员,其中1 名是英国飞行员,另1名是外籍飞行员。在众多的飞行员中…

office 安装错误 1920 osppsvc服务无法启动 failed to start

今天忽然发现Office 报 1920 错误,按照网上的的各类教程,还是不行,没有办法启动。答搞了一下午了,终于Ok,超级简单: 首先,到文件夹 C:\Program Files\Common Files\microsoft shared\OfficeSo…

机器学习笔记(八):神经网络:学习

目录 1)Cost function 2)Backpropagation algorithm 3)Backpropagation intuition 4) Gradient checking 5)Random initialization 6)Putting it together 注:吴恩达老师的机器学习课程对反向传播算…

【HDU - 6231】K-th Number(二分,思维)

题干: Alice are given an array A[1..N]A[1..N] with NN numbers. Now Alice want to build an array BB by a parameter KK as following rules: Initially, the array B is empty. Consider each interval in array A. If the length of this interval is les…

C 语言运算符优先级(记忆口诀)

优先级 运算符 名称或含义 使用形式 结合方向 说明 1 [] 数组下标 数组名[常量表达式] 左到右 () 圆括号 (表达式)/函数名(形参表) . 成员选择(对象) 对象.成员名 -> 成员选择(指针&#xff0…

吴恩达机器学习作业(3):逻辑回归

目录 1)数据处理 2)sigmoid函数 3)代价函数 4)梯度下降 5)预测函数 我们首先做一个练习,问题是这样的:设想你是大学相关部分的管理者,想通过申请学生两次测试的评分&#xff0c…

机器学习笔记(九):应用机器学习的建议

目录 1)Deciding what to try next 2)Evaluating a hypothesis 3)Model selection and training/validation/test sets 4)Diagnosing bias vs. variance 5)Regularization and bias/variance 6)Learn…

【洛谷 - P3410】拍照(最大权闭合图,网络流最小割)

题干: 题目描述 小B有n个下属,现小B要带着一些下属让别人拍照。 有m个人,每个人都愿意付给小B一定钱让n个人中的一些人进行合影。如果这一些人没带齐那么就不能拍照,小B也不会得到钱。 注意:带下属不是白带的&…

ROS有三个层级的概念,分别是:文件系统级、计算图级和开源社区级

ROS有三个层级的概念,分别是:文件系统级、计算图级和开源社区级。 文件系统级:ROS的内部结构、文件结构和所需的核心文件都在这一层里,理解ROS文件系统是入门ROS的基础。一个ROS程序的结构,是一些按不同功能进行区分的…

【洛谷 - P1231 】教辅的组成(网络流最大流,拆点)

题干: 题目描述 蒟蒻HansBug在一本语文书里面发现了一本答案,然而他却明明记得这书应该还包含一份练习题。然而出现在他眼前的书多得数不胜数,其中有书,有答案,有练习册。已知一个完整的书册均应该包含且仅包含一本书…

机器学习笔记(十):机器学习系统的设计

目录 1)Prioritizing what to work on:Spam classification example 2)Error analysis 3)Error metrics for skewed classes 4)Trading off precision and recall 5)Data for machine learning 下面将学习到在构建…

ROS坐标系统,常见的坐标系和其含义

常见的坐标系 在使用ROS进行定位导航等操作时,我们经常会遇到各种坐标系。每种坐标系都有明确的含义。理论上坐标系的名称可以是随意的,但是为了方便不同的软件间共享坐标信息,ROS定义了几个常见的坐标系。 1.base_linkbase_link坐标系和机…

【洛谷 - P1345 [USACO5.4]】奶牛的电信(网络流最小割,拆点)

题干: 题目描述 农夫约翰的奶牛们喜欢通过电邮保持联系,于是她们建立了一个奶牛电脑网络,以便互相交流。这些机器用如下的方式发送电邮:如果存在一个由c台电脑组成的序列a1,a2,...,a(c),且a1与a2相连,a2与…

机器学习笔记(十一):支持向量机

目录 1)Optimization objective 2)Large Margin Intuition 3)Kernels 1 4)Kernels II 5)Using an SVM 注:这一章SVM可能有点难理解,强烈建议大家把本章的编程作业做了。 1)Opt…

ros中的坐标系,

ros中的坐标系,主要包括: map,odom,base_link(base_footprint) 以及如laser,camera等传感器的坐标系; 这些坐标系间的关系可以用下图表示: 这是一个有向图,图中涉及四个坐标系&#…

【BZOJ - 3224】普通平衡树(Splay模板题)

题干: 您需要写一种数据结构(可参考题目标题),来维护一些数,其中需要提供以下操作: 1. 插入x数 2. 删除x数(若有多个相同的数,因只删除一个) 3. 查询x数的排名(若有多个相同的数,因…