1-3.监督学习(supervised learning)

定义:监督学习指的就是我们给学习算法一个数据集,这个数据集由“正确答案”组成,然后运用学习算法,算出更多的正确答案。术语叫做回归问题

【监督学习可分为】:回归问题、分类问题。两种

例:一个学生从波特兰俄勒冈州的研究所收集了一些房价的数据。你把这些数据画出来,看起来是这个样子:横轴表示房子的面积,单位是平方英尺,纵轴表示房价,单位是千美元。那基于这组数据,假如你有一个朋友他有一套 750 平方英尺房子,现在他希望把房子卖掉,他想知道这房子能卖多少钱?

解:

我们应用学习算法,可以在这组数据中画一条直线,或者换句话说,拟合一条直线,根
据这条线我们可以推测出,这套房子可能卖$150,000,当然这不是唯一的算法。可能还有更
好的,比如我们不用直线拟合这些数据,用二次方程去拟合可能效果会更好。根据二次方程
的曲线,我们可以从这个点推测出,这套房子能卖接近$200,000。稍后我们将讨论如何选择
学习算法,如何决定用直线还是二次方程来拟合。两个方案中有一个能让你朋友的房子出售
得更合理。这些都是学习算法里面很好的例子。以上就是监督学习的例子。

【离散值】(discrete valued)就是孤立的点集,像区间,它在每一点上都是连续的,而像整数集,它的每一元素之间都有一点的距离。
例:所谓在某一点上连续,就是对于该点,无论给定一个多么小的正数,总能在定义域内找到一点,它的函数值到该点的函数值距离小于给定的数。而离散就是指不连续。
想得到的话,计算机的随机变量也算是,随便找几个人问几个整数,得到的也是离散值,一个范围内,人的身高也算
监督学习例2:乳腺癌例

让我们来看一组数据:这个数据集中,横轴表示肿瘤的大小,纵轴上,我标出 1 和 0 表
示是或者不是恶性肿瘤。我们之前见过的肿瘤,如果是恶性则记为 1,不是恶性,或者说良
性记为 0。
我有 5 个良性肿瘤样本,在 1 的位置有 5 个恶性肿瘤样本。现在我们有一个朋友很不幸
检查出乳腺肿瘤。假设说她的肿瘤大概这么大,那么机器学习的问题就在于,你能否估算出
肿瘤是恶性的或是良性的概率。用术语来讲,这是一个分类问题。
分类指的是,我们试着推测出离散的输出值:0 或 1 良性或恶性,而事实上在分类问题
中,输出可能不止两个值。比如说可能有三种乳腺癌,所以你希望预测离散输出 0、1、2、
3。0 代表良性,1 表示第 1 类乳腺癌,2 表示第 2 类癌症,3 表示第 3 类,但这也是分类问
题。
因为这几个离散的输出分别对应良性,第一类第二类或者第三类癌症,在分类问题中我
们可以用另一种方式绘制这些数据点。
现在我用不同的符号来表示这些数据。既然我们把肿瘤的尺寸看做区分恶性或良性的特
征,那么我可以这么画,我用不同的符号来表示良性和恶性肿瘤。或者说是负样本和正样本
现在我们不全部画 X,良性的肿瘤改成用 O 表示,恶性的继续用 X 表示。来预测肿瘤的恶性与否。
在其它一些机器学习问题中,可能会遇到不止一种特征。举个例子,我们不仅知道肿瘤
的尺寸,还知道对应患者的年龄。在其他机器学习问题中,我们通常有更多的特征,我朋友
研究这个问题时,通常采用这些特征,比如肿块密度,肿瘤细胞尺寸的一致性和形状的一致
性等等,还有一些其他的特征。这就是我们即将学到最有趣的学习算法之一。

我们以后会讲一个算法,叫【支持向量机】,里面有一个巧妙的数学技巧,能让计算机处理无限多个特征。

【监督学习基本思想】是,我们数据集中的每个样本都有相应的“正确答案”。再根据这些样本作出预测。(就像房子和肿瘤的例子中做的那样)

【回归问题】Regression Problem,即通过回归来推出一个连续的输出,之后我们介绍了分类问题,其目标是为了推出一组离散的结果

【分类问题】Classification Problem,分类指的是,我们试着推测出离散的输出值:0 或 1 良性或恶性,而事实上在分类问题中,输出可能不止两个值

 

转载于:https://www.cnblogs.com/chenxi188/p/10869724.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/277725.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Mac OS使用技巧之十五:快捷方便的Mini Dock

Mini Dock是前面忘记了提,这里做一些补充。Mini Dock是Mac OSX的一个值得大书特书的亮点。虽然windows下也有类似的东西,但Mac下却提供了更为全面的功能,通过Mini Dock栏,可以快速切换、隐藏、关闭正在运行的APP。这也就比之前讲过…

linux下的SSHD被连接端口修改

连接别人:vim /etc/ssh/ssh_config 被连接: vim /etc/ssh/sshd_config 端口重启生效: /etc/init.d/sshd restart 转载于:https://www.cnblogs.com/gered/p/10871335.html

Mac OS使用技巧之十六:系统失去响应怎么办?

再好的系统,再快的本本,也会在运行时因为种种原因出现卡顿或者死机等失去响应的情况。Mac用户也会时不时碰到这种情况,最常见的表现为鼠标变为七彩圆圈,通常等上一会儿系统会自己恢复。如果迟迟没有响应的话,那就需要来…

单例模式--工厂模式

单例模式又称为职责模式,它用来在程序中创建一个单一功能的访问点,通俗地说就是实例化出来的对象是唯一的。所有的单例模式至少拥有以下三种公共元素:1. 它们必须拥有一个构造函数,并且必须被标记为private2. 它们拥有一个保存类的…

Mac OS使用技巧十七:丰富多彩的花哨输入法

OSX Mavericks中的汉字输入功能,丝毫不逊色于windows,甚至提供了强大的手写输入功能和语音输入功能,并且发展到现在,已经有很多种第三方输入法支持Mac了。 一、基本的输入法首先说一下支持Mac的各种中文输入法,其实我觉…

语言-汉语:汉语

ylbtech-语言-汉语:汉语汉语,即汉族的传统语言,是中国通用语言,国际通用语言之一,属汉藏语系,与藏语、壮语、侗语、黎语、彝语、苗语、瑶语等都是亲属语言。汉语历史悠久,使用人数最多&#xff…

Duboo入门示例(Idea开发环境)

在学习Dubbo分布式框架时的官方入门例子,很有代表性。简单清晰。 有关Dubbo的概念、概述和简单的配置文件,可以看官方文档的简述 会很快对Duboo有个整体的概念。 准备工作: 下载示例,点击这里下载,建议用git管理。下载注册中心&am…

Mac OS使用技巧十八:Safari碉堡功能之一制作Widget

Safari的使用大家应该自己摸索就可以慢慢驾轻就熟,毕竟再高端也是个浏览器,从开始上网就要一直使用浏览器,Safari只是众多浏览器中的一个比较强大的罢了。下面给大家介绍一下Safari的一个碉堡隐藏功能!!!!(其实不算隐藏啦。。。在…

CentOS 6.5 部署WordPress

1、安装环境: #yum install httpd mysql-server php php-mysql php-gd php-imap php-ldap php-odbc php-pear php-xml php-xmlrpc -y 2、配置mysql初始化密码: #mysqladmin -u root password ********** 2.1、mysql新建一个wordpress的表: create database wordpress; 3、启动服…

BZOJ1562: [NOI2009]变换序列(二分图 匈牙利)

Description Input Output Sample Input 5 1 1 2 2 1Sample Output 1 2 4 0 3HINT 30%的数据中N≤50;60%的数据中N≤500;100%的数据中N≤10000。 Source 这题是二分图应该不难看出来。 对于原序列中的一个点,对应两个可匹配的点。 关键是怎么…

Mac OS使用技巧十九:Safari碉堡功能之二查看网页源码

因为大三下的时候选修了搜索技术,了解了网络上搜索引擎和网络爬虫的信息扒取的一些东西,后来我们做了一个比较水的东西,就是只扒取了几家较大的下载网站几十个软件的评分下载量等信息,当用户输入一个程序名称,我们会根…

python文件打包发布(引用的包也可以加进来),打包出错解决了,运行出错解决了...

一开始,我以为,打包本来就很容易,可是没有。。。。。 没想到打包还能遇到坑 T.T 打包步骤: 1、安装 pyinstaller (cmd) pip install pyinstaller 2、进入目标文件所在文件夹,右键在此打开cmd py…

虚拟机(Visual Machine)的云平台的自动伸缩扩容(auto-scaling)技术

云计算平台中允许客户依据应用的负载进行云计算资源的弹性动态伸缩(理想的情况是实现一个用多少付费多少的模型,最大限度地降低用户的运营成本) 在进行讨论之前,先对几个名词进行定义 1)客户:使用云服务的人…

Unity 3D学习笔记之一 界面介绍

因为学校的课程,本学期对Unity 3D有学习的要求,在博客中记录下自己的Unity学习之路(内容摘录自书本和视频,书本为Unity 4.x从入门到精通)一、Unity界面介绍首先进入Unity3D,在菜单栏,File中new …

Coding and Paper Letter(一)

2019独角兽企业重金招聘Python工程师标准>>> 最近发现需要在快速阅读背景下,对快餐式资源做整理与收集。以Coding(以Github)和Paper(自己看到的一些论文,论文一般主要看题目和摘要做些简单小结)…

MacBook刷机勘错篇

前一段时间突然发现自己的MacBook已经好久没有刷过系统了,10.9用着还好,但bootcamp装的win8.1越来越卡,越用越慢。想要重做一下双系统,后来就演变成了两个系统一起更新,再后来就演变成了一个惨案。因为自己一直也没有使…

Mac OS X 10.10更新及体验

前一阵子,更新了Mac OS 10.10 Yosemite,总体用起来感觉还是很不错的,是很值得升级,相对于10.9 Mavericks优化了不少东西。我之前写的使用教程有一些也就不适用了;比如更换Dashboard中的背景,10.10中Dashboa…

Mac OS X必备APP推荐之一

本篇博文要推荐一下装机必备的APP,因为电脑的使用需求因人而异,这里我根据我的见解和长时间的使用经验推荐一些我认为大家基本都用得到的APP,太过专业性质的我就不推荐了,当然我的推荐肯定会有疏漏和偏差的地方,还请熟…

2018-2019-2 20175235 实验四《Android开发基础》实验报告

实验目的 一、Android Studio的安装测试 二、Activity测试 三、UI测试 四、布局测试 五、事件处理测试 一.Android Stuidio的安装测试: 参考《Java和Android开发学习指南(第二版)(EPUBIT,Java for Android 2nd)》第二十四章: 参考http://www.cnblogs.com…

Mac OS X必备APP推荐之二

本篇接着上一篇APP推荐的博文,继续为大家推荐Mac下好用的APP。 一、首先推荐一款DaisyDisk,磁盘分析、清理工具。前面第一篇APP推荐中,我们推荐过APP和系统垃圾清理工具——Cleanmymac,这两个APP侧重有所不同。Cleanmymac主要清理…