目录
1)welcome
2)What is Machine Learning
3)Supervised Learning
4)Unsupervised Learning
1)welcome
第一个视频主要介绍了机器学习目前的案例,主要有:数据库挖掘、医疗记录、生物工程、无人直升机、手写识别、NLP、计算机视觉等。
2)What is Machine Learning
下面是机器学习的两个定义,分别来自于Arthur Samuel 和 Tom Mitchell:
第一个定义是:在未进行特定编程的情况下,给予计算机学习能力的领域。
第二个定义是:一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。
目前存在几种不同类型的学习算法,主要的两种类型为监督学习和无监督学习。此外还有强化学习和推荐系统等。但更重要的还有了解应用学习算法的建议。我们不仅要知道工具,更要知道如何使用好工具。
3)Supervised Learning
先看一个例子,这有一张数据图,横轴表示面积,纵轴表示房价。基于这组数据,假如你有一个朋友,他有一套750平方英尺的房子,能卖多少钱?从图中可以看出,红色和蓝色曲线代表两种拟合方式,显然蓝色曲线拟合的效果更好。这是一个回归问题,回归的意思是,我们在试着推测出一个连续值的结果。
这里有一份关于乳腺癌的数据,横轴表示肿瘤大小,纵轴表示肿瘤是否为恶性。恶性则为1,良性记为0。这是一个分类的问题,分类指的是,我们推测出离散的输出值。
在其它机器学习问题中,可能会遇到不止一种特征,我们不仅知道肿瘤的尺寸,还知道患者的年龄。肿块密度、肿瘤细胞尺寸等等。
现在我们来总结一下,监督学习基本思想是:我们数据集中的每个样本都有相应的 “正确答案”。回归可以推出一个连续的输出,分类目标是一组离散的结果。
4)Unsupervised Learning
现在我们来介绍无监督学习。在监督学习中,数据集已经有了正确的标记。而在无监督学习中,数据集没有任何的标签。下图中,我们把数据分成了两个簇,这是聚类算法。
下图也是一个聚类算法的应用,输入一组不同个体的基因,我们把个体聚类到不同的类或不同类型的组。
下面是无监督学习的应用,如组织大型计算机群、社交网络分析,市场分割,天文学数据分析。