目录
- 1.机器学习
- 2.监督学习
- 3.无监督学习
- 4.线性回归
- 5.逻辑回归
1.机器学习
机器学习的定义:一个计算机程序可从经验E(Experience)中学习如何完成任务T(Task),并且随着经验E的增加,性能指标P(performance measure)会不断提高;
拿下西洋棋举例,经验E 就是程序上万次的自我练习的经验而任务 T 就是下棋。性能度量值 P,就是它在与一些新的对手比赛时,赢得比赛的概率。再比如垃圾邮件筛选器,经验E就是程序从垃圾邮件成千上万次的自我练习的经验而任务是当邮件过来时,给邮件分类是正常邮件还是垃圾邮件,性能P就是对垃圾邮件正确分类的准确率;
2.监督学习
监督学习是机器学习的一种方法,它使用已知输入和对应的输出数据来训练模型,以便模型能够预测新的输入数据对应的输出。在监督学习中,训练数据包括输入特征和目标输出,模型通过学习输入和输出之间的关系来进行预测。
监督学习常用于解决分类和回归问题。在分类问题中,模型试图将输入数据分为不同的类别或标签;在回归问题中,模型试图预测连续数值型输出。
常见的监督学习算法包括线性回归、逻辑回归、支持向量机、决策树、随机森林、神经网络等。监督学习是机器学习中最常见和重要的方法之一,被广泛应用于各种领域,如自然语言处理、图像识别、金融预测等。
3.无监督学习
无监督学习是机器学习的一种方法,它用于从未标记、未分类的数据中发现模式、结构和关系。与监督学习不同,无监督学习不需要已知输出的训练数据,而是通过对数据进行聚类、降维、关联规则挖掘等技术来发现数据中的隐藏结构和模式。
在无监督学习中,训练数据只包括输入特征,而没有对应的目标输出。模型需要自主地发现数据中的内在结构和规律,从而能够对数据进行归纳、分类或者分析。
常见的无监督学习算法包括 K均值聚类、DBSCAN、主成分分析(PCA)、关联规则挖掘算法等。
无监督学习在许多领域都有重要应用,如数据挖掘、模式识别、推荐系统等。通过无监督学习,可以从未标记的数据中获取有价值的信息和见解。
4.线性回归
线性回归是一种用于建立输入变量(特征)和连续数值型输出变量之间关系的统计学习方法。它试图通过对输入变量和输出变量之间的线性关系进行建模,来预测新的输入对应的输出。
线性回归模型通常会使用最小二乘法来估计模型的参数,通过最小化观测值和模型预测值之间的残差平方和来确定最优的参数估计值。
线性回归模型的应用非常广泛,包括经济学、金融、社会科学、生物统计学等领域。它是一种简单而有效的预测模型,为数据分析和预测提供了重要的工具。
5.逻辑回归
逻辑回归是一种用于处理分类问题的统计学习方法,尽管其名称中包含“回归”一词,但逻辑回归实际上是一种分类算法,用于预测离散的输出值(类别标签),而不是连续数值型输出。
逻辑回归模型采用了逻辑函数(也称为S形函数)来建模输入变量与输出变量之间的关系,通常用于解决二元分类问题,即将输入数据分为两个类别。
逻辑回归在分类问题中有着广泛的应用,如医学诊断、金融风险评估、广告点击率预测等。它是一种简单而有效的分类算法,为处理二元分类问题提供了重要的工具。
持续更新中!!!!!