首先给大家介绍一个很好用的学习地址:https://cloudstudio.net/columns
在上一节中,我们已经完成了对所有经过均衡和清洗的菜品数据的准备工作。接下来,我们将考虑使用多种算法,也就是不同的分类器,来构建模型。我们将利用这个数据集和各种分类器,基于一组特定的配料,预测这些菜品属于哪个国家的美食。
在这一过程中,你将深入学习如何评估和权衡不同分类算法的优缺点,以及如何选择最适合当前任务的模型。
选择你的分类器
Scikit-learn 将分类任务归类为监督学习的一部分,其中包含了多种可用于分类的算法和方法。初看之下,这些选择似乎让人眼花缭乱。以下是一些可用于分类的主要算法:
- 线性模型(Linear Models):这些模型基于线性假设,通过对特征进行线性组合来进行分类。
- 支持向量机(Support Vector Machines):此算法通过找到最佳分隔超平面来最大化类别间的间隔,从而实现分类。
- 随机梯度下降(Stochastic Gradient Descent):一种高效的优化方法,可以用于训练各种模型,特别是在处理大规模数据集时。