一、机器学习介绍及其原理
1.什么是人工智能?
机器对人的思维信息过程的模拟,让它能相认一样思考。
a.输入 b.处理 c.输出
根据输入信息进行模型建构、权重更新,实现最终优化。
特点:信息处理、自我学习,优化升级
2.人工智能核心方法
机器学习:使用算法来解析数据,从中学习,然后对真实世界中的事件做出决策和预测。如:垃圾邮件检测、房价预测。
深度学习:模仿人类神经网络,建立模型,进行数据分析。如:人脸识别、语义理解、无人驾驶。
机器学习是一种实现人工智能的方法
深度学习是一种实现机器学习的技术
3.机器学习的主要类别监督学习:基于数据及结果进行预测,一组输入数据对应一个“正确的”输出结果。如:垃圾邮件检测、房价预测。
半监督学习:从数据中挖掘并联性,不存在“正确的”答案。如:数据聚类、相关新闻自动推送。
强化学习
4.机器学习的基本原理监督式学习
a.使用标签数据(由输入数据对应的输出数据)训练机器学习模型(将学习输入数据与之对应的输出结果间的函数关系)
b.调用训练好的机器学习模型,根据新的数据预测对应的结果非监督式学习
不需要标签数据,而是通过引入预先设定的优化准则进行模型训练。如:自动将数据分为3类。
二、机器学习开发环境部署
1.python
解释型的、面向对象的、移植性强的高级程序设计语言
(解释型是指不需要编译成二进制代码,可直接从源代码运行)
2.scikit-learn
可以实现数据预处理、分类、回归、降维、模型选择等常用的机器学习算法。
不支持Python之外的语言,不支持深度学习和强化学习。
3.jupyter notebook
开源的web应用程序
步骤:
a.安装python
b.安装Anaconda
c.新建开发环境,安装numpy,scikit-learn库
conda create -n env_name
pip(conda) install package_name
d.jupyter notebook界面优化