一、机器学习基础知识:基本概念与Python开发环境

文章目录

  • 1、机器学习的不同类型
    • 1.1 监督学习
    • 1.2 无监督学习
    • 1.3 强化学习
  • 2、Python开发环境
    • 2.1 Python第三方库
    • 2.2 Anaconda+Pycharm集成开发环境

1、机器学习的不同类型

机器学习属于人工智能的一个分支,专门用于对数据进行自动分析以发现相关规律,从而对未知数据进行预测。机器学习的研究方式一般是基于现有数据生成模型,在解决问题时,使用该模型进行判断、预测。
机器学习方法通常是从已知数据中去学习数据中蕴含的规律或者判断规则,借此获取新知识、新技能。已知数据的用途是学习素材,而学习的主要目的是推广,即把学到的规则应用到未来的新数据上,并做出新的判断或预测。

1.1 监督学习

监督学习是机器学习中最常见的一种学习方法,该方法是从现有的数据中获取一定的规则,该规则可以通过训练结果的反馈对学习过程进行调整,即起到一个监督作用。
例如,我们已知多种不同水果以及它们各自的颜色、重量、尺寸,有无核等特征信息。通过对该数据进行训练,掌握不同水果对应哪些具体的特征并将此对应关系记录下来,之后专门输入颜色、重量等特征信息,可以预测出该水果的种类。
在上述预测过程中,已知的水果颜色、重量、尺寸,有无核等特征信息为训练集,其种类为预测量的真实值,利用该真实值对学习过程不断进行调整,已知水果颜色、重量、尺寸,有无核等特征信息但不知其种类的数据集为测试数据,利用学习到的规则对其种类进行预测。

1.2 无监督学习

上述监督学习过程要求为每个样本提供预测量的真实值,这在有些应用场景是困难的,在这些应用场景中,只知道特征信息,不知道预测量的真实值,需要通过自我学习的方式,发现其中的规则,这种不提供监督信息的条件下进行学习的方法称为无监督学习。
例如,同一种水果在不同地区它们的颜色、重量、尺寸等信息均存在月底那个的差别,现已知所有水果的特征信息数据集,对该数据集进行训练,利用自我学习的方式发现不同地区水果之间的差别从而进一步将该数据集进行划分,同一地区的水果数据集划分为同一类。

1.3 强化学习

在机器学习的实际应用中,还有一种类型的问题就是利用学习到的模型来指导行动。
例如在下棋的过程中,需要关注的不是某次移动是否是正确的,而是关注这次移动能够给后期的博弈带来什么影响。为了解决这类问题,强化学习被提了出来。
强化学习的重点是需要获得一个策略去指导下一步的行动,也就是在下棋的过程中,指导在当下的场景中需要将棋子下在哪一个位置。与监督学习不同,该方法不需要一系列的输入和预测的样本,它主要在行动过程中进行学习。

2、Python开发环境

机器学习领域最为热门的开发环境就是Python。Python语言之所以应用如此广泛,为广大开发者所追捧,主要是因为它具备了很多优点:

  1. 学习难度低,Python语言简单易学,容易理解,只要具备基本的编程思想在学习Python时就没有什么难度。
  2. 开发效率高。Python语言可以让开发者以更少的代码、更短的时间来完成学习与工作,相对于Java等静态编译语言,其开发效率提高了若干倍。
  3. 资源丰富。Python语言的标准库功能强大,同时加上不用应用领域有着众多开源的第三方程序库,开发者可以直接拿来使用,无需自己从头设计。
  4. 可移植性好。Python是一门脚本语言,它不需要编译,它的执行只与解释器有关,同样的代码无需改动就可以移植到不同类型的操作系统上运行。
  5. 扩展性好。通过各类接口或者函数库可以方便地在Python程序中调用其他程序设计语言编写的代码,将它们整合一起来完成某项工作。

2.1 Python第三方库

Python的标准库包括math、random、datetime、os等,同时它也拥有强大的第三方资源库,为开发者提供了大量的开发资源。借助常用的机器学习库,Python可以解决多种问题,例如科学计算、数据分析、图像处理等。下面简单介绍几种常见的机器学习库:

  1. Numpy。Numpy是Numerical Python的简称,是高性能计算和数据分析的基础包,是Python的一个重要扩充库。Numpy支持高维度数组与矩阵运算,也针对数组运算提供了大量数学函数库,其运算效率极好,是大量机器学习框架的基础库。
  2. Pandas。Pandas是Python的一个数据分析包,是基于Numpy的一种工具,是为了解决数据分析任务而创建的。
  3. Matplotlib。Matplotlib是Python的一个基本2D绘图库,它提供了很多参数,可以通过参数控制样式、属性等,生成跨平台的出版质量级别的图形。
  4. Sklearn。Sklearn的全称是Scikit learn,它专门提供了机器学习的模块,该模块中包含了很多常见的机器学习算法,例如数据分类、聚类、回归、数据预处理等。

2.2 Anaconda+Pycharm集成开发环境

Anaconda是一个开源的Python发行版本,可以看作是增值版的Python,本身自带了python解释器而且还自带很多实用性的工具,其中包括大规模数据处理、预测分析和科学计算等包及支持模块,是数据分析和机器学习的有力工具。
anaconda官方下载https://www.anaconda.com/download/。官网下载比较慢,给大家推荐清华源的下载地址: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
在这里插入图片描述

进入后选择最下方的Anaconda3,3的意思就是Python3以上的版本,如果是anaconda2则就是python2,此处推荐下载Anaconda3 注:x86是32位的,而x86_64就是64位的。
下载完成后运行安装即可,具体的安装过程较为简单,主要在安装过程中设置好自定义安装路径即可。
安装完成后在开始菜单中就会有anaconda程序,启动Jupyter notebook就可以开始进行Python的编程和笔记的记录,Jupyter notebook是Web交互计算环境,Jupyter notebook文档(.ipynb)实际上是一个JSON文档,可以包含代码、文本、数字公式、图形和多媒体。使用Jupyter notebook可以让文档和代码相辅相成,具有优秀的可视化能力,使用户能够专注于数据分析过程。
Jupyter notebook程序:
在这里插入图片描述

Jupyter notebook主页面:
在这里插入图片描述

从右上角的New选项中选择Python3选项,可以看到如下的编程窗口:
在这里插入图片描述

代码上方的菜单栏提供了对网页中单元格的操作选项。
File:文件操作,如新建文件(New),打开文件(Open)和重命名文件(Rename)等。
Edit:编辑,包括常见的剪切(Cut Cells)、复制 (Copy Cells)和删除单元格 (Delete Cells)操作,以及上下移动单元格(Move Cell Up/ Move Cell Down)等操作。
Inser:添加单元格。
Cell:包括运行单元格中的代码(Run Cells)和全部运行(Run All)。
Kernel: 包括对内核的操作,如中断运行(Interrupt),以及重新启动内核(RestarD)。
在工具栏的下拉菜单中有四个选项,各按钮的功能依次如下。
在这里插入图片描述

Code: 当前单元格的内容是可运行的程序代码。
Markdown:当前单元格的内容是文本,例如代码以外的结论、注释等文字。
Raw NBConvert:当前单元格的内容为操作页面(Notebook)的命令。
Heading:当前单元格的内容为标题,用于使 Notebook 页面整洁。在最新版本中,Heading 已经被集成到 Markdown 选项,选择 Markdown 选项,然后在文字前添加“#“行号,该行文字内容就被视为标题。

如果要对Jupyter notebook文档(.ipynb)的存储路径进行修改,将其保存在其他路径之下,首先找到配置文件jupyter_notebook_config.py,其存储路径一般为C盘下用户路径之下。
在这里插入图片描述

用记事本打开,找到 #c.NotebookApp.notebook_dir = ‘’,去掉该行前面的“#”;在打算存放文件的位置先新建一个文件夹,然后将新的路径设置在单引号中,保存配置文件,之后在Jupyter notebook中创建的文档将会保存在该路径之下。
在这里插入图片描述

PyCharm是一种Python集成开发环境,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外,该集成环境提供了一些高级功能,以用于支持Django框架下的专业Web开发。
Pycharm官方下载地址:https://www.jetbrains.com/pycharm/download/#section=windows
注意:Pycharm 有社区版和专业版之分,专业版收费的(有30天试用),而社区版免费的。社区版功能缺失比较多,所以建议安装专业版。
Pycharm的安装过程较为简单,其中专业版需要激活,未激活则可以免费试用30天。
Pycharm的启动界面如下,这里是选择创建一个项目还是打开一个项目。
在这里插入图片描述

选择创建一个项目,选择好项目目录,然后就可以进入Pycharm了。
在这里插入图片描述

安装完Pycharm之后需要设置关联一下解释器才能正常工作,进入设置(Ctrl+Alt+S),在这里添加Anaconda安装目录下的Python.exe路径就可以了。
在这里插入图片描述

如果你有多个解释器,可以添加上去之后,在这里进行切换。
之后就可以在该项目中进行python文件的创建以及编辑了。
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/87270.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

视频监控/视频汇聚/安防视频监控平台EasyCVR配置集群后有一台显示离线是什么原因?

开源EasyDarwin视频监控TSINGSEE青犀视频平台EasyCVR能在复杂的网络环境中,将分散的各类视频资源进行统一汇聚、整合、集中管理,在视频监控播放上,TSINGSEE青犀视频安防监控汇聚平台可支持1、4、9、16个画面窗口播放,可同时播放多…

芯片验证就是一次旅行

如果你国庆希望去一个你不曾去过的城市旅行,比如“中国苏州”。对游客来说,它是个蛮大的城市,有许多景点可以游玩,还有许多事情可以做。但实际上,即使最豪也最清闲的游客也很难看苏州的所有方方面面。同样的道理也适用…

肖sir__mysql中数据库后端无法展示

mysql中数据库后端无法展示: 错误现象 解决方法: mysql中数据库后端无法展示:my.cnf (5,7数据库) 在 mysql 配置文件中加入: sql_modeNO_ENGINE_SUBSTITUTION,STRICT_TRANS_TABLES 或者重启数据库

Android Kotlin 基础详解

1,基础语法 1.1 可变变量与不可变变量 可以多次赋值的变量是可变变量&#xff0c;用关键字var表示&#xff1a; var <标识符> : <类型> <初始化值> 注意&#xff0c;在kotlin中成员变量不会赋默认值&#xff0c;不像java一样&#xff0c;必须手动添加默…

Android12之容器类SortedVector、KeyedVector、Vector、VectorImpl总结(一百六十六)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 人生格言&#xff1a; 人生…

「大数据-2.1」HDFS集群启停命令

目录 一、HDFS集群一键启停脚本 1. HDFS集群的一键启动脚本 2. HDFS集群的一键关闭脚本 二、单进程启停 1. hadoop-daemon.sh脚本 2. hdfs脚本 三、总结 1. 一键启停脚本 2. 独立进程启停 一、HDFS集群一键启停脚本 Hadoop HDFS组件内置了HDFS集群的一键启停脚本。 1. HDFS集群…

ubuntu20.04 jammy 安装ros2

ubunut22.04 jammy&#xff08;5.15&#xff09; ros2版本: humble 安装参考&#xff1a; Ubuntu (Debian packages) — ROS 2 Documentation: Humble documentationl 按照官方给的操作指南进行操作即可&#xff0c;到安装软件包的时候&#xff0c;若只为开发&#xff0…

【LeetCode热题100】--56.合并区间

56.合并区间 排序&#xff1a; 如果按照区间的左端点排序&#xff0c;那么在排完序的列表中&#xff0c;可以合并的区间一定是连续的&#xff0c;如下图所示&#xff0c;标记为蓝色、黄色和绿色的区间分别可以合并为一个大区间&#xff0c;它们在排完序的列表中是连续的 算法&a…

安科瑞AMC16-DETT铁塔jizhan直流电能计量模块,直流计量用

安科瑞虞佳豪壹捌柒陆壹伍玖玖零玖叁 9月20日&#xff0c;在杭州亚运会火炬传递的现场&#xff0c;不少人通过网络与亲友连线&#xff0c;共同见证火炬传递的历史时刻。上午6时&#xff0c;杭州铁塔的一线通信保障人员共27人就已经在本次火炬传递收官点位奥体中心西广场附近&a…

【操作系统笔记九】并发安全问题

用户态抢占和内核态抢占 内核中可以执行以下几种程序&#xff1a; ① 当前运行的进程&#xff1a;陷阱程序&#xff08;系统调用&#xff09; 和 故障程序&#xff08;page fault&#xff09; &#xff0c;进程运行在内核态的时候&#xff0c;其实就是在执行进程在用户态触发的…

关于安卓SVGA浅尝(一)svgaplayer库的使用

关于安卓SVGA浅尝&#xff08;一&#xff09;使用 相关链接 SVGA官网 SVGA-github说明文档 背景 项目开发&#xff0c;都会和动画打交道&#xff0c;动画的方案选取&#xff0c;就有很多选择。如Json动画&#xff0c;svga动画&#xff0c;gif等等。各有各的优势。目前项目中…

【PCIE702-1】基于Kintex UltraScale系列FPGA的高性能PCIe总线数据预处理载板

PCIE702-1是一款基于PCIE总线架构的高性能数据预处理FMC载板&#xff0c;板卡采用Xilinx的高性能Kintex UltraScale系列FPGA作为实时处理器&#xff0c;实现各个接口之间的互联。板卡具有1个FMC&#xff08;HPC&#xff09;接口&#xff0c;1路PCIe x8主机接口&#xff0c;板载…

AxureRP制作静态站点发布互联网,实现公网访问【内网穿透】

AxureRP制作静态站点发布互联网&#xff0c;内网穿透实现公网访问 文章目录 AxureRP制作静态站点发布互联网&#xff0c;内网穿透实现公网访问前言1.在AxureRP中生成HTML文件2.配置IIS服务3.添加防火墙安全策略4.使用cpolar内网穿透实现公网访问4.1 登录cpolar web ui管理界面4…

【实战项目之个人博客】

目录 项目背景 项目技术栈 项目介绍 项目亮点 项目启动 1.创建SSM&#xff08;省略&#xff09; 2.配置项目信息 3.将前端页面加入到项目中 4.初始化数据库 5.创建标准分层的目录 6.创建和编写项目中的公共代码以及常用配置 7.创建和编写业务的Entity、Mapper、…

认识HTTP和HTTPS协议

HTTPS 是什么 HTTPS 也是一个应用层协议. 是在 HTTP 协议的基础上引入了一个加密层. 为什么要引入加密层呢&#xff1f; HTTP 协议内容都是按照文本的方式明文传输的. 这就导致在传输过程中出现一些被篡改的情况. HTTPS就是在HTTP的基础上进行了加密&#xff0c;进一步的保…

Qt QCustomPlot介绍

介绍 主要介绍qcustomplot及其用法 最新版本:QCustomPlot Patch Release 2.1.1//November 6, 2022 下载:https://www.qcustomplot.com/index.php/download 官网:https://www.qcustomplot.com/index.php 简单使用 mainwindow.h /**************************************…

2023年8月京东洗烘套装行业品牌销售排行榜(京东数据开放平台)

鲸参谋监测的京东平台8月份洗烘套装市场销售数据已出炉&#xff01; 根据鲸参谋平台的数据显示&#xff0c;今年8月份&#xff0c;京东平台洗烘套装的销量为1.1万&#xff0c;同比增长约218%&#xff1b;销售额约为1.2亿&#xff0c;同比增长约279%。可以看到&#xff0c;洗烘…

清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

为了验证大语言模型的沟通、规划、反思等拟人化能力&#xff0c;清华研究团队发布了一篇名为“探索大语言模型在交流游戏中的应用&#xff1a;《狼人杀》实验”的研究论文。 结果显示&#xff0c;通过ChatGPT&#xff08;GPT -turbo-0301&#xff09;构建的7个玩家&#xff0c…

HEC-RAS 1D/2D水动力与水环境模拟从小白到精通

专题一 水动力模型基础 1.水动力模型的本质 2.水动力模型的基本方程与适用范围 3.模型建模要点 4.注意事项与建模经验 专题二 恒定流模型(1D/2D) 1.恒定流及其适用范围 2.水面线分析及其数据要求 3.曼宁公式与恒定流&#xff0c;后处理 4.HEC-RA的水工建筑物&#xff…

【计算机网络】IP协议第二讲(Mac帧、IP地址、碰撞检测、ARP协议介绍)

IP协议第二讲 1.IP和Mac帧2.碰撞检测2.1介绍2.2如何减少碰撞发生2.3MTU2.4一些补充 3.ARP协议3.1协议介绍3.2报文格式分析 1.IP和Mac帧 IP&#xff08;Internet Protocol&#xff09;和MAC&#xff08;Media Access Control&#xff09;帧是计算机网络中两个不同层次的概念&am…