0开篇-介绍

创作灵感

最近又开始写Python,换新机器了,加上回顾硬盘上的一些资料,发现当时用在态势上的一些机器学习内容一直没有收尾,2019年10月研发中心成立中断了机器学习产品的研发,加上后来疫情,这几年荒废了。有空归纳下,希望有机会能用上。

基础介绍

语言、框架及环境:

当然是Python。优点:好用的数学函数库例如numpy,绘图工具matplotlib,框架或库sklearn,keras和有名的TensorFlow。缺点:性能。硬件cpu最好是intel的,原来有一次使用联想AMD本跑模型始终有问题,同样的使用我自己的intel本就没问题,不知道现在还有没有这种CPU问题。显卡不强求,学习的话已算法为主,测试数据不多的话cpu跑也没问题,就是cpu一直100%啥也干不了,最好有闲置机跑。有显卡建议也是台式机显卡,我用神舟笔记本差点把GTX960M干冒烟了。

数学基础和相关资料:

高数,线性代数,概率论和数理统计,基本都是大学本科的数学知识,知道各种概念就OK,用于理解各种算法,毕竟都是调包调参数,不用深入到框架原理。

相关资料可以参考各个大佬(吴恩达,周志华,李宏毅等)的书,和现在b站很多讲解视频。

机器学习开发算法步骤:

1.数据收集(Extract)。因为需要有样本数据,学习的话我会从kaggle之类的网站下载,实际项目会有特定格式的数据,我原来使用的都是安全设备上提取的数据。

2.数据格式化和分析(Transform)。数据要整理成标准格式,标准数据格式可以融合算法,方便操作。同时对于值需要转化或填充,异常值可能还需要进行必要的展示和分析,判断是否有保留价值。

3.算法训练。机器学习从这一步才真正开始。和下一步一起组成机器学习算法的核心。训练就是通过一定的算法将数据变为知识或信息或者模型。这里需要区别的是监督学习和无监督学习。简单理解,分类和回归是监督学习,监督就是必须知道预测什么,知道目标变量的分类信息,算法就是做到如何分类,常用算法有k-邻近算法、线性回归、朴素贝叶斯、决策树等。相对的无监督学习没有确定的目标,没有类别信息。常用算法有k-均值、最大期望算法、DBSCAN等。

4.测试算法。使用前一步输出的知识、信息或者模型,使用测试数据,评测检验算法的成功率。如果不满意算法的输出结果,可以回到第一步重新运算。如果发现准备的数据有问题,也可以回到第一步重新收集数据。

5.实际使用。利用验证算法过的算法执行实际操作。

工具

推荐使用anaconda,集成JupyterLab Notebook  Spyder等工具,配合vscode使用。

算法

按照整理的顺序写。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/21148.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何创建一个线程池,为什么不推荐使用Executors去创建呢?

我们在学线程的时候了解了几种创建线程的方式,比如继承Thread类,实现Runnable接口、Callable接口等,那对于线程池的使用,也需要去创建它,在这里我们提供2种构造线程池的方法: 方法一: 通过Thre…

【vue】vue2项目将npm包管理器修改为yarn包管理器

【vue】vue2项目将npm包管理器修改为yarn包管理器 1.删除node_modules文件夹、package-lock.json文件 2.全局安装yarn npm install -g yarn3.安装项目依赖 yarn install如果执行yarn install 报类似以下这种版本不兼容错误,执行 yarn config set ignore-engines …

MySQL之数据库数据库范式学习笔记(二)

三大范式 范式是数据库设计中的概念,用于规范化数据结构,以减少数据冗余并确保数据的一致性和完整性。MySQL 数据库设计通常遵循一定的范式,其中最常见的是第一至第三范式。以下是各个范式的简要说明: 第一范式(1NF&…

【Qt】探索Qt绘图世界:自定义控件与视觉效果的全面指南

文章目录 前言:1. 绘图基本概念2. 绘制各种形状3. 绘制文字(显示文字)、设置画笔4. 画刷5. 绘制图片6. 特殊的绘图设备总结: 前言: 在软件开发中,图形用户界面(GUI)的设计是至关重要…

Unity中帧动画素材的切割设置

有几个问题,美术在给我们帧动画的时候,一般都是给一个比较大的图,然后进行切割成多个sprite,导入到animation中 一般来说,进行那个autoSlide,自动切割就可以了 这个自动切割的图片会沿着有像素的最小包围…

【1】AI介绍

迎接 AGI 时代 AGI(Artificial General Intelligence),人工通用智能,AGI是一种可以执行复杂任务的人工智能,能够完全模仿人类智能的行为。应用领域涉及医疗、交通、智能家居等多个与人类活动密切相关的领域。 AGI 多久会到来? 乐观预测:明年(未来已来)主流预测:3-5…

js 同步和异步学习笔记

1、为什么有同步和异步? js是单线程,因为同个时间只能处理一个任务,所有的任务都要排队,前一个任务执行完,才能继续执行下一个任务。 因此js设计时先挂起来处于等待中的任务,先运行排在后面的任务&#xff…

【数据结构与算法 | 力扣篇】力扣每日一题575

1. 力扣575 : 分糖果 (1). 题 Alice 有 n 枚糖,其中第 i 枚糖的类型为 candyType[i] 。Alice 注意到她的体重正在增长,所以前去拜访了一位医生。 医生建议 Alice 要少摄入糖分,只吃掉她所有糖的 n / 2 即可(n 是一个偶数&#…

RHEL7.9修改分区

系统RHEL7.9 他因为安装软件,需要修改分区 进入超级用户root,输入lsblk 查看分区,可见465.8G系统盘sda下有三个物理卷,其中sda3下/home有410.6G,需要这部分拆分出200G软件和100G的数据库分区 备份/home 目录下文件 c…

Apache Omid Idea Debug 环境搭建

IDEA 搭建 Apache Omid 源码 DEBUG 环境 Apache Omid 在 Apache HBase 之上提供了多行分布式事务的能力,支持全局 MVCC 功能。简单介绍编译过程。 1.下载 HBase2 并启动 https://dlcdn.apache.org/hbase/ 配置环境变量 export HBASE_HOME/xxx/hbase-2.4.18 exp…

debian9 apt 镜像源问题

由于debian9在22年官方停服,所以sources.list需要改成带archive的路径,如下: deb http://archive.debian.org/debian/ stretch main non-free contrib deb-src http://archive.debian.org/debian/ stretch main non-free contrib deb http:/…

GDPU unity游戏开发 动画状态机

每一个动画状态都演绎着你的奔赴。 动画混合 1) 前往 Mixamo选择适合的角色模型和idle/walking/backward动画并下载。确保下载时选择FBX for Unity格式。 2) 新建Unity项目,导入下载的模型。 3) 在导入模型的Inspector窗口中,选择Materials选项卡&a…

chatgpt4和文心一言的简单对比

功能1. 写一个ebpf程序监控udp延迟 文心一言 答案 编写一个完整的eBPF程序来监控UDP延迟涉及多个步骤,包括编写eBPF C代码、编译、加载到内核,以及用户空间程序来读取eBPF map中的数据。以下是一个简化的示例框架,展示如何使用eBPF来监控U…

分治策略的实现

目录 前言 分治策略的应用 最大子数组问题 矩阵乘法问题 求解递归式的三种方法 代入法求递归式 用递归树求递归式 主方法求递归式 前言 分治三个步骤: 分解:分解原问题为子问题,这些子问题为原问题的较小规模的问题。 解决&#xf…

浅谈SpringBoot日志文件

文章目录 一、日志的作用二、如何在SpringBoot中使用日志2.1、在程序中得到日志对象。2.2、通过日志对象中提供的内置方法操打印日志信息2.2.1 日志级别2.2.1.1、日志级别有什么作用??2.2.1.2、日志级别的分类2.2.1.2、在配置文件中设置日志级别[!] 三、…

对话机器人 Rasa 基本调试过程

以下记录rasa基本的配置,以及调试过程。首先用rasa init 生成一个初始的文件目录。 1、最简单的中文配置 打开项目根目录下的 config.yml 配置文件,修改如下: recipe: default.v1language: zhpipeline:- name: JiebaTokenizer- name: Lang…

Linux线程:线程分离

目录 一、什么是线程分离 1.1pthread_detach 1.2pthread线程库存在的意义 1.3__thread线程的局部存储 1.4系统调用clone 一、什么是线程分离 1.1pthread_detach 默认情况下,新创建的线程是joinable的,线程退出后,需要对其进行pthread_joi…

Windows Server 2019 DataCenter 配置 IIS Web Server (for Vue)

IIS 并非是最终会采用的web server,这里只是做个测试,最终会用C或者是rust自己写web server. 制作pfx证书 用openssl为IIS制作pfx格式的SSL证书: # openssl pkcs12 -inkey privkey.pem -in fullchain.pem -export -out idealand.xyz.pfx 用w…

java中创建对象的四种方式

1.new出一个对象 String s new String(“abc”); 2.利用反射创建对象 利用反射的两种方式: 使用Class对象的newInstance()方法来创建Class对象对应类的实例。但是这种方法要求Class对象的对应类有默认构造器,而执行newInstan…

非对称密钥:应用场景

public class EncryptionAndSignatureExample { public static void main(String[] args) throws Exception {// 生成公私钥对KeyPairGenerator keyPairGenerator KeyPairGenerator.getInstance("RSA");keyPairGenerator.initialize(1024);KeyPair keyPair keyPai…