分类算法——sklearn转换器和估计器(一)

转换器(特征工程的父类)

  • 实例化(实例化的是一个转换器类(Transformer))
  • 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)

把特征工程的接口称之为转换器,其中转换器调用有这么几种形式:
标准化:(X- mean) / std

  • fit_transform( )
  • fit()——计算每一列的平均值、标准差
  • transform()——(X- mean) /std进行最终的转换
In [1] : from sklearn.preprocessing import StandardScaler
In [2] : std1=StandardScaler()
In [3] : a=[[1,2,3],[4,5,6]]
In [4] : std1.ft_transform( a)
out [4] :
array ([[-1.,-1.,-1.][1.,1.,1.]])In [5] : std2=StandardScaler()
In [6] : std2.fit(a)
out[6] : StandardScaler(copy=True,with_mean=True,with_std=True)In [7] : std2.transform(a)
out[7] :
array([[-1.,-1.,-1.],[1.,1.,1.]])

从中可以看出,fit_transform的作用相当于transform加上fit。

In [8] : b=[[7,8,9],[10,11,12]]
In [9] : std2.transform(b)
out [9] :
array([[3.,3.,3.],[5., 5.,5.]])In [10] : std2.fit_transform(b)
out [10] :
array([[-1.,-1.,-1.],[1.,1.,1.]])

估计器(sklearn机器学习算法的实现)

在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API

  • 1用于分类的估计器:
    • sklearn.neighbors k-近邻算法
    • sklearn.naive_bayes 贝叶斯
    • sklearn.linear_model.LogisticRegression 逻辑回归
    • sklearn.tree 决策树与随机森林
  • 2用于回归的估计器:
    • sklearn.linear_model.LinearRegression 线性回归
    • sklearn.linear_model.Ridge 岭回归
  • 3用于无监督学习的估计器:
    • sklearn.cluster.KMeans 聚类

估计器工作流程
在这里插入图片描述

  • 实例化一个estimator
  • estimator.fit(x train, y train) 计算
    一调用完毕,模型生成
  • 3模型评估:
    • ①直接比对真实值和预测值
      y_predict = estimator. predict(x_test)
      y_test == y_predict
    • ②计算准确率
      accuracy = estimator.score(x_test, y_test)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/811622.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是跨域?

跨域(Cross-Origin)指的是在Web开发中,一个网页的资源(例如脚本、样式表、图片等)请求另一个源的资源时,两个源的协议、域名或端口不相同。简单来说,当浏览器试图从一个源加载来自不同源的资源时…

当你的项目体积比较大?你如何做性能优化

在前端开发中,项目体积优化是一个重要的环节,它直接影响到网页的加载速度和用户体验。随着前端项目越来越复杂,引入的依赖也越来越多,如何有效地减少最终打包文件的大小,成为了前端工程师需要面对的挑战。以下是一些常…

汽车咨询|基于SprinBoot的汽车资讯管理系统设计与实现(源码+数据库+文档)

汽车资讯管理系统目录 基于SprinBoot的汽车资讯管理系统设计与实现 一、前言 二、系统设计 三、系统功能设计 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍:✌️大厂码农|毕设布道师&#xff…

npm 切换成淘宝源,以及遇到npm 报错如何解决

淘宝源:npm config set registryhttps://registry.npmmirror.com/ 然后再npm下 package-lock.json这个删了 npm i再试一下

MySQL——创建和插入

一、插入数据 INSERT 使用建议; 在任何情况下建议列出列名,在 VALUES 中插入值时,注意值和列的意义对应关系 values 指定的值顺序非常重要,决定了值是否被保存到正确的列中 在指定了列名的情况下,你可以仅对需要插入的列给到…

【已解决】VMware Horizon Client: 无法建立安全加密链路连接

文章目录 问题原因解决方法方法1:在HTTPS拦截中添加VMware忽略列表 (推荐)方法2: 只拦截 浏览器进程的请求 / 取消 HTTPS 拦截(如果没有拦截HTTPS的必要 / 只针对浏览器请求,可以使用此方法) 当前使用mac 编辑&#xf…

Vue中$attrs的作用和使用方法

Vue中$attrs的作用和使用方法 1. 使用场景举例2. 官方解释3. 使用示例 $attrs是 vue2.4.0版本以上新增的属性; 1. 使用场景举例 假如我们现在要二次封装一个组件,我们需要把当前组件获取到的所有的props都传递给子组件,我们可以在当前组件中…

飞书api增加权限

1,进入飞书开发者后台:飞书开放平台 给应用增加权限 2,进入飞书管理后台 https://fw5slkpbyb3.feishu.cn/admin/appCenter/audit 审核最新发布的版本 如果还是不行,则需要修改数据权限,修改为全部成员可修改。 改完…

【排序思想掌握】

排序思想掌握 前言: 开发当中为什么会用到算法?或者说为什么需要算法与数据结构等? 算法思想可以帮助我们优化程序的性能,例如减少时间与空间复杂度,从而使程序更快、更有效地运行。在数据分析领域,算法思想…

Matlab与ROS(1/2)---Message(三)

0. 简介 消息是ROS中交换数据的主要容器。主题和服务使用消息在节点之间传输数据。为了标识其数据结构,每条消息都有一个消息类型。例如,来自激光扫描仪的传感器数据通常以sensor_msgs/LaserScan类型的消息发送。每种消息类型标识消息中包含的数据元素。…

第八十二周周报

学习目标: 论文 学习时间: 2024.4.6-2024.4.12 学习产出: 这周修改在杨老师指导下修改好了论文,另外更新一下CelebA64的结果,FID到了7.27,IS为2.38。

趣谈 Rust 的 Copy trait 和 Clone trait

一、Copy trait 的关键作用 Rust 程序中的变量可以分成两类:实现 Copy trait 的和没实现 Copy trait 的。这有啥区别?当然很重要! 实现 Copy trait 的变量: 不存在所有权问题,可以随意赋值给其他变量,可以随意当参数…

类和对象二

一、运算符重载 为了使自定义类型可以使用加减等运算符,CPP提供了一个功能叫运算符重载。 关键字:operator操作符 运算符重载最好定义在类对象里,这也可以避免访问不到私有成员的问题。 代码演示: 在类里定义之后,…

Java常用数据结构与集合

数据结构 数组: 内存地址连续检索效率高(可以通过下标访问成员)增删操作效率低(保证数据越界的问题,需动态扩容)长度固定,扩容的需要新的数组复制或者Arrays类的copyOf方法 链表 内存地址不连续查询快删除慢,因为需要移动指针又分双向链表…

区块链安全-----区块链基础

区块链是一种全新的信息网络架构 ,是新一代信息基础设施 ,是新型的价值交换方式、 分布式协 同生产机制以及新型的算法经济模式的基础。 区块链技术可以集成到多个领域。 区块链的主要用途 是作为加密货币的分布式总帐。 它在银行 ,金融 &…

数据仓库—数据仓库的特征

数据仓库的兴起正是源于企业日益增长的商业智能和决策分析需求。企业期望能够全面获取内外部的数据资源,洞见历史运营趋势,预测未来发展态势,从而制定前瞻性的经营策略。然而,分散的OLTP系统由于数据孤岛、格式不一致等问题,无法很好地满足这一需求。 因此,建立一个集成的、面…

Java同步机制synchronized:理解wait和notify的运用

引言: 在Java多线程编程中,线程间的同步是确保共享资源被正确访问的关键。线程的协调,如何等待和通知是解决线程同步问题的核心。 synchronized的作用与机制: synchronized是Java中的一个关键字,用于在多线程的环境下…

浏览器工作原理与实践--HTTP/3:甩掉TCP、TLS 的包袱,构建高效网络

前面两篇文章我们分析了HTTP/1和HTTP/2,在HTTP/2出现之前,开发者需要采取很多变通的方式来解决HTTP/1所存在的问题,不过HTTP/2在2018年就开始得到了大规模的应用,HTTP/1中存在的一大堆缺陷都得到了解决。 HTTP/2的一个核心特性是使…

MFC:手写一个模态对话框程序

我们知道,在MFC中,要生成一个模态对话框程序,只要按着VS的提示,拖拖拽拽就能生成一个这样的程序,效率非常高。这里,我们反其道而行之,自己写一个这样的程序,这个程序与自动生成的程序…

生活是否磨灭斗志:一场深度探讨

在人生的舞台上,每个人都在演绎着自己的故事,其中充满了挑战、挫折、成功与喜悦。在这个过程中,一种名为“斗志”的精神力量始终贯穿其中,驱动我们面对困难,追求目标,实现自我价值。然而,有一种…