【SCAU数据挖掘】数据挖掘期末总复习题库简答题及解析——下

1.从某超市顾客中随机抽取5名,他们的购物篮数据的二元0/1表示如下:

顾客号

面包

 牛奶

尿布

啤酒

鸡蛋

可乐

1

1

1

0

0

0

0

2

1

0

1

1

1

0

3

0

1

1

1

0

1

4

1

1

1

1

0

0

5

1

1

1

0

0

1

某学生依据这些数据做关联分析,考虑规则{牛奶,尿布}->{啤酒},请计算该规则的支持度(support)、置信度(confidence)。

可以这样看:

T1   {面包,牛奶}
T2   {面包,尿布,啤酒,鸡蛋}
T3  {牛奶,尿布,啤酒,可乐}
T4  {面包,牛奶,尿布,啤酒}
T5  {面包,牛奶,尿布,可乐}

对于规则{牛奶,尿布}->{啤酒},X = {牛奶,尿布},Y = {啤酒}。

支持度(Support): 是指同时包含X和Y的事务在总事务中的比例。
 
置信度(Confidence): 是指包含X的事务同时也包含Y的比例。

支持度(Support):

Support(牛奶,尿布→啤酒)=2/5​=0.4

置信度(Confidence):

Confidence(牛奶,尿布→啤酒)=2/3​=0.667

2.

逻辑回归中,常用优势比OR(Odds Ratio)衡量因素作用大小的比数,即:

在一个具有17个家庭的样本里,共有3家的收入为10000元,5家的收入为11 000元,9家的收入为12 000元。在收入为10000元的家庭里,1个主妇不工作,2个主妇工作;在收入为11000元的家庭里,1个主妇不工作,4个主妇工作;在收入为12000元的家庭里,1个主妇不工作,8个主妇工作。

收入(单位:千)

主妇工作情况

总计

0(不工作)

1(工作)

10

1

2

3

11

1

4

5

12

1

8

9

总计

3

14

17

令收入为变量,X类别标签为工作状态。

(1)计算X为10和11时,优势比OR等于多少?

(2)计算X为11和12时,优势比OR等于多少?

优势比(Odds Ratio,OR)是用于衡量自变量对因变量影响程度的一种指标。它表示在不同自变量值情况下,事件发生的几率值之比。OR = (P1/(1-P1)) / (P0/(1-P0))

(1)

当X=10时,不工作的概率1-P0 = 1/3, 工作的概率为P0 = 2/3
当X=11时,不工作的概率1-P1 = 1/5, 工作的概率为P1 = 4/5

代入公式:
OR = (4/5 / 1/5)/ (2/3 / 1/3)
    = 4 / 2
    = 2

(2)

当X=11时,不工作的概率1-P0 = 1/5, 工作的概率为P0 = 4/5  
当X=12时,不工作的概率1-P1 = 1/9, 工作的概率为P1 = 8/9

代入公式:
OR =  (8/9 / 1/9)  /  (4/5 / 1/5)
    = (8/1) /4
    = 2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/857384.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Security6 设置免登录接口地址

1. 在SecurityFilterChain中设置免登录接口地址。如果定义了多个SecurityFilterChain,并且前面的SecurityFilterChain里使用了anyRequest().authenticated(),后面的免登录可能会失效。 Configuration EnableWebSecurity public class SecurityConfig {B…

Linux常用命令(16)—awk命令(有相关截图)

写在前面: 最近在学习Linux命令,记录一下学习Linux常用命令的过程,方便以后复习。仅供参考,若有不当的地方,恳请指正。如果对你有帮助,欢迎点赞,关注,收藏,评论&#xf…

tessy 编译错误总结

目录 1,tessy 单元测试 TDE 界面 数据无法填充:the test object interface is incomplete 2,tessy 编译报错:单元测试时,普通桩函数内容相关异常场景 3,tessy 编译报错:模块分析后 头文件 找不到 4,tessy 集成测试:SCE界面component函数太多 5,tessy 编译报错:函…

Java 10新特性介绍

Java 10是Java平台的一个重要更新,它引入了多项新特性和改进。以下是一些主要的新特性: 局部变量类型推断(var关键字) Java 10允许使用var关键字来声明局部变量,而无需显式指定变量的类型。编译器会根据变量赋值的上下…

non_blocking=True 与 torch.cuda.synchronize()

需要注意的是:GPU和CPU之间是异步执行的,CPU向GPU下达指令以后会立刻执行之后的代码,CPU不会等待GPU执行完成 一、non_blockingTrue 目的:压缩gpu的效果,避免CPU与GPU设备数据传输时间开销带来的计算效率低下 在 P…

Android获取控件宽高的几种方式

第一种方式:在需要时获取,如控件点击时再获取 button.setOnClickListener(new View.OnClickListener() { Override public void onClick(View v) { getTextWidthAndHeight(); } }); 第二种方式:重写onWindowFocusChanged()方法 Overr…

【SQL】varchar 与 char 的区别

在 SQL 中,VARCHAR 和 CHAR 是用于存储字符串类型数据的两种数据类型,但它们在存储方式和性能上有显著的区别。 CHAR 定义: CHAR 是一种固定长度的字符串数据类型。长度: 你需要在定义表结构时指定长度,例如 CHAR(10)。存储方式: 无论实际存…

【机器学习】机器学习赋能交通出行:智能化实践与创新应用探索

📝个人主页🌹:Eternity._ 🌹🌹期待您的关注 🌹🌹 ❀目录 📒1. 引言📙2. 交通流量预测与优化🌞数据准备🌙模型训练与预测⭐评估模型与优化 &#x…

jsonpath_解析例子代码

# _*_ coding : utf-8 _*_ # Time : 2023-11-05 13:23 # Author : haowen # File : jsonpath_解析_淘票票 # Project : py练习 import urllib.request url https://dianying.taobao.com/cityAction.json?activityId&_ksTS1699161894273_112&jsoncallbackjsonp113&…

网页抓取单词关联

在当今数字化的时代,数据的获取与处理成为了众多企业和开发者关注的焦点。API 服务的出现,为我们打开了高效、便捷获取和利用数据的新大门。接下来,为您介绍几款独具特色的 API 服务,它们将为您的业务和开发工作带来前所未有的便利…

ABB机械手3HAC024518-001电机振动过大维修方案

【ABB机械臂伺服电机维修方案】 1. 更换轴承 如果检查发现轴承磨损,我们需要更换新的轴承。请选择与原轴承型号相同的产品,以确保电机正常运行。 2. 重新平衡转子 如果ABB机械手3HAC024518-001电机转子不平衡,我们需要重新平衡转子。这可以通…

棉花叶子病害分类数据集3601张6类别

数据集类型:图像分类用,不可用于目标检测无标注文件 数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):3601 分类类别数:6 类别名称:[“aphids”,“army_worm”,“bact…

小熊文件工具箱免费版

小熊文件工具箱是一款基于本地离线操作的一系列工具的合集,最大特点是各种批量任务的执行,包含了智能证件照,自动抠图,直播录制,九宫格切图,拼图,视频格式转换及压缩,zip压缩解压缩&…

Python一文轻松搞定正则匹配

一、前言 日常工作中,不可避免需要进行文件及内容的查找,替换操作,python的正则匹配无疑是专门针对改场景而出现的,灵活地运用可以极大地提高效率,下图是本文内容概览。 ​ 二、正则表达式符号 对于所有的正则匹配表达…

C++中的抽象类和纯虚函数。

在C中,抽象类和纯虚函数是面向对象编程的两个重要概念,它们允许我们定义接口和强制派生类实现特定的行为。 抽象类(Abstract Class) 抽象类是一种特殊的类,它不能被实例化(即不能创建抽象类的对象&#x…

MySQL的DML语句

文章目录 ☃️概述☃️DML☃️添加数据☃️更新和删除数据☃️DML的重要性 ☃️概述 MySQL 通用语法分类 ● DDL: 数据定义语言,用来 定义数据库对象(数据库、表、字段) ● DML: 数据操作语言,用来对数据库表中的数据进行增删改 …

佳能打印机问题解决

佳能家用打印机加墨水但是墨盒不到中间来怎么处理 您好亲, 一、真堵原因: 1、打印间隔时间太长,造成打印头干沽结皮 。 每15天开动打印机打印一张全色文档。 2、封条未撕开,空气不进入。将黄色封条撕开重装墨盒。 3、经长时间…

Android系统揭秘(一)-Activity启动流程(上)

public ActivityResult execStartActivity( Context who, IBinder contextThread, IBinder token, Activity target, Intent intent, int requestCode, Bundle options) { IApplicationThread whoThread (IApplicationThread) contextThread; … try { … int result …

TCP 和 UDP 可以同时绑定相同的端口吗?

在网络编程中,TCP和UDP都可以绑定到同一个端口上进行通信。TCP和UDP是OSI模型中的传输层协议,它们分别使用不同的端口号来区分不同的应用程序或服务。 TCP(Transmission Control Protocol)提供了面向连接的、可靠的传输服务&…

C高级编程笔记

提升方向: 1. **深入理解指针**: 指针的高级用法,包括指针的指针、函数指针、指针与数组、指针与结构体的深入应用等。 指针数组:本质是数组 1.指针数组的每个元素都是一个一级指针,每个元素都有自己独立的内存地址 2.应用于…