数据仓库作业五:第8章 关联规则挖掘

目录

    • 第8章 关联规则挖掘
      • 作业题


第8章 关联规则挖掘

作业题

1、设4-项集 X = { a , b , c , d } X=\{a,b,c,d\} X={a,b,c,d},试求出由 X X X 导出的所有关联规则。

解:

首先生成项集的所有非空真子集。这包括:
{ a } , { b } , { c } , { d } \{a\},\{b\},\{c\},\{d\} {a},{b},{c},{d}
{ a , b } , { a , c } , { a , d } , { b , c } , { b , d } , { c , d } \{a,b\},\{a,c\},\{a,d\},\{b,c\},\{b,d\},\{c,d\} {a,b},{a,c},{a,d},{b,c},{b,d},{c,d}
{ a , b , c } , { a , b , d } , { a , c , d } , { b , c , d } \{a,b,c\},\{a,b,d\},\{a,c,d\},\{b,c,d\} {a,b,c},{a,b,d},{a,c,d},{b,c,d}

对于每个非真空子集,生成相应的关联规则。一般地,对于子集 { A } \{A\} {A},关联规则的形式是 { X } ⇒ { X − A } \{X\}\Rightarrow\{X-A\} {X}{XA},其中 X − A X-A XA 表示项集 X X X 中不包含在 A A A 中的项。

下面是所有可能的关联规则:

{ a } ⇒ { b , c , d } , { b } ⇒ { a , c , d } , { c } ⇒ { a , b , d } , { d } ⇒ { a , b , c } , \{a\}\Rightarrow\{b,c,d\},\{b\}\Rightarrow\{a,c,d\},\{c\}\Rightarrow\{a,b,d\},\{d\}\Rightarrow\{a,b,c\}, {a}{b,c,d},{b}{a,c,d},{c}{a,b,d},{d}{a,b,c},

{ a , b } ⇒ { c , d } , { a , c } ⇒ { b , d } , { a , d } ⇒ { b , c } , { b , c } ⇒ { a , d } , { b , d } ⇒ { a , c } , { c , d } ⇒ { a , b } , \{a,b\}\Rightarrow\{c,d\},\{a,c\}\Rightarrow\{b,d\},\{a,d\}\Rightarrow\{b,c\},\{b,c\}\Rightarrow\{a,d\},\{b,d\}\Rightarrow\{a,c\},\{c,d\}\Rightarrow\{a,b\}, {a,b}{c,d},{a,c}{b,d},{a,d}{b,c},{b,c}{a,d},{b,d}{a,c},{c,d}{a,b},

{ a , b , c } ⇒ { d } , { a , b , d } ⇒ { c } , { a , c , d } ⇒ { b } , { b , c , d } ⇒ { a } \{a,b,c\}\Rightarrow\{d\},\{a,b,d\}\Rightarrow\{c\},\{a,c,d\}\Rightarrow\{b\},\{b,c,d\}\Rightarrow\{a\} {a,b,c}{d},{a,b,d}{c},{a,c,d}{b},{b,c,d}{a}

这些规则代表了项集导出的所有可能的关联规则。

2、设有交易数据库如下表1所示,令MinS=0.3,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid顾客id购买商品购买日期
t 1 t_1 t1 c 01 c_{01} c01 { a , b } \{a,b\} {a,b}2015.03.01
t 2 t_2 t2 c 02 c_{02} c02 { c , b , d } \{c,b,d\} {c,b,d}2015.03.01
t 3 t_3 t3 c 01 c_{01} c01 { c } \{c\} {c}2015.03.03
t 4 t_4 t4 c 02 c_{02} c02 { b , d } \{b,d\} {b,d}2015.03.03

解:

因为最小支持度 M i n S = 0.3 MinS=0.3 MinS=0.3,事务数据库有4条记录, M i n S p t N = 0.3 × 4 = 1.2 MinSptN=0.3\times4=1.2 MinSptN=0.3×4=1.2,所以最小支持数 M i n S p t N = 2 MinSptN=2 MinSptN=2

如下表,候选频繁1-项集 C 1 C_1 C1和频繁1-项集 L 1 L_1 L1

在这里插入图片描述
如下表,候选频繁2-项集 C 2 C_2 C2和频繁2-项集 L 2 L_2 L2

在这里插入图片描述
得所有的频繁项集为 L = L 2 = { { b , d } } L=L_2=\{\{b,d\}\} L=L2={{b,d}}

3、对如表1所示的交易数据库,令MinC=0.6,试在习题2所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度 M i n C = 0.6 MinC=0.6 MinC=0.6
C o n f i d e n c e ( { b } ⇒ { d } ) = S u p p o r t ( { b , d } ) S u p p o r t ( { b } = 2 3 ≈ 0.67 > 0.6 Confidence(\{b\}\Rightarrow\{d\})=\frac{Support(\{b,d\})}{Support(\{b\}}=\frac{2}{3}\approx0.67>0.6 Confidence({b}{d})=Support({b}Support({b,d})=320.67>0.6 C o n f i d e n c e ( { d } ⇒ { b } ) = S u p p o r t ( { b , d } ) S u p p o r t ( { d } = 2 2 = 1 > 0.6 Confidence(\{d\}\Rightarrow\{b\})=\frac{Support(\{b,d\})}{Support(\{d\}}=\frac{2}{2}=1>0.6 Confidence({d}{b})=Support({d}Support({b,d})=22=1>0.6

所以 { b } ⇒ { d } \{b\}\Rightarrow\{d\} {b}{d} { d } ⇒ { b } \{d\}\Rightarrow\{b\} {d}{b} 都是强关联规则。

4、设有交易数据库如表2所示,令MinS=0.3,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid顾客id购买商品购买日期
t 1 t_1 t1 c 01 c_{01} c01 { a , b , e } \{a,b,e\} {a,b,e}2015.03.01
t 2 t_2 t2 c 02 c_{02} c02 { b , d } \{b,d\} {b,d}2015.03.01
t 3 t_3 t3 c 03 c_{03} c03 { b , c } \{b,c\} {b,c}2015.03.01
t 4 t_4 t4 c 01 c_{01} c01 { a , b , d } \{a,b,d\} {a,b,d}2015.03.03
t 5 t_5 t5 c 02 c_{02} c02 { a , c } \{a,c\} {a,c}2015.03.03
t 6 t_6 t6 c 03 c_{03} c03 { b , c } \{b,c\} {b,c}2015.03.03
t 7 t_7 t7 c 01 c_{01} c01 { a , c } \{a,c\} {a,c}2015.03.05
t 8 t_8 t8 c 03 c_{03} c03 { a , b , c , e } \{a,b,c,e\} {a,b,c,e}2015.03.05
t 9 t_9 t9 c 03 c_{03} c03 { a , b , c } \{a,b,c\} {a,b,c}2015.03.06

解:

因为最小支持度 M i n S = 0.3 MinS=0.3 MinS=0.3,事务数据库有9条记录, M i n S p t N = 0.3 × 9 = 2.7 MinSptN=0.3\times9=2.7 MinSptN=0.3×9=2.7,所以最小支持数 M i n S p t N = 3 MinSptN=3 MinSptN=3

如下表,候选频繁1-项集 C 1 C_1 C1和频繁1-项集 L 1 L_1 L1

在这里插入图片描述
如下表,候选频繁2-项集 C 2 C_2 C2和频繁2-项集 L 2 L_2 L2

在这里插入图片描述
如下表,候选频繁3-项集 C 3 C_3 C3

在这里插入图片描述

得所有的频繁项集为 L = L 2 = { { a , b } , { a , c } , { b , c } } L=L_2=\{\{a,b\},\{a,c\},\{b,c\}\} L=L2={{a,b},{a,c},{b,c}}

5、对如表2所示的交易数据库,令MinC=0.6,试在习题4所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度 M i n C = 0.6 MinC=0.6 MinC=0.6
C o n f i d e n c e ( { a } ⇒ { b } ) = S u p p o r t ( { a , b } ) S u p p o r t ( { a } = 4 6 ≈ 0.67 > 0.6 Confidence(\{a\}\Rightarrow\{b\})=\frac{Support(\{a,b\})}{Support(\{a\}}=\frac{4}{6}\approx0.67>0.6 Confidence({a}{b})=Support({a}Support({a,b})=640.67>0.6 C o n f i d e n c e ( { b } ⇒ { a } ) = S u p p o r t ( { a , b } ) S u p p o r t ( { b } = 4 7 ≈ 0.57 < 0.6 Confidence(\{b\}\Rightarrow\{a\})=\frac{Support(\{a,b\})}{Support(\{b\}}=\frac{4}{7}\approx0.57<0.6 Confidence({b}{a})=Support({b}Support({a,b})=740.57<0.6 C o n f i d e n c e ( { a } ⇒ { c } ) = S u p p o r t ( { a , c } ) S u p p o r t ( { a } = 4 6 ≈ 0.67 > 0.6 Confidence(\{a\}\Rightarrow\{c\})=\frac{Support(\{a,c\})}{Support(\{a\}}=\frac{4}{6}\approx0.67>0.6 Confidence({a}{c})=Support({a}Support({a,c})=640.67>0.6 C o n f i d e n c e ( { c } ⇒ { a } ) = S u p p o r t ( { a , c } ) S u p p o r t ( { c } = 4 6 ≈ 0.67 > 0.6 Confidence(\{c\}\Rightarrow\{a\})=\frac{Support(\{a,c\})}{Support(\{c\}}=\frac{4}{6}\approx0.67>0.6 Confidence({c}{a})=Support({c}Support({a,c})=640.67>0.6 C o n f i d e n c e ( { b } ⇒ { c } ) = S u p p o r t ( { b , c } ) S u p p o r t ( { b } = 4 7 ≈ 0.57 < 0.6 Confidence(\{b\}\Rightarrow\{c\})=\frac{Support(\{b,c\})}{Support(\{b\}}=\frac{4}{7}\approx0.57<0.6 Confidence({b}{c})=Support({b}Support({b,c})=740.57<0.6 C o n f i d e n c e ( { c } ⇒ { b } ) = S u p p o r t ( { b , c } ) S u p p o r t ( { c } = 4 6 ≈ 0.67 > 0.6 Confidence(\{c\}\Rightarrow\{b\})=\frac{Support(\{b,c\})}{Support(\{c\}}=\frac{4}{6}\approx0.67>0.6 Confidence({c}{b})=Support({c}Support({b,c})=640.67>0.6

所以 { a } ⇒ { b } \{a\}\Rightarrow\{b\} {a}{b} { a } ⇒ { c } \{a\}\Rightarrow\{c\} {a}{c} { c } ⇒ { a } \{c\}\Rightarrow\{a\} {c}{a} { c } ⇒ { b } \{c\}\Rightarrow\{b\} {c}{b} 是强关联规则。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/930.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UE5集成gRPC

最近有项目需要在UE5里做RPC&#xff0c;对比了thrift、gRPC、rcplib等开源rpc框架&#xff0c;由于习惯使用protobuf&#xff0c;故选择了gRPC。然而&#xff0c;Google出品也是一言难尽啊&#xff0c;最起码编译太繁琐了。 本次使用的gRPC版本为1.62.1&#xff0c;UE5.2&…

基于机器学习的车辆状态异常检测

基于马氏距离的车辆状态异常检测&#xff08;单一传感器&#xff09; 基于多元自动编码器的车辆状态异常检测 基于单传感器平滑马氏距离的车辆状态异常检测 工学博士&#xff0c;担任《Mechanical System and Signal Processing》等期刊审稿专家&#xff0c;擅长领域&#xff1…

【加密周报】中东“惊雷”炸响币圈!比特币减半成功完成,市场情绪已被提前消化!中美突传USDT重磅消息!

周五(4月19日)&#xff0c;比特币经历惊魂一刻&#xff0c;伊朗核设施所处的中部城市伊斯法罕惊传爆炸&#xff0c;叙利亚与伊拉克也都传来爆炸声响&#xff0c;中东全面战争与核武攻击威胁触发加密市场恐慌情绪。比特币一度下探59600美元。但随后伊朗强调核设施未受损&#xf…

组件安全(Solr、Shiro、Log4j、Jackson、FastJson、XStream)

Solr 主要基于HTTP和 Apache Lucene 实现的全文搜索服务器。 特征&#xff1a;图标识别 端口&#xff1a;8393 CVE-2019-0193&#xff08;远程命令执行漏洞&#xff09; 漏洞版本&#xff1a;Apache Solr < 8.2.0 利用条件&#xff1a; Apache Solr 的 DataImportHandler 启…

二维码门楼牌管理应用平台建设:构建智能社区治理新模式

文章目录 前言一、二维码门楼牌管理应用平台的意义二、走访日志功能的重要性三、走访日志功能的具体应用四、走访日志功能的优势五、结语 前言 在数字化浪潮下&#xff0c;社区管理正面临着前所未有的机遇与挑战。二维码门楼牌管理应用平台的建设&#xff0c;不仅为社区治理提…

代码随想录训练营Day 27|Python|Leetcode|122.买卖股票的最佳时机II ● 55. 跳跃游戏 ● 45.跳跃游戏II

122.买卖股票的最佳时机II 给你一个整数数组 prices &#xff0c;其中 prices[i] 表示某支股票第 i 天的价格。 在每一天&#xff0c;你可以决定是否购买和/或出售股票。你在任何时候 最多 只能持有 一股 股票。你也可以先购买&#xff0c;然后在 同一天 出售。 返回 你能获…

fastjson转换json时默认将属性第一个字母转小写

描述&#xff1a; 我新建了一个实体类&#xff0c;但是实体类的首字母是大写的&#xff0c;但是使用fastjson后打印的&#xff0c;Json字符串首字母却是小写的&#xff0c;这是fastjson的一个bug 实体类&#xff1a; Json字符串&#xff1a; 解决方法&#xff1a; 一、使…

HoloLens2的Unity应用在电脑上发布成安装包,然后通过wifi安装到设备

一、VS工程中的鼠标右键 二、发布——>创建应用程序包 三、选择【旁加载】 四、选择签名方法&#xff1a; 五、选择和配置包 六、创建完毕 七、网络连接设备 八、登录设备 九、安装app

六边形酷科技特效单页源码

源码介绍 基于canvas画布绘制多个六边形追踪鼠标&#xff0c;科技感的几何图形酷炫动画特效&#xff0c; 单页html源码&#xff0c;可以做网站动态背景&#xff0c;喜欢的朋友可以拿去 效果截图 完整源码 <!doctype html> <html> <head> <meta charset…

项目7-音乐播放器3(删除模块+播放音乐模块设计)

1.播放音乐模块设计 1.1 请求响应设计 请求&#xff1a; { get, /music/get?pathxxx.mp3 } 响应&#xff1a; { 音乐数据本身的字节信息 } 1.2 后端代码 1. Files.readAllBytes(String path) : 读取文件中的所有字节&#xff0c;读入内存 &#xff…

SpringBoot集成FTP

1.加入核心依赖 <dependency><groupId>commons-net</groupId><artifactId>commons-net</artifactId><version>3.8.0</version></dependency> 完整依赖 <dependencies><dependency><groupId>org.springfra…

蛋白质亚细胞定位预测(生物信息学工具-017)

直奔主题&#xff0c;下面这张表图怎么制作&#xff0c;一般都是毕业论文hh&#xff0c;蛋白质的亚细胞定位如何预测&#xff1f; 01 方法 https://wolfpsort.hgc.jp/ #官网小程序&#xff0c;简单好用&#xff0c;不用R包&#xff0c;python包&#xff0c;linux程序&#x…

微服务使用SockJs+Stomp实现Websocket 前后端实例 | Vuex形式断开重连、跨域等等问题踩坑(一)

大家好&#xff0c;我是程序员大猩猩。 之前几篇文章&#xff0c;我们讲了Spring Cloud Gateway的轻量级实现&#xff0c;Nginx的配置概念与实现&#xff0c;如以下往期文章。 轻量级的Spring Cloud Gateway实践&#xff0c;实现api和websocket转发轻松实现Nginx的HTTP与WebS…

基于Springboot+Vue的Java项目-网上超市系统开发实战(附演示视频+源码+LW)

大家好&#xff01;我是程序员一帆&#xff0c;感谢您阅读本文&#xff0c;欢迎一键三连哦。 &#x1f49e;当前专栏&#xff1a;Java毕业设计 精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f380; Python毕业设计 &am…

平衡二叉树(后序遍历,力扣110)

解题思路&#xff1a;采取后序遍历的好处是先遍历节点得到高度&#xff0c;然后再判断高度差是否大于一&#xff0c;如果是的话就返回-1&#xff0c;不是就返回两高度中较大的高度加一就是父节点的高度 具体代码如下&#xff1a; class Solution { public: int travel(TreeN…

# 从浅入深 学习 SpringCloud 微服务架构(三)注册中心 Eureka(2)

从浅入深 学习 SpringCloud 微服务架构&#xff08;三&#xff09;注册中心 Eureka&#xff08;2&#xff09; 段子手168 1、搭建 EurekaServer 注册中心&#xff0c;使用 Eureka 的步骤&#xff1a; 1&#xff09;搭建 EurekaServer 创建工程&#xff0c;导入依赖坐标&…

论文阅读-Multiple Targets Directed Greybox Fuzzing (Hongliang Liang,2024)

标题: Multiple Targets Directed Greybox Fuzzing (Hongliang Liang,2024) 作者: Hongliang Liang, Xinglin Yu, Xianglin Cheng, Jie Liu, Jin Li 期刊: IEEE Transactions on Dependable and Secure Computing 研究问题: 发现局限性&#xff1a;之前的定向灰盒测试在有…

“中医显示器”是人体健康监测器

随着科技的进步&#xff0c;现代医学设备已经深入到了人们的日常生活中。然而&#xff0c;在这个过程中&#xff0c;我们不应忘记我们的医学根源&#xff0c;中医。我们将中医的望、闻、问、切四诊与现代科技相结合&#xff0c;通过一系列的传感器和算法将人体的生理状态以数字…

部署Hyperledger Fabric测试区块链网络

一. 快速启动区块链测试网络 启动Fabric虚拟机 将 fabric-samples.zip 拷贝进虚拟机 ubzip fabric-samples.zip 解压并重命名为fabric-samples mv fabric-samples-main fabric-samples 拷贝bin和config目录 cd fabric-samples cp ~/fabric/bin bin -r cp ~/fabric/config …

圣地亚哥 Toler 小学利用School AI帮助每个学生都有自己的聊天机器人,提高学习兴趣和效率

圣地亚哥 Toler 小学利用 AI 程序 SchoolAI 平台为学生创建个性化的聊天机器人&#xff0c;帮助他们更好地学习和提问。这个 AI 程序让学生可以在几秒钟内得到问题的答案&#xff0c;激发了他们提出更多问题的好奇心。 管理、调节和指导学生如何通过任务控制使用人工智能。 当…