数据仓库实验四:聚类分析实验

目录

    • 一、实验目的
    • 二、实验内容和要求
    • 三、实验步骤
      • 1、建立数据表
      • 2、建立数据源视图
      • 3、建立挖掘结构Student.dmm
      • 4、部署项目并浏览结果
      • 5、挖掘模型预测
    • 四、实验结果分析
    • 五、实验总结体会


一、实验目的

  通过本实验,进一步理解基于划分的、基于层次的、基于密度的聚类分析方法以及经典的聚类分析算法,并掌握利用 SQL Server 等工具平台进行聚类分析的方法,掌握挖掘结构、挖掘模型的基本概念,能够使用数据挖掘向导创建数据挖掘结构和模型,掌握数据挖掘设计器的使用方法,掌握模型查看器方法 ,理解聚类分析算法常用的参数含义和设置方法。

二、实验内容和要求

  针对实际需求,构建格式规范的数据集,并能够借助于 SQL Server、Weka、SPSS 等工具平台,利用 K-means 等聚类分析算法进行聚类分析,正确分析实验结果,发现知识,完成实验报告。

三、实验步骤

  以下是参照示例:以 SQL Server 作为工具,完成数据集的构建和聚类分析。——以下内容,仅供参考!

1、建立数据表

启动SQL Server,在DM数据库中建立一个Student表,其结构如下,并输入示例数据。

在这里插入图片描述
在这里插入图片描述

2、建立数据源视图

新建一个 Analysis Services 项目 ClusterMining。建立数据源视图,它对应DM数据库中的Student表。

在这里插入图片描述
在这里插入图片描述

3、建立挖掘结构Student.dmm

新建挖掘结构,在“创建数据挖掘结构”页面的“您要使用何种数据挖掘技术?”选项下,选中列表中的“Microsoft聚类分析”。

在这里插入图片描述
选择数据源视图为DM。

在“指定表类型”页面上,在Student表的对应行中选中“事例”复选框,并单击下一步按钮。

在这里插入图片描述
在“指定定型数据”页面中,将“学号”列设为键列,把其它所有列设为输入列。

在这里插入图片描述
在这里插入图片描述
在“创建测试集”页面上,“测试数据百分比”选项的默认值为30%,将该选项更改为0.

在这里插入图片描述
在完成向导页面的“挖掘结构名称”和“挖掘模型名称”中,都输入Student。

在这里插入图片描述
在“挖掘模型”选项卡中设置算法的参数如下图所示。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4、部署项目并浏览结果

先处理(部署)、再浏览。

在这里插入图片描述
在挖掘模型查看器中,浏览聚类分析的结果。

在这里插入图片描述

5、挖掘模型预测

(1)单击“挖掘模型预测”选项卡,再单击“选择输入表”对话框中的“选择事例表”命令,指定DM数据源视图中的Student表。

在这里插入图片描述
(2)保持默认的字段连接关系,将Student表中的各个列拖放到下方的列表中,选中最后一行下面的空白行字段前面的“源”,从下拉列表中选择“预测函数”选项,并设置字段为Cluster。

在这里插入图片描述
(3)在任一空白处右击,并在下拉菜单中选择“结果”,出现如下所示的分类结果。

在这里插入图片描述

四、实验结果分析

1、分类关系图

(1)所有链接

在这里插入图片描述
(2)最强链接

在这里插入图片描述
2、分类剖面图

在这里插入图片描述
3、分类特征

在这里插入图片描述
4、分类对比
(1)“分类1”VS“非分类1”

在这里插入图片描述
(2)“分类1”VS“分类2”

在这里插入图片描述

五、实验总结体会

  通过数据挖掘聚类分析实验,积累了许多宝贵的经验。首先,我认识到对数据进行深入理解是取得成功的关键。在开始实验之前,我仔细分析了数据的结构、特征和可能存在的异常或缺失值等情况。这样的数据理解使我能够更好地选择合适的分析方法,并取得更好的结果。其次,在进行聚类分析之前,特征选择和预处理是不可或缺的步骤。通过特征选择,我能够提高模型的性能并降低计算复杂性。而预处理则可以使数据更加干净、一致,从而减少对聚类结果的影响。
  选择合适的算法是成功实现聚类分析的重要因素。我研究了各种聚类算法,包括K均值、层次聚类和DBSCAN等。每种算法都有其适用的场景和限制,所以我根据实际情况选择了最合适的算法。这样做可以确保我的聚类结果更加准确和可靠。然后,我意识到结果的解释和评估是聚类分析中不可或缺的步骤。聚类分析的结果不仅仅是一组类别标签,更重要的是对这些类别的解释和理解。最后,我意识到持续学习和改进是取得优秀成绩的关键。数据仓库与数据挖掘是一个不断发展和变化的领域,需要不断学习新的方法和算法。通过不断尝试新的技术和流程,我能够不断优化实验流程,并取得更好的结果。
  总的来说,进行数据仓库与数据挖掘的聚类分析实验是一个充满挑战但又充满乐趣的过程。通过深入理解数据、选择合适的算法、进行特征选择和预处理、解释和评估结果,以及持续学习和改进,我相信我能够不断提高我的数据分析技能,并在这个领域取得更出色的成果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/13550.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Easy-poi 和 EasyExcel 选型

目录 共同点地址如何选 共同点 easy-poi 和 easyexcel 都是基于 apache poi 进行二次开发的,底层都是依赖的 apache poi使用简单,都可以通过简单的注解实现excel文件的导入导出 地址 esay poi 是一个开源的 excel,word 处理框架。链接 easy excel 是…

Xed编辑器开发第二期:使用Rust从0到1写一个文本编辑器

第三篇 这部分接着处理用户退出命令以及一些其他新功能; 3.1 使用CtrlQ退出 modifiers: event::KeyModifiers::CONTROL,使用CONTROL替换之前的NONE值即可; 3.2 重构键盘输入 让我们重构我们的代码,以便我们有一个用于低级按键读取的函数&…

《Rust奇幻之旅:从Java和C++开启》第1章Hello world 2/5

讲动人的故事,写懂人的代码 很多程序员都在自学Rust。 🤕但Rust的学习曲线是真的陡,让人有点儿怵头。 程序员工作压力大,能用来自学新东西的时间简直就是凤毛麟角。 📕目前,在豆瓣上有7本Rust入门同类书。它们虽有高分评价,但仍存在不足。 首先,就是它们介绍的Rust新…

【前端面经】BFC

BFC BFC什么是 BFC?元素开启 BDC 后的特殊布局效果元素开启 BFC 的方式 BFC 什么是 BFC? 官方解释:A block formatting context (BFC) is a part of a visual CSS rendering of a web page. It’s the region in which the layout of block…

什么是谷歌爬虫?

其实就是谷歌用来浏览网络信息的一个自动化程序,他们会在你的网站爬取,寻找和搜集信息,谷歌爬虫可以说决定着一个网站在谷歌的生死 谷歌爬虫的作用机制就在于发现新网站以及新网页,然后他会把网页的内容带回去,更新到…

PikaUnsafe upfileupload

1.client check 客户端检测,前端js检测,禁用js和修改后缀名即可。 php格式不能上传,我们修改后缀上传。 蚁剑成功连接。 2.MIME type 这个就是 content-type 规定上传类型,上面的方法也能成功,也可以修改 conten-ty…

面试框架【面试准备】

前言 2023-9-12 12:12:04 2023-09-14 16:13:04 公开发布于 2024-5-22 00:16:21 以下内容源自《【面试准备】》 仅供学习交流使用 版权 禁止其他平台发布时删除以下此话 本文首次发布于CSDN平台 作者是CSDN日星月云 博客主页是https://blog.csdn.net/qq_51625007 禁止其他平…

奇偶数递增递减-第13届蓝桥杯选拔赛Python真题精选

[导读]:超平老师的Scratch蓝桥杯真题解读系列在推出之后,受到了广大老师和家长的好评,非常感谢各位的认可和厚爱。作为回馈,超平老师计划推出《Python蓝桥杯真题解析100讲》,这是解读系列的第70讲。 奇偶数递增递减&a…

vite+ts+mock+vue-router+pinia实现vue的路由权限

0.权限管理 前端的权限管理主要分为如下: 接口权限路由权限菜单权限按钮权限 权限是对特定资源的访问许可,所谓权限控制,也就是确保用户只能访问到被分配的资源 1.项目搭建 创建vite项目 yarn create vite配置别名 npm install path -…

4. C++入门:内联函数、auto关键字、范围for及nullptr

内联函数 概念 以inline修饰的函数叫做内联函数,编译时C编译器会在调用内联函数的地方展开,没有函数调用建立栈帧的开销,内联函数提升程序运行的效率 对比C的宏 C语言不足:宏 #define ADD(x, y) ((x)(y))int main() {int ret…

python实现520表白图案

今天是520哦,作为程序员有必要通过自己的专业知识来向你的爱人表达下你的爱意。那么python中怎么实现绘制520表白图案呢?这里给出方法: 1、使用图形库(如turtle) 使用turtle模块,你可以绘制各种形状和图案…

Docker 安装kingbase V8r6

下载 官网下载,注意:这里下载 Docker 版本v8r6 安装 # 导入镜像 docker load -i kingbase.tar# 重命名 docker tag [image-name]:[tag] [new-image-name]:[new-tag]# 删除 docker rmi [image-name]:[tag]# 创建容器 docker run -tid \ --privileged \…

python实现绘制烟花代码

在Python中,我们可以使用多个库来绘制烟花效果,例如turtle库用于简单的绘图,或者更复杂的库如pygame或matplotlib结合动画。但是,由于turtle库是Python自带的,我们可以使用它来绘制一个简单的烟花效果。 下面是一个使…

Stable Diffusion AMD加速方法-ZLUDA重出江湖

目前几大开源的Stable Diffusion平台,更新速度都慢了,一个是没有太多新技术出现,新出的基础模型也都不完整开源了(API调用),能整的功能,也都整得差不多了。然后一群AMD死忠还在等着有一个能有一…

【前端】使用 Canvas 实现贪吃蛇小游戏

使用 Canvas 实现贪吃蛇小游戏 在这篇博客中,我们将介绍如何使用 HTML5 Canvas 和 JavaScript 实现一个简单的贪吃蛇(Snake)小游戏。这个项目是一个基础的游戏开发练习,它可以帮助你理解如何在 Canvas 上绘图、如何处理用户输入以…

Laravel(Lumen8) + Supervisor 实现多进程redis消息队列

相关文章:Supervisor守护进程工具安装与使用 1、通用消息队列 /App/Job/CommonJob.php: <?phpnamespace App\Jobs; use Illuminate\Support\Facades\Log; use Illuminate\Support\Str;class CommonJob extends Job {public $timeout; //超时时间protected $data; //队列…

Android:OkHttp网络请求框架的使用

目录 一&#xff0c;OkHttp简介 二&#xff0c;OkHttp请求处理流程 三&#xff0c;OkHttp环境配置 四&#xff0c;OkHttp的使用 1.get网络请求 2.post上传表单数据 3.post上传json格式数据 4.文件上传 5.文件下载 一&#xff0c;OkHttp简介 OkHttp是square公司推出的一…

npm 源管理工具 nrm

npm 源管理工具 nrm 安装(可能很慢, 多试几次) npm install -g nrm查看可选择源列表 nrm ls切换源 nrm use <registry>如: nrm use taobao

rust的版本问题,安装问题,下载问题

rust的版本、安装、下载问题 rust版本问题&#xff0c; 在使用rust的时候&#xff0c;应用rust的包&#xff0c;有时候包的使用和rust版本有关系。 error: failed to run custom build command for pear_codegen v0.1.2 Caused by: process didnt exit successfully: D:\rus…

鸿蒙全面开发指南:入门、生态安全与资源支持

鸿蒙全面开发指南&#xff1a;入门、生态安全与资源支持 本文全面梳理了鸿蒙操作系统的开发入门流程&#xff0c;涵盖了开发环境准备、工具使用、项目创建、模拟器配置到应用安全设计的各个方面。通过本文&#xff0c;读者不仅能够了解鸿蒙开发的基本步骤&#xff0c;也能深入理…