【SCAU数据挖掘】数据挖掘期末总复习题库应用题及解析

1.

给定圆的半径为e ,令 MinPts=3,考虑下面两幅图。


(1)哪些对象是核心对象?       

        m,p,o,r(因为这些核心对象在半径e的范围内都至少包含MinPts=3个对象)


(2)哪些对象是直接密度可达的?        

        对象q是从m直接密度可达的。对象m从p直接密度可达的。


(3)哪些对象是密度可达的?

        对象q是从p(间接)密度可达的(因为q从m直接密度可达,m从p直接密度可达。)

        r和s是从o密度可达的


(4)哪些对象是密度相连的?

        r和s是从o密度可达的,所以r和s是密度相连的。

核心对象:如果一个对象的ε-邻域内至少包含MinPts个对象,则该对象为核心对象。在这里,ε是邻域半径,MinPts是给定的最小点数。
直接密度可达:如果对象p在对象q的ε-邻域内,且q是核心对象,那么对象p从对象q出发是直接密度可达的。

密度可达:如果存在一个对象链p1, p2, ..., pn,其中p1=q,pn=p,且pi+1从pi关于ε和MinPts直接密度可达,那么对象p从对象q出发是密度可达的。
密度相连:如果对象集合D中存在一个对象o,使得对象p和q都是从o关于ε和MinPts密度可达的,那么对象p和q是关于ε和MinPts密度相连的。

2.相异性计算

给定两个元组(22,1,42,10)和(20,0,36,8):
(1)计算这两个对象之间的欧几里得距离。
(2)计算这两个对象之间的曼哈顿距离。
(3)使用q=3,计算这两个对象之间的闵可夫斯基距离。
(4)计算这两个对象之间的上确界距离。

欧几里得距离(Euclidean Distance):两点之间的直线距离
曼哈顿距离(Manhattan Distance):是两点在标准坐标系上的绝对轴距总和
上确界距离(Supremum Distance):是两点在各维度上距离的最大值

(1)

d=sqrt((22-20)^2+(1-0)^2+(42-36)^2+(10-8)^2)=sqrt(45)

(2)

d=∣22−20∣+∣1−0∣+∣42−36∣+∣10−8∣=2+1+6+2=11

(3)d=max(|p-q|)=6

(4)

d=max(∣22−20∣,∣1−0∣,∣42−36∣,∣10−8∣)=max(2,1,6,2)=6

3.

对于数据:{12,9,7,6,20,100,35,21,11,18,25,37},完成以下任务:

(1)计算它的平均值,20%的截断均值和中位数,并说明这三个统计特征在描述数据集方面的特点。

(2)使用最小-最大规范方法将其中的6,100,35转换到[0,1]。

(1)

平均值 = (12 + 9 + 7 + 6 + 20 + 100 + 35 + 21 + 11 + 18 + 25 + 37) / 12 = 25.08

20%截断均值:12×0.2=3.6向上取整到4个
首先将数据从小到大排序: {6, 7, 9, 11, 12, 18, 20, 21, 25, 35, 37, 100}
去掉最小的2个和最大的2个
{9, 11, 12, 18, 20, 21, 25, 35}
20%截断均值 = (9 + 11 + 12 + 18 + 20 + 21 + 25 + 35) / 8 = 18.875

中位数(18+20)/2=19

(2)

最小-最大规范化:将待转换数据减去最小值,再除以极差(最大值-最小值)
原数据集中最小值为6,最大值为100
极差 = 100 - 6 = 94

6的规范化值 = (6 - 6) / 94 = 0
100的规范化值 = (100 - 6) / 94 = 1
35的规范化值 = (35 - 6) / 94 = 0.3085
所以6、100、35分别规范化为0、1、0.3085
 

4.

对于如下的前馈神经网络,假设现在有一个训练样本,X={1,0,1},其对应的类标号(标签)为1,节点4、5、6的激活函数为sigmoid函数,结构如下图所示:

网络的初始输入、权值(w)和偏置值(4、5、6节点分别为)如下表所示:

(1)请计算节点4、5、6的净输入和输出


(2)请计算节点4、5、6的误差


(3)假设学习率为0.9,请计算上表中所有权值和偏置的一次更新。


(4)请问什么是梯度消失?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/29479.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Thermo Fisher赛默飞TSQ单杆电源维修1R120380-0001

美国热电质朴分析仪电路板维修,液相色谱质谱联用仪维修,Thermo Fisher赛默飞世尔光谱仪IS10 IS5赛默飞主板维修。 公司仪器维修设备备有三相交流电源,变频电源,无油空压气源,标准化的维修平台、电子负载,耐压测试仪、老…

MongoDB和AI 赋能行业应用:零售

欢迎阅读“MongoDB 和 AI 赋能行业应用”系列的第三篇。 本系列重点介绍 AI 应用于不同行业的关键用例,涵盖制造业和汽车行业、金融服务、零售、电信和媒体、保险以及医疗保健行业。 利用生成式 AI 技术(Gen AI),零售商可以创造…

软考中级哪个科目比较简单,只为拿证?

中级科目包括信息系统、计算机网络等5个方向,共计15门课程。软考中级难度适中,考取后即可获得中级职称,因此性价比最高。 需要留意的是,这些科目中,有一些是每年只有一次考试的,有一些是每年有两次考试的&a…

【机器学习】第2章 线性回归及最大熵模型

一、概念 1.回归就是用一条曲线对数据点进行拟合,该曲线称为最佳拟合曲线,这个拟合过程称为回归。 2.一个自变量 叫 一元线性回归,大于一个自变量 叫 多元线性回归。 (1)多元回归:两个x,一个…

qmt量化交易策略小白学习笔记第37期【qmt编程之指数数据--如何获取迅投商品市场指数行情数据】

qmt编程之获取商品市场指数数据 qmt更加详细的教程方法,会持续慢慢梳理。 也可找寻博主的历史文章,搜索关键词查看解决方案 ! 感谢关注,咨询免费开通量化回测与获取实盘权限,欢迎和博主联系! 获取迅投商…

HPMicro:FEMC应用指南

先楫FEMC的基本概念介绍 FEMC (Flexible External Memory Controller)全称为多功能外部存储器控制器。作为并行接口控制器,FEMC具有访问存储数据速度快的特点。 HPM的FEMC只有一路,由于FEMC是并口,所以占用的管脚较多。而且HPM的FEMC信号引脚…

【面试干货】ArrayList、Vector、LinkedList的存储性能和特性比较

【面试干货】ArrayList、Vector、LinkedList的存储性能和特性比较 1、ArrayList1.1 存储性能1.2 特性1.3 示例用法 2、Vector2.1 存储性能2.2 特性2.3 示例用法 3、LinkedList3.1 存储性能3.2 特性3.3 示例用法 4、ArrayList、Vector、LinkedList用法总结 💖The Beg…

Transformer革新:Infini-Transformer在长文本处理中的突破

在当今信息爆炸的时代,大型语言模型(LLMs)在处理长文本数据方面的需求日益增长。无论是科学研究、法律分析还是医学诊断,长文本的处理能力都显得尤为重要。然而,现有的基于Transformer的模型在处理这类数据时遇到了重大…

硬件电路基础【5.二极管】

二极管 前言一、基本原理1.1 介绍1.2 结构组成1.3 符号1.4 正负极判断 二、特性参数开关电路注意的参数极限特性电气特性特性曲线 三、应用场景稳压二极管原理故障特点连接方式参数最大额定参数电气特性特性曲线 应用典型的串联型稳压电路过压保护稳压二极管的应用与选择 肖特基…

需要用来做3D家具展示的软件哪个网站更专业?

国内外的3D家具展示软件网站并且值得推荐的也就那么几家: 1、Cedreo,Cedreo 是一个在线3D家居设计平台,适合专业的房屋建筑商、改造商和室内设计师。它允许用户创建2D和3D平面图以及室内外效果图,拥有7000多件可定制的3D家具、材…

单元测试的思考与实践

1. 什么是单元测试 通常来说单元测试,是一种自动化测试,同时包含一下特性: 验证很小的一段代码(业务意义 或者 代码逻辑 上不可再分割的单元),能够更准确的定位到问题代码的位置 能够快速运行(…

opencv中文路径问题

目的 在windows系统上,就是直接用QT的utf8编码作为图片路径用在opencv读取或者写入函数,在路径当中含有中文时,会提示编码错误。 就是解决opencv中的中文路径的问题。 情况 代码如下: #pragma execution_character_set("…

以CMDB为基础构建DevOps平台体系

在当今数字化转型的浪潮中,企业IT运维模式正从传统的资产管理向现代化的资源管理转变。配置管理数据库(CMDB)作为IT运维的核心组成部分,其在DevOps平台中的重要性愈加凸显。通过国信证券和招商银行的实际案例,我们将详…

css 文字下划线 text-decoration

背景: 在某些时候需要给文字添加特殊样式。使用 text-decoration: underline; 来为段落文字添加下划线。也有其它文本装饰样式,例如: none:无装饰(去掉装饰)overline:上划线line-through&…

《珊瑚岛》是一款什么类型的游戏 苹果电脑如何玩到《珊瑚岛》

在众多电子游戏中,有些游戏因其独特的游戏体验和丰富的内容而脱颖而出,《珊瑚岛》便是其中之一。在游戏中你将离开宝京前往珊瑚岛,种植农作物、饲养动物、和岛民成为朋友。您不仅可以振兴该岛小镇,还可以保护和修复周围的珊瑚礁。…

C# OpenCV 部署RecRecNet广角图像畸变矫正

C# OpenCV 部署RecRecNet广角图像畸变矫正 目录 说明 效果 模型信息 项目 代码 下载 说明 ICCV2023 - RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline Model and DoF-based Curriculum Learning 参考: https://github.com/Kang…

CleanMyMac中文版2024破解完美版本下载链接

CleanMyMac中文版,是一款功能强大的系统优化软件。它能够帮助你清理垃圾文件、卸载无用应用、优化内存使用等,让你的电脑运行更加流畅稳定。 CleanMyMac中文版具有智能扫描功能,能够自动识别电脑上的垃圾文件和冗余数据。它能够快速扫描整个…

【MongoDB 新搭档 Kafka】

对于做过数据处理,使用过消息队列的小伙伴 ,Kafka可以算是老朋友了,但是最近一个场景下,新的用法,让其变为了MongoDB的新搭档。 开始 从一个问题开始,熟悉MongoDB的小伙伴,可能使用过changeSt…

Java的三个接口Comparable,Comparator,Cloneable(浅拷贝与深拷贝)

Comparable 当我们要进行对象的比较的时候&#xff0c;我们是不能直接用>、< 这些符号直接进行比较的。 由于这是引用类型变量也是自定义类型变量&#xff0c;直接进行比较的时候&#xff0c;我们是通过对象的地址进行比较的&#xff0c;我们可以使用、! 进行两个对象的…

Spring Cloud 专题-前言篇(1)

引言 随着微服务架构的兴起&#xff0c;Spring Cloud 作为一套基于 Spring Boot 实现的云应用开发工具集&#xff0c;为开发者提供了在分布式系统&#xff08;如配置管理、服务发现、断路器、智能路由、微代理、控制总线等&#xff09;中快速构建一些常见模式的能力。本篇文档…