机器学习课后习题 --- 朴素贝叶斯

(一)单选题

1.假设会开车的本科生比例是15%,会开车的研究生比例是23%。若在某大学研究生占学生比例是20%,则会开车的学生是研究生的概率是多少?
A:80%
B:16.6%
C:23%
D:15%
 

2.下列关于朴素贝叶斯的特点说法错误的是()
A:朴素贝叶斯模型发源于古典数学理论,数学基础坚实
B:朴素贝叶斯模型无需假设特征条件独立
C:朴素贝叶斯处理过程简单,分类速度快
D:朴素贝叶斯对小规模数据表现较好
 

3.以下算法不属于生成模型 ( )
A:朴素贝叶斯模型
B:混合高斯模型
C:隐马尔科夫模型
D:支持向量机
 

4.关于拉普拉斯平滑说法正确的是()
A:避免了出现概率为0的情况
B:加上拉普拉斯平滑有助于提高学习性能
C:会使得最终结果可能大于1
D:以上说法都不对
 

5.假设X和Y都服从正态分布,那么P(X<5,Y<0)就是一个( ),表示X<5,Y<0两个条件同时成立的概率,即两个事件共同发生的概率。
A:先验概率
B:后验概率
C:联合概率
D:以上说法都不对
 

6.以下算法属于判别模型的是( )
A:朴素贝叶斯模型
B:深度信念网络
C:隐马尔科夫模型
D:线性回归
 

7.以下算法属于判别模型的是()

A:朴素贝叶斯模型
B:深度信念网络
C:隐马尔科夫模型
D:线性回归

8. 朴素贝叶斯的优点不包括( )
A:算法逻辑简单,易于实现
B:分类过程中时空开销小
C:对缺失数据不太敏感,算法也比较简单,常用于文本分类
D:朴素贝叶斯模型对输入数据的表达形式很敏感
 

9.市场上某商品来自两个工厂,它们市场占有率分别为60%和40%,有两人各自买一件,则买到的来自不同工厂之概率为( )。
A:0.5
B:0.24
C:0.48
D:0.3
 

10.以A表示事件"甲种产品畅销,乙种产品滞销",则其对立事件A为( ) 
A:甲种产品滞销,乙种产品畅销
B:甲,乙两种产品均畅销
C:甲种产品滞销
D:甲种产品滞销或乙种产品畅销

11.关于朴素贝叶斯,下列说法错误的是:( )
A:它是一个分类算法
B:朴素的意义在于它的一个天真的假设:所有特征之间是相互独立的
C:它实际上是将多条件下的条件概率转换成了单一条件下的条件概率,简化了计算
D:朴素贝叶斯不需要使用联合概率
 

12.掷二枚骰子,事件A为出现的点数之和等于3的概率为( )
A:1/11
B:1/18
C:1/6
D:都不对
 

12、 问题:公司里有一个人穿了运动鞋,推测是男还是女?已知公司里男性30人,女性70人,男性穿运动鞋的有25人,穿拖鞋的有5人,女性穿运动鞋的有40人,穿高跟鞋的有30人。则以下哪项计算错误()?
选项:
A:p(男|运动鞋)=0.25
B:p(女|运动鞋)=0.4
C:p(运动鞋|男性)=25/30
D:p(运动鞋|女性)=0.4
 

(二)判断题

1.根据以往经验和分析得到的概率。在这里,我们用P(Y)来代表在没有训练数据前假设Y拥有的初始概率,因此称其为Y的后验概率,它反映了我们所拥有的关于Y的背景知识。
答案: 【错误】

2.朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性相关性较小时,朴素贝叶斯性能良好。而在属性个数比较多或者属性之间相关性较大时,分类效果不好。
答案: 【正确】

15.朴素贝叶斯对缺失数据较敏感。
答案: 【正确】

16.判别模型所学内容是决策边界。
答案: 【正确】

17.逻辑回归是生成模型,朴素贝叶斯是判别模型
答案: 【错误】

18、 问题:逻辑回归和朴素贝叶斯都有对属性特征独立的要求
答案: 【错误】

19、 问题:朴素贝叶斯法的基本假设是条件独立性。 
答案: 【正确】

20、 问题:朴素贝叶斯适用于小规模数据集,逻辑回归适用于大规模数据集。
答案: 【错误】
 

(三)问答题

1.朴素贝叶斯与逻辑回归的区别是什么?

定义与原理

逻辑回归:是一个用于预测目标变量为二分类或多分类的概率的线性模型。

朴素贝叶斯:是基于贝叶斯定理和特定假设(特征之间相互独立)的一种分类方法。

假设与模型

逻辑回归:假设特征与输出log-odds之间存在线性关系。

朴素贝叶斯:假设特征之间是条件独立的,即给定目标值时,一个特征的存在不会影响其他特征的存在。

适用场景

逻辑回归:当特征与输出之间的关系可以近似为线性关系时,逻辑回归通常表现得较好。

朴素贝叶斯:在文本分类、垃圾邮件识别等需要特征独立性假设的场景中表现良好。

参数估计

逻辑回归:通常使用极大似然估计来确定参数。

朴素贝叶斯:使用先验概率和似然来估计后验概率。

模型表现

逻辑回归:当特征数量很大或存在多重共线性时,可能需要正则化来防止过拟合。

朴素贝叶斯:虽然其“朴素”的假设在许多实际应用中不成立,但它在许多情况下仍然表现得很好。

实际应用

逻辑回归:广泛应用于金融、医疗、社交媒体等领域的分类问题。

朴素贝叶斯:在文本处理、情感分析、垃圾邮件过滤等领域有广泛的应用。

2.朴素贝叶斯“朴素”在哪里?

        朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的分类技术,它的名称中的“朴素”是指其一个核心假设:特征之间是条件独立的。即给定类别标签后,一个特征的出现不会影响其他特征的出现。“朴素”是假设了特征之间是同等重要、相互独立、互不影响的,但是在我们的现实社会中,属性之间并不是都是互相独立的,有些属性也会存在性,所以说朴素贝叶斯是一种很“朴素”的算法。

        具体来说,在许多实际情况中,特征之间确实存在某种依赖关系或关联。例如,在文本分类中,某些词的出现可能与其他词的出现有关。然而,尽管这个假设看起来过于简化,朴素贝叶斯分类器在很多应用中都表现得相当好。

        这个简化的假设带来了计算上的便利性。假设特征是条件独立的,意味着我们可以简单地将每个特征的概率相乘,而不需要担心它们之间的复杂交互。

        总的来说,“朴素”在朴素贝叶斯中是指它对特征间关系的简化假设,即认为所有特征都是条件独立的。这是一个在很多实际情况下并不完全成立的假设,但这种方法经常在实际应用中得到令人满意的结果。

3.在估计条件概率P((X|Y)时出现概率为0的情况怎么办?

引入拉普拉斯平滑法

4.何为朴素贝叶斯?

      朴素贝叶斯是一种简单但强大的分类算法,它基于贝叶斯定理并考虑到了特征的条件独立性。朴素贝叶斯被广泛应用于垃圾邮件检测、文本分类、情感分析等任务。

 补充:

贝叶斯定理: 贝叶斯定理描述了随机事件A和B之间的概率关系。数学表示为:  P(A∣B)=P(B)P(B∣A)P(A)​ 在分类任务中, A 通常是类别标签,而  B 是给定的数据或特征。

特征的条件独立性: 朴素贝叶斯分类器的“朴素”之处在于它假设给定类别标签后,所有特征都是条件独立的。这意味着,如果你有一个数据点的多个特征,那么这些特征之间不会相互影响。这种假设简化了计算,尽管在现实世界中,特征间可能存在关联。

模型训练: 为了训练一个朴素贝叶斯分类器,你首先需要计算每个类别的先验概率(即在没有任何其他信息的情况下某个类别出现的概率),以及给定某个类别时每个特征的概率。

预测: 对于一个新的数据点,朴素贝叶斯分类器计算它属于每个类别的后验概率,并选择概率最高的类别作为预测结果。

应用场景: 朴素贝叶斯在特定的应用中效果非常好,特别是在文本分类任务中。例如,判断一封电子邮件是不是垃圾邮件、对产品评论进行情感分析等。

       总之,朴素贝叶斯是一个基于贝叶斯定理的分类方法,其“朴素”是因为它假设所有特征在给定类别标签的条件下是独立的。尽管这种假设在许多真实情境中并不完全成立,但朴素贝叶斯在很多任务上都能得到相当不错的结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/68329.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

day30 日期转换

一&#xff1a;Date Date类&#xff1a; 这个类是java.util.Date getTime() : 获取内部维护的long值 Date date new Date(); long time date.getTime(); setTime()&#xff1a;按照指定的long值&#xff08;表示的时间&#xff09;设置Date表示的时间 time 60*60*24*1000;…

【力扣每日一题】2023.9.4 序列化和反序列化二叉搜索树

目录 题目&#xff1a; 示例&#xff1a; 分析&#xff1a; 代码&#xff1a; 题目&#xff1a; 示例&#xff1a; 分析&#xff1a; 题目给我们一棵搜索二叉树&#xff0c;要我们将这棵二叉树转变为字符串&#xff0c;同时我们需要根据字符串再变回二叉树&#xff0c;具体…

Linux之虚拟主机功能

目录 虚拟主机功能 概述 基于 IP 地址的虚拟主机 原理 案例 --- 增加多个IP地址&#xff0c;实现基于不同IP地址的虚拟主机功能 基于端口号的虚拟主机 原理 案例 --- 基于不同端口号的虚拟主机 基于域名的虚拟主机 原理 域名解析 案例 --- 使用2个域名建立虚拟主机网…

Mysql 高阶语句

高阶语句 对 MySQL 数据库的查询&#xff0c;除了基本的查询外&#xff0c;有时候需要对查询的结果集进行处理&#xff1b; 例如只取 10 条数据、对查询结果进行排序或分组等&#xff0c;来获取想要有用的数据 无非还是对于MySQL —— 增、删、改、查 的操作 升降序 SELECT…

基于单片机的万年历温度无线传输控制系统系统

一、系统方案 本设计采用DS1302采集年月日时分秒&#xff0c;DS18B20采集温度值&#xff0c;按键设置温度报警上下限&#xff0c;实际测量温度低于下限或高于上限&#xff0c;蜂鸣器报警&#xff0c;同时将测量温度上传到蓝牙助手。 二、硬件设计 原理图如下&#xff1a; 三…

R语言图形的组合( par(),layout(),par(fig()) )

引入d.class进行画图 > d.class<-read.csv("D://class.csv",header T) > attach(d.class) > opar<-par(no.readonly TRUE)非常简单的数据&#xff0c;需要可自取 链接&#xff1a;https://pan.baidu.com/s/1zNx5z9JsaaRqFueRgGY3mQ 提取码&#x…

3D开发工具HOOPS Publish如何快速创建交互式3D PDF文档?

HOOPS Publish是一款功能强大的SDK&#xff0c;可以创作丰富的工程数据并将模型文件导出为各种行业标准格式&#xff0c;包括PDF、STEP、JT和3MF。HOOPS Publish核心的3D数据模型是经过ISO认证的PRC格式(ISO 14739-1:2014)&#xff0c;它为装配树、拓扑和几何、产品制造信息和视…

群狼调研(长沙顾客需求调研)如何提升供应商满意度?

本文由群狼调研(长沙超市满意度调查)出品&#xff0c;欢迎转载&#xff0c;请注明出处。提升供应商满意度是确保供应链稳定和业务持续发展的重要一环。以下是一些建议&#xff0c;帮助您提升供应商满意度&#xff1a; 1. 透明沟通&#xff1a;建立开放、透明的沟通渠道&#x…

Seata1.5.2+Nacos分布式事务环境搭建详解

文章目录 一、下载seata server二、配置application.yml三、初始Mysql数据库四、导入初始配置到nacos五、启动测试 本文以seata-server-1.5.2&#xff0c;以配置中心、注册中心使用Nacos&#xff0c;store.modedb&#xff08;mysql&#xff09;为例进行操作。 Seata简介及入门参…

[深度学习]1. 深度学习知识点汇总

本文记录了我在学习深度学习的过程中遇到过的不懂的知识点&#xff0c;为了方便翻阅&#xff0c;故将其发表于此&#xff0c;随时更新&#xff0c;供大家参考。 深度学习常见知识点 1. 测试精度和训练精度 在深度学习中&#xff0c;测试精度和训练精度是两个重要的指标&#…

vue中使用wow.js

一、安装 npm install wowjs --save-dev 二、main中引入 animate.css会自动安装 因为wow.js在animate.css基础上 main.js中引入animate.css import "animate.css" 三、 页面使用 有两种引入使用方式&#xff1a;1. import {WOW} from wowjs mounted() { n…

spring cloud openfeign中@RequestMapping和@FeginClient注解不能同时使用的问题

项目启动异常如下 Caused by: java.lang.IllegalArgumentException: RequestMapping annotation not allowed on FeignClient interfacesat org.springframework.cloud.openfeign.support.SpringMvcContract.processAnnotationOnClass(SpringMvcContract.java:180)at feign.Co…

【zip密码】zip压缩包删除密码方法

Zip压缩包设置设置了密码&#xff0c;想要删除密码&#xff0c;除了将压缩包解压出来之后再将文件压缩为不带密码的压缩文件以外&#xff0c;还有一种删除密码的方法。设置方法如下&#xff1a; 右键点击zip文件&#xff0c;找到打开方式&#xff0c;以Windows资源管理器方式打…

暴力递归转动态规划(四)

题目 规定1对应A、2对应B、3对应C…26对应Z&#xff0c;那么一个数字字符串比如"111"&#xff0c;就可以转化为&#xff1a;“AAA”、“KA"或"AK”&#xff0c;给定一个数字字符组成的字符串str&#xff0c;返回有多少种转化结果。 解释一下&#xff0c;字…

VBA技术资料MF52:VBA_在Excel中突出显示前 10 个值

【分享成果&#xff0c;随喜正能量】一言之善&#xff0c;重于千金。善良不分大小&#xff0c;有时候你以为的一句话&#xff0c;小小的举手之劳&#xff0c;也可能就是别人的救赎&#xff01;不要吝啬你的善良&#xff0c;因为你永远不知道那小小的善良能给多少人带来光明。。…

【 ARMv9 Cluster BUS QoS 配置】

文章目录 ARM Cluster QoS ARM Cluster QoS QoS&#xff08;Quality of Service&#xff0c;服务质量&#xff09;在 ARM 架构中&#xff0c;主要指的是一种机制&#xff0c;它可以控制和管理系统资源&#xff08;如内存、总线带宽等&#xff09;的使用&#xff0c;以满足各种…

Cyber RT学习---5.Cyber RT通信机制解析与实践

5.Cyber RT通信机制解析与实践 5.1 通信机制简介 5.1.1 话题通信 模式&#xff1a; 以发布订阅的方式实现不同节点之间数据交互的通信模式。 如图1-1所示&#xff0c;Listener-Talker通信首先创建了两个Node&#xff0c;分别是Talker Node和 Listener Node。 每个Node实例化…

【B树 B+树】B树、B+树理论

目录 引入B树B树定义和性质m阶B树核心特性 B树B树的查找 引入B树 满足上面两个策略就是B树&#xff1a; m 叉查找树中&#xff0c;规定除了根节点外&#xff0c;任何结点至少有 ⌈ m / 2 ⌉ \lceil m/2 \rceil ⌈m/2⌉ 个分叉&#xff0c;即至少含有 ⌈ m / 2 ⌉ \lceil m/2 \…

LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER

本文是LLM系列文章&#xff0c;针对《LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER》的翻译。 作为自主决策者的大语言模型 摘要1 引言2 前言3 任务形式化4 方法5 实验6 相关工作7 结论 摘要 尽管大型语言模型&#xff08;LLM&#xff09;表现出令人印象深刻的语言理解…

Python爬虫——新手使用代理ip详细教程

Python代理IP爬虫是一种可以让爬虫拥有更多网络访问权限的技术。代理IP的作用是可以为爬虫提供多个IP地址&#xff0c;从而加快其爬取数据的速度&#xff0c;同时也可以避免因为访问频率过高而被网站封禁的问题。本文将介绍如何使用Python实现代理IP的爬取和使用。 一、代理IP的…