机器学习复习题

1 单选题

  1. ID3算法、C4.5算法、CART算法都是( )研究方向的算法。
    A . 决策树 B. 随机森林
    C. 人工神经网络 D. 贝叶斯学习

参考答案:A

  1. ( )作为机器学习重要算法之一,是一种利用多个树分类器进行分类和预测的方法。
    A . 决策树 B. 随机森林
    C. 人工神经网络 D. 贝叶斯学习

参考答案:B

  1. ()是一种具有非线性适应性信息处理能力的算法,可克服传统人工智能方法对模式识别、语音识别、非结构化信息处理方面的缺陷。
    A . 决策树 B. 随机森林
    C. 人工神经网络 D. 贝叶斯学习

参考答案:C

  1. ()是机器学习较早的研究方向,其源于英国数学家托马斯.贝叶斯在1763年发表的一篇论文中提到的贝叶斯定理。
    A . 决策树 B. 随机森林
    C. 人工神经网络 D. 贝叶斯学习

参考答案:D

  1. 基于学习策略进行分类,机器学习可分为( )。
    A. 模拟人脑的机器学习和采用数学方法的机器学习
    B. 归纳学习、演绎学习、类比学习、分析学习
    C. 监督学习、无监督学习、强化学习
    D. 结构化学习、非结构化学习

参考答案:A

  1. 机器学习按学习方法大致可分为( )。
    A. 模拟人脑的机器学习和采用数学方法的机器学习
    B. 归纳学习、演绎学习、类比学习、分析学习
    C. 监督学习、无监督学习、强化学习
    D. 结构化学习、非结构化学习

参考答案:B

  1. 机器学习按学习方式大致可分为( )。
    A. 模拟人脑的机器学习和采用数学方法的机器学习
    B. 归纳学习、演绎学习、类比学习、分析学习
    C. 监督学习、无监督学习、强化学习
    D. 结构化学习、非结构化学习

参考答案:C

  1. 机器学习按数据形式大致可分为( )。
    A. 模拟人脑的机器学习和采用数学方法的机器学习
    B. 归纳学习、演绎学习、类比学习、分析学习
    C. 监督学习、无监督学习、强化学习
    D. 结构化学习、非结构化学习

参考答案:D

  1. 机器学习的实质是( )。
    A. 根据现有数据,寻找输入数据和输出数据的映射关系/函数
    B. 建立数据模型
    C. 衡量输入数据和输出数据的映射关系/函数的好坏
    D. 挑出输入数据和输出数据的最佳映射关系/函数

参考答案: A

  1. 越复杂的模型,在training data set表现出越好的误差性能,但在testing data set中并不总是表现出好的误差性能,这种现象被称为( )?
    A. 过拟合
    B. 泛化性能
    C. 欠拟合
    D. 泛化能力

参考答案: A

  1. K近邻算法是( )。
    A.有监督学习
    B.无监督学习
    C.半监督学习
    D.自主学习

参考答案: A

  1. 在数据预处理阶段,我们常常对数值特征进行归一化或标准化(standardization, normalization)处理。这种处理方式理论上不会对下列哪个模型产生很大影响?()
    A. k k k-Means
    B. k k k-NN
    C. 决策树

参考答案:C

分析: k k k-Means和 k k k-NN都需要使用距离。而决策树对于数值特征,只在乎其大小排序,而非绝对大小。不管是标准化或者归一化,都不会影响数值之间的相对大小。关于决策树如何对数值特征进行划分。

  1. 下面哪个情形不适合作为 k k k-Means迭代终止的条件?
    A. 前后两次迭代中,每个聚类中的成员不变
    B. 前后两次迭代中,每个聚类中样本的个数不变
    C. 前后两次迭代中,每个聚类的中心点不变

参考答案:B

分析:A和C是等价的,因为中心点是聚类中成员各坐标的均值

  1. 关于欠拟合(under-fitting),下面哪个说法是正确的?
    A. 训练误差较大,测试误差较小
    B. 训练误差较小,测试误差较大
    C. 训练误差较大,测试误差较大

参考答案:C

当欠拟合发生时,模型还没有充分学习训练集中基本有效信息,导致训练误差太大。测试误差也会较大,因为测试集中的基本信息(分布)是与训练集相一致的。

  1. 关于集成学习(ensemble learning),下面说法正确的是:
    A. 单个模型都是使用同一算法
    B. 在集成学习中,使用“平均权重”会好于使用“投票”
    C. 单个模型之间有低相关性

参考答案:C

  1. 以下说法哪些是正确的?
    A. 在使用 k k k-NN算法时,k通常取奇数
    B. k k k-NN是有监督学习算法
    C.在使用 k k k-NN算法时, k k k取值越大,模型越容易过拟合
    D. k k k-NN和 k k k-Means都是无监督学习算法

参考答案:B

  1. (单选题)不属于神经网络常用学习算法的是( )。
    A. 监督学习
    B. 增强学习
    C. 观察与发现学习
    D. 无监督学习

参考答案: C

  1. (单选题)
    ( ) 是一门用计算机模拟或实现人类视觉功能的新兴学科,其主要研究目标是使计算机具有通过二维图像认知三维环境信息的能力。
    A. 机器视觉
    B. 语音识别
    C. 机器翻译
    D. 机器学习

参考答案: A

  1. (单选题)在图灵测试中,如果有超过( )的测试者不能分清屏幕后的对话者是人还是机器,就可以说这台计算机通过了测试并具备人工智能。
    A. 30%
    B. 40%
    C. 50%
    D. 60%

参考答案: A

  1. (单选题)知识图谱可视为包含多种关系的图。在图中,每个节点是一个实体(如人名、地名、事件和活动等),任意两个节点之间的边表示这两个节点之间存在的关系。下面对知识图谱的描述,哪一句话的描述不正确( )
    A. 知识图谱中一条边可以用一个三元组来表示
    B. 知识图谱中一条边连接了两个节点,可以用来表示这两个节点存在某一关系
    C. 知识图谱中两个节点之间仅能存在一条边
    D. 知识图谱中的节点可以是实体或概念

参考答案:C

  1. 以下哪个步骤不是机器学习所需的预处理工作( )
    A. 数值属性的标准化
    B. 变量相关性分析
    C. 异常值分析
    D. 与用户讨论分析需求

参考答案: D

  1. 数据预处理对机器学习是很重要的,下面说法正确的是( )
    A. 数据预处理的效果直接决定了机器学习的结果质量
    B. 数据噪声对神经网络的训练没什么影响
    C. 对于有问题的数据都直接删除即可
    D. 预处理不需要花费大量的时间

参考答案: A

  1. 谷歌新闻每天收集非常多的新闻,并运用( )方法再将这些新闻分组,组成若干类有关联的新闻。于是,搜索时同一组新闻事件往往隶属同一主题的,所以显示到一起。
    A. 回归
    B. 分类
    C. 聚类
    D. 关联规则

参考答案: C

  1. 回归问题和分类问题的区别是什么?
    A. 回归问题与分类问题在输入属性值上要求不同
    B. 回归问题有标签,分类问题没有
    C. 回归问题输出值是连续的,分类问题输出值是离散的
    D. 回归问题输出值是离散的,分类问题输出值是连续的

参考答案: C

  1. 有关数据质量不正确的说法是( )
    A. 错误的数据将可能产生有害于决策的结果
    B. 因为数据量很大,所以数据质量差一些也对机器学习没多大影响
    C. 数据预处理的重要目的是提高机器学习结果的质量
    D. 从业务系统提取的脏数据需要预处理才能进行建模工作

参考答案: B

  1. 假设你正在做天气预报,并使用算法预测明天气温(摄氏度/华氏度),你会把这当作一个分类问题还是一个回归问题?
    A. 分类
    B. 回归

参考答案: B

  1. 假设你在做股市预测。你想预测某家公司是否会在未来7天内宣布破产(通过对之前面临破产风险的类似公司的数据进行训练)。你会把这当作一个分类问题还是一个回归问题?
    A. 分类
    B. 回归

参考答案: A

  1. 下列哪一个图片的假设与训练集过拟合?
    A.
    在这里插入图片描述
    B.
    在这里插入图片描述
    C.
    Image Name
    D.
    在这里插入图片描述
    参考答案: A

  2. 下列哪一个图片的假设与训练集欠拟合?
    A.
    在这里插入图片描述
    B.
    在这里插入图片描述
    C.
    在这里插入图片描述
    D.
    在这里插入图片描述
    参考答案: A

  3. 给定一定数量的红细胞、白细胞图像以及它们对应的标签,设计出一个红、白细胞分类器,这属于什么问题?
    A. 有监督学习
    B. 半监督学习
    C. 无监督学习
    D. 其他答案都正确

参考答案: A

  1. 已知变量x与y正相关,且由观测数据算得x的样本平均值为3,y的样本平均值为3.5,则由该观测数据算得的线性回归方程可能是( )。
    A. y=0.4x+2.3
    B. y=2x-2.4
    C. y=-2x+9.5
    D. y=-0.3x+4.4

参考答案: A

  1. ( )属于机器学习中的回归问题。
    A. 根据房屋特性预测房价
    B. 预测短信是否为垃圾短信
    C. 识别车牌
    D. 机场安检人脸识别

参考答案: A

  1. 以下哪个选项是尚未实现的人工智能技术?( )
    A. 无人驾驶
    B. 人工智能下围棋
    C. 智能导航
    D. 人脑芯片

参考答案: D

  1. 以下哪个选项是已经实现的人工智能技术?( )
    A. 有情感的机器人
    B. 通过图灵测试的语音应答机器人
    C. 自我进化的机器人
    D. 智能导航

参考答案: D

  1. 当前的人工智能处于( )阶段。
    A. 弱人工智能
    B. 强人工智能
    C. 超人工智能
    D. 非人工智能

参考答案: A

  1. 若得到如下一颗决策树,则属性值为(色泽 = 乌黑,根蒂 = 稍蜷,敲声 = 浊响,纹理 = 清晰,脐部 = 稍凹,触感 = 硬滑)的西瓜应判别为()
    A. 好瓜
    B. 坏瓜
    C. 好瓜坏瓜都行
    D. 无法判断
    在这里插入图片描述

参考答案: A

  1. 若神经网络结构中输入层有a个神经元,紧跟其后的隐藏层有b个神经元,则从输入层到该隐藏层的权重个数是( )
    A. a + b
    B. a - b
    C. a * b
    D. a/b

参考答案: C

  1. 在聚类中,样本数据()
    A. 有标签信息
    B. 没有标签信息
    C. 标签信息可有可无
    D. 不同的聚类情况不一样

参考答案: B

  1. 聚类试图将样本划分为若干个不相交的子集,每个子集称为( )
    A. 类
    B. 树
    C. 簇
    D. 点

参考答案: C

  1. 根据下图,查准率的定义是( )
    A. P = T P T P + F N P = \frac{TP}{TP + FN} P=TP+FNTP
    B. P = T P T N + F N P = \frac{TP}{TN + FN} P=TN+FNTP
    C. P = T P T P + F P P = \frac{TP}{TP + FP} P=TP+FPTP
    D. P = T P T P + T N P = \frac{TP}{TP + TN} P=TP+TNTP
    在这里插入图片描述
    参考答案: C

分析: T P TP TP指 “预测为正(Positive), 预测正确(True)” (可以这样记忆:第一位表示该预测是否正确,第二位表示该预测结果为正还是负) , 于是,我们可以这样理解查准率 P = T P T P + F P P = \frac{TP}{TP + FP} P=TP+FPTP : 所有预测为正例的样本中,预测准确的比例;召回率 R = T P T P + T N R = \frac{TP}{TP + TN} R=TP+TNTP所有预测准确的样本中,正例所占的比例

2 多选题

  1. 下面属于训练集(Training data set)和测试集(Testing data set)区别表述的是
    A. Testing data set用于测试寻找到的函数的效果
    B. Training data set用于寻找函数
    C. Training data set用于挑选模型
    D. Training data set用于构建模型

参考答案: ABCD

  1. 机器学习的方法由( )等几个要素构成。
    A. 损失函数
    B. 优化算法
    C. 模型
    D. 模型评估指标

参考答案: ABCD

  1. 下列哪些学习问题不属于监督学习?( )
    A. 聚类
    B. 回归
    C. 分类
    D. 降维

参考答案: AD

  1. 下面的一些问题最好使用有监督的学习算法来解决,而其他问题则应该使用无监督的学习算法来解决。以下哪一项你会使用监督学习?(选择所有适用的选项)在每种情况下,假设有适当的数据集可供算法学习。
    A. 根据一个人的基因(DNA)数据,预测他/她的未来10年患糖尿病的几率
    B. 根据心脏病患者的大量医疗记录数据集,尝试了解是否有多种类型的心脏病患者群,我们可以为其量身定制不同的治疗方案
    C. 让计算机检查一段音频,并对该音频中是否有人声(即人声歌唱)或是否只有乐器(而没有人声)进行分类
    D. 给出1000名医疗患者对实验药物的反应(如治疗效果、副作用等)的数据,发现患者对药物的反应属于哪种类别或“类型”

参考答案: AD

  1. 当数据集中样本类别不均衡时,常采用哪些方法来解决?()
    A. 降采样
    B. 升采样
    C. 人造数据
    D. 更换分类算法
    E. 以上都不是。

参考答案: ACD

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/29216.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatGPT能力培训,客户最关注的99个方向

前言: chatGPT的主要应用,包括文本生成、图像生成和图文关联三大核心方向: 用户的在实际的工作和学习过程中,最关心的内容,可以按照上述类别进行划分,我们总结了,相关的插头GPT能力培训的相关主…

DAY04_SpringMVC—SpringMVC简介PostMan和ApiFox工具使用SpringMVC请求与响应REST风格

目录 一 SpringMVC简介1 SpringMVC概述问题导入1.1 SpringMVC概述 2 入门案例问题导入2.0 回顾Servlet技术开发web程序流程2.1 使用SpringMVC技术开发web程序流程2.2 代码实现【第一步】创建web工程(Maven结构)【第二步】设置tomcat服务器,加…

【iOS安全】开启任意app的WebView远程调试

参考:https://mp.weixin.qq.com/s/bNKxQaVrPaXsZ5BPbsXy7w (来自周智老师的公众号) 概述 Safari 有一个内置的前端调试器, 在iPhone通过局域网或者USB连接MacBook 并启用Safari 远程调试之后,前端调试器默认情况下对…

构建Docker容器监控系统 (1)(Cadvisor +InfluxDB+Grafana)

目录 Cadvisor InfluxDBGrafana 1. Cadvisor 2.InfluxDB 3.Grafana 开始部署: 下载组件镜像 创建自定义网络 创建influxdb容器 创建数据库和数据库用户 创建Cadvisor 容器 准备测试镜像 创建granafa容器 访问granfana 添加数据源 Add data source 新建 …

java.sql.SQLFeatureNotSupportedException 问题及可能的解决方法

目录 问题 分析: 解决方法 问题 java.sql.SQLFeatureNotSupportedException 分析: 可能是你的 druid的maven依赖版本太低了,我的以前是1.1.16,就出现了异常! 解决方法 把druid的maven依赖版本调高! 运…

unity海康威视原生SDK拉取网络摄像头画面,并展示在一个Material上

原理是使用sdk获取视频流,格式为YUV,然后分离YUV通道到三张不同的Texture2D上,通过shader将三个通道重新输出为原始图像。 我将所用的各个部分已经整理成一个压缩包,免积分下载 压缩包结构如下 使用步骤 1 DLL:放在Plugins文件…

湘大oj1138爱你一生一世题解:最大公约数 逆向思维 int整除会向下取整

一、链接 爱你一生一世 二、题目 题目描述 在2013年1月4日,这个“爱你一生一世”的特别日子,男生都想向自己的喜欢的女生表达爱意。 你准备在该死的C语言考试后,去向她(或者他?)告白。告白怎么能缺了礼…

渗透攻击方法:原型链污染

目录 一、什么是原型链 1、原型对象 2、prototype属性 3、原型链 1、显示原型 2、隐式原型 3、原型链 4、constructor属性 二、原型链污染重现 实例 Nodejs沙箱逃逸 1、什么是沙箱(sandbox) 2、vm模块 一、什么是原型链 1、原型对象 JavaS…

不只是Axure,这5 个也能轻松画原型图!

在设计和开发过程中,原型图是一个至关重要的工具。它是将设计理念转化为可视化、交互式的形式,使团队成员和利益相关者更好地理解和评估产品的功能和用户体验。选择适合的软件工具对于画原型图至关重要,本文将介绍 5 种常用的画原型图软件&am…

spring 面试题

一、Spring面试题 专题部分 1.1、什么是spring? Spring是一个轻量级Java开发框架,最早有Rod Johnson创建,目的是为了解决企业级应用开发的业务逻辑层和其他各层的耦合问题。它是一个分层的JavaSE/JavaEE full-stack(一站式)轻量…

【LeetCode 75】第二十三题(2352)相等行列对

目录 题目: 示例: 分析: 代码运行结果: 题目: 示例: 分析: 题目很简洁,就是要我们寻找行与列相同的对数。相同行与列不仅是要元素相同,还需要顺序也一样&#xff08…

tomcat虚拟主机配置演示

一.新建用于显示的index.jsp文件,写入内容 二.修改tomcat/apache-tomcat-8.5.70/conf/server.xml配置文件 匹配到Host那部分,按上面格式在后面添加自己的域名和文件目录信息 主要是修改name和docBase 保存退出重启tomcat,确保tomcat运行…

如何使用Pycharm 快速搭建 Django 项目 (分享详细图文教程)

1. 准备工作 在开始创建Django项目之前,需要先确保已经安装了Python和Pycharm。并且python中已经安装好了Django依赖。 1安装python(这里我安装使用的是python3.11.4稳定版本) 官网下载太慢了这里直接贴网盘下载连接了,一起贴出py…

常见监控网络链路和网络设备的方法

网络监控主要包括网络链路监控和网络设备监控,通常系统运维人员会比较关注。 一、网络链路监控 网络链路监控主要包含三个部分,网络连通性、网络质量、网络流量。 连通性和质量的监控手段非常简单,就是在链路一侧部署探针,去探…

Leetcode-每日一题【剑指 Offer 14- II. 剪绳子 II】

题目 2、3、3的三段,此时得到的最大乘积是18。 答案需要取模 1e97(1000000007),如计算初始结果为:1000000008,请返回 1。 示例 1: 输入: 2输出: 1解释: 2 1 1, 1 1 1 示例 2: 输入: 10输出…

nginx负载均衡(反向代理)

nginx负载均衡 负载均衡:由反向代理来实现。 nginx的七层代理和四层代理: 七层是最常用的反向代理方式,只能配置在nginx配置文件的http模块当中,而且配置方法名称:upstream模块,不能写在server模块中&#…

leetcode26-删除有序数组中的重复项

双指针—快慢指针 慢指针 slow 走在后面&#xff0c;快指针 fast 走在前面探路&#xff0c;找到一个不重复的元素的时候就让slow前进一步并赋值给它。 流程&#xff1a; 代码 class Solution { public:int removeDuplicates(vector<int>& nums) {int slow 0, fas…

解决 “fatal: Could not read from remote repository.

问题描述&#xff1a; 在使用Git将本地仓库推送到远程仓库或将远程仓库克隆到本地的时候&#xff0c;发生了如下错误&#xff1a;“fatal: Could not read from remote repository.” 原因分析&#xff1a; 出现这错误一般是以下两种原因&#xff1a; 客户端与服务端未生成 …

Mybatis异常Invalid bound statement (not found)原因之Mapper文件配置不匹配

模拟登录操作 $.post("/admin/login", {aname, pwd }, rt > {if (rt.code 200) {location.href "manager/index.html";return;}alert(rt.msg)});网页提示服务器代码错误 POST http://localhost:8888/admin/login 500后端显示无法找到Mapper中对应的…

一文看懂Apipost接口自动化使用方法

随着项目研发进程的不断推进&#xff0c;软件功能不断增多&#xff0c;对于软件测试的要求也越来越高。为了提高测试效率和减少测试成本&#xff0c;许多软件测试团队借助于自动化测试工具来优化测试流程。Apipost也提供了自动化测试工具&#xff0c;在本文中&#xff0c;我们将…