线性回归csv数据集_测试数据科学家线性回归的30个问题

你的目标是数据科学家吗?那你对线性回归了解有多深入呢,下面的30道题,可以帮助你或者测试别人是否真的达到的数据科学家的水平,关注回复,答案在评论区:

1)是非题:线性回归是一种受监督的机器学习算法。

A)是
B)虚假

2)是非题:线性回归主要用于回归。

A)是
B)虚假

3)是非题:可以使用神经网络设计线性回归算法吗?

A)是
B)虚假

4)我们使用以下哪种方法在线性回归中找到最适合数据的线?

A)最小二乘误差
B)最大似然率
C)对数损失
D)A和B

5)在对连续输出变量建模时,可以使用以下哪个评估指标来评估模型?

A)AUC-ROC
B)精度
C)对数损失
D)均方误差

6)是非题:套索正则化可用于线性回归中的变量选择。

A)是
B)虚假

7)关于残差的以下哪项是正确的?

A)越低越好
B)越高越好
C)A或B取决于情况
D)这些都不是

8)假设我们有N个自变量(X1,X2 ... Xn),因变量为Y。现在,想象一下,您正在通过使用最小二乘方误差对该数据拟合最佳拟合线来应用线性回归。

您发现其中一个变量(说X1)的Y的相关系数为-0.95。

以下哪个对X1是正确的?

A)X1和Y之间的关系是弱的
B)X1和Y
之间的关系是强的C)X1和Y之间的关系是中性的
D)相关性无法判断该关系

9)从以上两个特征来看,对于V1和V2之间的皮尔逊相关性,以下哪个选项是正确的?

如果给出两个变量V1和V2,它们将遵循以下两个特征。

1.如果V1增加,则V2也增加

2.如果V1减小,则V2行为未知

A)皮尔逊相关性将接近1
B)皮尔逊相关性将接近-1
C)皮尔逊相关性将接近0
D)这些都不是

10)假设V1和V2之间的皮尔逊相关性为零。在这种情况下,得出V1和V2之间没有任何关系的结论是正确的吗?

A)是
B)虚假

11)我们在线性回归的最小二乘拟合中使用以下哪个偏移量?假设水平轴是自变量,垂直轴是因变量。

e315db64fe3235cde4dbf08bf14c8c33.png

A)垂直偏移
B)垂直偏移
C)两者,视情况而定
D)以上都不是

12)是非题:当您需要训练大量数据时,过度拟合的可能性更高?

A)是
B)虚假

13)我们还可以借助称为“正态方程”的分析方法来计算线性回归系数。关于正规方程,以下哪项是正确的?

  1. 我们不必选择学习率
  2. 功能数量很大时变慢
  3. 不需要重复

A)1和2
B)1和3
C)2和3
D)1,2和3

14)关于A和B的残差之和,以下哪一项是正确的?

下图显示了随机生成的数据上的两条拟合的回归线(A和B)。现在,我想找到情况A和情况B的残差之和。

注意:

  1. 两个图中两个轴的比例都是相同的。
  2. X轴是自变量,Y轴是因变量。
54c3d20a3e1d819dd7b551fed16422fe.png

A)A的残差总和比B高
B)A的残差总和比B低
C)两者的残差总和相同
D)这些都不是

15)选择以最佳方式描述偏差的选项。
A)如果x很大;偏差低
B)如果x很大;偏见很高
C)我们不能说偏见
D)这些都不是

16)当您施加非常大的罚款时会发生什么?A)一些系数将变为绝对零
B)一些系数将接近零但不是绝对零
C)A和B都取决于情况
D)这些都不是

17)如果对套索应用非常大的罚款会发生什么?
A)一些系数将变为零
B)一些系数将接近零但不是绝对零
C)A和B都取决于情况
D)这些都不是

18)关于线性回归中的离群值,以下哪个说法是正确的?A)线性回归对异常值敏感
B)线性回归对异常值不敏感
C)不能说
D)这些都不是

19)假设您在线性回归中的残差和预测值之间绘制了散点图,并且发现它们之间存在关联。您对这种情况做出以下哪个结论?A)由于存在关系意味着我们的模型不好
B)由于存在关系意味着我们的模型很好
C)不能说
D)这些都不是

20)在线性回归中拟合4级多项式时会发生什么?
A)高度为4的多项式将非常适合数据
B)高度为4的多项式将
不太适合数据C)不能说
D)这些都不是

21)在线性回归中拟合2度多项式时会发生什么?
A)2阶多项式过拟合数据的
可能性很高B)2阶多项式过拟合数据的可能性很高
C)不能说
D)这些都不是

22)在偏见和差异方面。当您拟合2级多项式时,以下哪项是正确的?
A)偏差会很高,方差会很高
B)偏差会很低,方差会很高
C)偏差会很高,方差会很低
D)偏差会很低,方差会很低

23)假设l1,l2和l3分别是A,B,C的三个学习率。关于l1,l2和l3,以下哪一项是正确的?

A)l2 B)l1> l2> l3
C)l1 = l2 = l3
D)这些都不是

24)现在我们逐渐增加训练集的大小。随着训练集大小的增加,您期望平均训练误差发生什么?

A)增加
B)减少
C)保持不变
D)不能说

25)随着训练数据量的增加,您期望偏差和方差会发生什么?

A)偏差增加且方差增加
B)偏差减小且方差增加
C)偏差减小且方差减小
D)偏差增加且方差减小
E)不能说错

26)如果运行形式为(Y = A0 + A1X)的线性回归模型,此数据的均方根训练误差是多少?

A)小于0
B)大于零
C)等于0
D)这些都不是

851f939dab547a4be2602683bb55fbff.png

27)以下哪种情况会为您提供正确的超级参数?

A)1
B)2
C)3
D)4

28)假设您从上一个问题中获得了已调整的超级参数。现在,假设您要在变量空间中添加变量,以使此添加功能很重要。在这种情况下,您会观察以下哪件事?

A)训练错误将减少而验证错误将增加

B)训练错误将增加并且验证错误将增加
C)训练错误将增加并且验证错误将减少
D)训练错误将减少并且验证错误将减少
E)以上都不是

问题上下文29-30:

假设您发现线性回归模型拟合数据不足。

29)在这种情况下,您会考虑以下哪些选择?

  1. 添加更多变量
  2. 开始引入多项式度变量
  3. 删除一些变量

A)1和2
B)2和3
C)1和3
D)1、2和3

30)现在情况与上一个问题(拟合中)相同。您希望使用以下哪个正则化算法?

A)L1
B)L2
C)任何
D)这些都不是

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/370839.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux调试crontab,linux - crontab 的调试,启动thin服务器

linux - crontab 的调试,启动thin服务器2018-11-18 17:10访问量: 1059分类:技术参考:https://askubuntu.com/questions/56683/where-is-the-cron-crontab-log日志默认位置在 /var/log/syslog 中。 grep CRON 。 如果没有安装MTA的话(例如 mai…

番石榴前提条件课

编写过很多Java文章的人可能都编写了以条件为开头的方法,这些条件可以在继续进行该方法的其余实现之前,先验证提供的参数或要操作的对象的状态。 这些会增加方法的冗长性,有时,尤其是在有多个检查的情况下,几乎会淹没该…

dw空心圆项目符号_如何懂建筑施工图?搞懂这些符号解析,耐下性子研究不会学不会...

施工图纸一个建筑方向,是房屋建筑的依据,更是一种工程语言,它能够明确的规定出我们建造出怎样的建筑,看懂它是入行基础。当然建筑图包含的因素比较多,有具体的建筑符号,尺寸、做法以及技术要求都在里面&…

子域名查询技术

子域名查询是渗透测试中的重要一环,收集尽可能多的子域名就是尽可能地扩大我们的攻击面和了解网络内部结构。 子域名保存位置利用点具体用法DNS服务器区域传送漏洞dig ns.dnsdomain.com target.com axfr主站链接网站爬虫百度site:target.com被动解析字典枚举解析fie…

Dashboard集群

#Dashboard集群 openstack pike 部署 目录汇总 http://www.cnblogs.com/elvi/p/7613861.html ##8.Dashboard集群#####在controller1安装配置#安装 yum install openstack-dashboard -y#配置 cp /etc/openstack-dashboard/local_settings{,.bak} #egrep -v #|^$ /etc/openstack-…

canvas学习和滤镜实现

最近学习了 HTML5 中的重头戏--canvas。利用 canvas,前端人员可以很轻松地、进行图像处理。其 API 繁多,这次主要学习常用的 API,并且完成以下两个代码:实现去色滤镜实现负色(反色)滤镜 欢迎入群:857989948 。IT 技术深…

python 数据分析库_五个 Python 常用数据分析库

前言 Python 是常用是数据分析工具,常用的数据分析库有很多,下面主要介绍如下五个分析库:NumPy、Pandas、SciPy、StatsModels、Matplotlib。 NumPy 是一个非常常用的数据分析库,更准确点说是一个数学计算库,包括下面的…

android代码混淆作用,Android分享:代码混淆那些事

1) 前言ProGuard是一个开源的Java代码混淆器。它可以混淆Android项目里面的java代码,对的,你没看错,仅仅是java代码。它是无法混淆Native代码,资源文件drawable、xml等。2) ProGuard作用压缩: 移除无效的类、属性、方法等优化: 优…

echarts图形,图形自适应窗口大小

一个页面只有一个echarts图形时,可以写为myChart.setOption(option);window.onresize myChart.resize;一个页面含有多个echarts图形时,则只有一个图形可自适应窗口大小,另外一个则不能随窗口大小而改变图形大小,解决办法为在每一…

施工部署主要不包括_建筑工程施工方案及培训实例

[南京]大型土石方工程施工方案本资料为[南京]大型土石方工程施工方案格,共43页。内容简介:本工程位于南京化工园内,扬子玉带扬巴路附近,工程项目为江苏成品油管道配设施扬子玉带油库套油库工程,由中国石化股份有限公司…

Markdown 进阶

目录 markdown进阶语法 内容目录加强代码块脚注流程图时序图LaTeX公式 markdown进阶语法 内容目录 使用 [TOC] 引用目录,将 [TOC] 放至文本的首行,编辑器将自动生成目录有一些编辑器不支持[TOC]标记 加强代码块 使用3个 "" “语言名称”…

Python 字典 values() 方法

描述 Python 字典 values() 方法以列表形式(并非直接的列表,若要返回列表值还需调用list函数)返回字典中的所有值。 语法 values() 方法语法: D.values() 参数 无。返回值 以列表形式返回字典中的所有值。 实例 以下实例展示了 va…

适用于Atom Feed的Spring MVC

如何仅使用两个类就将提要(Atom)添加到Web应用程序? Spring MVC呢? 这是我的假设: 您正在使用Spring框架 您有一些要发布在供稿中的实体,例如“新闻” 您的“新闻”实体具有creationDate,tit…

python数据类型所占字节数_python标准数据类型 Bytes

预备知识: bin(): """ Return the binary representation of an integer. >>> bin(2796202) 0b1010101010101010101010 """ pass ord(): """ Return the Unicode code point for a one-character…

java第六次作业

《Java技术》第六次作业 (一)学习总结 1.用思维导图对本周的学习内容进行总结。 2.当程序中出现异常时,JVM会依据方法调用顺序依次查找有关的错误处理程序。可使用printStackTrace 和getMessage方法了解异常发生的情况。阅读下面的程序&#…

华为鸿蒙不再孤,华为鸿蒙OS系统不再孤单!又一款国产系统启动内测:再掀国产替代化...

【5月10日讯】相信大家都知道,备受广大花粉们期待的鸿蒙OS系统终于开始推送公测版本了,并且适配机型也开始不断地增多,而根据华为官方最新消息,华为鸿蒙OS系统将会在6月份开始大规模推送正式版鸿蒙系统,这无疑将会成为…

Spring系列合并

Spring Collection合并是我第一次遇到的功能,它是对StackOverflow 问题的回答 这是一种创建基本集合(列表,集合,地图或属性)并在其他Bean中修改此基本集合的方法,下面通过一个示例对此进行最好的解释- 考虑…

CSS 水平垂直居中

方法一&#xff1a; 容器确定宽高&#xff1a;知识点&#xff1a;transform只能设置在display为block的元素上。 <head> <meta charset"UTF-8"> <title>Title</title> <style type"text/css"> #container{…

linux怎么进入文件夹_Linux基础命令《上》

上一节介绍了VMware中安装centos7以及克隆系统&#xff0c;之中用到的几个命名还都是开发不常用的&#xff0c;这节课就准备讲解一下入门的Linux命名&#xff0c;都是日常使用的。首先呢&#xff0c;我们进入系统后&#xff0c;得先知道我是谁&#xff0c;我在哪儿&#xff1f;…

UML学习(一)-----用例图

1、什么是用例图 用例图源于Jacobson的OOSE方法&#xff0c;用例图是需求分析的产物&#xff0c;描述了系统的参与者与系统进行交互的功能&#xff0c;是参与者所能观察和使用到的系统功能的模型图。它的主要目的就是帮助开发团队以一种可视化的方式理解系统的功能需求&#xf…