线性回归csv数据集_测试数据科学家线性回归的30个问题

你的目标是数据科学家吗？那你对线性回归了解有多深入呢，下面的30道题，可以帮助你或者测试别人是否真的达到的数据科学家的水平，关注回复，答案在评论区：

1)是非题：线性回归是一种受监督的机器学习算法。

A)是
B)虚假

2)是非题：线性回归主要用于回归。

A)是
B)虚假

3)是非题：可以使用神经网络设计线性回归算法吗？

A)是
B)虚假

4)我们使用以下哪种方法在线性回归中找到最适合数据的线？

A)最小二乘误差
B)最大似然率
C)对数损失
D)A和B

5)在对连续输出变量建模时，可以使用以下哪个评估指标来评估模型？

A)AUC-ROC
B)精度
C)对数损失
D)均方误差

6)是非题：套索正则化可用于线性回归中的变量选择。

A)是
B)虚假

7)关于残差的以下哪项是正确的？

A)越低越好
B)越高越好
C)A或B取决于情况
D)这些都不是

8)假设我们有N个自变量(X1，X2 ... Xn)，因变量为Y。现在，想象一下，您正在通过使用最小二乘方误差对该数据拟合最佳拟合线来应用线性回归。

您发现其中一个变量(说X1)的Y的相关系数为-0.95。

以下哪个对X1是正确的？

A)X1和Y之间的关系是弱的
B)X1和Y
之间的关系是强的C)X1和Y之间的关系是中性的
D)相关性无法判断该关系

9)从以上两个特征来看，对于V1和V2之间的皮尔逊相关性，以下哪个选项是正确的？

如果给出两个变量V1和V2，它们将遵循以下两个特征。

1.如果V1增加，则V2也增加

2.如果V1减小，则V2行为未知

A)皮尔逊相关性将接近1
B)皮尔逊相关性将接近-1
C)皮尔逊相关性将接近0
D)这些都不是

10)假设V1和V2之间的皮尔逊相关性为零。在这种情况下，得出V1和V2之间没有任何关系的结论是正确的吗？

A)是
B)虚假

11)我们在线性回归的最小二乘拟合中使用以下哪个偏移量？假设水平轴是自变量，垂直轴是因变量。

A)垂直偏移
B)垂直偏移
C)两者，视情况而定
D)以上都不是

12)是非题：当您需要训练大量数据时，过度拟合的可能性更高？

A)是
B)虚假

13)我们还可以借助称为“正态方程”的分析方法来计算线性回归系数。关于正规方程，以下哪项是正确的？

我们不必选择学习率
功能数量很大时变慢
不需要重复

A)1和2
B)1和3
C)2和3
D)1,2和3

14)关于A和B的残差之和，以下哪一项是正确的？

下图显示了随机生成的数据上的两条拟合的回归线(A和B)。现在，我想找到情况A和情况B的残差之和。

注意：

两个图中两个轴的比例都是相同的。
X轴是自变量，Y轴是因变量。

A)A的残差总和比B高
B)A的残差总和比B低
C)两者的残差总和相同
D)这些都不是

15)选择以最佳方式描述偏差的选项。
A)如果x很大；偏差低
B)如果x很大；偏见很高
C)我们不能说偏见
D)这些都不是

16)当您施加非常大的罚款时会发生什么？A)一些系数将变为绝对零
B)一些系数将接近零但不是绝对零
C)A和B都取决于情况
D)这些都不是

17)如果对套索应用非常大的罚款会发生什么？
A)一些系数将变为零
B)一些系数将接近零但不是绝对零
C)A和B都取决于情况
D)这些都不是

18)关于线性回归中的离群值，以下哪个说法是正确的？A)线性回归对异常值敏感
B)线性回归对异常值不敏感
C)不能说
D)这些都不是

19)假设您在线性回归中的残差和预测值之间绘制了散点图，并且发现它们之间存在关联。您对这种情况做出以下哪个结论？A)由于存在关系意味着我们的模型不好
B)由于存在关系意味着我们的模型很好
C)不能说
D)这些都不是

20)在线性回归中拟合4级多项式时会发生什么？
A)高度为4的多项式将非常适合数据
B)高度为4的多项式将
不太适合数据C)不能说
D)这些都不是

21)在线性回归中拟合2度多项式时会发生什么？
A)2阶多项式过拟合数据的
可能性很高B)2阶多项式过拟合数据的可能性很高
C)不能说
D)这些都不是

22)在偏见和差异方面。当您拟合2级多项式时，以下哪项是正确的？
A)偏差会很高，方差会很高
B)偏差会很低，方差会很高
C)偏差会很高，方差会很低
D)偏差会很低，方差会很低

23)假设l1，l2和l3分别是A，B，C的三个学习率。关于l1，l2和l3，以下哪一项是正确的？

A)l2 B)l1> l2> l3
C)l1 = l2 = l3
D)这些都不是

24)现在我们逐渐增加训练集的大小。随着训练集大小的增加，您期望平均训练误差发生什么？

A)增加
B)减少
C)保持不变
D)不能说

25)随着训练数据量的增加，您期望偏差和方差会发生什么？

A)偏差增加且方差增加
B)偏差减小且方差增加
C)偏差减小且方差减小
D)偏差增加且方差减小
E)不能说错

26)如果运行形式为(Y = A0 + A1X)的线性回归模型，此数据的均方根训练误差是多少？

A)小于0
B)大于零
C)等于0
D)这些都不是

27)以下哪种情况会为您提供正确的超级参数？

A)1
B)2
C)3
D)4

28)假设您从上一个问题中获得了已调整的超级参数。现在，假设您要在变量空间中添加变量，以使此添加功能很重要。在这种情况下，您会观察以下哪件事？

A)训练错误将减少而验证错误将增加

B)训练错误将增加并且验证错误将增加
C)训练错误将增加并且验证错误将减少
D)训练错误将减少并且验证错误将减少
E)以上都不是

问题上下文29-30：

假设您发现线性回归模型拟合数据不足。

29)在这种情况下，您会考虑以下哪些选择？

添加更多变量
开始引入多项式度变量
删除一些变量

A)1和2
B)2和3
C)1和3
D)1、2和3

30)现在情况与上一个问题(拟合中)相同。您希望使用以下哪个正则化算法？

A)L1
B)L2
C)任何
D)这些都不是

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/370839.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

线性回归csv数据集_测试数据科学家线性回归的30个问题

相关文章

linux调试crontab,linux - crontab 的调试，启动thin服务器

番石榴前提条件课

dw空心圆项目符号_如何懂建筑施工图？搞懂这些符号解析，耐下性子研究不会学不会...

子域名查询技术

Dashboard集群

canvas学习和滤镜实现

python 数据分析库_五个 Python 常用数据分析库

android代码混淆作用,Android分享：代码混淆那些事

echarts图形，图形自适应窗口大小

施工部署主要不包括_建筑工程施工方案及培训实例

Markdown 进阶

Python 字典 values() 方法

适用于Atom Feed的Spring MVC

python数据类型所占字节数_python标准数据类型 Bytes

java第六次作业

华为鸿蒙不再孤,华为鸿蒙OS系统不再孤单!又一款国产系统启动内测:再掀国产替代化...

Spring系列合并

CSS 水平垂直居中

linux怎么进入文件夹_Linux基础命令《上》

UML学习（一）-----用例图