南开《数据科学导论》20春期末考核答案

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《数据科学导论》20春期末考核-00001

试卷总分:100 得分:70

一、单选题(共15 道试题,共30 分)

1.下面不是分类的常用方法的有()

A.K近邻法

B.朴素贝叶斯

C.决策树

D.条件随机场

答案:D

2.BFR聚类用于在()欧氏空间中对数据进行聚类

A.高维

B.中维

C.低维

D.中高维

答案:A

3.聚类是一种()。

A.有监督学习

B.无监督学习

C.强化学习

D.半监督学习

答案:B

4.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()

A.异常值

B.缺失值

C.不一致的值

D.重复值

答案:C

5.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。

A.产量每增加一台,单位成本增加100元

B.产量每增加一台,单位成本减少1.2元

C.产量每增加一台,单位成本平均减少1.2元

D.产量每增加一台,单位平均增加100元

答案:C

6.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。

A.减小,减小

B.减小,增大

C.增大,减小

D.增大,增大

答案:B

7.在回归分析中,自变量为(),因变量为()。

A.离散型变量,离散型变量

B.连续型变量,离散型变量

C.离散型变量,连续型变量

D.连续型变量,连续型变量

答案:D

8.手肘法的核心指标是()。

A.SES

B.SSE

C.RMSE

D.MSE

答案:B

9.特征选择的四个步骤中不包括()

A.子集产生

B.子集评估

C.子集搜索

D.子集验证

答案:C

10.一元线性回归中,真实值与预测值的差称为样本的()。

A.误差

B.方差

C.测差

D.残差

答案:D

11.K-means聚类适用的数据类型是()。

A.数值型数据

B.字符型数据

C.语音数据

D.所有数据

答案:A

12.以下哪些不是缺失值的影响()

A.数据建模将丢失大量有用信息

B.数据建模的不确定性更加显著

C.对整体总是不产生什么作用

D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出答案:C

相关文档
最新文档