南开《数据分析》在线作业满分答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

南开《数据分析》在线作业满分答案

1

任何故意提高网页在搜索引擎结果中的位置,使其与网页的()不相符的行为,称为Web 作弊

A 访问量

B 实际价值

C 搜索量

D 用户数量

答案:B

2

最小类间距离是()

A 两类中各个个体距离的最小值

B 两类中心距离

C 两类所有样本对距离的平均值

D 所有样本对之间距离的平均值

答案:A

3

大数据的特点不包含

A 数据体量大

B 价值密度高

C 处理速度快

D 数据不统一

答案:D

4

类的Q型聚类是指()

A 对样本个体进行聚类

B 对指标变量进行聚类。

答案:A

5

以下哪个会降低Apriori算法的挖掘效率()

A 支持度阈值增大

B 项数减少

C 事务数减少

D 减小硬盘读写速率

答案:D

6

基于MapReduce的Apriori算法,共进行几轮MapReduce()

A 1

B 2

C 3

D 4

答案:B

7

评价分类器效果时,表示正确分类的样本数与总样本数之比的指标是()。

A 准确率

B 精确率

C 召回率

D F1值

答案:A

8

逻辑斯谛分布的分布函数范围在()

A (-∞,+∞)

B (0,1)

C (-1/2,1/2)

D (-1,1)

答案:B

9

闵式距离参数是()时代表曼哈顿距离

A 0

B 1

C 2

D 无穷

答案:B

10

置信度(confidence)是衡量兴趣度度量()的指标

A 简洁性

B 确定性

C 实用性

D 新颖性

答案:B

11

维克托▪迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强调了一个观点:大数

据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而

不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘()

A K-means

B Bayes Network

C C4.5

D Apriori

答案:D

12

非频繁模式()

A 其置信度小于阈值

B 令人不感兴趣

C 包含负模式和负相关模式

D 对异常数据项敏感

答案:D

13

向量空间的度量,表示文本之间的()。

A 关系

B 相似度

C 语义关系

D 语义相似度

答案:D

14

话题向量空间模型中,用()的一个向量表示该文本。

A 特征词

B 话题空间

C 语义空间

D 词向量空间

答案:B

15

朴素贝叶斯中,给定输入x,求解在x出现的前提下各个类别出现的概率,哪个最大,就认为x属于哪个类

别。即选择()最大的类别。

A 后验概率

B 先验概率

C 极大似然估计

答案:A

16

在文本信息处理系统中,所处理的原始数据是()

A 结构化的自然语言文本

B 非结构化的自然语言文本

C 非结构化的编码

D 结构化的编码

答案:B

17

k近邻法中的分类决策规则往往是()

A 依权重表决

B 多数表决

C 前提设定

D 随机决定

答案:B

18

数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。

A 运营式系统阶段

B 用户原创内容阶段

C 感知式系统阶段

答案:C

19

支持向量机的MapReduce实现要进行几轮MapReduce()

相关文档
最新文档