南开《数据分析》在线作业满分答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
南开《数据分析》在线作业满分答案
1
任何故意提高网页在搜索引擎结果中的位置,使其与网页的()不相符的行为,称为Web 作弊
A 访问量
B 实际价值
C 搜索量
D 用户数量
答案:B
2
最小类间距离是()
A 两类中各个个体距离的最小值
B 两类中心距离
C 两类所有样本对距离的平均值
D 所有样本对之间距离的平均值
答案:A
3
大数据的特点不包含
A 数据体量大
B 价值密度高
C 处理速度快
D 数据不统一
答案:D
4
类的Q型聚类是指()
A 对样本个体进行聚类
B 对指标变量进行聚类。
答案:A
5
以下哪个会降低Apriori算法的挖掘效率()
A 支持度阈值增大
B 项数减少
C 事务数减少
D 减小硬盘读写速率
答案:D
6
基于MapReduce的Apriori算法,共进行几轮MapReduce()
A 1
B 2
C 3
D 4
答案:B
7
评价分类器效果时,表示正确分类的样本数与总样本数之比的指标是()。
A 准确率
B 精确率
C 召回率
D F1值
答案:A
8
逻辑斯谛分布的分布函数范围在()
A (-∞,+∞)
B (0,1)
C (-1/2,1/2)
D (-1,1)
答案:B
9
闵式距离参数是()时代表曼哈顿距离
A 0
B 1
C 2
D 无穷
答案:B
10
置信度(confidence)是衡量兴趣度度量()的指标
A 简洁性
B 确定性
C 实用性
D 新颖性
答案:B
11
维克托▪迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强调了一个观点:大数
据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而
不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘()
A K-means
B Bayes Network
C C4.5
D Apriori
答案:D
12
非频繁模式()
A 其置信度小于阈值
B 令人不感兴趣
C 包含负模式和负相关模式
D 对异常数据项敏感
答案:D
13
向量空间的度量,表示文本之间的()。
A 关系
B 相似度
C 语义关系
D 语义相似度
答案:D
14
话题向量空间模型中,用()的一个向量表示该文本。
A 特征词
B 话题空间
C 语义空间
D 词向量空间
答案:B
15
朴素贝叶斯中,给定输入x,求解在x出现的前提下各个类别出现的概率,哪个最大,就认为x属于哪个类
别。即选择()最大的类别。
A 后验概率
B 先验概率
C 极大似然估计
答案:A
16
在文本信息处理系统中,所处理的原始数据是()
A 结构化的自然语言文本
B 非结构化的自然语言文本
C 非结构化的编码
D 结构化的编码
答案:B
17
k近邻法中的分类决策规则往往是()
A 依权重表决
B 多数表决
C 前提设定
D 随机决定
答案:B
18
数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。
A 运营式系统阶段
B 用户原创内容阶段
C 感知式系统阶段
答案:C
19
支持向量机的MapReduce实现要进行几轮MapReduce()