东财《数据分析与决策》单元作业二答卷
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
东财《数据分析与决策》单元作业二
试卷总分:100 得分:100
一、单选题 (共 4 道试题,共 20 分)
1. 采样的时间间隔越短,数据的丢失就()。
A. 越多
B. 越少
C. 越不确定
D. 没有影响
答案:B
2.下列对于时间序列理解错误的是()。
A. 大多数时间序列都是平稳的
B. 时间序列是通过定期测量时间段中某个变量获得的一组观察值
C. 公司每年的红利属于离散时间序列
D. 季节周期与序列的时间间隔相联系
答案:A
3.当提升度()时,称为正相关规则。
A. 等于0
B. 等于1
C. 大于1
D. 小于1
答案:C
4.下列关于CARMA算法步骤的算法中错误的是()。
A. 在估计阶段的表格中记录项目集之间的关系
B. 在验证阶段,需要计算候选项目集的规模
C. 验证的第一步是将非频繁项目集从表格中删除
D. 验证阶段的删除方式和表格裁剪方式相同
答案:B
二、多选题 (共 8 道试题,共 40 分)
5.衡量关联规则强弱的指标主要有()。
A. 支持度
B. 置信度
C. 相似度
D. 提升度
答案:ABD
6.通过霍尔特指数平滑法可以处理()的趋势。
A. 随机
B. 固定
C. 非线性
D. 线性
答案:BD
7.下列关于K均值算法理解正确的有()。
A. K均值聚类算法是高效的,但是比较缓慢
B. K均值算法使簇内对象具有较高的相似度
C. K均值算法使簇间的相似度较低
D. K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的
答案:BCD
8.利用时间散点图可以分析时间序列是否存在()。
A. 趋势
B. 季节性变化
C. 离群值
D. 缺失值
答案:ABCD
9.时间序列的特征主要有()。
A. 趋势
B. 季节性周期性变化
C. 连续值
D. 离群值
答案:ABD
10.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照()步骤更新。
A. 增加统计量
B. 插入项目集
C. 裁剪表格
D. 删除表格
答案:ABC
11.两步聚类算法的步骤为()。
A. 预聚类
B. 归一化处理
C. 离散值处理
D. 聚类
答案:ACD
12.下列选项中列出的聚类算法能很好处理大批量数据的有()。
A. BIRCH聚类算法
B. 分层聚类算法
C. 两步聚类算法
D. K均值聚类算法
答案:AC
三、判断题 (共 8 道试题,共 40 分)
13.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。
()
答案:正确
14.越低的最小支持度阈值产生的关联规则数量越少。
答案:错误
15.聚类中同一个组内的数据对象的相似性较低。
()
答案:错误
16.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。
()
答案:正确
17.从数据中发现关联规则的问题可以转变为发现频繁项目集。
()
答案:正确
18.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。
()
答案:正确
19.聚类中相似或不相似是基于数据描述属性的取值来确定的。
()
答案:正确
20.简单移动平均法的各元素的权重要有所差别。
()答案:错误。