大数据应知应会试题及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据应知应会试题及答案
一、大数据(单选)
I、题目:大数据是指不用随机分析法这样的捷径,而采用0的方法[单选题]*
A.所有数据(正确答案
B.绝大部分数据
C.适量数据
D.少量数据
2、题目:大数据环境下的隐私担忧,主要表现为0 [单选题]*
A.个人信息的被识别与暴露三礁答案)
B.用户画像的生成
C.恶意广告的推送
D.病毒入侵
3、题目:大数据基于云计算进行数据的分析,那么云计算按照提供的服务类型进行分类,包括laaS、PaaS、()[单选题]*
A.Xen
B.SaaSiIE 确答案.)
C.KVM
D.Docker
4、题目:以下哪个不是海量大数据的常用处理工具()[单选题1*
B.Excel正确答案)
C.Spark
D.Hive 5、题目:当前社会中,最为突出的大数据环境是()[单选题]*
A.互联网(正确答案।
B.物联网
C.综合国力
D.自然资源
6、题目:根据电信客户的特征对客户进行打标分类主要用到()算法[单选题]*
A.分类
B.聚类(正确答案)
C.降维
D.回归
7、题目:以下哪一项属于非结构化数据()[单选题]*
A.视频监控数据(正确答案)
B.企业ERP数据
C.财务系统数据
D.日志数据
8、题目:大数据的起源是()[单选题]*
A.金融
B.电信
C互联网(正确答案)
9、题目:统计分组时,若某标志值刚好等于相邻两组上下限数值时()[单选题]*
A.将此数值归入上限所在组
B.将此数值归入下限所在组(正确空案।
C.归入这两组中任意一组均可
D.另立一组10、题目:有200家公司每位职工的工资资料,如果要调查这200家区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是()。[单选题]*
A.普查
B.典型调查
C抽样调查
D.重点调查(正确答案)
11、题目:某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值
为170,则末组组中值为()[单选题]*
A.260
B.215
C.230 IZ确答案)
D.185 12、题目:当一组数据属于左偏分布时.则()[单选题]*
A.平均数、中位数与众数是合而为一的
B.众数在左边、平均数在右边
C.众数的数值较小,平均数的数值较大
D.众数在右边、平均数在左边王礁答案)
13、题目:要通过移动平均法消除季节变动得到趋势值,则移动平均项数()[单选题]*
A.应选择奇数
B.应和季节周期长度一致三确空案)
C.应选择偶数
D.可取4或12
14、题目:不重复抽样平均误差()。[单选题]*
A.总是大于重复抽样平均误差
B.总是小于重复抽样平均误差E确答案।
C.总是等于重复抽样平均误差
D.以上情况都可能发生
15、题目:如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用
0 [单选题1*
A.均值
B.中位数
C.众数(正确答案)
D.四分位数
16、题目:某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度0【单选题1*
A.乡村较大
B.城市较大正确答案।
C.城市和乡村一样
D.不能比较
17、题目:重点调查的实施条件是()[单选题]*
A.被调查的单位总数相当多
B.存在少数举足轻重的单位(正确答案।
C.调查结果能够用于推算总体数据
D.被调查的现象总量在各总体单位之间的分布极其不均匀
18、题目:抽样平均误差与极限误差间的关系是()【单选题1*
A.抽样平均误差大于极限误差
B.抽样平均误差等于极限误差
C抽样平均误差小于极限误差
D.抽样平均误差可能大于、等于或小于极限误差[确笔案।
19、题目:进行单侧检验时,利用P值进行判断,拒绝原假设的条件是0 [单选题]*
A.P值(正确答案)
B.P 值,
C.P值
D.P 值>2
20、题目:假设检险中,第二类错误的概率表示()【单选题1*
A.为真时拒绝的概率
B.为真时接受的概率
C.不真时拒绝的概率
D.不真时接受的概率(正确答案)
21、题目:时间序列在长时期内呈现出来的某种持续向上或持续下降的变动称为0 [单选题1*
A.趋势:王碓答案)
B.季节性
C周期性
D.随机性
22、题目:根据各处的季度数据计算季节指数,各季节指数的平均数应等于() [单选题]*
A.100%正确答案)
B.400%
C.25%
D.0
23、题目:如下哪些不是最近邻分类器的特点。()[单选题]*
A.它使用具体的训练实例进行预测,不必维护源自数据的模型
B.分类一个测试样例开销很大
C.最近邻分类器基于全局信息进行预测:案।
D.可以生产任意形状的决策边界
24、题目:推荐系统为客户推荐商品,自动完成个性化选择商品的过程、满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、()、推测客户将来可能的购买行为。[单选题]*
A.客户的朋友
B.客户的个人信息
C.客户的兴趣爱好
D.客户过去的购买行为和购买记录(王确答案)
25、题目:()的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要, 并且能够得到和原始数据相同的分析结果。【单选题1*