大数据题目

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《大数据》题目

一、单选题

1)大数据的4V特点:Volume、Velocity、Variety、Veracity,其中他们的含义分别是

( 1 )、( 2 )、( 3 )、( 4 )。

A.价值密度低

B.处理速度快

C.数据类型繁多

D.数据体量巨大

2)大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行

( 5 )。

A. 数据信息

B. 专业化处理

C.速度处理

D. 内容处理

3)随着谷歌( 6 )和( 7 )的发布,大数据不再仅用来描述大量的数据,

还涵盖了处理数据的( 8 )。

6: A.Map B.Docs C. YouTube D. MapReduce

7: A. Google Mobile B. iGoogle C. GoogleFile System D. Google Docs

8: A.质量 B. 速度 C.精度 D. 进度

4)斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的2.5米口径望远镜进行的红移

巡天项目,2012年4月发布的关于Quasar spectra的数据为( 9 )。

A.932,891,133

B. 228,468

C. 1,457,002

D. 668,054

5)下列哪一项不属于大数据的治理:( 10 )

A. 安全问题

B. 成本问题

C. 针对大用户

D. 信息生命周期管理

6)IBM的大数据战略以其在2012年5月发布智慧分析洞察“3A5步”动态路线图作为基础,

指的是在( 11 )的基础上( 12 )、,进而( 13 ),优化决策策划能够救业务绩效。

A. 采取行动(Act)

B. 获取洞察(Anticipate)

C. 掌握信息(Align)

D. 应用管理(management)

7)在云生态环境中,用户需求相当于( 14 ),云数据中心相当于( 15 ),

云服务相当于( 16 )。

A. 降水

B. 水滴

C. 水库

D. 阳光

8)尿布啤酒是大数据分析的( 17 )

A. A/B测试

B. 分类

C. 关联规则挖掘

D. 数据聚类

9)在GAPMINDER的Wealth & Health of Nations 中,中国在什么区域( 18 )

A.黄色

B.红色

C.绿色

D. 蓝色

10)舆情研判,信息科学侧重( 19 ),社会和管理科学侧重突发群体事件管理中的

群体心理行为及( 20 ),新闻传播学侧重对( 21 )。

A. 舆论的本体进行规律性的探索和研究

B.舆论控制研究

C. 互联网文本挖

掘和分析技术

11)物联网是在计算机的( 22 )基础上,利用( 23 )、( 24 )等

技术,构造一个覆盖世界上万事万物的“Internet of Things”。在这个网络中,物品(商品)能够彼此进行“交流”,而无需人的干预。

A. 有线数据通信

B. 无线数据通信

C. RFID

D. 互联网

12)数据挖掘工作的四个阶段,数据挖掘占总时间的百分比%( 25 ),对于成功重

要性的百分比%( 26 )

A. 50

B. 20

C.80

D. 60

13)MapReduce的Map函数产生很多的( 27 )

A. key

B. value

C.

D. Hash

14)PageRank是一个函数,它对Web中的每个网页赋予一个实数值。它的意图在于网页的

PageRank越高,那么它就( 28 )。

A. 相关性越高

B.越不重要

C.相关性越低

D. 越重要

15)购物篮模型(market-basket model):用于描述两类对象之间的一种常见形式的

( 29 )关系。

A.一对一

B.一对多

C. 多对多

D. 多对一

16)AdWords 是一种快速简单的购买广告服务的方式,这种广告服务的针对性强,无论您的

预算是多少,它都按( 30 )。

A.每个广告计费

B. 每次点击计费

C.每显示一次计费

D. 每浏览一次计费

17)协同过滤分析用户兴趣,在用户群中找到指定用户的( 31 )用户,综合这些

用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度( 32 ),并将这些用户喜欢的项推荐给有相似兴趣的用户。

A. 相似

B.相同

C.推荐

D. 预测

18)2012年12月28日,全国人大三次会议通过的( 33 )

A. 《互联网行业的自律公约》

B.《治安管理处罚条例》

C. 《关于加强网络信息保护的决定》

D. 《信息安全保护条例》

19)Google 收集的信息不包括( 34 )

A. 日志信息

B. 位置信息

C.你的家庭成员

D. Cookie 和匿名标识

20)大数据的取舍与( 35 )不相关。

A. 易于提取

B.家庭信息

C. 数字化

D. 廉价的存储器

21)IBM智慧地球中Smart Work指( 36 )

A. 新锐洞察

B. 智慧运作

C. 动态架构

D. 绿色未来

22)根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB,而这个数

值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有的数据量

( 37 ),增长近( 38 )倍。

A. 10

B. 20

C. 35ZB

D. 20ZB

23)2012年3月29日奥巴马政府公布了( 39 )。该计划的目标是改进现有人们从

海量和复杂的数据中获取知识的能力,从而加速美国在科学与工程领域发明的步伐,增强国家安全,转变现有的教学和学习方式。首批共有6个联邦部门宣布投资

( 40 )美元,共同提高收集、储存、保留、管理、分析和共享海量数据所需核心技术的先进性,并形成合力;扩大大数据技术开发和应用所需人才的供给。

A.全民健康计划

B. 5亿

C. 大数据研发计划

D. 2亿

24)大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,

在合理时间内达到撷取、管理、处理、并( 41 )成为帮助企业经营决策更积极目的的信息。

A.收集

B. 整理

C.规划

D.聚集

25)大数据工程指大数据的( 42 )的系统工程。

A. 大数据网络发展和运营过程

B. 规划建设运营管理

C. 规律和验证

D. 发现和验证

26)大数据科学关注大数据网络发展和运营过程中( 43 )大数据的规律及其与自

相关文档
最新文档