探索大数据与人工智能习题库

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《探索大数据与人工智能》习题库

单选

1、Spark Streaming是什么软件栈中的流计算

A. Spark

B. Storm

C. Hive

D. Flume

2、下列选项中,不是大数据发展趋势的是

A. 大数据分析的革命性方法出现

B. 大数据与与云计算将深度融合

C. 大数据一体机将陆续发布

D. 大数据未来可能会被淘汰

3、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的

A.比尔·恩门

B. 麦肯锡

C. 扎克伯格

D. 乔图斯

4、以下哪个属于大数据在电信行业的数据商业化方面的应用

A.精准广告

B. 网络管理

C. 网络优化

D. 客服中心优化

5、以下哪个不属于大数据在电信行业的应用

A.数据商业化

B. 物流网络

C. 企业运营

D. 客户关系管理

6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。

A.首席数据官

B. 首席科学家

C. 首席执行官

D. 首席架构师

7、下列选项中,不是kafka适合的应用场景是

A.日志收集

B. 消息系统

C. 业务系统

D.流式处理

8、下列选项中,哪个不是HBASE的特点

A.面向行

B. 多版本

C. 扩展性

D. 稀疏性

9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系

A.数量越多处理时间越长

B. 数量越多处理时间越短

B.数量越小处理时间越短 D.没什么关系

10、在Spark的软件栈中,用于机器学习的是

A.Spark Streaming

B. Mllib

C. GraphX

11、Spark是在哪一年开源的

A.1980

B. 2010

C. 1990

D. 2000

12、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是

A结构化数据 B. 非结构化数据 C. 半结构化数据 D. 全结构化数据

13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是

A.机器性能

B. 语言歧义性

C. 知识依赖

D. 语境

14、语音识别常用的应用有四个,下列不是常用应用的是

A.聊天

B. 拨号

C. 导航

D. 设备控制

15、以下哪种学习方法不属于人工智能算法

A.迁移学习

B. 对抗学习

C. 强化学习

D.自由学习

16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么

A.模型

B. 表结构

C. 结果

D. 报表

17、总体来说,人工智能发展的未来趋势是

A.上升

B. 下降

C. 不动

D. 大幅度下降

18、中国移动自主研发、发布的首个人工智能平台叫做()

A.九天

B. OneNET

C. 移娃

D.大云

19、以下数据单位从小到大排列的顺序是

A.GB、B、KB

B. B、KB、MB

C. KB、ZB、PB 、MB、KB

20、以下数据单位换算错误的是

A.1KB=1024B

B. 1GB=1024MB

C. 1TB=1000GB

D. 1MB=1024KB

21、以下不是非结构化数据的项是

A.图片

B. 音频

C. 数据库二维表数据

D. 视频

22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()

A.Reduce

B. Hash

C. Clean

D. Loading

23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是

A.AI

B. BI

C. AL

D. AF

24、下列选项中,哪项是由谷歌开发的人工智能算法框架

A.Kafka

B. Tensorflow

C. Caffe

25、BP神经网络的学习规则是

A.梯度上升法

B.梯度下降法

C. 梯度提升法

D. 梯度曲线法

26、语音识别产品体系有四部分,下列哪项不是体系之一

A.语音合成

B. 语音播放

C. 语音识别

D. 语义理解

27、数据生态中,算法模型分为两代,那么第一代算法模型是

A.Tez

B. Spark

C. Pig

28、Spark是基于什么的迭代计算框架它适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小;

A.内存

B. 硬盘

C. 磁带

D. 显卡

29、下列选项中,哪项是分布式文件存储系统

A.HDFS

B. Flume

C. Kafka

D. Zookeeper

30、工信部官网正式发布大数据产业”十三五“发展规划是在哪一年

A.1987

B. 1997 D. 2017

31、学习没有标签的数据集的机器学习方法是

A.监督学习

B. 无监督学习

C. 半监督学习

D. 强化学习

32、当前世界产生的数据总量的单位是

A.KB

B. ZB

C. GB

D. TB

33、下列选项中正确说明价值密度低的是

数据中有50TB有效数据 B. 1TB数据中有1KB有效数据

数据中有100PB有效数据 D. 10EB数据中有10EB有效数据

34、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。

A.精灵

B. 阿尔法蛋

C. 小度

D. 移娃

35、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。

A.AlphaGo

B. 深蓝

C. 图灵机模型

D. 深度学习机器人

36、在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢

A.连接器

B. 客户端

C. 接口提供者

D. 数据采集

37、mapreduce计算模型适用于哪种任务

A.多线程处理

B. 有关联的行处理

C. 批处理

D. 实时数据变化处理

38、大数据特征有几种（不包括IBM提出的新特征）

39、Hadoop是（）年诞生的