大数据测试题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

光环国际大数据测试题

姓名_______ 成绩________

一、单选题(每题2分,共15题)

1、当前大数据技术的基础是由()首先提出的

A. 微软

B. 百度

C. 谷歌

D. 阿里巴巴

2、大数据的起源是()

A. 金融

B. 电信

C. 互联网

D. 公共管理

3、()反映数据的精细化程度,越细化的数据,价值越高。

A. 规模

B. 活性

C. 关联度

D. 颗粒度

4、数据清洗的方法不包括()

A. 缺失值处理

B. 噪声数据清除

C. 一致性检查

D. 重复数据记录处理

5、当程序经过编译或者汇编以后,形成了一种由机器指令组成的集合,被称为()

A. 源程序

B. 目标程序

C. 可执行程序

D. 非执行程序

6、大数据的核心就是()

A. 告知与许可

B. 预测

C. 匿名化

D. 规模化

7、大数据不是要教机器像人一样思考。相反,它是()

A.把数学算法运用到海量的数据上来预测事情发生的可能性。

B.被视为人工智能的一部分

C.被视为一种机器学习

D.预测与惩罚

8、当前社会中,最为突出的大数据环境是()

A.互联网

B.物联网

C.综合国力

D.自然资源

9、以下哪些技术为大数据常用框架或技术(多选)()。

A.Hadoop

B.Spark

C.Hbase

D.Linux

10、云计算按照服务类型大致可分为以下类(多选)()

A.IaaS

B.PaaS

C.SaaS

D.效用计算

11、下列哪个语句在Python中是非法的?()

A.x=y=z=1

B.x=(y=z+1)

C.x,y=y,x

D.x+=y

12、关于数据的潜在价值,说法正确的是(多选)()

A. 数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,

而绝大部分则隐藏在表面之下。

B. 判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考

虑其目前的用途。

C. 在基本用途完成后,数据的价值仍然存在,只是处于休眠状态

D. 数据的价值是其所有可能用途的总和

13、下列不是Java语言面向对象的特点()

A.封装

B.继承

C.跨平台

D.多态

14、大数据人才整体上需要具备(多选)()等核心知识

A.数学与统计知识

B.计算机相关知识

C.马克思主义哲学知识

D.市场运营管理知识

15、观察下图,其中问号选择()

16、在Python中,下列哪种说法是错误的 ( D )

A、除字典类型外,所有标准对象均可以用于布尔测试

B、空字符串的布尔值是False

C、空列表对象的布尔值是False

D、值为0的任何数字对象的布尔值是False

17、ArrayList类的底层数据结构是( A )

A、数组结构

B、链表结构

C、哈希表结构

D、红黑树结构

18、Java中覆盖与重载的关系是:( A )。

A、覆盖只有发生在父类与子类之间,而重载可以发生在同一个类中

B、覆盖方法可以不同名,而重载方法必须同名

C、final修饰的方法可以被覆盖,但不能被重载

D、覆盖与重载是同一回事

19、下面关于进程、线程的说法不正确的是( C )。

A、进程是程序的一次动态执行过程。一个进程在其执行过程中,可以产生

多个线程——多线程,形成多条执行线索。

B、线程是比进程更小的执行单位,是在一个进程中独立的控制流,即程序

内部的控制流。线程本身不能自动运行,栖身于某个进程之中,由进程

启动执行。

C、Java多线程的运行与平台无关。

D、对于单处理器系统,多个线程分时间片获取CPU或其他系统资源来运行。

对于多处理器系统,线程可以分配到多个处理器中,从而真正的并发执

行多任务。

20、请问下列哪些类是定义在java.io包中的抽象类( ABD ) (多选)

A. InputStream

B. OutputStream

C. PrintStream

D. Reader

E. FileInputStream

F. FileWriter

二、填空题(共10题,每题2分)

16、数据库的三大范式______、______、______

17、Linux下__________________命令把某一个文件下的所有的文件分发到其他的机器上。

18、Linux用_______命令查看cpu,硬盘,内存的信息。

19、Java的三大体系分别是______、______、______

20、Java中的变量可分为两种数据类型,分别是______和______。

21、在java中,byte类型数组占_____个字节,short类型数据占____个字节,int类型数据占____个字节,long类型数据占____个字节

22、Python中的可变数据类型有_______,不可变数据类型有_________ 。

23、Python提供了两个对象身份比较操作符_____和______来测试两个变量是否指向同一个对象,也可以通过内建函数_______来测试对象的类型。

24、队列的实现是_______,消费的顺序是________。

25、hadoop的角色中_______负责管理元数据信息、________做namenode冷备份、________主要做储存数据的、_________管理任务、_________执行任务。

三、判断题(每题1分,共10题)

26、数据化就是数字化,是相互等同的关系。( )

27、即使数据用于基本用途的价值会减少,但潜在价值却依然强大。()

28、对于大型、中等、小型规模的公司而言,大数据对中等规模的公司帮助最大。( )

29、大数据的核心思想就是用规模剧增来改变现状。()

30、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的

数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。()

31、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,

大数据收集的信息量要尽量精确。()

32、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这

些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。()

33、大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事

件必然会发生。()

34、Java 和 c都是面向对象的程序设计语言。()

相关文档
最新文档