【奥鹏】[南开大学]19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【奥鹏】[南开大学]19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业
试卷总分:100 得分:100
第1题,用于描述相等时间间隔下连续数据随时间变化趋势的是()
A、折线图
B、散点图
C、条形图
D、饼图
正确答案:A
第2题,下列不属于Google云计算平台技术架构的是()
A、并行数据处理MapReduce
B、分布式锁Chubby
C、结构化数据表BigTable
D、弹性云计算EC2
正确答案:D
第3题,用于描述数据分散情况的是()
A、分布图
B、箱式图
C、饼图
D、折线图
正确答案:B
第4题,SAN是一种()
A、存储设备
B、专为数据存储而设计构建的网络
C、光纤交换机
D、HBA
正确答案:B
第5题,IaaS是()的简称
A、软件即服务
B、平台即服务
C、基础设施即服务
D、硬件即服务
正确答案:C
第6题,医疗健康数据的基本情况不包括以下哪项?
A、诊疗数据
B、个人健康管理数据
C、公共安全数据
D、健康档案数据
正确答案:C
第7题,数据清洗的方法不包括
A、缺失值处理
B、噪声数据清除
C、一致性检查
D、重复数据记录处理
正确答案:D
第8题,下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A、ggplot2
B、network
C、ggmaps
D、animation
正确答案:D
第9题,基础设施即服务的英文简称是
A、IaaS
B、PaaS
C、SaaS
正确答案:A
第10题,下面哪一项不是中国发展大数据产业的基础()。
A、信息化积累了丰富的数据资源
B、大数据技术创新取得明显突破
C、大数据应用推动势头良好
D、大数据产业支撑薄弱
正确答案:D
第11题,()是Microsoft Office的核心组件
A、SQL
B、WORD
C、PPT
D、EXCEL
正确答案:D
第12题,数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案:C
第13题,PaaS是()的简称
A、软件即服务
B、平台即服务
C、基础设施即服务
D、硬件即服务
正确答案:B
第14题,下列不属于商业大数据类型的是
A、传统企业数据
B、机器和传感器数据
C、社交数据
D、电子商务数据
正确答案:B
第15题,以下不是数据仓库基本特征的是()
A、数据仓库是面向主题的
B、数据仓库是面向事务的
C、数据仓库的数据是相对稳定的
D、数据仓库的数据是反映历史变化的
正确答案:B
第16题,一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A、一个名字节点
B、若干个名字节点
C、一个数据节点
D、若干个数据节点
正确答案:A,D
第17题,数据预处理的过程主要是
A、数据清洗
B、数据集成
C、数据变换
D、数据
规约
正确答案:A,B,C,D
第18题,大数据的技术支撑有()
A、计算速度加快
B、存储成本下降
C、机器智能化
D、数据量增加
正确答案:A,B,C
第19题,KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。
A、数据集成
B、数据处理
C、数据分析
D、数据挖掘
正确答案:A,B,C,D
第20题,大数据在社交网络中的应用
A、用户偏好、情感、社交网络结构
B、用户画像、精准推荐
C、舆情监控、突发事件预警
D、预测外部趋势
正确答案:A,B,C,D
第21题,大数据时代预测人类移动行为的数据特点是
A、多样化
B、数据量大
C、维数高
D、变化快
正确答案:B,C,D
第22题,大数据时代预测人类移动行为的数据来源有
A、志愿者定位数据
B、装有导航设备的出租车轨迹数据
C、手机终端定位于通讯记录
D、社会网络签到数据
正确答案:A,B,C,D
第23题,数据清洗(Data Cleaning)的方法有()
A、填充空缺值
B、清除数据中的噪声
C、识别或删除离群点并解决不一致性
正确答案:A,B,C
第24题,大数据存储的特点与挑战有()
A、容量问题
B、延迟问题
C、安全问题
D、成本问题
正确答案:A,B,C,D
第25题,百度大脑包括()
A、深度学习
B、超大规模机器学习
C、大规模GPU并行化平台
正确答案:A,B,C
第26题,按照数据量的大小,可将数据分析分为()
A、内存级数据分析
B、Bl级数据分析
C、海量级数据分析
D、巨量级数据分析
正确答案:A,B,C
第27题,云计算是##,##,##的发展?,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A、流计算
B、分布式计算
C、并行计算
D、网络计算
正确答案:B,C,D
第28题,交通数据分析可用于:
A、交通流量实时分析
B、合理进行道路规划
C、信号灯智能调度
D、实时路况查询播报
正确答案:A,B,C,D
第29题,医疗领域如何利用大数据
A、临床决策支持
B、个性化医疗
C、社保资金安全
D、用户行为分析
正确答案:A,B,C,D
第30题,百度大数据引擎主要包含三大组件()
A、开放云
B、数据工厂
C、百度大脑。
正确答案:A,B,C
第31题,轨迹数据包含空间和时间属性,并且通常规模巨大且维度高
T、对
F、错
正确答案:T
第32题,FP-growth算法需要对数据库进行三次扫描
T、对
F、错
正确答案:F
第33题,R语言是S语言的实现,是一种B编译语言
T、对
F、错
正确答案:F
第34题,经典的基于节点和边的可视化,是图可视化的主要形式。
T、对
F、错
正确答案:T
第35题,FP算法比Apriori算法慢
T、对
F、错
正确答案:F
第36题,大数据虽然
拥有大量的价值信息,但是价值密度较低
T、对
F、错
正确答案:T
第37题,谷歌大数据流感趋势已经可以替代当前政府在流感监测方面的工作。( )
T、对
F、错
正确答案:F
第38题,数据可根据作用方式的不同分为交互数据和交易数据
T、对
F、错
正确答案:T
第39题,HDFS为海量的数据提供了存储;
T、对
F、错
正确答案:T
第40题,RDD是一种自定义的可并行数据容器,可以存放任意类型的数据
T、对
F、错
正确答案:T
第41题,NewSQL是对各种可扩展/高性能数据库的简称,这类数据库在保持了传统数据库支持ACID和SQL等能力的同时,还具有NoSQL对海量数据的存储管理能力。
T、对
F、错
正确答案:T
第42题,离群点检测的任务是识别特征显著不同于其他数据的观测值
T、对
F、错
正确答案:T
第43题,半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
T、对
F、错
正确答案:T
第44题,频繁项集的子集是频繁项集,非频繁项集的超集是非频繁项集。
T、对
F、错
正确答案:T
第45题,城市公共交通规划、教育资源配置、医疗资源配置、商业中心建设、房地产规划、产业规划、城市建设等都可以借助于大数据技术进行良好的规划和动态调整。
T、对
F、错
正确答案:T
第46题,Human mobility 即“人类移动性”,表示人类个体或群体在地理空间中具有特定意义的“移动(Movement)”所隐含的社会系统要素时空分布与演化规律。
T、对
F、错
正确答案:T
第47题,数据分析是大数据发展面临的挑战
T、对
F、错
正确答案:T
第48题,用户可以容易地分析空间情况(道路网络内部)随时间的任何变化,或分析道路段上的交通状况的时间变化,或者利用历史数据跟踪单个车辆的即时状态。
T、对
F、错
正确答案:T
第49题,空间视图提供了交通堵塞的概览
T、对
F、错
正确答案:T
第50题,交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。
T、对
F、错
正确答案:T