大数据知识竞赛试题
最新精编《大数据》考试题库500题(含答案)
大数据考试试题题库500题[含答案]一、选择题1.下列选项中,属于贵州发展大数据的先天优势的是(abcd)。
(多选题3分)得分.3分A.空气清新B.远离地震带C.气候凉爽D.电力资源充沛2.“(b)阿里巴巴·贵州年货节”销售额突破8.5亿元,促进了贵州电子商务加快发展。
(单选题1分)得分.1分A.2015B.2016C.2013D.20143.2015年,阿里平台完成农产品销售达到6000多亿元。
(判断题1分)1分正确错误14.大数据仅仅是指数据的体量大。
(判断题1分)正确错误1 得分.1分5.2010年“中央1号文件”指出.要推进农村信息化。
(判断题1分)得分.0分正确错误16.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。
(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理7.建立大数据需要设计一个什么样的大型系统?abcd(多选题3分)得分.3分A.能够把应用放到合适的平台上B.能够开发出相应应用C.能够处理数据D.能够存储数据8.20世纪中后期至今的媒介革命,以(acd )的出现为标志。
(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化9.2012年“中央1号文件”提出,要全面推进农业农村信息化,着力提高(abd)的信息服务水平。
(多选题3分)得分.3分A.农业生产经营B.质量安全控制C.文化交流D.市场流通10.医疗领域如何利用大数据?acd(多选题3分)得分.0分A.临床决策支持B.个性化医疗C.社保资金安全D.用户行为分析11.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?abcd(多选题3分)得分.3分A.农作物病虫害监测B.农业精准生产控制C.农田环境监测D.农作物长势苗情监测12.贵州发展大数据的“八个一”建议包括(abcd)。
大数据知识竞赛试题
大数据知识竞赛试题学院队名一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?姓名性别学号年级成绩张三男2016130133 2016 80 李四女2016131038 2016 60表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、BeansDB 是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.Hadoop1.0平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。
大数据考试题含答案
1 多选传统大数据质量清洗的特点有:A. 确定性B. 强类型性C. 协调式的D. 非确定性2 多选以下选项中属于数据的作用的是()。
A. 沟通B. 验证假设C. 建立信心D. 欣赏3 多选数据建立信心的作用需具备的条件包括()。
A. 可靠数据源B. 多方的数据源C. 合适的数据分析D. 信得过的第三方单位4 多选数据只有在与()的交互中才能发挥作用。
A. 人B. 物C. 消费者D. 企业5 单选大数据可能带来(),但未必能够带来()。
A. 精确度;准确度B. 准确度;精确度C. 精确度;多样性D. 多样性;准确度6 多选大数据的定义是:A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合B. 任何超过了一台计算机处理能力的数据量C. 技术D. 商业7 多选大数据五大类应用方向是:A. 查询B. 触达C. 统计D. 预警E. 预测8 多选以下哪些指标是衡量大数据应用成功的标准?A. 成本更低B. 质量更高C. 速度更快D. 风险更低9 多选大数据有哪些价值?A. 用户身份识别B. 描述价值C. 实时价值D. 预测价值E. 生产数据的价值10 多选大数据的预测价值体现在:A. 预测用户的偏好、流失B. 预测热卖品与交易额C. 预测经营趋势D. 评价11 单选什么是大数据使用的最可靠方法?A. 大数据源B. 样本数据源C. 规模大D. 大数据与样本数据结合12 多选大数据是描述()所发生的行为。
A. 未来B. 现在C. 过去D. 实时13 多选传统研究中数据采集的方法包括:A. 网络监测B. 电话访谈C. 对面访谈D. 线上互动14 单选大数据整合要保证各个数据源之间的()。
A. 一致性、协调性B. 差异性、协调性C. 一致性、差异性D. 一致性、相容性15 单选分类变量使用()建立预测模型。
A. 决策树B. 分类树C. 离散树D. 回归树16 多选()是大数据应用的步骤。
A. 数据输入B. 建模分析C. 使用决策支持工具输出结果D. 验证假设17 多选避免“数据孤岛”的方法包括:A. 关键匹配变量B. 数据融合C. 数据输入D. 利用样本框18 多选以下属于机器学习的是:A. 监督式学习B. 非监督式学习C. 半监督式学习D. 强化学习19 多选机器学习的四大类分析技术的主要算法包括()A. 描述性统计B. 聚类分析C. 关联分析D. 分类与预测20 单选购物篮分析属于()。
大数据应用竞赛复习题7
大数据应用竞赛复习题7301电网大数据中输变配电数据日均产生数据超过()TB。
[单选题] *A、10B、20(正确答案)C、30D、40302典型的数据分析系统分层结构不包括下面哪层? [单选题] *A、数据缓冲层B、数据集市层C、数据筛选层(正确答案)D、数据仓库303当前大数据技术的基础是由()首先提出的。
[单选题] *A、微软B、百度C、谷歌(正确答案)D、阿里巴巴304当代社会中,最为突出的大数据环境是() [单选题] *A、互联网(正确答案)B、物联网C、综合国力D、自然资源305当存在异方差现象时,估计模型参数的适当方法是()。
[单选题] *A、加权最小二乘法(正确答案)B、工具变量法C、广义差分法D、使用非样本先验信息306当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?() [单选题] *A、分类B、聚类(正确答案)C、关联分析D、隐马尔可夫链307大数据最显著的特征是() [单选题] *A、数据类型多样B、数据处理速度快C、数据价值密度高D、数据规模大(正确答案)308大数据指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并()成为帮助企业经营决策更积极目的的信息。
[单选题] *A、收集B、整理(正确答案)C、规划D、聚集309大数据应用需依托的新技术有() [单选题] *A、大规模存储与计算B、数据分析处理C、智能化D、三个选项都是(正确答案)310大数据应用需求来源于(),其成果应用于()。
[单选题] *A、数据、业务B、业务、业务(正确答案)C、数据、数据D、业务、数据311大数据业务场景数据获取路线需从系统数据主题和()两个角度开展。
[单选题] *A、数据分析主题B、业务分析主题(正确答案)C、系统分析主题D、业务数据主题312大数据未来的趋势是大数据与()、物联网和移动互联网的深度融合。
(完整版)大数据考试题
《大数据》试题单选题1、大数据的核心就是(B)A、告知与许可B、预测C、匿名化D、规模化2、大数据不是要教机器像人一样思考。
相反,它是(A)A、把数学算法运用到海量的数据上来预测事情发生的可能性。
B、被视为人工智能的一部分。
C、被视为一种机器学习。
D、预测与惩罚。
3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。
A、降低B、不变C、提高D、无关4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法A、所有数据B、绝大部分数据C、适量数据D、少量数据5、大数据的简单算法与小数据的复杂算法相比(A)A、更有效B、相当C、不具备可比性D、无效6、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。
A、安全性B、完整性C、混杂性D、完整性和混杂性7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A)A、信息B、数字C、文字D、方位8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B)A、原因B、是什么C、关联物D、预测的关键9、建立在相关关系分析法基础上的预测是大数据的(C)A、基础B、前提C、核心D、条件10、(C)下列说法正确的是A、有价值的数据是附属于企业经营核心业务的一部分数据;B、数据挖掘它的主要价值后就没有必要再进行分析了;C、所有数据都是有价值的;D、在大数据时代,收集、存储和分析数据非常简单;11、关于数据创新,下列说法正确的是(D)A、多个数据集的总和价值等于单个数据集价值相加;B、由于数据的再利用,数据应该永久保存下去;C、相同数据多次用于相同或类似用途,其有效性会降低;D、数据只有开放价值才能得到真正释放。
12、关于数据估值,下列说法错误的是(B)A、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴;B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的;C、数据的价值可以通过授权的第三方使用来实现D、目前可以通过数据估值模型来准确的评估数据的价值评估13、在大数据时代,下列说法正确的是(B)。
最新版精选《大数据》完整考题库500题(含参考答案)
大数据考试试题题库500题[含答案]一、选择题1.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。
(判断题1分)得分.1分正确1 错误2.习近平总书记在2016年几月主持召开了网络安全和信息化工作座谈会?A(单选题1分)分.得1分A.4月B.2月C.3月D.5月3.根据周琦老师所讲,高德地图使用大数据能进行小路的识别。
(判断题1分)得分.1分正确1 错误4.2016年9月,国务院印发《促进大数据发展行动纲要》,10月,十八届六中全会将大数据上升为国家战略。
(判断题1分)得分.0分正确1 错误5.我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用。
(判断题1分)得分.1分正确1 错误6.宁家骏委员指出,我国民生领域信息化服务水平显著提升。
(判断题1分)分.1分正确1 错误7.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。
(判断题1分)得分.1分正确1 错误8.习近平总书记指出,网信事业代表着新的生产力.新的发展方向,应该也能够在践行新发展理念上先行一步。
(判断题1分)得分.1分正确1 错误9.依据黑龙江大农场的应用,精准农业技术能够将产量提高5%-10%。
(判断题1分)得分.0分正确1 错误10.根据周琦老师所讲,进入了阿里巴巴集团之后,高德对大数据的处理和基础架构的能力得到了提升。
(判断题1分)得分.1分正确1 错误11.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的25%。
(判断题1分)得分.0分正确1 错误12.林雅华博士指出,网络时代的国家治理必须要借鉴互联网多元向度.扁平化.相互竞合的方式进行。
(判断题1分)得分.1分正确1 错误13.根据涂子沛先生所讲,数据就是简单的数字。
(判断题1分)得分.1分正确错误114.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是abcd(多选题3分)得分.3分从柜台式管理走向全天候管理B.从粗放化管理走向精细化管理C.从被动反应走向主动预见型管理D.从单兵作战走向联合共享型管理15.大数据仅仅是指数据的体量大。
试卷题(大数据知识竞赛)
2018年度一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、B eansDB 是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。
大数据基础理论知识考核试题题库及答案
大数据基础理论知识考核一、选择题1.下列说法正确的是()[单选题] *A.在使用KNN算法时.B.KNN是有监督学习算法√C.在使用KNN算法时.上取值越大.模型越容易过拟合D.KNN和K-means都是无监督学习算法2.下列关于决策树的说法错误的是()。
[单选题] *A.冗余属性不会对决策树的准确率造成不利的影响B.子树可能在决策树中重复多次C.决策树算法对于噪声的干扰非常敏感√D.寻找最佳决策树是NP完全问题3.相关关系是一种与函数关系区别的非确定性关系,而相关分析就是研究事物或现象之间是否存在这种非确定性关系的统计方法,下列不属于相关性分析方法的是()。
[单选题] *A.Pearson相关系数B.Spearman秩相关系数C.Kendall相关系数D.傅里叶系数√4.信息增益、增益率分别对可取值数目()的属性有所偏好。
[单选题] *A.较高.较高B.较高.较低√C.较低.较高D.较低.较低5. LSTM中,()的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。
[单选题] *A.输入门√B.遗忘门C.输出门D.更新门6.傅里叶变换得到的频谱中,低频系数对应于()o[单选题] *A.物体边缘B.噪声C.变化平缓部分√D.变化剧烈部分7.数据科学基本原则中,基于数据的智能的主要特点是()。
[单选题] *A.数据简单,但算法简单B.数据复杂,但算法简单√C.数据简单,但算法复杂D.数据复杂,但算法复杂8. Sigmoid函数作为神经元激活函数的特点是()。
[单选题] *A.连续但不光滑B.不连续但光滑C.连续且光滑√D.不连续且不光滑9.离散程度的测度值愈大,则()。
[单选题] *A.反映变量值愈分散.算术平均数代表性愈差√B.反映变量值愈集中.算术平均数代表性愈差C.反映变量值愈分散.算术平均数代表性愈好D.反映变量值愈集中.算术平均数代表性愈好10.当构建一个神经网络进行图片的语义分割时,通常采用的顺序是()o[单选题] *A. 先用卷积神经网络处理输入,再用反卷积神经网络得到输出√A. 先用反卷积神经网络处理输入,再用卷积神经网络得到输出A. 不能确定11.给定词汇表如下:(Bob, ok, likes, football, car}o 则下面句子Bob likes football的词袋模型表示为()o[单选题] *A. [1 1 1 00]B. [1 0 1 1 0]√C. [100 10]D. [0 1 1 0 1]12.BASE原则的含义不包括()。
大数据知识竞赛试题及答案
大数据知识竞赛试题及答案一、选择题1. 大数据的“4V”特征是指以下哪四项?A. 体积(Volume)、速度(Velocity)、多样性(Variety)、价值(Value)B. 体积(Volume)、速度(Velocity)、多样性(Variety)、准确性(Accuracy)C. 体积(Volume)、速度(Velocity)、可用性(Usability)、价值(Value)D. 体积(Volume)、复杂性(Complexity)、多样性(Variety)、价值(Value)答案:A2. Hadoop的核心组件包括以下哪两个?A. HDFS和MapReduceB. Spark和HDFSC. Hive和MapReduceD. HBase和Spark答案:A3. 以下哪个不是大数据技术?A. 数据挖掘B. 数据清洗C. 数据存储D. 数据加密答案:D二、判断题1. 所有数据都可以被视为大数据。
()答案:×(不是所有数据都是大数据,大数据需要满足特定的规模和复杂度)2. 大数据技术可以提高数据处理的速度和效率。
()答案:√3. 大数据只关注数据的存储,不关注数据的分析和挖掘。
()答案:×(大数据技术不仅关注数据存储,更关注数据的分析和挖掘)三、简答题1. 请简述大数据在商业智能中的应用。
答案:大数据在商业智能中的应用主要体现在通过分析大量数据来获得有价值的商业洞察,包括市场趋势分析、消费者行为分析、产品推荐系统、风险管理等,帮助企业做出更明智的决策。
2. 描述一下大数据与传统数据仓库的主要区别。
答案:大数据与传统数据仓库的主要区别在于处理的数据规模、数据类型、处理速度和成本。
大数据技术能够处理非结构化和半结构化数据,具有更高的扩展性和灵活性,而传统数据仓库通常只处理结构化数据,且扩展性有限。
四、案例分析题1. 某电商平台希望通过大数据分析来优化其推荐系统,请你提出几个可能的分析方向。
大数据知识竞赛试题
大数据知识竞赛试题大数据知识竞赛试题一、大数据概述1.1 什么是大数据1.2 大数据的特点1.3 大数据的应用领域二、大数据技术基础2.1 大数据技术架构2.2 数据采集与清洗2.3 数据存储与管理2.4 数据分析与挖掘2.5 数据可视化三、大数据工具和平台3.1 Hadoop3.2 Spark3.3 NoSQL数据库3.4 数据仓库3.5 数据挖掘工具四、大数据处理算法4.1 MapReduce4.2 数据流处理4.3 分布式机器学习算法4.4 图计算算法五、大数据安全与隐私保护5.1 大数据安全威胁5.2 大数据隐私保护技术5.3 大数据安全管理六、大数据伦理与法律6.1 大数据伦理原则6.2 大数据法律框架6.3 数据保护和隐私法规附件:附件1:大数据知识竞赛试题参考答案注释:1.大数据:指的是规模大、类型多样且处理速度快的数据集合。
2.Hadoop:是一个开源的分布式计算框架,用于存储和处理大规模数据集。
3.Spark:是一个基于内存计算的大数据处理引擎,具有高速的数据处理能力。
4.NoSQL数据库:指的是非关系型数据库,常用于大规模数据存储和查询。
5.MapReduce:是一种用于分布式计算的编程模型,常用于大数据处理。
6.数据流处理:指的是对无限流式数据进行实时处理和分析的技术。
7.分布式机器学习算法:指的是在分布式计算环境下运行的机器学习算法。
8.数据仓库:是一个用于存储和管理结构化数据的集中式数据系统。
9.数据挖掘工具:是用于从大量数据中发现隐藏模式和关联规则的软件工具。
10.大数据安全管理:指的是对大数据进行安全审计、权限控制和数据加密等管理措施的实施。
11.大数据伦理原则:包括数据透明、数据安全和数据使用的合法性原则。
12.大数据法律框架:指的是制定和规范大数据相关法律法规的框架体系。
13.数据保护和隐私法规:包括GDPR、CCPA等一系列涉及个人数据保护的法律法规。
大数据知识竞赛试题
大数据知识竞赛试题学院队名题号一二三总分得分一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?姓名性别学号年级成绩张三男2016130133201680李四女2016131038201660表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、BeansDB是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.Hadoop1.0平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。
云计算、大数据基础知识答题题库
云计算、大数据基础知识答题题库云计算、大数据基础知识答题题库1、云计算基础知识1.1 云计算的定义及特点1.1.1 云计算的概念1.1.2 云计算的特点1.2 云服务模型1.2.1 IaaS(基础设施即服务)1.2.2 PaaS(平台即服务)1.2.3 SaaS(软件即服务)1.3 云计算的优势和挑战1.3.1 云计算的优势1.3.2 云计算面临的挑战1.4 云计算的应用场景1.4.1 企业级应用1.4.2 科学研究与教育1.4.3 个人用户2、大数据基础知识2.1 大数据的定义及特点2.1.1 大数据的概念2.1.2 大数据的特点2.2 大数据处理框架2.2.1 Hadoop2.2.2 Spark2.2.3 Flink2.3 大数据的存储技术2.3.1 分布式文件系统2.3.2 列存储2.3.3 NoSQL数据库2.4 大数据的应用场景2.4.1 商业智能与数据分析 2.4.2 金融行业2.4.3 医疗健康附件:1、云计算实践案例分析2、大数据应用案例展示法律名词及注释:1、云计算:将计算资源通过网络按需提供给用户的一种服务模式,以弹性伸缩、按使用量付费为特点。
2、大数据:指数据量大、速度快、种类繁多的数据集合,对传统数据处理工具进行挑战。
3、IaaS(基础设施即服务):云计算服务模型之一,提供基础的计算资源如服务器、存储等。
4、PaaS(平台即服务):云计算服务模型之一,除了提供基础设施外,还包含了开发、运行和管理应用程序所需的平台。
5、SaaS(软件即服务):云计算服务模型之一,提供以网络为基础的应用软件。
6、Hadoop:大数据处理框架之一,用于分布式存储和处理大规模数据。
7、Spark:大数据处理框架之一,具有高速、通用、易用的特点。
8、Flink:大数据处理框架之一,支持流处理和批处理,并具有低延迟和容错能力。
9、分布式文件系统:用于存储大规模数据的分布式文件系统,如HDFS、Ceph等。
2021大数据知识竞赛考试题及答案
2021大数据知识竞赛考试题及答案1、以下哪项不属于大数据的特征?数据量大数据类型复杂单位处理数据的速度高数据价值密度高【正确答案】2、以下哪项不属于大数据流式处理典型业务应用场景?实时营销实时服务实时监控用户画像【正确答案】3、以下不属于Hadoop内核的组成部分的是HDFSMapReduceHbase【正确答案】YARN4、HDFS默认的当前工作目录是/user/$USER,的值需要在下列哪一个配置文件内说明?mapred-site.xmlcore-site.xml【正确答案】hdfs-site.xml以上均不是5、下列哪一项不属于HDFS相对于分布式系统而言特有的特性?高容错大文件存储大量的随机读应用【正确答案】高吞吐量6、下列存储HDFS某一时段NameNode内存元数据信息的是hdfs-site.xmlfsimage【正确答案】editsfstime7、以下哪个不是HDFS的守护进程?secondarynamenodedatanodemrappmaster/yarnchild【正确答案】namenode8、关于 SecondaryNameNode 哪项是正确的?它是 NameNode 的热备它是内存没有要求它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间【正确答案】SecondaryNameNode 应与 NameNode 部署到一个节点9、以下哪一项不属于HDFS集群中的namenode职责维护HDFS集群的目录树结构维护HDFS集群的所有数据块的分布、副本数和负载均衡负责保存客户端上传的数据【正确答案】响应客户端的所有读写数据请求10、以下哪一项属于SecondaryNamenode的作用监控Namenode管理Datanode合并fsimage和editlogs【正确答案】支持Namenode HA11、下面哪个程序负责 HDFS 中实际数据的存储NameNodeJobtrackerDatanode【正确答案】secondaryNameNode12、关于HDFS集群中的DataNode的描述不正确的是DataNode之间不是独立的,相互之间会有通信和数据传输存储客户端上传的数据的数据块一个DataNode上存储的所有数据块可以有相同的【正确答案】响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑13、如果我们现有一个hadoop集群,默认存储文件3份,并且大文件会按照128M 的数据块大小进行切割分散存储,在不修改默认配置的情况下存储200个每个200M的文本文件,请问最终会在集群中产生多少个数据块(包括副本)?200400004001200【正确答案】14、下列选项中,哪一项是存储HDFS某一时段NameNode内存元数据信息?hdfs-site.xmlfsimage【正确答案】editsfstime15、HBase底层依靠什么进行数据的存储HDFS【正确答案】HiveMemoryMapReduce16、下列选项中,哪个选项是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构?GFSMapReduce【正确答案】ChubbyBitTable17、Mapreduce擅长哪个领域的计算离线批处理【正确答案】DAG计算流式计算实时计算18、在MapReduce中哪一个阶段,把Mapper的输出数据归并整理后分发给Reducer处理Shuffle【正确答案】MapReduceSort19、关于MapReduce原理,下面说法错误的是分为Map和Reduce两个阶段Map阶段由一系列Map任务组成Reduce阶段由一系列Reduce任务组成Map阶段与Reduce阶段没有任何依赖关系【正确答案】20、下列哪个程序通常与NameNode 在同一个节点启动TaskTrackerDataNodeSecondaryNameNodeJobtracker【正确答案】21、MapReduce的Map函数产生很多的keyvalue<key,value>【正确答案】Hash22、下面关于Hive,说法错误的是Hive支持所有标准SQL语法【正确答案】Hive底层采用的计算引擎是MapReduceHive提供的HQL语法,与传统SQL很类似Hive Server可采用MySQL存储元数据信息23、下列哪项通常是Hadoop中MapReduce集群的最主要瓶颈CPU网络磁盘【正确答案】内存24、Hadoop框架的缺陷不包括MR编程框架的限制过多的磁盘操作,缺乏对分布式内存的支持无法高效低支持迭代式计算海量的数据存储【正确答案】25、YARN的调度算法不包括以下哪种FIFO SchedulerFair SchedulerCapacity SchedulerStack Scheduler【正确答案】26、YARN和MapReduce的关系是MapReduce是一个计算框架,可运行在YARN之上【正确答案】YARN是一个计算框架,可运行在MapReduce之上MapReduce和YARN无直接关系以上回答均不正确27、下列选项中,哪个是用来将Hadoop和关系型数据库中的数据相互转移的工具?ZookeeperSqoop【正确答案】HIVESpark28、Hadoop 大数据平台在整个数据挖掘的过程中,起到的作用是数据源处理数据清洗和装载【正确答案】数据展现CUBE生成29、以下哪一项是大数据的核心告知与许可预测【正确答案】匿名化规模化30、以下哪一项是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。
大数据应用竞赛复习题2
大数据应用竞赛复习题251以下哪些分类方法可以较好地避免样本的不平衡问题() [单选题] *A、KNN(正确答案)B、SVMC、BayesD、神经网络52以下哪些不属于概念模型() [单选题] *A、ER图B、关系模型(正确答案)C、面向对象模型D、谓词模型53以下哪项技术是把信息变为认知的工具()? [单选题] *A、数据存储B、数据分析C、数据挖掘(正确答案)D、云计算54以下哪项技能(能力)属于数据科学家需要掌握的()。
[单选题] *A、数据可视化(正确答案)B、计算机编码能力C、对特定应用领域或行业的知识D、设计能力55以下哪项关于决策树的说法是错误的() [单选题] *A、冗余属性不会对决策树的准确率造成不利的影响B、子树可能在决策树中重复多次C、决策树算法对于噪声的干扰非常敏感(正确答案)D、寻找最佳决策树是NP完全问题56以下哪项不属于互联网业务模式 [单选题] *A、动态运营(正确答案)B、建运一体C、常态运营D、持续迭代57以下哪项不属于国网公司泛在电力物联网建设执行层总部统一组织类联合小组[单选题] *A、营配贯通B、多站融合(正确答案)C、多维精益D、企业中台58以下哪项不属于国网公司泛在电力物联网建设执行层各单位联合组织类联合小组 [单选题] *A、智慧能源(正确答案)B、多站融合C、虚拟电厂D、资源商业化运营59以下哪项不属于国网公司泛在电力物联网建设工作层商务组职责() [单选题] *A、负责统筹组织建设能源互联网生态圈,与上下游合作伙伴建立畅通的合作渠道和战略性合作伙伴关系B、负责开展商业模式的创新研究C、负责优化调整泛在电力物联网管理、研发、建设和运营组织机构和管控模式(正确答案)D、负责与国家、相关政府、协会等机构沟通以寻求支持并争取资源60以下哪项不属于国网公司泛在电力物联网建设工作层技术组职责() [单选题] *A、负责组织编制泛在电力物联网建设方案和规划B、负责组织制定相关标准规范,优化技术标准体系C、组织开展泛在电力物联网顶层设计和专项典型设计D、负责开展商业模式的创新研究(正确答案)61以下哪项不属于大数据的5V特征()。
大数据考试题
大数据考试题一、选择题1.大数据是指()。
A.海量数据存储B.海量数据处理C.海量数据分析D.以上皆是2.以下哪个行业中不适合应用大数据技术()。
A.金融B.教育C.医疗D.制造3.大数据技术的主要特点包括()。
A.高速B.大容量C.多样性D.以上皆是4.数据挖掘是大数据技术中的一种()。
A.数据收集方法B.数据处理方法C.数据分析方法D.数据存储方法5.以下哪种技术不属于大数据技术中的数据存储方法()。
A.关系数据库B.分布式文件系统C.非关系型数据库D.数据仓库二、填空题1.大数据技术的核心是()。
答:数据分析2.大数据处理能力的衡量指标是()。
答:吞吐量3.数据清洗是大数据处理过程中的()。
答:第一步4.大数据技术广泛应用于()行业。
答:金融、电商、物流等5.数据挖掘的目标是()。
答:发现隐藏在大数据中的有价值信息三、简答题1.请简述大数据的三个V特点。
答:大数据的三个V特点是:高速(Velocity)、大容量(Volume)和多样性(Variety)。
高速指的是数据的快速产生和传输速度,要求系统能够实时处理大量的数据;大容量意味着大数据处理系统需要具备海量数据存储和处理的能力;多样性指的是大数据来源的多样性,包括结构化数据和非结构化数据等。
2.数据挖掘是什么?简要介绍其在大数据领域的应用。
答:数据挖掘是通过自动或半自动的方式,在大数据中发现模式、关联、异常等有价值的信息的过程。
在大数据领域,数据挖掘技术被广泛应用于市场分析、用户画像、推荐系统等方面。
通过数据挖掘,企业可以挖掘出用户的偏好、需求,从而优化产品设计和营销策略,提升竞争力。
3.请简述大数据技术在金融行业中的应用。
答:大数据技术在金融行业中的应用广泛,包括风险管理、反欺诈、营销分析等方面。
在风险管理方面,大数据技术可以通过对大量的交易数据进行实时监控和分析,及时发现异常交易和风险事件,并采取相应措施预防风险。
在反欺诈方面,大数据技术可以对用户的行为数据进行分析,建立起用户画像,准确识别风险,防止欺诈行为的发生。
大数据应用竞赛复习题
大数据应用竞赛复习题136、云是网络的一种比喻说法,传统架构图中用来表示电信网,后续扩展到表示互联网和底层基础设施。
用户通过()等方式接入云数据中心,按自己的需求进行数据处理。
*A台式机(正确答案)B笔记本(正确答案)C手机(正确答案)D服务器137、在数据缺失严重时,会对分析结果造成较大的影响,因此剔除的异常值和缺失值,要采用合理的方法进行填补,常用的方法有()。
*A平均值填充(正确答案)B.K最近邻距离法(正确答案)C回归法(正确答案)D极大似然估计(正确答案)E多重插补法(正确答案)138、在数据资产质量管理中,同一责任人产生的同一数据项一年内出现两次以上质量问题需要进行问责,以下说法正确的是()。
*A体现了数据资产质量管理遵循“谁产生、谁负责”的原则(正确答案)B.对责任单位予以通报批评(正确答案)C.按照公司员工奖惩规定第十二条追究相关人员责任(正确答案)D.具体惩处按照公司员工违规违纪行为惩处细则第十三条执行(正确答案)139、在网络爬虫的爬行策略中,应用最为基础的是() *A深度优先遍历策略(正确答案)B广度优先遍历策略(正确答案)C高度优先遍历策略D反向链接策略E大站优先策略140、在重大活动保电工作准备期间应超前谋划部署,加强对公司重要数据管控,加强漏洞隐患排查整改,妥善做好涉密数据传递及应用有关工作,综合运用()等手段,构建全方位、立体式监管与防护体系。
深 *A人防(正确答案)B物防(正确答案)C技防(正确答案)D监管(正确答案)141、噪声数据的产生原因主要有()。
*A数据采集设备有问题(正确答案)B在数据录入过程中发生了人为或计算机错误(正确答案)C数据传输过程中发生错误(正确答案)D由于命名规则或数据代码不同而引起的不一致(正确答案)142、正在推动能源行业变革的技术有哪些? *A.电网运行技术(正确答案)B.互联网技术C.用户侧技术(正确答案)D.信息技术(正确答案)E.能源技术(正确答案)143、中国大数据产业特征包括()。
大数据考核试题
大数据基础考核题姓名:考核得分:一、选择题(共11题,共40分)1、大数据的起源是()。
(单选题3分)A .金融 B.电信 C.互联网 D.公共管理2、数据清洗的方法不包括()。
(单选题3分)A.缺失值处理B.垃圾数据清除C.一致辞性检查 D重复数据记录处理3、大数据的最显著特征是()。
(单选题3分)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高4、当前社会中,最为突出的大数据环境()。
(单选题3分)A.互联网B.物联网C.综合国力D.自然资源5、在数据生命周期管理实践中,()是执行方法。
(单选题3分)A.数据存储和备份规范B.数据管理和维护C.数据价值发觉和利用D.数据应用开发和管理6、第一个提出大数据概念的公司是()。
(单选题2分)A. 微软公司B.谷歌公司C.脸谱公司D.麦肯锡公司7、以下选项中不属于大数据对人才能力的要求是()。
(单选题3分)A.业务能力B.数据统计能力C.IT技术能力D.逻辑思维能力8、大数据处理流程可以概括为以下哪几步?()(多选题5分)A. 挖掘B. 采集C.统计和分析 D导入和预处理9、大数据作为一种数据集合,它的含义包括()。
(多选题5分)A. 数据很大B. 很有价值C.构成复杂D.变化很快10、以下选项中,属于大数据对人才能力的要求是()。
(多选题5分)A.业务能力B.数据统计能力C.IT技术能力D.逻辑思维能力11、大数据的主要特征表现为()。
(多选题5分)A.数据容量大B.商业价值高C.处理速度快D.数据类型多二、简答题(每题12分,共40分)1.大数据的简介,描述一下个人对大数据的理解?2.大数据测试的流程有哪些?3.大数据对测试人员人才的技能要求有哪些?4.大数据的处理流程有哪些?5.大数据测试方法的有哪些?。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据知识竞赛试题
学院队名
一、单选题(每题1分)
1、小米摄像头记录下来的10分钟视频属于哪类数据:
A、结构化数据
B、半结构化数据
C、非结构化数据
2、结构化数据具备哪种特征:
A、具备明确逻辑关系
B、不具备明确逻辑关系
C、不一定具备明确逻辑关系
3、指纹打卡的数据属于哪些数据:
A、传感数据
B、交互数据
C、交易数据
4、大数据擅长处理哪个级别的数据?
A、MB
B、GB
C、TB
D、PB
5、电子邮件是什么类型数据:
A、非结构化数据
B、结构化数据
C、半结构化数据
6、网络新闻是什么类型数据:
A、非结构化数据
B、结构化数据
C、半结构化数据
7、下列属于结构化数据的是:
A、图片
B、一卡通学生信息
C、简历
8、表1属于几维列表?
姓名性别学号年级成绩张三男2016130133 2016 80 李四女2016131038 2016 60
表1
A、二维
B、三维
C、四维
D、五维
9、图1中的警衔级别属于哪种属性?
图1
A、标称属性
B、二元属性
C、序数属性
D、数值属性
10、关系型数据库中所谓的“关系”是指什么
A、数据库中的数据彼此间存在任意关联
B、数据模型满足一定条件的二维表格式
C、两个数据库之间有一定的关联
11、下列哪种数据类型不适合MySQL存储:
A、EXCEL报表
B、图片和声音
C、数据库里的财务数据
12、以下不属于ACID原则的是:
A、原子性
B、相对性
C、隔离性
D、持久性
13、淘宝自主设计的自动化分布式存储系统是:
A、MongoDB
B、HBase
C、Oceanbase
14、BeansDB 是一个由我国哪个公司网站自主开发的:
A、淘宝
B、豆瓣社区
C、优酷
D、视觉中国
15、下列不是NewSQL数据库的是:
A、Sybase
B、MemSQL
C、TokuDB
16、下列不是NoSQL数据库的是:
A、Bigtable
B、Dynamo
C、DB2
17、下列不是传统关系型数据库的是:
A、MySQL
B、HBase
C、Sybase
18、下面关于数据挖掘的说法哪些是错误的:
A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容
B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据
C、所有发现的知识都是绝对的
19、下列不属于数据挖掘知识的方法
A、数学方法
B、归纳方法
C、实验方法
20、一般情况下,舆情监测内容不包含:
A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描
B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计
C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计
21、科学可视化、信息可视化和可视分析三者之间如何区分:
A、三者从属关系
B、三者属于递进关系
C、三者之间没有清晰边界
22、下列哪个不属于可视化的作用:
A、信息传播与协调
B、支持对信息的推理和分析
C、对信息进行筛选和储存
23、下图为百度地图显示某地区的加油站,此图为哪类可视化:
A、层次与网络可视化
B、时空数据可视化
C、多变量数据可视化
24、下图为伦敦地铁图,此图为哪类可视化:
A、层次与网络可视化
B、时空数据可视化
C、多变量数据可视化
25、下图为大数据标签云,此图为哪类可视化:
A、多变量数据可视化
B、时空数据可视化
C、非结构化数据可视化
26、目前在全球云计算市场份额占有率最高的公司是:
A、谷歌
B、亚马逊
C、微软
D、IBM
27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:
A、电子商务营销精准化和实时化
B、产品和服务高度差异化和个性化
C、价值链上企业运作差异化和静态化
D、新型增值服务模式不断涌现
28、下列哪个不是大数据下互联网广告的特点
A、广告内容更有针对性
B、提高广告决策效率
C、广告以平面媒体为主
D、广告传播模式的改变
29、微信朋友圈的FEED流广告的推广更为准确描述是:
A、大数据会使受众与产品的距离更贴近
B、对于目标受众的划分更加精细
C、大数据最本质的应用就在于预测
D、随意投放的广告
30、啤酒与尿布的营销案例应用了零售行业的哪种方法:
A、发现关联购买行为
B、客户群体细分
C、供应链管理
二、多选题(每题2分)
1.Hadoop1.0平台最核心的两个项目(组件)是:
A、HDFS
B、HIVE
C、HBase
D、MapReduce
2.以下平台属于Apache软件基金会项目的是:
A、Hadoop
B、Spark
C、Storm
D、MongoDB
3.以下属于大数据挖掘算法的是:
A、决策树
B、支持向量机
C、极差规格化
D、朴素贝叶斯
4.以下属于Spark平台特点的是:
A、共享变量
B、离线处理
C、内存计算
D、弹性分布式数据集
5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:
A、28M
B、64M
C、100M
D、128M
三、判断题(每题1分)
1.Newsql是一种新兴的非关系型数据库。
()
2.数据分析主要是指对过去的数据进行分析总结可视化,而数据科学主要是通过数据模型
指对将来的发展趋势进行预测。
()
3.Python是一种跨平台语言,可以安装在Linux,MacOS和Windows操作系统中。
()
4.数据ETL属于数据分析和挖掘的范畴。
()
5.MapReduce的输入是基于Key-Value键值对。
()
6.云计算提供的三种服务形式中,Iaas是指客户通过Internet即可使用租用商提供的软
件。
()
7.Hadoop主要用于离线大数据分析,而Storm主要用于在线实时大数据分析。
()
8.商务智能(BI)的基本体系结构包括数据仓库、联机分析处理和数据挖掘。
()
9.R语言只能用作数据分析,而Python语言既可以用作数据分析也可以用作数据可视化。
()
10.HDFS的主服务器名称叫做DataNode。
()。