(完整版)大数据复习题(答案)

合集下载

最新2020年最新公需科目《大数据》测试题库(含参考答案)

最新2020年最新公需科目《大数据》测试题库(含参考答案)

2020年最新公需科目《大数据》考试题(含答案)一、单选题1.数据仓库的最终目的是(D )° (单选题)A.收集业务需求建立数据仓库逻辑模型C.开发数据仓库的应用分析D.为用户和业务部门提供决策支持二、多选题2.宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。

©°正确C错误3.2012年,我国农村居民家庭每百户拥有移动电话197.8部。

(判断题1分)分■正确错误46,当今世界四大趋势指的是经济全球化全球城市化.全球信息化.信息智慧化。

(判断题1分)■正确错误47.根据涂子沛先生所讲,数据就是简单的数字。

(判断题1分)正确■错误4.大数据作为一种数据集合,它的含义包括()。

■ A.数据很大B.很有价值■ C.构成复杂■「).变化很快5.“最为成功的商业运作模式是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这是下列哪个定律的内涵?A.牛顿定律B.麦特卡尔夫定律C,摩尔定律■ D.吉尔德定律6.大数据的主要特征表现为()。

ABCE©分A.数据类型多B-处理速度快C.数据容量大D.商业价值高7.林雅华博士指出,网络时代的国家治理必须要借鉴互联网多元向度扁平化.相互竞合的方式进行。

(判断题1分)■正确错误49. 2000年,全国涉农网站超过6000家。

(判断题1分)正确■错误8.以下说法错误的是哪项? QA.大数据是一种思维方式B.大数据不仅仅是讲数据的体量大C.大数据会带来机器智能D.大数据的英文名称是large data9.“ (b)阿里巴巴•贵州年货节”销售额突破8. 5亿元,促进了贵州电子商务加快发展。

A.2015B.2016C.201310.农业农村信息化业务应用深入发展,其业务应用主要表现在哪几个方面?©* A.农业信息资源开发利用水平提高V B.农村电子商务蓬勃兴起V C.农村综合信息服务平台发展迅速17 D.农村电了政务己经基本普及11.下列各项表述中正确的有哪些?⑥得分.0分* A.在网络时代,电子政务的发展刻不容缓,政务微博发声应该成为政府治理的“标配”。

完整版)大数据复习题(答案)

完整版)大数据复习题(答案)

完整版)大数据复习题(答案)1.大数据的起源是互联网。

2.大数据的最明显特点是数据规模大。

3.大数据时代,数据使用的最关键是数据再利用。

4.云计算分层架构不包括Yaas。

5.大数据技术是由___首先提出来的。

6.数据的精细化程度是指颗粒度,越细化的数据,价值越高。

7.数据清洗的方法不包括重复数据记录处理。

8.智能手环的应用开发,体现了传感器的数据采集技术的应用。

9.下列关于数据重组的说法中,错误的是数据的重新生产和采集。

10.美国海军军官___通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中在分析方法上更注重相关分析而不是因果分析。

11.下列关于含___对大数据特点的说法中,错误的是价值密度高。

12.当前社会中,最为突出的大数据环境是互联网。

13.在数据生命周期管理实践中,数据管理和维护是执行方法。

14.下列关于网络用户行为的说法中,错误的是数字轨迹用完即自动删除。

15.下列关于聚类挖掘技术的说法中,错误的是要求同类数据的内容相似度尽可能小。

1.大数据最初来源于互联网。

2.大数据最显著的特点就是数据规模庞大。

3.在大数据时代,数据再利用是最关键的。

4.云计算分层架构不包括Yaas。

5.___首先提出了大数据技术。

6.数据精细化程度指的是颗粒度,数据越精细,价值越高。

7.数据清洗的方法不包括重复数据记录处理。

8.智能手环的应用开发体现了传感器的数据采集技术的应用。

9.数据重组的说法中,错误的是数据的重新生产和采集。

10.美国海军军官___通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中更注重相关分析而不是因果分析。

11.___对大数据特点的说法中,错误的是价值密度高。

12.当前社会中,互联网是最为突出的大数据环境。

13.在数据生命周期管理实践中,数据管理和维护是执行方法。

14.关于网络用户行为的说法中,错误的是数字轨迹用完即自动删除。

精选最新2020年最新公需科目:《大数据》完整题库(含参考答案)

精选最新2020年最新公需科目:《大数据》完整题库(含参考答案)

2020年最新公需科目《大数据》考试题(含答案)一、选择题1.内存够大,所以集群的瓶颈不可能是 a 和 d二、单选题2.大数据时代,数据使用的关键是( D )。

(单选题) A.数据收集B.数据存储C.数据分析D.数据再利用三、多选题3.阿兰·图灵在哪一年提出图灵测试的概念?CA.1952年B.1954年C.1950年D.1955年4.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是 3分得分.■A.从柜台式管理走向全天候管理■B.从粗放化管理走向精细化管理■C.从被动反应走向主动预见型管理■D.从单兵作战走向联合共享型管理5.医疗健康数据的基本情况不包括以下哪项?A.诊疗数据B.个人健康管理数据■C.公共安全数据D.健康档案数据6.宁家骏委员指出,大数据要与“互联网+”医疗健康紧密结合起来,国家明确支持“互联网+”医疗.“互联网+”健康。

对7.国务院在哪一年印发了《促进大数据发展行动纲要》?AA.2015年B.2014年C.2016年D.2013年8.下列哪些国家已经将大数据上升为国家战略?■A.英国■B.日本■C.美国■D.法国9.吴军博士认为未来二十年就是()为王的时代。

CA.文化B.工业C.数据D.农业10.在网络爬虫的爬行策略中,应用最为基础的是(AB )。

A.深度优先遍历策略B.广度优先遍历策略C.高度优先遍历策略D.反向链接策略E.大站优先策略11.根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。

A.2010年B.2006年C.2014年D.2008年12.大数据仅仅是指数据的体量大。

×正确错误13.大数据正快速发展为对数量巨大.来源分散.格式多样的数据进行采集.存储和关联分析,从中发现新知识.创造新价值.提升新能力的(B)。

A.新一代技术平台B.新一代信息技术和服务业态C.新一代服务业态D.新一代信息技术14.以下说法错误的是哪项?DA.大数据是一种思维方式B.大数据不仅仅是讲数据的体量大C.大数据会带来机器智能D.大数据的英文名称是large data15.农业部发布的《关于推进农业农村大数据发展的实施意见》提出,到2020年底前,实现农业农村历史资料的数据化.()。

大数据考试试题及答案

大数据考试试题及答案

大数据考试试题及答案1. 大数据是什么?请简要解释其定义和重要性。

大数据是指以巨大数据量为基础,通过各种技术和工具进行收集、存储、管理和分析的一种数据处理方式。

其定义可以由“3V原则”来概括,即数据的量(Volume)、速度(Velocity)和多样性(Variety)都达到了非常高的水平。

大数据的重要性在于它能够帮助企业和组织从庞杂的数据中挖掘出有价值的信息和洞见,进而做出更明智的决策,提升业务效率和竞争力。

2. 列举常见的大数据技术工具和框架,并简述其主要功能。

- Hadoop: 一个分布式计算框架,可以实现大规模数据的存储和处理,并提供高可靠性和容错性。

- Spark: 一个快速通用的大数据处理引擎,支持内存计算,适用于迭代式和交互式的数据处理任务。

- Hive: 基于Hadoop的数据仓库工具,提供SQL查询接口,能够将结构化的查询转化为MapReduce任务。

- HBase: 一个面向列的NoSQL数据库,适合存储和处理海量结构化数据。

- Kafka: 一个分布式流处理平台,用于处理实时数据流,支持高吞吐量和低延迟。

- TensorFlow: 一个开源的机器学习框架,支持构建和训练各种机器学习算法模型。

3. 大数据的生命周期包括哪些阶段?大数据的生命周期一般包括以下几个阶段:- 数据收集:通过各种方式获取数据,如传感器、日志记录等。

- 数据存储:将数据保存在适当的存储介质中,如Hadoop分布式文件系统(HDFS)或云存储服务。

- 数据清洗和预处理:对原始数据进行清洗和转换,去除噪声和冗余信息,并进行数据归一化和标准化。

- 数据分析:应用统计学和机器学习算法对数据进行分析和建模,探索数据的内在关系和规律。

- 数据可视化:将分析结果以可视化的方式展示,以便更直观地理解数据,并从中获取洞见。

- 报告和决策:根据数据分析的结果,撰写报告并做出相应决策,以优化业务流程和提高绩效。

- 数据存储和归档:将分析过的数据存储和备份,以备将来再次使用。

最新2020年最新公需科目《大数据》完整题库(含答案)

最新2020年最新公需科目《大数据》完整题库(含答案)

2020年最新公需科目《大数据》考试题(含答案)一、单选题1.智能健康手环的应用开发,体现了( D)的数据采集技术的应用。

(单选题)A.统计报表B.网络爬虫C.API接口D.传感器2.当前社会中,最为突出的大数据环境是(A )。

(单选题) A.互联网B.物联网C.综合国力D.自然资源二、多选题3.根据周琦老师所讲,将大数据智能化融入高德地图,能够提供更精准的到达时间预测和实时躲避拥堵功能。

对4.“十二五”以来我国信息化发展的亮点包括以下哪些方面?■A.信息产业的支撑性.保障性.带动性作用进一步增强■B.信息基础设施建设取得长足进步,为信息化全面深化发展提供了有力保障■C.电子商务异军突起,互联网经济发展速度超出预期■D.两化融合成为当前我国工业创新驱动.转型升级的时代特征5.云计算的特点包括以下哪些方面?■A.服务可计算■B.高性价比■C.服务可租用D.低使用度 28.下列选项中,属于贵州发展大数据的先天优势的是()。

■A.空气清新■B.远离地震带■C.气候凉爽■D.电力资源充沛6.大数据作为一种数据集合,它的含义包括()。

■A.数据很大B.很有价值■C.构成复杂■D.变化很快7.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。

对8.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是 3分得分.■A.从柜台式管理走向全天候管理■B.从粗放化管理走向精细化管理■C.从被动反应走向主动预见型管理■D.从单兵作战走向联合共享型管理9.宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。

对10.大数据的核心是洞察,洞察有以下哪些特色?ABCD分A.洞察工作重点B.洞察调度奥妙C.洞察管理规律D.洞察未来趋势11.云计算是信息技术发展和集成应用到新阶段产生的新技术。

正确错误12.《中共中央关于全面深化改革若干重大问题的决定》提出,要推进国家()和()现代化。

A.治理能力B.治理体系C.治理文化D.治理制度13.以下说法正确的有哪些?A.机器的智能方式和人是完全一样的B.机器的智能方式是结果导向的C.机器的智能方式和人的智能不同D.机器产生智能的方式是通过数据.数学模型14.信息技术的发展非常快,表现在()。

精选最新2020年最新公需科目《大数据》完整版考核题库(含答案)

精选最新2020年最新公需科目《大数据》完整版考核题库(含答案)

2020年最新公需科目《大数据》考试题(含答案)一、选择题1.cpu 处理能力强二、单选题2.下列关于数据重组的说法中,错误的是( A)。

(单选题)A.数据重组是数据的重新生产和重新采集B.数据重组能够使数据焕发新的光芒C.数据重组实现的关键在于多源数据融合和数据集成D.数据重组有利于实现新颖的数据模式创新3.万维网之父是( C)。

(单选题)A.彼得·德鲁克B.舍恩伯格C.蒂姆·伯纳斯-李D.斯科特·布朗三、多选题4.宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。

正确错误5.下列选项中,属于贵州发展大数据的先天优势的是()。

ABCDA.空气清新B.远离地震带C.气候凉爽D.电力资源充沛6.云计算的特点包括以下哪些方面?■A.服务可计算■B.高性价比■C.服务可租用D.低使用度 28.下列选项中,属于贵州发展大数据的先天优势的是()。

■A.空气清新■B.远离地震带■C.气候凉爽■D.电力资源充沛7.第一个提出大数据概念的公司是A.微软公司B.谷歌公司C.脸谱公司D.麦肯锡公司8.发展现代农业,要发展高产.优质.高效.生态安全农业,可以利用信息技术进行精准控制,实现农业的()和规模化运行。

ABCD分A.集约化经营B.自动化控制C.智能化管理D.标准化生产9.信息社会经历的发展阶段包括()。

BCD分A.云计算时代B.大数据时代C.计算机时代D.互联网时代10.宁家骏委员指出,()主导了21世纪。

A.移动支付B.大数据C.物联网D.云计算11.全球信息化发展六大趋势包括()。

A.全球信息化发展向智慧化阶段迈进B.全球进入移动互联网全面爆发时期C.信息技术对促进创新的作用日益凸显D.全球制造业互联网化进程加速12.关于大数据在社会综合治理中的作用,以下理解不正确的是( c)。

A.大数据的运用能够维护社会治安B.大数据的运用能够加强交通管理C.大数据的运用能够杜绝抗生素的滥用D.大数据的运用有利于走群众路线13.国务院在哪一年印发了《促进大数据发展行动纲要》?AA.2015年B.2014年C.2016年D.2013年14.“十二五”以来我国信息化发展的亮点包括以下哪些方面?■A.信息产业的支撑性.保障性.带动性作用进一步增强■B.信息基础设施建设取得长足进步,为信息化全面深化发展提供了有力保障■C.电子商务异军突起,互联网经济发展速度超出预期■D.两化融合成为当前我国工业创新驱动.转型升级的时代特征15.吴军博士认为凡是简单.重复的工作,在未来的时代里一定是机器做得比人更好。

大数据复习题(答案)

大数据复习题(答案)

大数据复习题(答案)一、单选题1、大数据的起源是(B)。

A:金融B:互联网C:电信D:公共管理2、大数据的最明显特点是(B)。

A:数据类型多样B:数据规模大C:数据价值密度高D:数据处理速度快3、大数据时代,数据使用的最关键是(D)。

A:数据收集B:数据存储C:数据分析D:数据再利用4、云计算分层架构不包括(D)。

A: Iaas B: Paas C: Saas D: XXX5、大数据技术是由(C)公司首先提出来的。

6、数据的精细化程度是指(C),越细化的数据,价值越高。

A:规模B:活性C:颗粒度D:关联性7、数据清洗的方法不包括(C)A:噪声数据清除B:一致性检查C:重复数据记录处理D:缺失值处理智能手环的应用开发,体现了(C)的数据采集技术的应用。

A:网络爬虫B:API接口C:传感器D:统计报表9、下列关于数掲重组的说法中,错误的是(A)。

A:数据的从头出产和收罗B:能使数据焕发新的光芒C:关键在于多源数据的融会和集成D:有利于新的数据形式创新10、美国海军军官XXX通过对前人航海日志的分析,绘制考了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B)。

A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析结果上更追究效率而不是绝对正确D:在数据范围上强调相对数据而不是绝对数据11、下列关于含XXX对大数据特点的说法中,错误的是(D)A:数据范围大B:数据类型多C:处理速度快D:价值密度高12、当前社会中,最为突出的大数据环境是(A)A:互联网B:自然环境C:综合国力D:物联网13、在数据生命周期管理实践中,(B)是执行方法。

A:数据存储和各份规范B:数据管理和保护C:数据价值发觉和利用D:数据利用开发和管理14、下列关于网络用户行动的说法中,错误的是(C)。

A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互XXX能够为企业晋升效劳质量提供参C:数字轨迹用完即主动删除D:用户的隐私安全很难得以规范保护15、下列关于聚类挖报技术的说法中,错误的是(B)。

最新2020年最新公需科目:大数据完整考题库(含答案)

最新2020年最新公需科目:大数据完整考题库(含答案)

2020年最新公需科目《大数据》考试题(含答案)一、选择题1.如果是互联网有瓶颈,可以让集群搭建内网。

每次写入数据都要通过网络(集群是内网),然后还要写入 3 份数据,所以 I 就会打折扣。

二、多选题2.韩国政府利用位置信息和通话记录数据,规划出合理的公交线路,提升了政府科学决策和公共服务水平,提高了公众满意度。

正确错误3.“()阿里巴巴·贵州年货节”销售额突破 8.5 亿元,促进了贵州电子商务加快发展。

(单选题 1 分) A.2015■B.2016C.2013D.2014 7.关于大数据在社会综合治理中的作用,以下理解不正确的是()。

1分 A.大数据的运用能够维护社会治安 B.大数据的运用能够加强交通管理得分.■C.大数据的运用能够杜绝抗生素的滥用D.大数据的运用有利于走群众路线 8.根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国 10 万公里 15 万处更新。

A.2006 年■B.2014 年C.2008 年D.2010 年 9.第一个提出大数据概念的公司是A.谷歌公司B.微软公司C.脸谱公司■D.麦肯锡公司4.大数据能帮助教师改进教学。

利用大数据方法,教师通过学生反馈回来的作业,就可以发现到底是哪些学生并没有真正听懂,进而有针对性地加以辅导。

对5.建立大数据需要设计一个什么样的大型系统?ABCD分A.能够把应用放到合适的平台上B.能够开发出相应应用C.能够存储数据D.能够处理数据6.大数据系统体系建设规划包括以下哪些内容?ABCD分A.采数据B.搭平台C.编代码D.建模型7.大数据元年是指()。

CA.2012年B.2011年C.2013年D.2010年8.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是 3分得分.■A.从柜台式管理走向全天候管理■B.从粗放化管理走向精细化管理■C.从被动反应走向主动预见型管理■D.从单兵作战走向联合共享型管理9.2012年全国各城市支付宝人均支出排名中,位居第一位的是()CA.嘉兴市B.杭州市C.嘉义市D.高雄市10.下列关于数据生命周期管理的核心认识中,正确的是(ABC )。

大数据技术概论期末复习题2023-11(附参考答案)

大数据技术概论期末复习题2023-11(附参考答案)

单项选择题1.下列各项不属于数据的是()oA.文本B.图像C.视频D.印象2.下列各项不属于大数据特征的是()oA体量大 B.种类多C真实性 D.数据生成慢3.数据异常值的处理方法不包括()。

A极小值替换 B.删除C忽略 D.视为缺失值进行填补4.下列各项不能用于描述数据集中趋势的是()。

A方差 B.平均数C中位数D.峰值5.下列各项不属于HadoOP的特点是()。

A.存储迅速B.成本高C,计算能力强 D.灵活性强6.在工业网络实时监控系统中,需要连续不断地采集和处理数据。

以下()不属于这种计算模式。

A.在线处理B.实时处理C.流式计算D.批量计算7.下面不是研究数据方法的是()。

A.统计学B.机器学习C.心理分析D.数据挖掘8.下面不属于大数据的处理过程的是()。

A.数据获取B.数据清洗C数据分析 D.数据安全9.下面不属于大数据计算模式的类型的是()。

A.批量计算B.手动计算C.流式计算D,交互式计算10.下列各项属于合规数据的是()oA非法收集隐私信息数据 B.取得使用者同意的个人资料数据C泄露的隐私信息数据 D.垄断数据11.在HadOOP生态系统中,主要负责节点集群的任务调度和资源分配,将存储和计算资源分配给不同应用程序的组件是()。

A.HDFSB.MapReduceC.YARND.Storm12.下列属于图数据的主要特性的是()。

A.数据驱动计算B.不规则问题C高数据访问率 D.以上均是13.可以用来查看数值型变量的分布的可视化方法是()。

A.箱线图B.直方图C小提琴图D,以上方法均可以14.如果只是研究两个数值变量之间的关系,最常见的可视化方法是()。

A.直方图B.散点图C饼图 D.折线图15.下列各项不属于批处理系统的特点的是()。

A.可以实现实时的分析报告或自动响应B.可以实现无缝扩展以处理峰值数据量或数据请求C,支持数据在不同系统之间进行交换D.支持作业执行状态的监控16.下列各项属于非结构化数据的是()0A.图像B.二维数据表CHTML文档 D.以上均是17.在大数据的处理流程中,()步骤是将数据转化为图形,以更直观的方式展示和表达。

新版精编《大数据》完整考题库500题(含答案)

新版精编《大数据》完整考题库500题(含答案)

大数据考试试题题库500题[含答案]一、选择题1.大数据作为一种数据集合,它的含义包括(acd )。

(多选题3分)得分.3分A.数据很大B.很有价值C.构成复杂D.变化很快2.内存够大,所以集群的瓶颈不可能是 a 和 d3.大数据仅仅是指数据的体量大。

(判断题1分)正确错误1 得分.1分4.下列哪些国家已经将大数据上升为国家战略?abcd(多选题3分)得分.3分A.英国B.日本C.美国D.法国5.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。

(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理6.建立大数据需要设计一个什么样的大型系统?abcd(多选题3分)得分.3分A.能够把应用放到合适的平台上B.能够开发出相应应用C.能够处理数据D.能够存储数据7.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是abcd(多选题3分)得分.3分A.从柜台式管理走向全天候管理B.从粗放化管理走向精细化管理C.从被动反应走向主动预见型管理D.从单兵作战走向联合共享型管理8.20世纪中后期至今的媒介革命,以(acd )的出现为标志。

(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化9.医疗领域如何利用大数据?acd(多选题3分)得分.0分A.临床决策支持B.个性化医疗C.社保资金安全D.用户行为分析10.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?abcd(多选题3分)得分.3分A.农作物病虫害监测B.农业精准生产控制C.农田环境监测D.农作物长势苗情监测11.贵州发展大数据的“八个一”建议包括(ab;得分.3分;A.制定一个工作计划.建立一个领导机构B.培养 D.中央网络安全和信息化领导小组组长是李克强。

12.下列各项表述中正确的有哪些?ad(多选题3分)得分.0分A.我国中央网络安全和信息化领导小组宣告成立是在2013年。

大数据试题及答案

大数据试题及答案

大数据试题及答案一、选择题1. 大数据的4V特征中,不包括下列哪一项?A. 多样性(Variety)B. 速度(Velocity)C. 可访问性(Veracity)D. 价值(Value)答案:C2. 下列关于Hadoop的描述,哪一项是错误的?A. Hadoop是一个开源的分布式存储和计算平台。

B. Hadoop的核心是HDFS和MapReduce。

C. Hadoop可以处理结构化和非结构化数据。

D. Hadoop无法与其他数据库软件集成。

答案:D3. 在大数据分析中,数据清洗的目的是什么?A. 减少数据量B. 提高数据质量C. 增加数据种类D. 加快数据处理速度答案:B4. 下列哪个不是数据挖掘的主要任务?A. 分类B. 聚类C. 关联规则学习D. 机器翻译答案:D5. 数据仓库的主要作用是什么?A. 存储实时数据B. 支持决策制定C. 提高数据传输速度D. 加密数据保护答案:B二、填空题1. 大数据环境下,数据的________和________是保证数据安全的重要措施。

答案:加密、访问控制2. 在大数据应用中,________可以帮助企业发现潜在的客户群体和市场趋势。

答案:数据挖掘3. 为了提高数据分析的准确性,通常需要对数据进行________处理。

答案:标准化4. 大数据技术的发展,促进了________和________领域的融合,推动了智能化决策的发展。

答案:信息技术、业务管理5. 数据治理是确保数据________、________和________的关键过程。

答案:准确性、完整性、一致性三、简答题1. 简述大数据的基本概念及其对现代企业的影响。

答案:大数据指的是传统数据处理应用软件难以处理的大规模、高增长率和多样化的数据集合。

它通过高速处理数据,能够揭示隐藏在数据背后的模式、趋势和关联,对现代企业的影响主要体现在提高了决策效率、优化了客户服务、增强了市场竞争力等方面。

2. 描述数据仓库和大数据平台之间的区别。

大数据题库(130道)

大数据题库(130道)

大数据1、联通大数据产业解决方案中,DDS的意思是指? (1.0分)——[单选题]A 政务驱动服务B 数据驱动服务C 数据处理服务D 数据改进服务正确答案:B2、与运营商数据相比,政府数据的体量和维度更偏向于下面哪一种? (1.0分)——[单选题]A 大致相等B 小C 更大D 极少正确答案:C3、政务行业大数据解决方案中,以下哪项不是市场监管部门的关注点? (1.0分)——[单选题]A 识别监管对象真实身份B 查找监管对象经营地点C 掌控监管对象经营行为D 掌握市场主体的社保缴纳情况正确答案:D4、政务行业大数据对于社会治理大数据分析模块不包括哪项功能? (1.0分)——[单选题]A 人口热力分析B 人口结构分析C 人口来源分析D 政府办公正确答案:D5、联通大数据社会治理系统数据来源没有哪项? (1.0分)——[单选题]A 政府B 运营商C 银行D 物联网正确答案:C6、人口大数据标签数量大约有多少个? (1.0分)——[单选题]A 3800+B 2000+C 1000+D 500+正确答案:A7、以下不是人口大数据优势的是哪个? (1.0分)——[单选题]A 无感知采集B 全生命周期C 全国集中D 通知用户采集正确答案:D8、人口大数据中如何判定户籍所在地? (1.0分)——[单选题]A 身份证前六位B 春节路径C 每日工作路径D 常驻地位置正确答案:C9、人口大数据目前还不能实现的场景是哪一个? (1.0分)——[单选题]A 人口统计B 人口监测C 人口评估D 人员比对正确答案:D10、人口大数据的集中程度目前是实现了什么集中? (1.0分)——[单选题]A 全国集中B 部分集中C 省级集中D 市级集中正确答案:A11、药品溯源大数据中,对于食药监管的核心是什么? (1.0分)——[单选题]A 全B 大C 广D 严正确答案:A12、克强总理提到:百分之多少的数据掌握在政府手中 (1.0分)——[单选题]A 0.2B 0.6C 0.8D 0.5正确答案:C13、2020年大数据产业规模将超多少亿的规模? (1.0分)——[单选题]A 百亿B 万亿C 千亿D 十亿正确答案:B14、下面哪一个不是文旅大数据方案产品所直接面向的客户? (1.0分)——[单选题]A 文旅厅B 博物馆C 游客D 景区正确答案:C15、下列哪一类洞察是基于联通DPI数据,分析互联网APP、网站、微博、微信公众号等开展的? (1.0分)——[单选题]A 终端洞察B 互联网洞察C 区域洞察D 人口洞察正确答案:B16、以下不是联通APP洞察产品主要受众的是: (1.0分)——[单选题]A 互联网企业B 投资机构C 咨询公司D 政府机构正确答案:D17、以下不属于标准化SaaS数赢洞察的产品优势 (1.0分)——[单选题]A 中小企业为主,成本低B 业务流程简单,使用方便C 即开即用、省时高效D 只提供定制化服务正确答案:D18、朋友圈广告投放数据报表不能提供哪项指标? (1.0分)——[单选题]A 公众号关注数量B 公众号文章转发数量C 广告点击数量D 公众号内部访问时长正确答案:D19、广告产品更适合服务于下列哪类客户? (1.0分)——[单选题]A 寻求针对目标人群的精准投放B 预算大,潜客定向窄,注重销售转化效果C 有预算,定向范围较大,注重品牌宣传D 预算大,但客户没有素材和落地页正确答案:C20、朋友圈广告投放中,最常见的图片尺寸为下列哪个? (1.0分)——[单选题]A 800*450B 900*450C 400*550D 850*630正确答案:A21、可以根据点击过广告的人群进行重新投放的功能被称为什么? (1.0分)——[单选题]A lookalikeB 人群属性定向C 重定向人群D 自定义投放正确答案:C22、数睿广告不能定向的人群是下列哪一个? (1.0分)——[单选题]A 大连市的人群B 中小学老师C 25-45女性D 爱好金融、房产的男性正确答案:B23、在广告投放时候,联通大数据支撑朋友圈广告2分钟内反复刷5次,算作几次曝光?(1.0分)——[单选题]A 2B 1C 3D 5正确答案:B24、数睿广告产品中,朋友圈订单的起充金额为? (1.0分)——[单选题]A 1000B 2000C 1万D 5000正确答案:D25、下列有关数睿广告适用场景,最准确的说法是? (1.0分)——[单选题]A 品牌推广为主,效果为辅B 效果转化为主,品牌推广为辅C 品牌宣传D 效果ROI转化正确答案:A26、营销平台失联复联加密方式 (1.0分)——[单选题]A MD5(16位小写)B MD5(16位大写)C MD5(32位小写)D MD5(32位大写)正确答案:D27、数字营销产品优势表述正确的是? (1.0分)——[单选题]A 数据集中、画像全面、一站式服务、多租户模式、多渠道渠道B 数据集中、画像全面、一站式服务C 一站式服务、多租户模式、多渠道渠道、安全性D 画像全面、一站式服务、多租户模式、多渠道渠道正确答案:A28、联通大数据数睿广告产品中,朋友圈渠道推广的订单,可以不具备哪一项? (1.0分)——[单选题]A 开通微信公众号B 具备对应的行业资质C 客户有自己的小程序D 公众号开通广告主功能正确答案:C29、联通大数据产品中,线上广告可投放的行业,不包括以下哪个? (1.0分)——[单选题]A 医疗B 房产C 母婴D 教育正确答案:A30、数盾风控产品提供征信验证和风险评估服务,以及全方位的风控解决方案的前提是:(1.0分)——[单选题]A 充分保障用户隐私安全B 充分保障数据全面C 避免损失D 及时响应正确答案:A31、下面选项中,属于大数据数言预警模式的是: (1.0分)——[单选题]A 人工预警和智能预警B 人工预警C 智能预警D 手动预警正确答案:A32、大数据产品优势中,下面对于数据能力采集处理快描述错误的是: (1.0分)——[单选题]A 每毫秒10万组词逻辑匹配B 每秒钟高速流式大数据处理10万篇文章C 每分钟2200万贴吧全扫描D 每日去重原创信息采集近1.5亿正确答案:A33、联通大数据产品体系中,下面不是数言舆情产品的优势的是: (1.0分)——[单选题]A 复杂B 安全C 全面D 快速正确答案:A34、一般情况下,能力开放平台提供的数据均为生产平台的哪一类数据? (1.0分)——[单选题]A 真实明文数据B 真实脱敏数据C 伪造明文数据D 伪造脱敏数句正确答案:B35、客户可以通过开通以下哪个权限,从而能够自主地在能力开放平台上传数据? (1.0分)——[单选题]A CRTB APIC FTPD VPN正确答案:C36、以下字段中,能力开放平台不会脱敏处理的字段是哪个? (1.0分)——[单选题]A 手机号B IMEI号C 在网时长D 经纬度信息正确答案:C37、能力开放平台以多租户的方式进行管理运营,各租户之间数据资源,网络、计算资源如何相互规划,保证各合作伙伴的资源使用稳定及其模型资产安全。

大数据基础复习题与答案

大数据基础复习题与答案

大数据基础复习题与答案1.常见的数据的类型包括().A. 文本(正确答案)B. 图片(正确答案)C. 模型D .音频(正确答案)E. 视频(正确答案)2.更适应大数据时代的数据库类型是().A. 层次数据库B. 网状数据库C. 关系型数据库D. NoSQL数据库(正确答案)3.目前主流的数据库是()A. 层次数据库B. 网状数据库C. 关系型数据库(正确答案)D. NoSQL数据库3.关于数据的使用和管理,下面正确的是()A. 想要使用数据,必须先进行数据清洗,将数据变成一个可用的状态(正确答案)B. 有些初始数据的质量不高,比如数据缺失、语意模糊,因此需要数据清洗(正确答案)C. 进行数据管理时,关系型数据库更擅长存储非结构化数据D. 现代社会产生的大部分数据实际上是非结构化数据。

(正确答案)4.关于数据分析,下面说法正确的是()A. 数据分析需要借助数据挖掘和机器学习的相关算法(正确答案)B. 数据分析不需要用到大数据处理技术C. 数据分析需要构建统计模型(正确答案)D. 利用数据可视化技术可以将数据分析的结果更清晰地展示(正确答案)5.数据爆炸的时代对科学研究提出的挑战包括下面哪些()。

A. 需要更低成本的、能更快响应的大规模分布式存储(正确答案)B. 需要更加及时的大数据处理能力(正确答案)C. 需要更多的数据用于数据价值的挖掘D. 需要更加高效的数据分析工具(正确答案)6. 数据增速越来越快的原因在于?()A. 接入网络的设备越来越多(正确答案)B. 单条数据的所携带的信息也越来越多C. 用户越来越积极地参与到主动生产内容和数据的环节(正确答案)D. 物联网中的设备源源不断产生数据(正确答案)7第三次信息化浪潮的到来的标志是()。

A. 个人计算机的普及B. 互联网的普及和发展C. 人工智能时代的到来D. 云计算、大数据、物联网的快速发展(正确答案)8.华大基因公司2017年产出的数据达到1EB(艾字节)。

精编2020年最新公需科目《大数据》完整题库(含标准答案)

精编2020年最新公需科目《大数据》完整题库(含标准答案)

2020年最新公需科目《大数据》考试题(含答案)一、单选题1.智慧城市的构建,不包含( C)。

(单选题)A.数字城市B.物联网C.联网监控D.云计算大数据的最显著特征是( A)。

(单选题)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高2.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B )。

(单选题)A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据3.当前社会中,最为突出的大数据环境是(A )。

(单选题) A.互联网B.物联网C.综合国力D.自然资源4.下列关于计算机存储容量单位的说法中,错误的是( C)。

(单选题)A.1KB<1MB<1GBB.基本单位是字节(Byte)C.一个汉字需要一个字节的存储空间D.一个字节能够容纳一个英文字符,二、多选题5.下列关于数据生命周期管理的核心认识中,正确的是(ABC )。

A.数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段B.在不同的数据存在阶段,数据的价值是不同的C.根据数据价值的不同应该对数据采取不同的管理策略D.数据生命周期管理旨在产生效益的同时,降低生产成本E.数据生命周期管理最终关注的是社会效益6.下列选项中,属于贵州发展大数据的先天优势的是()。

ABCDA.空气清新B.远离地震带C.气候凉爽D.电力资源充沛7.大数据仅仅是指数据的体量大。

×正确错误8.茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?A.复旦B.清华C.北大D.浙大9.下列各项表述中正确的有哪些?得分.0分A.在网络时代,电子政务的发展刻不容缓,政务微博发声应该成为政府治理的“标配”。

B.在工业化社会到信息化社会的转折点上,互联网是我们党和政府面临的“最大变量”,处置不好,将成为“心头大患”。

大数据复习题(答案)

大数据复习题(答案)

大数据复习题(答案)大数据复习题(答案)1、大数据概述1.1 什么是大数据?大数据是指数据量太大、速度太快或种类太多,以至于无法通过传统的数据管理工具进行处理和分析的数据集合。

1.2 大数据的特征- 体量大:数据量通常以TB、PB、甚至EB计量。

- 速度快:数据的获取和处理速度要求很高。

- 多样性:数据类型和格式多样,包括结构化数据、半结构化数据和非结构化数据。

1.3 大数据的价值大数据具有挖掘价值和应用价值,可以帮助企业和组织发现潜在商机、预测趋势、精确定位目标用户、提高决策效率等。

2、大数据处理技术2.1 数据采集与存储- 数据采集:包括传感器数据、日志数据、用户行为数据等的收集和提取。

- 数据存储:传统的关系型数据库、NoSQL数据库和Hadoop分布式文件系统等。

2.2 数据清洗与预处理数据清洗和预处理是为了解决大数据中存在的异常数据、重复数据、缺失数据等问题,保证数据的准确性和一致性。

2.3 数据分析与挖掘- 数据分析:对数据进行统计、分布、趋势和关联等的分析。

- 数据挖掘:通过机器学习、模式识别、聚类和分类等方法,从数据中发现隐藏的模式和规律。

2.4 数据可视化与展示通过图表、地图、仪表盘等形式将数据结果进行可视化展示,便于用户理解和决策。

3、大数据分析算法3.1 关联分析算法关联分析是挖掘数据中的关联规则,找出数据中项之间的频繁项集和置信度较高的规则。

3.2 聚类分析算法聚类分析是将数据集中的对象按照某种相似度度量进行分组,使得同一组内的对象相似度较高,不同组间的对象相似度较低。

3.3 分类分析算法分类分析通过训练样本和已知类别来建立分类模型,然后将新的样本通过模型进行分类。

3.4 预测分析算法预测分析利用历史数据来预测未来的趋势和发展,为决策提供依据。

4、附件本文档涉及的附件包括相关的数据样本、数据处理代码、分析结果图表等。

5、法律名词及注释5.1 隐私保护指个人信息的收集、使用和存储等活动需要遵守相关的法律法规,并保证个人信息的安全性和保密性。

最新版精编2020年最新公需科目大数据完整版考核题库(含参考答案)

最新版精编2020年最新公需科目大数据完整版考核题库(含参考答案)

2020年最新公需科目《大数据》考试题(含答案)一、单选题1.在数据生命周期管理实践中,( B)是(单选题)A.数据存储和备份规范B.数据管理和维护C.数据价值发觉和利用D.数据应用开发和管理2.Mac S系统的开发者是(C )。

(单选题)A.微软公司B.惠普公司C.苹果公司D.IBM公司二、多选题3.以下说法错误的是哪项?DA.大数据是一种思维方式B.大数据不仅仅是讲数据的体量大C.大数据会带来机器智能D.大数据的英文名称是large data4.宁家骏委员指出,大数据要与“互联网+”医疗健康紧密结合起来,国家明确支持“互联网+”医疗.“互联网+”健康。

对5.宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。

对6.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是()。

■A.从被动反应走向主动预见型管理■B.从粗放化管理走向精细化管理■C.从单兵作战走向联合共享型管理■D.从柜台式管理走向全天候管理7.《中共中央关于全面深化改革若干重大问题的决定》提出,要推进国家()和()现代化。

BD分A.治理文化B.治理能力C.治理制度D.治理体系8.在网络爬虫的爬行策略中,应用最为基础的是(AB )。

A.深度优先遍历策略B.广度优先遍历策略C.高度优先遍历策略D.反向链接策略E.大站优先策略9.信息技术的发展非常快,表现在()。

得分.0分A.集成电路的规模每18到24个月翻一倍B.信息的存储能力每9个月翻一番C.信息的存储能力每9个月翻一番D.光通讯的速率和容量每年翻一番10.近几年,我国电子信息产业一直保持了()以上的年增长速度,成为国民经济各个领域中间的佼佼者。

A.7%B.8%C.9%D.10%11.2012年全国各城市支付宝人均支出排名中,位居第三位的是()A.嘉兴市B.嘉义市C.杭州市D.高雄市12.贵州发展大数据的“八个一”建议包括()。

ABCDA.制定一个工作计划.建立一个领导机构B.培养一批干部.出台一批政策C.引入一批人才.聚集一批创客D.谋划一批产业.引进一批项目13.20 世纪中后期至今的媒介革命,以()的出现为标志。

精选新版2020年最新公需科目《大数据》完整题库(含答案)

精选新版2020年最新公需科目《大数据》完整题库(含答案)
A.在数据基础上倾向于全体数据而不是抽样数据
B.在分析方法上更注重相关分析而不是因果分析
C.在分析效果上更追究效率而不是绝对精确
D.在数据规模上强调相对数据而不是绝对数据
30.医疗领域如何利用大数据?acd(多选题3分)得分.0分A.临来自决策支持B.个性化医疗
C.社保资金安全
D.用户行为分析
31.奥巴马认为,对大数据的占有与控制,反映的是一个国家的核心能力之大小。因此,他已经将大数据上升到国家战略高度。√分
A.6个月
B.18个月
C.12个月
D.24个月
21.以下对网络空间的看法,正确的是:(B)
A.网络空间是虚拟空间,不需要法律
B.网络空间虽然与现实空间不同,但同样需要法律
C.网络空间是一个无国界的空间,不受一国法律约束
D.网络空间与现实空间分离,现实中的法律不适用于网络空间
22.根据周琦老师所讲,高德早在(B)就开始投入;;
D.中央网络安全和信息化领导小组,是中国全面深化改革得以顺利进行.中国社会现代化转型得以顺利完成的压仓之石。
5.贵州电子商务的发展路径是.与阿里.京东.腾讯等电商企业强化合作,改善信息基础条件.物流条件,培育电商主体和平台,积极发展()。
A.电子商务+跨境
B.电子商务+社区
C.电子商务+物流
D.电子商务+农村
15.支撑大数据业务的基础是(B)。
A.数据科学B.数据应用C.数据硬件D.数据人才
16.对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。( F) (判断题)
是 否
17.下列关于脏数据的说法中,正确的是( ABCDE)。

大数据预处理 复习题(附参考答案)

大数据预处理 复习题(附参考答案)

大数据预处理复习题(一)单选题1.下列关于缺失值的形式的说法中,正确的是()oA.PythOn中默认的缺失值形式为NAB.PandaS中默认的缺失值形式为NaNC.PythOn中默认的缺失值形式为NU1ID.PandaS中默认的缺失值形式为空字符串(〃〃)2.下列表述中,正确的是()oA.对字符串型变量的缺失值,需要使用众数进行填补。

B.对于缺失值,最简单的处理方法是使用均值进行填补。

C.完全变量指的包含缺失值的变量。

D.在调查过程中,因被调查者拒绝回答敏感问题而造成的数据缺失,属于人为原因。

3.关于日期时间型数据,下列说法正确的是()oA.在计算机系统中,日期时间型数据是以文本形式存储的。

B.在计算机系统中,日期时间型数据是以数值形式存储的。

C.在计算机系统中,日期时间型数据是以因子形式存储的。

D.在计算机系统中,日期时间型数据是以缺失值形式存储的。

4.下图是某分类变量各类别计数分布的箱线图,从图中可知()oA.少部分分类计数很低。

8.该变量类别很少,可以清晰的用箱线图展示各类别的频数。

C.这个变量存在大量低频分类。

D.绝大多数分类计数很高。

5.下列关于数据预处理的表述中,不正确的是()oA.具备专业经验的数据科学家可以在数据分析前忽略数据预处理。

B.数据预处理是在数据采集后,分析前这段时间里对数据进行的处理操作。

C.数据预处理的效果与数据分析顺利与否直接相关。

D.数据预处理往往占据数据分析项目总工作量的60%以上。

6.下列数据特征缩放的公式中,正确的是()oA.数据中心化公式为:X sca1ed=8.数据标准化公式为:X sca1ed=X-X oC.Max-ABS缩放公式为:XSwed=而匚。

∣λImaxD.Robust缩放公式为:X sca1ed=x-Me^ian o7.下列关于相关系数的表述中,正确的是()oA.PearSon相关系数的值在[0,1]之间分布。

B.SPean11an相关系数的值在[T,1]之间分布。

大数据试题及答案解析

大数据试题及答案解析

大数据试题及答案解析一、单选题(每题2分,共10分)1. 大数据的4V特性指的是什么?A. 体积、速度、多样性、价值B. 体积、速度、多样性、可视化C. 体积、速度、可视化、价值D. 体积、多样性、可视化、价值答案:A2. 下列哪个不是大数据的典型应用场景?A. 客户行为分析B. 网络安全监控C. 天气预报D. 个人电脑操作系统答案:D3. Hadoop生态系统中,用于数据存储的是?A. HBaseB. HiveC. FlumeD. HDFS答案:D4. 大数据技术中,用于处理实时数据流的框架是?A. HadoopB. SparkC. KafkaD. HBase答案:C5. 下列哪个不是大数据分析的常见工具?A. RB. PythonC. ExcelD. Hadoop答案:C二、多选题(每题3分,共15分)1. 大数据技术可以应用于以下哪些领域?A. 金融分析B. 医疗健康C. 教育D. 游戏开发答案:A、B、C2. 在大数据处理中,以下哪些技术是常用的?A. 数据挖掘B. 机器学习C. 数据可视化D. 数据清洗答案:A、B、C、D3. 下列哪些是大数据存储技术?A. 数据库B. 文件系统C. 内存计算D. 云存储答案:A、B、D4. 在大数据架构中,以下哪些组件是Hadoop生态系统的一部分?A. HDFSB. HBaseC. SparkD. Kafka答案:A、B5. 大数据中的数据清洗包括哪些步骤?A. 缺失值处理B. 异常值处理C. 数据去重D. 数据转换答案:A、B、C、D三、判断题(每题1分,共5分)1. 大数据技术只能用于处理海量数据。

()答案:错误2. 大数据技术可以提高决策的效率和准确性。

()答案:正确3. 大数据技术不需要考虑数据的安全性。

()答案:错误4. 大数据技术可以完全替代传统的数据分析方法。

()答案:错误5. 大数据技术在处理数据时不需要考虑数据的时效性。

()答案:错误四、简答题(每题5分,共20分)1. 请简述大数据技术在金融领域的应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、单选题1、大数据的起源是(B)。

A:金融B:互联网C:电信D:公共管理2、大数据的最明显特点是(B)。

A:数据类型多样B:数据规模大C:数据价值密度高D:数据处理速度快3、大数据时代,数据使用的最关键是(D)。

A:数据收集B:数据存储C:数据分析D:数据再利用4、云计算分层架构不包括(D)。

A: Iaas B: Paas C: Saas D: Yaas5、大数据技术是由(C)公司首先提出来的。

A:阿里巴巴B:百度C:谷歌D:微软6、数据的精细化程度是指(C),越细化的数据,价值越高。

A:规模B:活性C:颗粒度D:关联性7、数据清洗的方法不包括(C)A:噪声数据清除B:一致性检查C:重复数据记录处理D:缺失值处理智能手环的应用开发,体现了(C)的数据采集技术的应用。

A:网络爬虫B:API接口C:传感器D:统计报表9、下列关于数掲重组的说法中,错误的是(A)。

A:数据的重新生产和采集B:能使数据焕发新的光芒C:关键在于多源数据的融合和集成D:有利于新的数据模式创新10、美国海军军官莫里通过对前人航海日志的分析,绘制考了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B)。

A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于含思伯格对大数据特点的说法中,错误的是(D)A:数据规模大B:数据类型多C:处理速度快D:价值密度高12、当前社会中,最为突出的大数据环境是(A)A:互联网B:自然环境C:综合国力D:物联网13、在数据生命周期管理实践中,(B)是执行方法。

A:数据存储和各份规范B:数据管理和维护C:数据价值发觉和利用D:数据应用开发和管理14、下列关于网络用户行为的说法中,错误的是(C)。

A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互痕迹能够为企业提升服务质量提供参C:数字轨迹用完即自动删除D:用户的隐私安全很难得以规范保护15、下列关于聚类挖报技术的说法中,错误的是(B)。

A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B:要求同类数据的内容相似度尽可能小C:要求不同类数据的内容相仪度尽可能小D:与分类挖据技术相似的是,都是要对数据进行分类处理16、下列国家的大数据发展行动中,集中体现“重视基础都先行”的国家是(D)A美国B:中国C:日本D:韩国17、万维网之父是(C)A彼得·德鲁克B:杨振宁c:蒂姆・伯纳斯-李D:钱学森18、下列关于数掲交易市场的说法中,错误的是(C)A:数据交易市场是大数据产业发展到一定程度的产物B:商业化的数据交易活动催生了多方参与的第三方数据交易市场C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D:数据交易市场是大数据资源化的必然产物下列论据中,能够支掉“大数据无所不能”的观点是(A)A:互联网金融打破了传统的观念和行为B:大数据具有非常高的成本C:大数据存在泡沫D:个人隐私泄露与信息安全担忧20、数据仓库的最终目的是(D)A开发数据仓库的应用分析B:收集业务需求C:建立数据仓库逻辑模型D:为用户和业务部门提供决策支持21、信息时代的三大定律不包括(A)A:牛顿定理B:摩尔定律C:麦特卡尔夫定律D:吉尔德定律22、信息技术(IT)不包括(D)A:计算机技术B:通信技术C:传感技术D:新材料技术23、云计算的特点不包括(D)。

A:高性价比B:服务可计算C:服务可租用D:低使用度24、关于大数据在社会综合治理中的作用,以下描述不正确的是(C)A:大数据的运用有利于走群众路线B:大数据的运用能够维护社会治安C:大数据的运用能社绝抗生素的滥用D:大数据的运用能够加强交通管理A:身份假冒B:隐私露C:商业问课D:以上都有大数据的利用过程是(D)A:果集-挖提-清洗-统计B:果集一统计-清洗一挖据C:采集-清洗一挖据-统计D:采集一清洗--统计-挖据26、大数据的本质是(A)A:洞察B:采集C:统计D:联系27、大数据元年是(D)A:2010年B:2011年C:2012年D:2013年28、(B)提供的支撑技术,有效的解决了大数据分析、研发的问题,比如:虚拟化技术、并行计算、海量存储及管理等。

A:点计算B:云计算C:面计算D:线计算29、(D)提出在今后的十几年里,半导体处理器的性能,每18个月左右可以翻一番。

A:牛顿B:爱因斯坦C:比尔盖茨D:戈登摩尔30、从社会稳定角度看,信息安全主要包括造成重大社会影南,产生重大经济损失的信息安会事件,具体包括(D)方面31、从信息安全涉及内容来看,一般物理安全不包括(A)方面。

A:备份与恢复B:环境安全C:设备安全D:媒体安全32、大数据方法的不准确性,根本原因是(D)。

A:数据量大B:算法变化C:信息遗渴D:以上都正确33、当今时代步入了一个信息化助力社会全方位创新的重要时期,具体包括(D)。

A:云计算B:物联网C:移动互联和人工智能D:以上都是34、互联网新生业态中新兴经济形态包括(B)。

A:网红经济B:平台经济C:粉丝经济D:生态经济以下哪些可以属于智慧城市的范畴(E)。

A:智慧政务B:智慧交通C:智慧医疗D:智慧公共安全E:以上都是36、人类的思维模式不包括哪一种(C)A逻辑思维B:.直观思维C:胡乱思维D:顿悟思维37、信息素养不包括(A)。

A:信息体系B:信息能力C:信息意识D:信息道德38、信息的碎片化导致了(E)的碎片化。

A:时间B:空间C:资源D:结构E:以上都有39、新体采用的技术不包括(D)。

A:数字技术B:网络技术C:移动通信技术D:碎片技术40、曾经,绝大多数的网络设备都来自于思科,同时几乎所有的(E)都由思科掌握。

A:超级核心节点B:国际交换节点C:国际汇聚节点D:互联互通节点E:以上都包括41、下面哪个(C)程序通常与Namenode A在ー个节点启动A: TasktrackerB: DatanodeC: JobtrackerD: secondarynamenode42、Hadoop的作者是(C)A: Martin Fowler B: Kent Beck C: Doug cutting DBILL43、HDFS默认Block Size(C)。

A:16MB:32MC:64MD:128M44、下列哪项通常是集群的最主要瓶颈(D)。

A:内存B:CPUC:网络D:磁盘1/045、发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备:给定最小支持度和(D),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则。

A:最小兴趣度B:最小置信度C:最大支持度D:最小可信度46、个性化推荐系统是建立在海量数据挖据基础上的一种高级商务智能平台,以帮助(C)为其顾客购物提供完全个性化的决策支持和信息服务。

A:公司B:单位C:电子商务网站D:跨国企业47、云计算是对(D)技术的发展与运用。

A:并行计算B:分布式计算C:网格计算D:以上都是48、(B)是[gl提出的用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。

A:GFS B: Mapreduce C: Bittable D: Chubby49、在Bigtable中,(A)主要用来存储子表数据以及一些日志文件。

A: GFS B: Mapreduce C: Sstable D: Chubby50、躁声数据的产生原因主要有(D)A:采集设备有问题B:数据录入过程中产生错误C:数据传输过程出现错误D:以上都有51、下面属于数据集的一般特性的有(D)。

A:维度B:稀疏性C:分辨率D:以上都有52、噪声数据处理的方法主要有(D)。

A:分类B:聚类C:回归D:以上都有53、如下哪些不是最近邻分类器的特点(C)A:它使用具体的训练实例进行预测,不必维护源自数据的模型B:分类一个测试样例开销很大C:最近邻分类器基于全局信息进行预测D:可以生产任意形状的决策边界54、数据挖据的挖据方法包括(乙)A:聚类分析B:回归分析C:神经网络D:决策树算法E:以上都是55、推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(B),推测客户将来可能的购买行为。

A:客户的朋友B:客户过去的购买行为和购买记录C:客户的兴趣爱好D:客户的个人信息56、数据预处理方法主要有(E)A:数据清洗B:数据集成C:数据归约D:数据交换E:以上都是57、大数据环境下的隐私担忧,主要表现为(A)A:个人信息的被识别与暴露B:用户画像的生成C:恶意广告的推送D:病毒入侵58、对线下零售而言,做好大数据分析应用的前提是(C)A:增加统计种类B:扩大营业面积C:增加数据来源D:开展优惠促销59、一切可连,任何数据之间逗辑上都有可能存在联系,这体现了大数据思雄中的(A)A:相关思维B:因果思维C:定量思维D:实验思维60、一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证,这体现了大数据思维维度中的(D) A:相关思维B:因果思维C:定量思维D:实验思维61、下列企业中,最有可能成为典型的数据资产动营商的是(B)A:云计算企业B:电信运营商C:互联网企业D:物联网企业62、下列关于云计算和数据库的说法中,错误的是(A):A:获取样本的代价很高B:获取足够大的样本数据乃至全体数据非常容易C:比抽样调查数据更全面D:比抽样调查更能反映整个群体的特征与规律63、大数据的低耗能存储及高效率计算的要求,需要以下多种技术协同合作(E)A:分布式云存错技术B:高性能并行计算C:多源数据清洗及数据整合技木D:分布式文件系统及分布式并行数据库E:以上都有64、下列演示方式中,不属于传统统计图方式的是(D)A:柱状图B:饼状图C:曲线图D:同络图65、数据、信息、知识三者之同的变化趋势是(B)A:价值递减B:价值递增C:价值先增后减D:价值不交66、下列说法错误的是(C)。

A大数据是一种思维B:大数据不仅仅是数的体量大C:大数据的英文1 arge data D:大数据会带来机器智能67、ENIAC误生于哪一年(A)。

A:1946年B:1938年C:1940年D:1942年68、美特卡尔夫定律主要是将信息网络,指出网终的价值在于网络的互联,联网的节点数与其价值星现(B)方式,联网越多,系统的价值越大A:正比B:指数C:对数D:反比69、下面有关分类算法的准确率,召回率,F1值的描述,错误的是(C)A:准确率是检索出相关文档数与检京出的文档总数的比率,衡量的是检索系统的查准率B:召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率C:正确率、召回率和F值取值都在0和1之间,数值越接近0,查准率或查全率就越高D:为了解决准确率和召回率冲突问題,引入了F1分数70、以下几种模型方法属于判别式模型(Discriminative Model)的有()1)混合高斯模型2)条件随机场模型3)区分度训练)4)隐马尔科夫模型(A)A:2,3B:1,4在HM中,如果已知观察序列和产生观察序列的状态序列,那么可用以下哪种方法直接进行参数估计(D)。

相关文档
最新文档