《大数据模型决策》复习(作业)题
大数据技术概论期末复习题2023-11(附参考答案)(1)
![大数据技术概论期末复习题2023-11(附参考答案)(1)](https://img.taocdn.com/s3/m/0d9e0a01ce84b9d528ea81c758f5f61fb7362880.png)
单项选择题1.下列各项不属于数据的是()oA.文本B.图像C.视频D.印象2.下列各项不属于大数据特征的是()。
A.体量大B.种类多C真实性 D.数据生成慢3.数据异常值的处理方法不包括()。
A.极小值替换B删除 C.忽略 D.视为缺失值进行填补4.下列各项不能用于描述数据集中趋势的是()。
A.方差B.平均数C中位数 D.峰值5.下列各项不属于Hadoop的特点是()。
A存储迅速 B.成本高C计算能力强 D.灵活性强6.在工业网络实时监控系统中,需要连续不断地采集和处理数据。
以下()不属于这种计算模式。
A.在线处理B.实时处理C.流式计算D.批量计算7,下面不是研究数据方法的是()。
A统计学 B.机器学习C心理分析 D.数据挖掘8.下面不属于大数据的处理过程的是()。
A.数据获取B.数据清洗C数据分析 D.数据安全9.下面不属于大数据计算模式的类型的是()。
A.批量计算B.手动计算C流式计算 D.交互式计算10.下列各项属于合规数据的是()oA.非法收集隐私信息数据B.取得使用者同意的个人资料数据C泄露的隐私信息数据 D.垄断数据11.在Had∞p生态系统中,主要负责节点集群的任务调度和资源分配,将存储和计算资源分配给不同应用程序的组件是()oA.HDFSB-MapReduce C.YARN D.Storm12.下列属于图数据的主要特性的是()。
A数据驱动计算 B.不规则问题C高数据访问率 D.以上均是13.可以用来查看数值型变量的分布的可视化方法是()。
A箱线图 B.直方图C小提琴图 D.以上方法均可以14.如果只是研究两个数值变量之间的关系,最常见的可视化方法是()。
A直方图 B.散点图C.饼图 D.折线图15.下列各项不属于批处理系统的特点的是()oA.可以实现实时的分析报告或自动响应B.可以实现无缝扩展以处理峰值数据量或数据请求C.支持数据在不同系统之间进行交换D.支持作业执行状态的监控16.下列各项属于非结构化数据的是()oA.图像B.二维数据表CHTM1文档D.以上均是17.在大数据的处理流程中,()步骤是将数据转化为图形,以更直观的方式展示和表达。
精编2020年最新公需科目《大数据》完整题库(含答案)
![精编2020年最新公需科目《大数据》完整题库(含答案)](https://img.taocdn.com/s3/m/6558f5b584254b35eefd34bf.png)
2020年最新公需科目《大数据》考试题(含答案)一、单选题1.根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C)。
(单选题)A.数据管理人员B.数据分析员C.研究科学家D.软件开发工程师2.下列关于大数据的分析理念的说法中,错误的是(D )。
(单选题)A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据二、多选题3.根据周琦老师所讲,高德交通信息服务覆盖全国主干道路及其它()以上。
A.70%B.50%C.90%D.30%4.根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。
A.2010年B.2006年C.2014年D.2008年5.2015年8月31日,国务院印发了《促进大数据发展行动纲要》。
正确错误6.2012年《全国现代农业发展规划(2011-2015年)》对“农业信息化”作了比较全面的阐述。
正确错误7.大数据能帮助教师改进教学。
利用大数据方法,教师通过学生反馈回来的作业,就可以发现到底是哪些学生并没有真正听懂,进而有针对性地加以辅导。
对8.2011年,()发布《大数据.创新.竞争和生产力的下一个新领域》报告,大数据开始备受关注。
CA.微软公司B.百度公司C.麦肯锡公司D.阿里巴巴公司9.国务院办公厅是在哪一年印发的《关于促进和规范健康医疗大数据应用发展的指导意见》?DA.2014年B.2015年C.2013年D.2016年10.对于大数据而言,最基本.最重要的要求就是减少错误.保证质量。
因此,大数据收集的信息量要尽量精确。
( F)(判断题)是否11.统筹城乡发展,就是要求公共财政向农村倾斜.公共服务向农村覆盖.公共设施向农村延伸。
对12.2015 年,阿里平台完成农产品销售达到 6000 多亿元。
精选最新2020年最新公需科目《大数据》测试版题库(含参考答案)
![精选最新2020年最新公需科目《大数据》测试版题库(含参考答案)](https://img.taocdn.com/s3/m/60e0779efab069dc502201f7.png)
2020年最新公需科目《大数据》考试题(含答案)一、单选题1.下列论据中,能够支撑“大数据无所不能”的观点的是( A)。
(单选题)A.互联网金融打破了传统的观念和行为B.大数据存在泡沫C.大数据具有非常高的成本D.个人隐私泄露与信息安全担忧二、多选题2.对于大数据而言,最基本.最重要的要求就是减少错误.保证质量。
因此,大数据收集的信息量要尽量精确。
( F)(判断题)是否3.宁家骏委员指出,()主导了21世纪。
ACDA.云计算B.移动支付C.大数据D.物联网4.根据周琦老师所讲,进入了阿里巴巴集团之后,高德对大数据的处理和基础架构的能力得到了提升。
√正确错误5.()说明如果联网越多,从介入方式.技术上越来越突破,则网络规模越大.成本越低,网络的成本可能会趋向于零。
A.梅特卡尔夫定律B.摩尔定律C.吉尔德定律D.新摩尔定律6.活字印刷术是由()发明的。
DA.商鞅B.鲁班C.蔡伦D.毕昇7.运用大数据进行大治理要做到()。
ABCD分A.用数据决策B.用数据管理C.用数据说话D.用数据创新8.大数据能帮助教师改进教学。
利用大数据方法,教师通过学生反馈回来的作业,就可以发现到底是哪些学生并没有真正听懂,进而有针对性地加以辅导。
对9.“最为成功的商业运作模式是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这是下列哪个定律的内涵?A.牛顿定律B.麦特卡尔夫定律C.摩尔定律■D.吉尔德定律10.大数据处理流程可以概括为以下哪几步?■A.挖掘■B.采集■C.统计和分析■D.导入和预处理11.2015 年,阿里平台完成农产品销售达到 6000 多亿元。
(判断题 1 分)正确■错误12.以下选项中,不属于大数据对人才能力的要求是A.业务能力B.数学统计能力C.IT 技术能力■D.逻辑思维能力13.治理理论认为,现代社会的发展必然要求公共服务多元化的供给。
对14.大数据的本质是()。
A.挖掘B.联系C.搜集■D.洞察15.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?ABCDA.农作物病虫害监测B.农业精准生产控制C.农田环境监测D.农作物长势苗情监测16.大数据处理流程可以概括为以下哪几步?ABCDA.挖掘B.采集C.统计和分析D.导入和预处理三、论述题17.决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。
最新2020年最新公需科目《大数据》测试题库(含参考答案)
![最新2020年最新公需科目《大数据》测试题库(含参考答案)](https://img.taocdn.com/s3/m/9da112f6a0c7aa00b52acfc789eb172dec639949.png)
2020年最新公需科目《大数据》考试题(含答案)一、单选题1.数据仓库的最终目的是(D )° (单选题)A.收集业务需求建立数据仓库逻辑模型C.开发数据仓库的应用分析D.为用户和业务部门提供决策支持二、多选题2.宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。
©°正确C错误3.2012年,我国农村居民家庭每百户拥有移动电话197.8部。
(判断题1分)分■正确错误46,当今世界四大趋势指的是经济全球化全球城市化.全球信息化.信息智慧化。
(判断题1分)■正确错误47.根据涂子沛先生所讲,数据就是简单的数字。
(判断题1分)正确■错误4.大数据作为一种数据集合,它的含义包括()。
■ A.数据很大B.很有价值■ C.构成复杂■「).变化很快5.“最为成功的商业运作模式是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这是下列哪个定律的内涵?A.牛顿定律B.麦特卡尔夫定律C,摩尔定律■ D.吉尔德定律6.大数据的主要特征表现为()。
ABCE©分A.数据类型多B-处理速度快C.数据容量大D.商业价值高7.林雅华博士指出,网络时代的国家治理必须要借鉴互联网多元向度扁平化.相互竞合的方式进行。
(判断题1分)■正确错误49. 2000年,全国涉农网站超过6000家。
(判断题1分)正确■错误8.以下说法错误的是哪项? QA.大数据是一种思维方式B.大数据不仅仅是讲数据的体量大C.大数据会带来机器智能D.大数据的英文名称是large data9.“ (b)阿里巴巴•贵州年货节”销售额突破8. 5亿元,促进了贵州电子商务加快发展。
A.2015B.2016C.201310.农业农村信息化业务应用深入发展,其业务应用主要表现在哪几个方面?©* A.农业信息资源开发利用水平提高V B.农村电子商务蓬勃兴起V C.农村综合信息服务平台发展迅速17 D.农村电了政务己经基本普及11.下列各项表述中正确的有哪些?⑥得分.0分* A.在网络时代,电子政务的发展刻不容缓,政务微博发声应该成为政府治理的“标配”。
完整版)大数据复习题(答案)
![完整版)大数据复习题(答案)](https://img.taocdn.com/s3/m/d986fe15ec630b1c59eef8c75fbfc77da26997f7.png)
完整版)大数据复习题(答案)1.大数据的起源是互联网。
2.大数据的最明显特点是数据规模大。
3.大数据时代,数据使用的最关键是数据再利用。
4.云计算分层架构不包括Yaas。
5.大数据技术是由___首先提出来的。
6.数据的精细化程度是指颗粒度,越细化的数据,价值越高。
7.数据清洗的方法不包括重复数据记录处理。
8.智能手环的应用开发,体现了传感器的数据采集技术的应用。
9.下列关于数据重组的说法中,错误的是数据的重新生产和采集。
10.美国海军军官___通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中在分析方法上更注重相关分析而不是因果分析。
11.下列关于含___对大数据特点的说法中,错误的是价值密度高。
12.当前社会中,最为突出的大数据环境是互联网。
13.在数据生命周期管理实践中,数据管理和维护是执行方法。
14.下列关于网络用户行为的说法中,错误的是数字轨迹用完即自动删除。
15.下列关于聚类挖掘技术的说法中,错误的是要求同类数据的内容相似度尽可能小。
1.大数据最初来源于互联网。
2.大数据最显著的特点就是数据规模庞大。
3.在大数据时代,数据再利用是最关键的。
4.云计算分层架构不包括Yaas。
5.___首先提出了大数据技术。
6.数据精细化程度指的是颗粒度,数据越精细,价值越高。
7.数据清洗的方法不包括重复数据记录处理。
8.智能手环的应用开发体现了传感器的数据采集技术的应用。
9.数据重组的说法中,错误的是数据的重新生产和采集。
10.美国海军军官___通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中更注重相关分析而不是因果分析。
11.___对大数据特点的说法中,错误的是价值密度高。
12.当前社会中,互联网是最为突出的大数据环境。
13.在数据生命周期管理实践中,数据管理和维护是执行方法。
14.关于网络用户行为的说法中,错误的是数字轨迹用完即自动删除。
最新2020年最新公需科目《大数据》模拟考核题库(含标准答案)
![最新2020年最新公需科目《大数据》模拟考核题库(含标准答案)](https://img.taocdn.com/s3/m/ab4f7f9a910ef12d2bf9e734.png)
2020年最新公需科目《大数据》考试题(含答案)一、选择题1.HDFS 中的 blck 默认保存几份?a)3 份 b)2 份 c)1 份 d)不确定答案.A 默认 3 份2.如果是互联网有瓶颈,可以让集群搭建内网。
每次写入数据都要通过网络(集群是内网),然后还要写入 3 份数据,所以 I 就会打折扣。
二、填空题3.HDFS 默认 Blck Size是64MB。
(填128也正确)三、单选题4.智能健康手环的应用开发,体现了( D)的数据采集技术的应用。
(单选题)A.统计报表B.网络爬虫C.API接口D.传感器5.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B )。
(单选题)A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据6.下列关于数据交易市场的说法中,错误的是( C)。
(单选题)A.数据交易市场是大数据产业发展到一定程度的产物B.商业化的数据交易活动催生了多方参与的第三方数据交易市场C.数据交易市场通过生产数据.研发和分析数据,为数据交易提供帮助D.数据交易市场是大数据资源化的必然产物四、多选题7.Web2.0强调(C)。
A.机构B.单位C.个人D.网站8.下列哪些国家已经将大数据上升为国家战略?ABCDA.英国B.日本C.美国D.法国9.根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。
A.2010年B.2006年C.2014年D.2008年10.建立大数据需要设计一个什么样的大型系统?■A.能够把应用放到合适的平台上■B.能够开发出相应应用■C.能够处理数据■D.能够存储数据11.2015 年,阿里平台完成农产品销售达到 6000 多亿元。
(判断题 1 分)正确■错误12.()年,部分计算机专家首次提出大数据概念。
精选最新2020年最新公需科目《大数据》考核题库(含参考答案)
![精选最新2020年最新公需科目《大数据》考核题库(含参考答案)](https://img.taocdn.com/s3/m/f8f3247859eef8c75fbfb3f1.png)
2020年最新公需科目《大数据》考试题(含答案)一、选择题1.关于 SecndaryNameNde 哪项是正确的?a)它是 NameNde 的热备 b)它对内存没有要求c)它的目的是帮助 NameNde 合并编辑日志,减少 NameNde 启动时间d)SecndaryNameNde 应与 NameNde 部署到一个节点答案.C。
2.下面哪个程序负责 HDFS 数据存储。
a)NameNdeb)Jbtrackerc)Datanded)SecndaryNameNdee)tasktracker答案.C Datande二、填空题3.MapReduce确保每个reducer的输入都是按键排序的。
系统执行排序的过程(即将map 输出作为输入传给reducer)称为shuffle。
三、单选题4.大数据的起源是(C )。
(单选题)A.金融B.电信C.互联网D.公共管理5.数据清洗的方法不包括( D)。
(单)A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理6.下列关于数据重组的说法中,错误的是( A)。
(单选题)A.数据重组是数据的重新生产和重新采集B.数据重组能够使数据焕发新的光芒C.数据重组实现的关键在于多源数据融合和数据集成D.数据重组有利于实现新颖的数据模式创新7.下列关于网络用户行为的说法中,错误的是( C)。
(单选题) A.网络公司能够捕捉到用户在其网站上的所有行为B.用户离散的交互痕迹能够为企业提升服务质量提供参考C.数字轨迹用完即自动删除D.用户的隐私安全很难得以规范保护8.当前社会中,最为突出的大数据环境是(A )。
(单选题) A.互联网B.物联网C.综合国力D.自然资源四、多选题9.“(b)阿里巴巴•贵州年货节”销售额突破8.5亿元,促进了贵州电子商务加快发展。
A.2015B.2016C.2013D.201410.由于有了现代信息技术的支撑,研制一个新型号的航天器,周期缩减到(A)以内。
精选2020年最新公需科目:《大数据》模拟考核题库(含标准答案)
![精选2020年最新公需科目:《大数据》模拟考核题库(含标准答案)](https://img.taocdn.com/s3/m/bb0a02206c175f0e7cd137bd.png)
2020年最新公需科目《大数据》考试题(含答案)一、选择题1.下列哪项通常是集群的最主要瓶颈a)CPU b)网络 c)磁盘Id)内存答案.C 磁盘首先集群的目的是为了节省成本,用廉价的 pc 机,取代小型机及大型机。
小型机和大型机有什么特点?2.cpu 处理能力强二、填空题3.HDFS 默认 Blck Size是64MB。
(填128也正确)三、单选题4.万维网之父是( C)。
(单选题)A.彼得·德鲁克B.舍恩伯格C.蒂姆·伯纳斯-李D.斯科特·布朗四、多选题5.大数据作为一种数据集合,它的含义包括()。
ACDA.数据很大B.很有价值C.构成复杂D.变化很快6.宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。
正确错误7.阿兰·图灵在哪一年提出图灵测试的概念?CA.1952年B.1954年C.1950年D.1955年8.贵州发展大数据的“八个一”建议包括()。
■A.制定一个工作计划.建立一个领导机构■B.培养一批干部.出台一批政策■C.引入一批人才.聚集一批创客■D.谋划一批产业.引进一批项目9.根据涂子沛先生所讲,以下说法正确的有哪些?ABCD分A.数据垃圾对商业公司是一个挑战B.个人要把数据当做自己的遗产C.中国社会迟早要面临数据遗产问题D.国家要制定合适的法律来规范数据遗产继承的问题10.根据周琦老师所讲,高德交通信息服务覆盖全国主干道路及其它()以上。
DA.90%B.70%C.30%D.50%11.云计算就是软件在云端无所不在.无限强大的计算,也叫网络化计算或网格计算。
(判断题 1 分)■正确错误 60.根据周琦老师所讲,高德地图使用大数据能进行小路的识别。
(判断题 1 分)分■正确错误12.云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。
ADA.分布式B.密闭式C.密集式D.共享式13.根据周琦老师所讲,高德交通信息服务覆盖全国高速(B)以上。
大数据技术期末复习题库
![大数据技术期末复习题库](https://img.taocdn.com/s3/m/2270b445cd7931b765ce0508763231126edb770c.png)
大数据技术期末复习题库一、选择题1. 大数据的4V特性包括:A. Volume(体量)、Variety(种类)、Velocity(速度)、Value(价值)B. Volume(体量)、Variety(种类)、Veracity(真实性)、Value(价值)C. Volume(体量)、Variety(种类)、Velocity(速度)、Veracity(真实性)D. Volume(体量)、Variety(种类)、Veracity(真实性)、Value(价值)2. Hadoop生态系统中,用于数据存储的是:A. HiveB. HBaseC. Hadoop Distributed File System (HDFS)D. Pig3. 下列哪个不是大数据技术中常用的数据处理框架?A. MapReduceB. SparkC. HadoopD. SQL Server4. 在大数据环境下,用于实时数据流处理的技术是:A. HiveB. StormC. PigD. HBase5. 以下哪个是大数据技术中的数据挖掘过程?A. 数据清洗B. 数据抽取C. 数据转换D. 数据加载二、简答题1. 简述大数据技术与传统数据库技术的区别。
2. 描述Hadoop生态系统中MapReduce的工作机制。
3. 解释什么是数据仓库以及它在大数据中的作用。
4. 阐述Spark与Hadoop MapReduce相比的优势。
5. 描述大数据技术在商业智能(Business Intelligence, BI)中的应用。
三、论述题1. 论述大数据技术在电子商务领域的应用及其带来的变革。
2. 分析大数据技术在社交媒体分析中的作用及其对市场策略的影响。
3. 探讨大数据技术在医疗健康领域的应用及其潜在的挑战。
四、案例分析题1. 假设你是一家电子商务公司的大数据分析师,请你根据该公司的业务需求,设计一个大数据解决方案来优化库存管理和客户服务。
2. 针对一家在线视频流媒体服务公司,分析如何利用大数据技术来提高用户体验和广告投放的精准度。
大数据复习题(答案)
![大数据复习题(答案)](https://img.taocdn.com/s3/m/9dfcffe89fc3d5bbfd0a79563c1ec5da51e2d676.png)
大数据复习题(答案)一、单选题1、大数据的起源是(B)。
A:金融B:互联网C:电信D:公共管理2、大数据的最明显特点是(B)。
A:数据类型多样B:数据规模大C:数据价值密度高D:数据处理速度快3、大数据时代,数据使用的最关键是(D)。
A:数据收集B:数据存储C:数据分析D:数据再利用4、云计算分层架构不包括(D)。
A: Iaas B: Paas C: Saas D: XXX5、大数据技术是由(C)公司首先提出来的。
6、数据的精细化程度是指(C),越细化的数据,价值越高。
A:规模B:活性C:颗粒度D:关联性7、数据清洗的方法不包括(C)A:噪声数据清除B:一致性检查C:重复数据记录处理D:缺失值处理智能手环的应用开发,体现了(C)的数据采集技术的应用。
A:网络爬虫B:API接口C:传感器D:统计报表9、下列关于数掲重组的说法中,错误的是(A)。
A:数据的从头出产和收罗B:能使数据焕发新的光芒C:关键在于多源数据的融会和集成D:有利于新的数据形式创新10、美国海军军官XXX通过对前人航海日志的分析,绘制考了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B)。
A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析结果上更追究效率而不是绝对正确D:在数据范围上强调相对数据而不是绝对数据11、下列关于含XXX对大数据特点的说法中,错误的是(D)A:数据范围大B:数据类型多C:处理速度快D:价值密度高12、当前社会中,最为突出的大数据环境是(A)A:互联网B:自然环境C:综合国力D:物联网13、在数据生命周期管理实践中,(B)是执行方法。
A:数据存储和各份规范B:数据管理和保护C:数据价值发觉和利用D:数据利用开发和管理14、下列关于网络用户行动的说法中,错误的是(C)。
A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互XXX能够为企业晋升效劳质量提供参C:数字轨迹用完即主动删除D:用户的隐私安全很难得以规范保护15、下列关于聚类挖报技术的说法中,错误的是(B)。
新版精编《大数据》完整考题库500题(含答案)
![新版精编《大数据》完整考题库500题(含答案)](https://img.taocdn.com/s3/m/a13d4ccaaef8941ea76e056b.png)
大数据考试试题题库500题[含答案]一、选择题1.大数据作为一种数据集合,它的含义包括(acd )。
(多选题3分)得分.3分A.数据很大B.很有价值C.构成复杂D.变化很快2.内存够大,所以集群的瓶颈不可能是 a 和 d3.大数据仅仅是指数据的体量大。
(判断题1分)正确错误1 得分.1分4.下列哪些国家已经将大数据上升为国家战略?abcd(多选题3分)得分.3分A.英国B.日本C.美国D.法国5.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。
(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理6.建立大数据需要设计一个什么样的大型系统?abcd(多选题3分)得分.3分A.能够把应用放到合适的平台上B.能够开发出相应应用C.能够处理数据D.能够存储数据7.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是abcd(多选题3分)得分.3分A.从柜台式管理走向全天候管理B.从粗放化管理走向精细化管理C.从被动反应走向主动预见型管理D.从单兵作战走向联合共享型管理8.20世纪中后期至今的媒介革命,以(acd )的出现为标志。
(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化9.医疗领域如何利用大数据?acd(多选题3分)得分.0分A.临床决策支持B.个性化医疗C.社保资金安全D.用户行为分析10.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?abcd(多选题3分)得分.3分A.农作物病虫害监测B.农业精准生产控制C.农田环境监测D.农作物长势苗情监测11.贵州发展大数据的“八个一”建议包括(ab;得分.3分;A.制定一个工作计划.建立一个领导机构B.培养 D.中央网络安全和信息化领导小组组长是李克强。
12.下列各项表述中正确的有哪些?ad(多选题3分)得分.0分A.我国中央网络安全和信息化领导小组宣告成立是在2013年。
大数据基础复习题与答案
![大数据基础复习题与答案](https://img.taocdn.com/s3/m/238dc452f6ec4afe04a1b0717fd5360cba1a8d39.png)
大数据基础复习题与答案1.常见的数据的类型包括().A. 文本(正确答案)B. 图片(正确答案)C. 模型D .音频(正确答案)E. 视频(正确答案)2.更适应大数据时代的数据库类型是().A. 层次数据库B. 网状数据库C. 关系型数据库D. NoSQL数据库(正确答案)3.目前主流的数据库是()A. 层次数据库B. 网状数据库C. 关系型数据库(正确答案)D. NoSQL数据库3.关于数据的使用和管理,下面正确的是()A. 想要使用数据,必须先进行数据清洗,将数据变成一个可用的状态(正确答案)B. 有些初始数据的质量不高,比如数据缺失、语意模糊,因此需要数据清洗(正确答案)C. 进行数据管理时,关系型数据库更擅长存储非结构化数据D. 现代社会产生的大部分数据实际上是非结构化数据。
(正确答案)4.关于数据分析,下面说法正确的是()A. 数据分析需要借助数据挖掘和机器学习的相关算法(正确答案)B. 数据分析不需要用到大数据处理技术C. 数据分析需要构建统计模型(正确答案)D. 利用数据可视化技术可以将数据分析的结果更清晰地展示(正确答案)5.数据爆炸的时代对科学研究提出的挑战包括下面哪些()。
A. 需要更低成本的、能更快响应的大规模分布式存储(正确答案)B. 需要更加及时的大数据处理能力(正确答案)C. 需要更多的数据用于数据价值的挖掘D. 需要更加高效的数据分析工具(正确答案)6. 数据增速越来越快的原因在于?()A. 接入网络的设备越来越多(正确答案)B. 单条数据的所携带的信息也越来越多C. 用户越来越积极地参与到主动生产内容和数据的环节(正确答案)D. 物联网中的设备源源不断产生数据(正确答案)7第三次信息化浪潮的到来的标志是()。
A. 个人计算机的普及B. 互联网的普及和发展C. 人工智能时代的到来D. 云计算、大数据、物联网的快速发展(正确答案)8.华大基因公司2017年产出的数据达到1EB(艾字节)。
精选新版2020年最新公需科目:《大数据》模拟题库(含答案)
![精选新版2020年最新公需科目:《大数据》模拟题库(含答案)](https://img.taocdn.com/s3/m/a7749e0027d3240c8447ef62.png)
2020年最新公需科目《大数据》考试题(含答案)一、选择题1.HDFS 中的 blck 默认保存几份?a)3 份 b)2 份 c)1 份 d)不确定答案.A 默认 3 份二、单选题2.当前社会中,最为突出的大数据环境是(A )。
(单选题) A.互联网B.物联网C.综合国力D.自然资源3.在数据生命周期管理实践中,( B)是(单选题)A.数据存储和备份规范B.数据管理和维护C.数据价值发觉和利用D.数据应用开发和管理4.当前社会中,最为突出的大数据环境是(A )。
(单选题) A.互联网B.物联网C.综合国力D.自然资源三、多选题5.Web2.0强调(C)。
A.机构B.单位C.个人D.网站6.下列选项中,属于贵州发展大数据的先天优势的是()。
ABCDA.空气清新B.远离地震带C.气候凉爽D.电力资源充沛7.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。
√正确错误8.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。
√正确错误9.大数据元年是指()。
CA.2012年B.2011年C.2013年D.2010年10.国务院办公厅是在哪一年印发的《关于促进和规范健康医疗大数据应用发展的指导意见》?DA.2014年B.2015年C.2013年D.2016年11.2012年全国各城市支付宝人均支出排名中,位居第一位的是()CA.嘉兴市B.杭州市C.嘉义市D.高雄市12.国务院在哪一年印发了《促进大数据发展行动纲要》?AA.2015年B.2014年C.2016年D.2013年13.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?■A.农作物病虫害监测■B.农业精准生产控制■C.农田环境监测■D.农作物长势苗情监测14.云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。
■A.分布式B.密闭式C.密集式■D.共享式15.2015年,贵州全省大数据服务器规模为100余万台,规划建设服务器规模1000万台。
《大数据导论》复习资料
![《大数据导论》复习资料](https://img.taocdn.com/s3/m/6417362233d4b14e84246895.png)
《大数据导论》课程期末复习资料《大数据导论》课程讲稿章节目录:第1章大数据概述(1)大数据的概念(2)大数据的特征(3)大数据的数据类型(4)大数据的技术(5)大数据的应用第2章大数据采集与预处理(1)大数据采集(2)大数据预处理概述(3)数据清洗(4)数据集成(5)数据变换(6)数据规约第3章大数据存储(1)大数据存储概述(2)数据存储介质(3)存储系统结构(4)云存储概述(5)云存储技术(6)新型数据存储系统(7)数据仓库第4章大数据计算平台(1)云计算概述(2)云计算平台(3)MapReduce平台(4)Hadoop平台(5)Spark平台第5章大数据分析与挖掘(1)大数据分析概述(2)大数据分析的类型及架构(3)大数据挖掘(4)大数据关联分析(5)大数据分类(6)大数据聚类(7)大数据分析工具第6章大数据可视化(1)大数据可视化概述(2)大数据可视化方法(3)大数据可视化工具第7章社交大数据(1)社交大数据(2)国内社交网络大数据的应用(3)国外社交网络大数据的应用第8章交通大数据(1)交通大数据概述(2)交通监测应用(3)预测人类移动行为应用第9章医疗大数据(1)医疗大数据简介(2)临床决策分析应用(3)医疗数据系统分析第10章大数据的挑战与发展趋势(1)大数据发展面临的挑战(2)大数据的发展趋势一、客观部分:(单项选择、多项选择)(一)、单项选择1.以下不是NoSQL数据库的是()A.MongoDBB。
HBaseC.CassandraD。
DB2★考核知识点:NoSQL与NewSQL主流系统参考讲稿章节:3.7附1.1。
1(考核知识点解释):目前市场上主要的NoSQL数据存储工具有:BigTable、Dynamo 、Hbase、MongoDB、CouchDB、Hypertable还存在一些其他的开源的NoSQL数据库,Neo4j、Oracle Berkeley DB、Apache Cassandra等另外,NewSQL数据库。
大数据复习题(答案)
![大数据复习题(答案)](https://img.taocdn.com/s3/m/d6fcf032f02d2af90242a8956bec0975f465a46e.png)
大数据复习题(答案)大数据复习题一、数据存储与处理1.数据存储1.1.什么是数据存储?答:数据存储是将数据保存在计算机或其他存储介质中,以便日后进行访问和检索。
1.2.数据存储的常见方式有哪些?答:常见的数据存储方式包括关系型数据库、非关系型数据库、文件系统、分布式文件系统等。
1.3.什么是关系型数据库?答:关系型数据库是基于关系模型的数据库,其中数据以表格的形式进行存储,并且表格之间存在关联关系。
1.4.什么是非关系型数据库?答:非关系型数据库是指不使用关系模型的数据库,其中数据以键值对、文档、列族等形式进行存储。
1.5.什么是文件系统?答:文件系统是操作系统用来管理、存储和检索文件的一种方法,可以将文件组织成层次结构,方便用户访问和管理。
1.6.什么是分布式文件系统?答:分布式文件系统是一个由多台计算机组成的文件系统,存储在不同计算机上的文件可以在整个系统中共享和访问。
2.数据处理2.1.什么是数据处理?答:数据处理是指对原始数据进行整理、分析、计算和转化的过程,以便得到有意义的结果。
2.2.数据处理的常见方式有哪些?答:常见的数据处理方式包括数据清洗、数据转换、数据聚合、数据挖掘等。
2.3.什么是数据清洗?答:数据清洗是指对原始数据进行去重、纠错、填充空值等预处理操作,以提高数据的质量和准确性。
2.4.什么是数据转换?答:数据转换是指将数据从一种格式或结构转变为另一种格式或结构,以满足特定的需求。
2.5.什么是数据聚合?答:数据聚合是指将多个数据集合并为一个数据集,以便进行统计分析和处理。
2.6.什么是数据挖掘?答:数据挖掘是指从大量的数据中提取隐藏在其中的有用信息和模式,以支持决策和预测。
二、数据分析与挖掘1.数据分析1.1.什么是数据分析?答:数据分析是指对收集到的数据进行探索和解释,以发现数据背后的规律和趋势。
1.2.数据分析的常用工具有哪些?答:常用的数据分析工具包括Excel、Python、R等。
大数据预处理 复习题(附参考答案)
![大数据预处理 复习题(附参考答案)](https://img.taocdn.com/s3/m/f84f648d5ebfc77da26925c52cc58bd6318693bd.png)
大数据预处理复习题(一)单选题1.下列关于缺失值的形式的说法中,正确的是()oA.PythOn中默认的缺失值形式为NAB.PandaS中默认的缺失值形式为NaNC.PythOn中默认的缺失值形式为NU1ID.PandaS中默认的缺失值形式为空字符串(〃〃)2.下列表述中,正确的是()oA.对字符串型变量的缺失值,需要使用众数进行填补。
B.对于缺失值,最简单的处理方法是使用均值进行填补。
C.完全变量指的包含缺失值的变量。
D.在调查过程中,因被调查者拒绝回答敏感问题而造成的数据缺失,属于人为原因。
3.关于日期时间型数据,下列说法正确的是()oA.在计算机系统中,日期时间型数据是以文本形式存储的。
B.在计算机系统中,日期时间型数据是以数值形式存储的。
C.在计算机系统中,日期时间型数据是以因子形式存储的。
D.在计算机系统中,日期时间型数据是以缺失值形式存储的。
4.下图是某分类变量各类别计数分布的箱线图,从图中可知()oA.少部分分类计数很低。
8.该变量类别很少,可以清晰的用箱线图展示各类别的频数。
C.这个变量存在大量低频分类。
D.绝大多数分类计数很高。
5.下列关于数据预处理的表述中,不正确的是()oA.具备专业经验的数据科学家可以在数据分析前忽略数据预处理。
B.数据预处理是在数据采集后,分析前这段时间里对数据进行的处理操作。
C.数据预处理的效果与数据分析顺利与否直接相关。
D.数据预处理往往占据数据分析项目总工作量的60%以上。
6.下列数据特征缩放的公式中,正确的是()oA.数据中心化公式为:X sca1ed=8.数据标准化公式为:X sca1ed=X-X oC.Max-ABS缩放公式为:XSwed=而匚。
∣λImaxD.Robust缩放公式为:X sca1ed=x-Me^ian o7.下列关于相关系数的表述中,正确的是()oA.PearSon相关系数的值在[0,1]之间分布。
B.SPean11an相关系数的值在[T,1]之间分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《数据模型决策》复习(作业)题二、分析、建模题1、(广告策划)一家广告公试司想在电视、广播及杂志做广告,其目的是尽可能多地招徕顾客。
下面是市场调查结果:这家公司希望广告费用不超过800(千元),还要求:(1)至少有二百万妇女收看广告;(2)电视广告费用不超过500(千元);(3)电视广告白天至少播出3次,最佳时间至少播出2次;(4)通过广播、杂志做的广告各重复5到10次。
试建立该问题的数学模型,并用软件求解。
解:设变量X1, X 2, X 3, X 4为白天、最佳时间、无线电广播、杂志次数目标函数maxZ=400 X1+900X2+500 X 3+200 X 4约束条件s.t40 X 1+75 X 2+30 X 3+15 X 4≤80040X1+400X2+200X3+100X4≥80040X1+75X2≤500X1≥3X2≥2,X3≥5X3≤10X4≥5X4≤10X i≥0 i=1,2,3,4软件求解2、(指派问题)分配甲、乙、丙、丁四人分别去完成A、B、C、D 四项工作。
已知每人完成各项工作的时间如下表所示。
规定每项工作只能由一人去单独完成,每个人最多承担一项工作。
如何分配工作,使完成四项工作总的耗时为最少?建立线性规划数学模型(不求解)。
解:设变量X11,X12,X13,X14为甲参加1,2,3,4工作,X 21,X22,X23,X24为乙参加1,2,3,4工作,X31,X32,X33,X34为丙参加1,2,3,4工作,X41,X42,X43,X44为丁参加1,2,3,4工作目标函数maXZ= 10X11+5X12+15X13, +20X14 +2X21+10X22+5X23+15X24+3X31+15X32+14X33+13X34 +15X41+2X42+7X43+6X44约束条件s.tX11+X12+X13, +X14=1X21+X22+X23+X24=1X31+X32+X33+X34=1X41+X42+X43+X44=1X i,j≥0 i=1,2,3,4 j=1,2,3,4软件求解3、昼夜运营的公交线路每天各时间区段内所需要的司机和乘务员人数如下表:设司机和乘务员分别在各时间区段一开始时上班,并连续工作8小时,问该公交线路至少配备多少名司机和乘务人员。
建立该问题的线性规划数学模型,并用软件求解。
解:设变量X1,X 2,X 3,X 4,X 5,X 6为班次人数目标函数minZ= X1+X 2+X 3+X 4+X 5+X 6约束条件s.tX1+X 6≥60X 1+X2≥70X 2+X 3≥60X 3+X 4≥50X 4+X 5≥20X 5+X 6≥30X i ≥0 i=1,2,3,4,5,64、一家百货商场对售货员的需求经过统计分析如下表所示。
为了保证售货人员充分休息,售货人员每周工作5天,休息两天,并要求休息的两天是连续的。
问应该如何安排售货人员的作息,既满足工作需要,又使配备的售货人员的人数最少?用软件求解。
解:设X i i=1,2,3,4,5,6,7为星期一至星期天每天所需休息人数,建立数学模型目标函数:Min X1 + X2 + X3 + X4 + X5 + X6 + X7约束条件s.tX1 + X2 + X3 + X4 + X5≥31X2 + X3 + X4 + X5 + X6≥15X3 + X4 + X5 + X6 + X7≥24X4 + X5 + X6 + X7+ X1 ≥25X5 + X6 + X7 + X1 + X2 ≥19X6 + X7+ X1 + X2 + X3 ≥31X7+ X1 + X2 + X3 + X4≥28X i≥0i=1,2,3,4,5,6,75、(投资问题)某部门现有资金200万元,今后五年内考虑给以下的项目投资。
某公司在今后五年内考虑给以下的项目投资。
已知:项目A:五年内每年初可购买公债,于当年末归还,并加利息6%,此项投资金额不限。
项目B:从第一年到第四年每年年初需要投资,并于次年末回收本利115%,但要求第一年投资最低金额为40万元,第二、三、四年不限;项目C:第三年初需要投资,到第五年末能回收本利128%,但规定最低投资金额为30万元,最高金额为50万元;项目D:第二年初需要投资,到第五年末能回收本利140%,但规定其投资额或为10万元的整数倍,最高金额为40万元。
据测定每万元每次投资的风险指数如右表:a)应如何确定这些项目的每年投资额,使得第五年年末拥有资金的本利金额为最大?b)应如何确定这些项目的每年投资额,使得第五年年末拥有资金的本利在280万元的基础上使得其投资总的风险系数为最小?解:a)确定决策变量:连续投资问题设X i,j≥0 i=1,2,3,4 ,5 j=1,2,3,4 表示第i年初投资于A(j=1), B(j=2), C(j=3), D(j=4)项目金额。
建立如下决策变量约束条件s.t.第一年A,B项目年未可收回投资,故第一年全部资金投入,有X11+ X12=200第二年B次年收回投资,故第二年年初资金为1.06 X11,有X21+ X22+ X24=1.06 X11第三年年初资金为1.06 X21+1.15 X12,有X31+ X32+ X33=1.06 X21+1.15 X12第四年年初资金为1.06 X31+1.15 X22,有X41+ X42 =1.06 X31+1.15 X22第五年年初资金为1.06 X41+1.15 X32,有X51 =1.06 X41+1.15 X22B,C,D投资限制:X12≥40X33≥30X33≤50X24≤40X24=10y y=1,2,3,4X i,j≥0 i=1,2,3,4 ,5 j=1,2,3,4目标函数及模型MaxZ=1.06 X51+1.15 X42+1.28 X33+1.4 X32约束条件s.tX11+ X12=200X21+ X22+ X24=1.06 X11X31+ X32+ X33=1.06 X21+1.15 X12X41+ X42 =1.06 X31+1.15 X22X51 =1.06 X41+1.15 X22X12≥40X33≥30X33≤50X24≤40X24=10y y=1,2,3,4X i,j≥0 i=1,2,3,4 ,5 j=1,2,3,4b)所设变量与问题a)同,目标函数为风险最小,有MinZ= X11+ X21+ X31+ X41+X51+ 2.5(X12+X22+ X32+ X42)+ 4X33+5.5X24 增加约束条件,使得第五年年末拥有资金的本利在280万元,1.06 X51+1.15 X42+1.28 X33+1.4 X32≥280目标函数MinZ= X11+ X21+ X31+ X41+X51+ 2.5(X12+X22+ X32+ X42)+ 4X33+5.5X24约束条件s.tX11+ X12=200X21+ X22+ X24=1.06 X11X31+ X32+ X33=1.06 X21+1.15 X12X41+ X42 =1.06 X31+1.15 X22X51 =1.06 X41+1.15 X221.06 X51+1.15 X42+1.28 X33+1.4 X32≥280X12≥40X33≥30X33≤50X24≤40X24=10y y=1,2,3,4X i,j≥0 i=1,2,3,4 ,5 j=1,2,3,46、(目标规划)一工艺品厂商手工生产某两种工艺品A、B,已知生产一件产品A需要耗费人力2工时,生产一件产品B需要耗费人力3工时。
A、B产品的单位利润分别为250元和125元。
为了最大效率地利用人力资源,确定生产的首要任务是保证人员高负荷生产,要求每周总耗费人力资源不能低于600工时,但也不能超过680工时的极限;次要任务是要求每周的利润超过70000元;在前两个任务的前提下,为了保证库存需要,要求每周产品A和B的产量分别不低于200和120件,因为B 产品比A产品更重要,不妨假设B完成最低产量120件的重要性是A完成200件的重要性的1倍。
如何安排生产,并用软件求解。
目标规划中引入偏差变量,其作用是允许约束条件不被精确满足。
解:本题有3个不同优先权的目标,用P1,P2,P3表示从高到低的优先权。
对应P1有两个目标,每周总耗费人力资源不能低于600工时,但也不能超过680工时的极限;对应P2,有一个目标,次要任务是要求每周的利润超过70000元;对应P3有一个目标,为了保证库存需要,要求每周产品A和B的产量分别不低于200和120件目标线性规划Min P1(d1+)+P1(d2-)+P2(d3-)+ P3(d4-)+P3(2d5-)s.t.2 x1+3 x2-d1++ d1-=6802 x1+3 x2- d2++d2-=600250 x1+125 x1- d3-+d3+=7000x1–d4++d4-=200x2–d5++d5-=120x1, x2,d1+,d1,d2+,d2-,d3-,d3+,d4+,d4-,d5+,d5-≥0三、求解题1、设某商业银行有10亿元资金,其中一部分用于贷款(L),贷款利率6%(不易流通),另一部分用于购买证券,证券利率4%(易流通)。
银行要求在下列约束下使总盈利最大:(1)流动投资至少保持在25%;(2)老客户的贷款额至少为8000万元。
建立该问题的数学模型,并用图解法求解。
MaxZ=0.06 x1+0.04x2s.t.x1+x2≤10x1≥0.8x2≥0.25(x1+x2)x1,x2≥02、表1-表2分别给出了各产地和各销地的产量和销量,以及相应的单位运价。
(1)建立该运输问题的数学模型;(2)试用软件求最优解。
表1表2产销量平衡x ij i=1,2,3 j=1,2,3,4表示从产地i到销地j 则有产地A1 到销地B1, B2, B3, B4运价为:4 x11+ x12+4 x13+6 x14产地A2 到销地B1, B2, B3, B4运价为:3 x21+2 x22+5 x23+0 x24产地A3 到销地B1, B2, B3, B4运价为:1 x31+7 x32+5 x33+1 x34 s.t.x11+ x12+x13+x14 =8x21+ x22+x23+x24 =8x31+ x32+x33+x34=4x11 + x21 +x31 =6x12 + x22 + x32 =5x13 +x23 +x33=6x 14 + x 24 + x 34=3 x ij ≥0 i=1,2,3 j=1,2,3,4[例题]:在一项关于软塑料管的实用研究中,工程师们想估计软管所承受的平均压力。
他们随机抽取了9个压力读数,样本均值和标准差分别为3.62kg 和0.45。