大数据技术及应用题库

合集下载

大数据技术及应用试题库

大数据技术及应用试题库.大数据技术及应用题库单选题:1从大量数据中提取知识的过程通常称为（A）。

a. .数据挖掘b. .人工智能c. .数据清洗d. .数据仓库2下列论据中，能够支撑“大数据无所不能”的观点的是（A）。

A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是（D）。

a. .收集业务需求b. .建立数据仓库逻辑模型c. .开发数据仓库的应用分析d. .为用户和业务部门提供决策支持4大数据处理技术和传统的数据挖掘技术最大的区别是（A）。

a. .处理速度快（秒级定律）b. .算法种类更多c. .精度更高d. .更加智能化5大数据的起源是（C）。

a. .金融b. .电信c. .互联网d. .公共管理6大数据不是要教机器像人一样思考。

相反，它是（A）。

a. .把数学算法运用到海量的数据上来预测事情发生的可能性b. .被视为人工智能的一部c. .被视为一种机器进修d. .预测与赏罚7人与人之间沟通信息、传递信息的技术，这指的是（D）。

a. .感测技术b. .微电子技术c. .计算机技术d. .通信技术教育资料.8数据清洗的方法不包括（D）。

a. .缺失值处理b. .噪声数据清除c. .一致性检查d. .重复数据记录处理9.下列关于XXX对大数据特点的说法中，错误的是（D）A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高10规模巨大且复杂，用现有的数据处理工具难以获取、整理、管理以及处理的数据，这指的是（D）。

a. .富数据b. .贫数据c. .繁数据d. .大数据a. .新一代信息技术b. .新一代服务业态c. .新一代技术平台d. .新一代信息技术和服务业态12万维网之父是（C）A.XXXC.XXX—XXX.XXX13下列演示方式中，不属于传统统计图方式的是（D）。

A、柱形图B、饼状图C、曲线图D、网络图14当前社会中，最为突出的大数据环境是（A）。

大数据技术与应用考试选择题 64题

1. 大数据的“4V”特征不包括以下哪一项？A. 大量性B. 高速性C. 多样性D. 价值性2. Hadoop的核心组件包括哪些？A. HDFS和MapReduceB. HDFS和YARNC. MapReduce和YARND. HDFS、MapReduce和YARN3. 以下哪个不是NoSQL数据库的类型？A. 键值存储B. 列存储C. 文档存储D. 关系型数据库4. 在Hadoop生态系统中，用于数据仓库和数据分析的工具是？A. HiveB. HBaseC. PigD. Zookeeper5. 以下哪个工具不是用于大数据处理的？A. SparkB. FlinkC. KafkaD. MySQL6. 在数据挖掘中，K-means算法属于哪一类算法？A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法7. 以下哪个是大数据处理框架Spark的核心组件？A. RDDB. DataFrameC. DatasetD. 以上都是8. 在Hadoop中，用于管理集群资源的组件是？A. HDFSB. MapReduceC. YARND. Zookeeper9. 以下哪个是用于实时数据处理的工具？A. StormB. HiveC. PigD. Sqoop10. 在数据仓库中，用于数据抽取、转换和加载的工具是？A. ETLB. OLAPC. OLTPD. BI11. 以下哪个是大数据分析的典型应用场景？A. 社交媒体分析B. 电子商务推荐系统C. 金融风险管理D. 以上都是12. 在Spark中，用于处理结构化数据的API是？A. RDDB. DataFrameC. DatasetD. 以上都是13. 以下哪个是用于大数据存储的分布式文件系统？A. HDFSB. NFSC. CIFSD. FTP14. 在Hadoop中，用于数据处理的编程模型是？A. HDFSB. MapReduceC. YARND. Zookeeper15. 以下哪个是用于大数据实时流处理的框架？A. KafkaB. FlinkC. Spark StreamingD. 以上都是16. 在数据挖掘中，Apriori算法属于哪一类算法？A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法17. 以下哪个是用于大数据查询和分析的工具？A. HiveB. HBaseC. PigD. Zookeeper18. 在Hadoop中，用于分布式协调服务的组件是？A. HDFSB. MapReduceC. YARND. Zookeeper19. 以下哪个是用于大数据批处理的框架？A. SparkB. FlinkC. StormD. Kafka20. 在数据仓库中，用于多维数据分析的工具是？A. ETLB. OLAPC. OLTPD. BI21. 以下哪个是大数据存储的典型应用场景？A. 云存储B. 数据备份C. 数据归档D. 以上都是22. 在Spark中，用于处理非结构化数据的API是？A. RDDB. DataFrameC. DatasetD. 以上都是23. 以下哪个是用于大数据处理的分布式计算框架？A. HadoopB. SparkC. FlinkD. 以上都是24. 在Hadoop中，用于数据存储的编程模型是？A. HDFSB. MapReduceC. YARND. Zookeeper25. 以下哪个是用于大数据实时处理的工具？A. StormB. HiveC. PigD. Sqoop26. 在数据挖掘中，决策树算法属于哪一类算法？A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法27. 以下哪个是用于大数据存储和管理的工具？A. HBaseB. HiveC. PigD. Zookeeper28. 在Hadoop中，用于数据处理的分布式协调服务是？A. HDFSB. MapReduceC. YARND. Zookeeper29. 以下哪个是用于大数据处理的实时流处理框架？A. KafkaB. FlinkC. Spark StreamingD. 以上都是30. 在数据仓库中，用于数据抽取和加载的工具是？A. ETLB. OLAPC. OLTPD. BI31. 以下哪个是大数据分析的典型应用场景？A. 客户行为分析B. 市场趋势分析C. 产品推荐系统D. 以上都是32. 在Spark中，用于处理半结构化数据的API是？B. DataFrameC. DatasetD. 以上都是33. 以下哪个是用于大数据存储的分布式数据库？A. HBaseB. MySQLC. OracleD. SQL Server34. 在Hadoop中，用于数据处理的分布式文件系统是？A. HDFSB. NFSC. CIFSD. FTP35. 以下哪个是用于大数据实时处理的工具？A. StormB. HiveC. PigD. Sqoop36. 在数据挖掘中，随机森林算法属于哪一类算法？A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法37. 以下哪个是用于大数据查询和分析的工具？A. HiveB. HBaseC. PigD. Zookeeper38. 在Hadoop中，用于分布式协调服务的组件是？A. HDFSB. MapReduceC. YARND. Zookeeper39. 以下哪个是用于大数据批处理的框架？A. SparkB. FlinkC. StormD. Kafka40. 在数据仓库中，用于多维数据分析的工具是？B. OLAPC. OLTPD. BI41. 以下哪个是大数据存储的典型应用场景？A. 云存储B. 数据备份C. 数据归档D. 以上都是42. 在Spark中，用于处理非结构化数据的API是？A. RDDB. DataFrameC. DatasetD. 以上都是43. 以下哪个是用于大数据处理的分布式计算框架？A. HadoopB. SparkC. FlinkD. 以上都是44. 在Hadoop中，用于数据存储的编程模型是？A. HDFSB. MapReduceC. YARND. Zookeeper45. 以下哪个是用于大数据实时处理的工具？A. StormB. HiveC. PigD. Sqoop46. 在数据挖掘中，逻辑回归算法属于哪一类算法？A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法47. 以下哪个是用于大数据存储和管理的工具？A. HBaseB. HiveC. PigD. Zookeeper48. 在Hadoop中，用于数据处理的分布式协调服务是？A. HDFSB. MapReduceC. YARND. Zookeeper49. 以下哪个是用于大数据处理的实时流处理框架？A. KafkaB. FlinkC. Spark StreamingD. 以上都是50. 在数据仓库中，用于数据抽取和加载的工具是？A. ETLB. OLAPC. OLTPD. BI51. 以下哪个是大数据分析的典型应用场景？A. 客户行为分析B. 市场趋势分析C. 产品推荐系统D. 以上都是52. 在Spark中，用于处理半结构化数据的API是？A. RDDB. DataFrameC. DatasetD. 以上都是53. 以下哪个是用于大数据存储的分布式数据库？A. HBaseB. MySQLC. OracleD. SQL Server54. 在Hadoop中，用于数据处理的分布式文件系统是？A. HDFSB. NFSC. CIFSD. FTP55. 以下哪个是用于大数据实时处理的工具？A. StormB. HiveC. PigD. Sqoop56. 在数据挖掘中，支持向量机算法属于哪一类算法？A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法57. 以下哪个是用于大数据查询和分析的工具？A. HiveB. HBaseC. PigD. Zookeeper58. 在Hadoop中，用于分布式协调服务的组件是？A. HDFSB. MapReduceC. YARND. Zookeeper59. 以下哪个是用于大数据批处理的框架？A. SparkB. FlinkC. StormD. Kafka60. 在数据仓库中，用于多维数据分析的工具是？A. ETLB. OLAPC. OLTPD. BI61. 以下哪个是大数据存储的典型应用场景？A. 云存储B. 数据备份C. 数据归档D. 以上都是62. 在Spark中，用于处理非结构化数据的API是？A. RDDB. DataFrameC. DatasetD. 以上都是63. 以下哪个是用于大数据处理的分布式计算框架？A. HadoopB. SparkC. FlinkD. 以上都是64. 在Hadoop中，用于数据存储的编程模型是？A. HDFSB. MapReduceC. YARND. Zookeeper答案：1. D2. D3. D4. A5. D6. B7. D8. C9. A10. A11. D12. D13. A14. B15. D16. C17. A18. D19. A20. B21. D22. A23. D24. A25. A26. A27. A28. D29. D30. A31. D32. B33. A34. A35. A36. A37. A38. D39. A40. B41. D42. A43. D44. A45. A46. D47. A48. D49. D50. A51. D52. B53. A54. A55. A56. A57. A58. D59. A60. B61. D62. A63. D64. A。

大数据技术及应用题库

大数据技术及应用题库单选题:1从大量数据中提取知识的过程通常称为（A）。

a..数据挖掘b..人工智能c..数据清洗d..数据仓库2下列论据中，能够支撑“大数据无所不能”的观点的是（A）。

A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是（D）。

a..收集业务需求b..建立数据仓库逻辑模型c..开发数据仓库的应用分析d..为用户和业务部门提供决策支持4大数据处理技术和传统的数据挖掘技术最大的区别是（A）。

a..处理速度快（秒级定律）b..算法种类更多c..精度更高d..更加智能化5大数据的起源是（C）。

a..金融b..电信c..互联网d..公共管理6大数据不是要教机器像人一样思考。

相反，它是（A）。

a..把数学算法运用到海量的数据上来预测事情发生的可能性b..被视为人工智能的一部c..被视为一种机器学习d..预测与惩罚7人与人之间沟通信息、传递信息的技术，这指的是（D）。

a..感测技术b..微电子技术c..计算机技术d..通信技术8数据清洗的方法不包括（D）。

a..缺失值处理b..噪声数据清除c..一致性检查d..重复数据记录处理9.下列关于舍恩伯格对大数据特点的说法中，错误的是（D）A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高10规模巨大且复杂，用现有的数据处理工具难以获取、整理、管理以及处理的数据，这指的是（D）。

a..富数据b..贫数据c..繁数据d..大数据11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的（D）。

a..新一代信息技术b..新一代服务业态c..新一代技术平台d..新一代信息技术和服务业态12万维网之父是（C）A.彼得·德鲁克B.舍恩伯格C.蒂姆·伯纳斯—李D.斯科特·布朗13下列演示方式中，不属于传统统计图方式的是（D）。

大数据技术及应用题库

1从大量数据中提取知识的过程通常称为（ A ）。

a. .数据挖掘b. .人工智能c. .数据清洗d. .数据仓库2下列论据中，能够支撑“大数据无所不能”的观点的是（A）。

A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是（D）。

a. .处理速度快（秒级定律）b. .算法种类更多c. .精度更高d. .更加智能化5大数据的起源是（C）。

a. .金融b. .电信c. .互联网d. .公共管理6大数据不是要教机器像人一样思考。

相反，它是（A ）。

a. .把数学算法运用到海量的数据上来预测事情发生的可能性b. .被视为人工智能的一部c. .被视为一种机器学习d. .预测与惩罚7人与人之间沟通信息、传递信息的技术，这指的是（D）。

a. .感测技术b. .微电子技术c. .计算机技术叮叮小文库d. .通信技术8数据清洗的方法不包括（D ）。

a. .缺失值处理b. .噪声数据清除c. . 一致性检查d. .重复数据记录处理9.下列关于舍恩伯格对大数据特点的说法中，错误的是（D）A. 数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高10规模巨大且复杂，用现有的数据处理工具难以获取、整理、管理以及处理的数据，这指的是（D）oa. .富数据b. .贫数据c. .繁数据d. .大数据11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的（D）oa. .新一代信息技术b. .新一代服务业态c. .新一代技术平台d. .新一代信息技术和服务业态12万维网之父是（C）A. 彼得•德鲁克B.舍恩伯格C.蒂姆•伯纳斯一李D.斯科特•布朗13下列演示方式中，不属于传统统计图方式的是（D）oA、柱形图B、饼状图C、曲线图D、网络图14当前社会中，最为突出的大数据环境是（A）oA、互联网B、物联网C、综合国力D、自然资源叮叮小文库16大数据的起源是（C）。

公需科目-大数据前沿技术及应用-考试与答案(全)

你现时的得分是100！1、下列单位不是数据单位？（）BA、bitB、NBC、GBD、TB2、（）主要承担了搭建大数据平台上层建筑的任务。

BA、数据存储技术B、数据开发技术C、数据计算技术D、数据挖掘技术3、下列哪项不属于商业大数据的类型。

（）DA、传统企业数据B、机器和传感器数据C、社交数据D、电子商务数据4、信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。

凡涉及到这些过程和技术的工作部门，都可称作（）部门。

CA、技术B、研究C、信息D、管理5、以下哪个数据单位最大？（）CA、MBB、KBC、TBD、GB6、大数据技术的战略意义是（）。

CA、掌握庞大的数据信息B、促进互联网和信息行业的发展C、对这些含有意义的数据进行专业化处理D、企业内部，以及企业与供应商、客户、合作伙伴和员工数字化共享所有形式的数据资源7、（）主要利用分布式数据库，或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等。

BA、采集B、统计/分析C、导入 / 预处理D、数据挖掘1、云计算包括有三个部分，分别是（）。

ABCA、基础设施服务B、平台服务C、软件服务D、数据服务2、“大数据”的特点是（）。

ABCDA、数据体量大B、数据类别大C、数据处理速度快D、数据真实性高3、美国哈佛大学的研究小组给出了著名的资源三角形。

包括（）ACDA、信息B、数据C、物质D、能量4、大数据平台的三个重要的技术部分。

ABDA、数据交易技术B、数据交互技术C、数据存储技术D、数据处理技术5、大数据处理流程可以概括为（）。

ABCDA、采集B、导入和预处理C、统计和分析D、数据挖掘6、互连网上出现的海量信息可以划分为三种。

分别为（）。

ABCA、结构化信息B、非结构化信息C、半结构化信息D、特殊化信息1、政府数据资源丰富，应用需求旺盛，政府应该是大数据发展的推动者，不是大数据应用的受益者。

错对错2、电子商务数据属于商业大数据的类型错对错3、大数据或称巨量资料，指的是所涉及的资料量规模巨大到无法透过目前主流软件工具，在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

大数据技术原理与应用(管理学门类)_郑州大学中国大学mooc课后章节答案期末考试题库2023年

大数据技术原理与应用（管理学门类）_郑州大学中国大学mooc课后章节答案期末考试题库2023年1.大数据建模的步骤为参考答案:模型建立-模型训练-模型评估-模型应用2.超级计算机可应用的领域有（）参考答案:防震减灾领域_交通领域_气象预报领域_医药领域3.Hadoop1.0和2.0都具有完善的HDFS HA策略。

参考答案:错误4.下列Amazon的云数据库属于关系数据库的是( )参考答案:Amazon RDS5.Spark的主要特点有（）参考答案:全栈式数据处理_快速高效_快速高效_兼容性高6.下列哪项不是Storm的主要特点（）参考答案:容错性不好7.下列对HBase的理解正确的是参考答案:HBase是针对谷歌BigTable的开源实现_HBase多用于存储非结构化和半结构化的松散数据8.NoSQL数据库的BASE特性是指参考答案:最终一致性_基本可用_软状态9.因为Hadoop有多个副本，所以NameNode不存在单点问题。

参考答案:错误10.决策数据挖掘不包括参考答案:信息挖掘11.Hadoop是一个分布式的、容错的实时计算系统，能够对实时动态的多源异构数据进行实时计算，获得有价值的信息。

参考答案:错误12.MapReduce的主要特点有（）参考答案:易于编程_高容错性_良好的扩展性_适合PB级以上海量数据的离线处理13.一个数据库事务具有ACID是指：原子性，一致性，持久性，隔离性参考答案:正确14.CAP是指参考答案:分区容忍性_可用性_一致性15.分布式架构中的计算机有明显的主/从之分，所有计算机节点都是不对等的。

参考答案:错误16.Pregel是一种基于模型实现的并行图处理系统，搭建了一套可扩展的、有容错机制的平台，提供了一套非常灵活的，可以描述各种各样的图计算，主要用于、、等。

参考答案:BSP、API 、图遍历、最短路径、PageRank计算17.数据资产包括：参考答案:企业内部数据、企业外部数据、企业购买数据18.大数据的发展历程总体上可以划分为4个重要阶段。

大数据技术及应用题库

大数据技术及应用题库单选题:1从大量数据中提取知识的过程通常称为（A）。

a. . 数据挖掘b. . 人工智能c. . 数据清洗d. . 数据仓库2下列论据中，能够支撑“大数据无所不能”的观点的是（A）。

A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是（D）。

a. . 收集业务需求b. . 建立数据仓库逻辑模型c. . 开发数据仓库的应用分析d. . 为用户和业务部门提供决策支持4大数据处理技术和传统的数据挖掘技术最大的区别是（A）。

a. . 处理速度快（秒级定律）b. . 算法种类更多c. . 精度更高d. . 更加智能化5大数据的起源是（C）。

a. . 金融b. . 电信c. . 互联网d. . 公共管理6大数据不是要教机器像人一样思考。

相反，它是（A）。

a. . 把数学算法运用到海量的数据上来预测事情发生的可能性b. . 被视为人工智能的一部c. . 被视为一种机器学习d. . 预测与惩罚7人与人之间沟通信息、传递信息的技术，这指的是（D）。

a. . 感测技术b. . 微电子技术c. . 计算机技术d. . 通信技术8数据清洗的方法不包括（D）。

a. . 缺失值处理b. . 噪声数据清除c. . 一致性检查d. . 重复数据记录处理9. 下列关于舍恩伯格对大数据特点的说法中，错误的是（D）A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高10规模巨大且复杂，用现有的数据处理工具难以获取、整理、管理以及处理的数据，这指的是（D）。

a. . 富数据b. . 贫数据c. . 繁数据d. . 大数据11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的（D）。

a. . 新一代信息技术b. . 新一代服务业态c. . 新一代技术平台d. . 新一代信息技术和服务业态12万维网之父是（C）A. 彼得·德鲁克B. 舍恩伯格C. 蒂姆·伯纳斯—李D. 斯科特·布朗13下列演示方式中，不属于传统统计图方式的是（D）。

《大数据技术原理及应用》题目

大数据技术原理与应用第一卷一:判断题（每小题5分）1:对于大数据而言，最基本、最重要的要求就是减少错误、保证质量。

因此，大数据收集的信息量要尽量精确。

A:对B:错答案：B2:Spark是一个高效的分布式计算系统，它有MapReduce所有优点，同时性能与Hadoop一样高。

A:对B:错答案：B3:信息生命周期管理是据生命周期管理的来源，最早由英国企业提出。

A:对B:错答案：B4:简单随机抽样，是从总体N 个对象中任意抽取n 个对象作为样本，最终以这些样本作为调查对象。

在抽取样本时，总体中每个对象被抽中为调查样本的概率可能会有差异。

A:对B:错答案：B5:大数据预测能够分析和挖掘出人们不知道或没有注意到的模式，确定判断事件必然会发生。

A:对B:错答案：B二:单选题（每小题5分）6:数据清洗的方法不包括______A缺失值处理B噪声数据清除C一致性检查D重复数据记录处理答案：D7:大数据的基本特征不包括______A数据量大B数据类型繁多C处理速度快D价值密度高答案：D8:HDFS中当前block大小为128M，如果当前要上传到HDFS中的文件大小为300M，那么在存储时会分配_______个block进行存储A1 B2 C3 D4答案：C9:下列______程序通常与NameNode在一个节点启动A SecondNameNodeB DataNodeC TaskTrackerD JobTracker答案：D10:配置Hadoop时，JAVA_HOME包含在______配置文件中A hadoop-default.xmlB hadoop-env.shC hadoop-site.xmlD configuration.xs答案：B11:在数据生命周期管理实践中______是执行方法A数据存储和备份规范B数据管理和维护C数据价值发觉和利用D数据应用开发和管理答案：B12:HBase系统基本架构中主服务器Master的作用是______A包含访问HBase的接口，同时在缓存中维护着已经访问过的Region位置信息，用来加快后续数据访问过程B可以帮助选举出一个Master作为集群的总管，并保证在任何时刻总有唯一一个Master在运行C主要负责表和Region的管理工作D是HBase中最核心的模块，负责维护分配给自己的Region，并响应用户的读写请求答案：C13:Hadoop具有特性不包括______A高可靠性B高效性C高可扩展性D低容错性，答案：D14:YARN的http端口默认是______A80 B8080 C 8090 D8088答案：D15:大数据时代，数据使用的关键是______A数据收集B数据存储C数据分析D数据再利用答案：D三:多选题（每小题5分）16:大数据人才整体上需要具备______等核心知识A数学与统计知识B计算机相关知识C马克思主义哲学知识D市场运营管理知识E在特定业务领域的知识答案：ABE17:下列关于数据生命周期管理的核心认识中，正确的是______A数据从产生到被删除销毁的过程中，具有多个不同的数据存在阶段B在不同的数据存在阶段，数据的价值是不同的C根据数据价值的不同应该对数据采取不同的管理策略D数据生命周期管理旨在产生效益的同时，降低生产成本答案：ABC18:数据研究经历了几种范式，包括______A实验B理论C计算D数据答案：ABCD19:按照涉及自变量的多少，可以将回归分析分为______A线性回归分析B非线性回归分析C一元回归分析D多元回归分析答案：CD20:大数据产业发展特点______A规模较大B规模较小C增速较快D增速缓慢E多产业交叉融合答案：ACE第二卷一:判断题（每小题5分）1:HDFS能提供高吞吐量的数据访问，非常适合于大规模数据集上的应用。

大数据技术及应用题库

大数据技术及应用题库单选题:1 从大量数据中提取知识的过程通常称为（A）。

a. . 数据挖掘b. . 人工智能c. . 数据清洗d. . 数据仓库2 下列论据中，能够支撑“大数据无所不能”的观点的是（ A ）。

A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3 数据仓库的最终目的是（D）。

a. . 收集业务需求b. . 建立数据仓库逻辑模型c. . 开发数据仓库的应用分析d. . 为用户和业务部门提供决策支持4 大数据处理技术和传统的数据挖掘技术最大的区别是（A）。

a. . 处理速度快（秒级定律）b. . 算法种类更多c. . 精度更高d. . 更加智能化5 大数据的起源是（ C ）。

a. . 金融b. . 电信c. . 互联网d. . 公共管理6 大数据不是要教机器像人一样思考。

相反，它是（ A ）。

a. . 把数学算法运用到海量的数据上来预测事情发生的可能性b. . 被视为人工智能的一部c. . 被视为一种机器学习d. . 预测与惩罚7 人与人之间沟通信息、传递信息的技术，这指的是（D）。

a. . 感测技术b. . 微电子技术c. . 计算机技术d. . 通信技术8 数据清洗的方法不包括（D）。

a. . 缺失值处理b. . 噪声数据清除c. . 一致性检查d. . 重复数据记录处理9. 下列关于舍恩伯格对大数据特点的说法中，错误的是（D）A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高10规模巨大且复杂，用现有的数据处理工具难以获取、整理、管理以及处理的数据，这指的是（D）。

a. . 富数据b. . 贫数据c. . 繁数据d. . 大数据1大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的（D）。

a. . 新一代信息技术b. . 新一代服务业态c. . 新一代技术平台d. . 新一代信息技术和服务业态12万维网之父是（ C ）A. 彼得·德鲁克B. 舍恩伯格C. 蒂姆·伯纳斯—李D. 斯科特·布朗13下列演示方式中，不属于传统统计图方式的是（D）。

大数据技术和应用课后测试及答案

大数据技术和应用课后测试及答案1. 什么是大数据？大数据是指数据量巨大且类型繁多的数据集合。

它具有三个关键特点：- 大量：大数据集合的规模非常庞大，远远超过传统数据处理方法的承载能力。

- 多样：大数据集合包含各种不同类型的数据，如结构化数据、半结构化数据和非结构化数据。

- 速度快：大数据集合的生成速度非常快，需要高效的处理方法来实时分析和提取价值。

2. 大数据技术有哪些？大数据技术包括以下几个关键技术：- 分布式存储：大数据需要通过分布式存储技术将数据存储在多个节点上，以实现数据的高可用性和高并发访问。

- 分布式计算：大数据处理需要通过分布式计算技术将计算任务分发到多个计算节点上并行处理，加快计算速度。

- 数据挖掘：大数据挖掘技术可以从海量数据中发现隐藏的模式和规律，从而提供洞察和决策支持。

- 机器研究：大数据机器研究技术可以利用大规模数据集来训练模型，并通过模型对未知数据进行预测和分类。

- 实时流处理：大数据实时流处理技术可以对数据流进行实时处理和分析，实现实时反馈和智能决策。

3. 大数据应用领域有哪些？大数据技术在各个领域都有广泛的应用，包括：- 金融：利用大数据技术可以对金融市场进行分析和预测，提高投资决策的准确性和效率。

- 零售：通过分析顾客购买记录和行为数据，可以实现个性化推荐和优化库存管理，提升顾客满意度和销售业绩。

- 医疗保健：大数据技术可以帮助医疗机构对大规模的医疗数据进行分析和挖掘，提供精准的诊断和治疗方案。

- 交通：通过分析交通数据，可以实现交通拥堵预测和智能路况调度，提高交通效率和减少拥堵现象。

4. 大数据技术面临的挑战有哪些？大数据技术在应用过程中面临以下挑战：- 数据隐私保护：大数据涉及大量的个人敏感信息，如何保护数据隐私是一个重要的问题。

- 数据质量问题：大数据集合中可能存在数据错误和重复等质量问题，如何保证数据的准确性和完整性是一个挑战。

- 技术复杂性：大数据技术涉及多个领域的知识和技术，对从业人员的技术能力提出了较高的要求。

大数据技术及应用试题库

大数据技术及应用题库单选题:1从大量数据中提取知识的过程通常称为（A）。

a. . 数据挖掘b. . 人工智能c. . 数据清洗d. . 数据仓库2下列论据中，能够支撑“大数据无所不能”的观点的是（A）。

A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是（D）。

a. . 收集业务需求b. . 建立数据仓库逻辑模型c. . 开发数据仓库的应用分析d. . 为用户和业务部门提供决策支持4大数据处理技术和传统的数据挖掘技术最大的区别是（A）。

a. . 处理速度快（秒级定律）b. . 算法种类更多c. . 精度更高d. . 更加智能化5大数据的起源是（C）。

a. . 金融b. . 电信c. . 互联网d. . 公共管理6大数据不是要教机器像人一样思考。

相反，它是（A）。

a. . 把数学算法运用到海量的数据上来预测事情发生的可能性b. . 被视为人工智能的一部c. . 被视为一种机器学习d. . 预测与惩罚7人与人之间沟通信息、传递信息的技术，这指的是（D）。

a. . 感测技术b. . 微电子技术c. . 计算机技术d. . 通信技术8数据清洗的方法不包括（D）。

a. . 缺失值处理b. . 噪声数据清除c. . 一致性检查d. . 重复数据记录处理9. 下列关于舍恩伯格对大数据特点的说法中，错误的是（D）A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高10规模巨大且复杂，用现有的数据处理工具难以获取、整理、管理以及处理的数据，这指的是（D）。

a. . 富数据b. . 贫数据c. . 繁数据d. . 大数据11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的（D）。

a. . 新一代信息技术b. . 新一代服务业态c. . 新一代技术平台d. . 新一代信息技术和服务业态12万维网之父是（C）A. 彼得·德鲁克B. 舍恩伯格C. 蒂姆·伯纳斯—李D. 斯科特·布朗13下列演示方式中，不属于传统统计图方式的是（D）。

大数据应用技术专题(92分)

大数据应用技术专题（练习一）（92分）1、(单选，4分)第一个提出大数据概念的公司是（）麦肯锡2、(单选，4分)海军人员通过对前人航海日志的分析，绘制了新的航海路线图，标明大风与洋流可能发生的地点。

这一操作体现大数据思维中的（）在分析方法上更注重相关分析而不是因果分析3、(单选，4分)支撑大数据业务的基础是（）数据应用4、(单选，4分)大数据处理流程不包括（）数据业务统计5计算机存储容量单位换算中，错误的是（）1TB=1024MB 6、(单选，4分)大数据起源于（）互联网7、(单选，4分)数据仓库的最终目的是（）为用户和业务部门提供决策支持8、(单选，4分)（）规模巨大且复杂，用现有的数据处理工具难以获取、整理、管理以及处理。

大数据9、(单选，4分)下列对大数据特点的说法中，错误的是（）数据价值密度高10、(单选，4分)大数据应用能够实现一场新的革命，提高综合管理水平的原因不包括（）从精细化管理走向开放式管理11、(单选，4分)医疗健康领域中大数据应用产业不包括（）社保资金安全12、(单选，4分)大数据的最显著特征（）数据规模大13、(单选，4分)假设一种基因同时导致两件事：（1）使人喜欢酗酒，（2）使这个人和肝癌就是（）关系，而酗酒和肝癌是（）因果相关14、(单选，4分)下列关于大数据中计算机存储容量单位的说法中，错误的是（）容纳一个英文字符需要2个字节15、(单选，4分)智能健康手环的应用开发，体现了（）的数据采集技术应用B、传感器16、(单选，4分)当前大数据技术的基础不包括（）关系型数据库17、(单选，4分)当前社会中，最为突出的大数据环境是（）互联网18、(单选，4分)云计算使用信息的存储是一个（）的方式，它会大大地节约网络成本。

分布式19、(单选，4分)下列论据中，能够支撑“大数据无所不能”的观点是（）“互联网+医疗”打破传通的观念和行为20、(单选，4分)大数据时代，数据使用的关键是（）数据再利用21、(单选，4分)医疗健康大数据的基本情况不包括以下哪项（）公共安全数据22、(单选，4分)大数据的本质是（）洞察价值23、(单选，4分)下列关于数据生命周期管理的核心认识中，错误的是（）数据生命周期管理最终关注的是社会效益24、(单选，4分)数据清洗清洗的方法不包括（）重复数据记录处理25、(单选，4分)当前大数据技术的基础是由（）首先提出的谷歌。

大数据技术与数据科学应用考试选择题 62题

1. 大数据的4V特征不包括以下哪一项？A. VolumeB. VelocityC. VarietyD. Value2. 下列哪个不是大数据处理的关键技术？A. HadoopB. SparkC. OracleD. Kafka3. 数据仓库和大数据平台的主要区别在于？A. 数据仓库主要用于实时数据处理B. 大数据平台主要用于批量数据处理C. 数据仓库主要用于结构化数据存储D. 大数据平台主要用于非结构化数据存储4. 下列哪个编程语言最适合用于数据科学？A. JavaB. PythonC. C++D. Ruby5. 在数据分析中，以下哪个步骤通常最先进行？A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集6. 下列哪个工具不是用于数据可视化的？A. TableauB. Power BIC. ExcelD. TensorFlow7. 机器学习中的监督学习与非监督学习的主要区别在于？A. 监督学习需要标签数据B. 非监督学习需要标签数据C. 监督学习不需要数据预处理D. 非监督学习不需要数据预处理8. 下列哪个算法不属于分类算法？A. K-近邻B. 决策树C. 线性回归D. 支持向量机9. 在数据科学项目中，以下哪个角色负责数据清洗和预处理？A. 数据工程师B. 数据分析师C. 数据科学家D. 数据架构师10. 下列哪个不是云计算的服务模型？A. IaaSB. PaaSC. SaaSD. DaaS11. 在Hadoop生态系统中，哪个组件用于数据存储？A. HiveB. HBaseC. PigD. Spark12. 下列哪个不是NoSQL数据库的类型？A. 键值存储B. 文档存储C. 关系数据库D. 图形数据库13. 在数据科学中，以下哪个方法用于处理缺失数据？A. 删除含有缺失值的记录B. 使用平均值填充缺失值C. 使用中位数填充缺失值D. 所有上述方法14. 下列哪个不是数据挖掘的主要任务？A. 分类B. 回归C. 聚类D. 排序15. 在机器学习中，交叉验证的主要目的是什么？A. 提高模型精度B. 防止过拟合C. 增加数据量D. 减少计算时间16. 下列哪个不是数据科学家的主要技能？A. 编程能力B. 统计学知识C. 项目管理能力D. 网络安全知识17. 在数据分析中，以下哪个图表最适合展示时间序列数据？A. 条形图B. 饼图C. 折线图D. 散点图18. 下列哪个不是大数据的主要应用领域？A. 金融B. 医疗C. 教育D. 农业19. 在数据科学中，以下哪个步骤通常最后进行？A. 数据收集B. 数据清洗C. 数据建模D. 数据可视化20. 下列哪个不是数据仓库的主要功能？A. 数据集成B. 数据存储C. 数据分析D. 数据备份21. 在数据科学中，以下哪个方法用于特征选择？A. 主成分分析B. 线性回归C. 决策树D. 聚类分析22. 下列哪个不是数据科学的主要工具？A. RB. PythonC. SQLD. Photoshop23. 在数据分析中，以下哪个步骤通常最先进行？A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集24. 下列哪个不是大数据处理的关键技术？A. HadoopB. SparkC. OracleD. Kafka25. 数据仓库和大数据平台的主要区别在于？A. 数据仓库主要用于实时数据处理B. 大数据平台主要用于批量数据处理C. 数据仓库主要用于结构化数据存储D. 大数据平台主要用于非结构化数据存储26. 下列哪个编程语言最适合用于数据科学？A. JavaB. PythonC. C++D. Ruby27. 在数据分析中，以下哪个步骤通常最先进行？A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集28. 下列哪个工具不是用于数据可视化的？A. TableauB. Power BIC. ExcelD. TensorFlow29. 机器学习中的监督学习与非监督学习的主要区别在于？A. 监督学习需要标签数据B. 非监督学习需要标签数据C. 监督学习不需要数据预处理D. 非监督学习不需要数据预处理30. 下列哪个算法不属于分类算法？A. K-近邻B. 决策树C. 线性回归D. 支持向量机31. 在数据科学项目中，以下哪个角色负责数据清洗和预处理？A. 数据工程师B. 数据分析师C. 数据科学家D. 数据架构师32. 下列哪个不是云计算的服务模型？A. IaaSB. PaaSC. SaaSD. DaaS33. 在Hadoop生态系统中，哪个组件用于数据存储？A. HiveB. HBaseC. PigD. Spark34. 下列哪个不是NoSQL数据库的类型？A. 键值存储B. 文档存储C. 关系数据库D. 图形数据库35. 在数据科学中，以下哪个方法用于处理缺失数据？A. 删除含有缺失值的记录B. 使用平均值填充缺失值C. 使用中位数填充缺失值D. 所有上述方法36. 下列哪个不是数据挖掘的主要任务？A. 分类B. 回归C. 聚类D. 排序37. 在机器学习中，交叉验证的主要目的是什么？A. 提高模型精度B. 防止过拟合C. 增加数据量D. 减少计算时间38. 下列哪个不是数据科学家的主要技能？A. 编程能力B. 统计学知识C. 项目管理能力D. 网络安全知识39. 在数据分析中，以下哪个图表最适合展示时间序列数据？A. 条形图B. 饼图C. 折线图D. 散点图40. 下列哪个不是大数据的主要应用领域？A. 金融B. 医疗C. 教育D. 农业41. 在数据科学中，以下哪个步骤通常最后进行？A. 数据收集B. 数据清洗C. 数据建模D. 数据可视化42. 下列哪个不是数据仓库的主要功能？A. 数据集成B. 数据存储C. 数据分析D. 数据备份43. 在数据科学中，以下哪个方法用于特征选择？A. 主成分分析B. 线性回归C. 决策树D. 聚类分析44. 下列哪个不是数据科学的主要工具？A. RB. PythonC. SQLD. Photoshop45. 在数据分析中，以下哪个步骤通常最先进行？A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集46. 下列哪个不是大数据处理的关键技术？A. HadoopB. SparkC. OracleD. Kafka47. 数据仓库和大数据平台的主要区别在于？A. 数据仓库主要用于实时数据处理B. 大数据平台主要用于批量数据处理C. 数据仓库主要用于结构化数据存储D. 大数据平台主要用于非结构化数据存储48. 下列哪个编程语言最适合用于数据科学？A. JavaB. PythonC. C++D. Ruby49. 在数据分析中，以下哪个步骤通常最先进行？A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集50. 下列哪个工具不是用于数据可视化的？A. TableauB. Power BIC. ExcelD. TensorFlow51. 机器学习中的监督学习与非监督学习的主要区别在于？A. 监督学习需要标签数据B. 非监督学习需要标签数据C. 监督学习不需要数据预处理D. 非监督学习不需要数据预处理52. 下列哪个算法不属于分类算法？A. K-近邻B. 决策树C. 线性回归D. 支持向量机53. 在数据科学项目中，以下哪个角色负责数据清洗和预处理？A. 数据工程师B. 数据分析师C. 数据科学家D. 数据架构师54. 下列哪个不是云计算的服务模型？A. IaaSB. PaaSC. SaaS55. 在Hadoop生态系统中，哪个组件用于数据存储？A. HiveB. HBaseC. PigD. Spark56. 下列哪个不是NoSQL数据库的类型？A. 键值存储B. 文档存储C. 关系数据库D. 图形数据库57. 在数据科学中，以下哪个方法用于处理缺失数据？A. 删除含有缺失值的记录B. 使用平均值填充缺失值C. 使用中位数填充缺失值D. 所有上述方法58. 下列哪个不是数据挖掘的主要任务？A. 分类B. 回归C. 聚类D. 排序59. 在机器学习中，交叉验证的主要目的是什么？A. 提高模型精度B. 防止过拟合C. 增加数据量D. 减少计算时间60. 下列哪个不是数据科学家的主要技能？A. 编程能力B. 统计学知识C. 项目管理能力D. 网络安全知识61. 在数据分析中，以下哪个图表最适合展示时间序列数据？A. 条形图B. 饼图C. 折线图D. 散点图62. 下列哪个不是大数据的主要应用领域？A. 金融C. 教育D. 农业答案1. D2. C3. D4. B5. D6. D7. A8. C9. A10. D11. B12. C13. D14. D15. B16. D17. C18. D19. D20. D21. A22. D23. D24. C25. D26. B27. D28. D29. A30. C31. A32. D33. B34. C35. D36. D37. B38. D39. C40. D41. D42. D43. A44. D46. C47. D48. B49. D50. D51. A52. C53. A54. D55. B56. C57. D58. D59. B60. D61. C62. D这些题目涵盖了大数据技术和数据科学应用的多个方面，包括基本概念、技术工具、数据处理方法、机器学习算法等。

大数据技术及应用题库

《大数据技术及应用题库》一、单选题1、从大量数据中提取知识的过程通常称为（A）。

A、数据挖掘B、人工智能C、数据清洗D、数据仓库2、下列论据中，能够支撑“大数据无所不能”的观点的是（A）。

A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3、数据仓库的最终目的是（D）。

A、收集业务需求B、建立数据仓库逻辑模型C、开发数据仓库的应用分析D、为用户和业务部门提供决策支持4、大数据处理技术和传统的数据挖掘技术最大的区别是（A）。

A、处理速度快（秒级定律）B、算法种类更多C、精度更高D、更加智能化5、大数据的起源是（C）。

A、金融B、电信C、互联网D、公共管理6、大数据不是要教机器像人一样思考。

相反，它是（A）。

A、把数学算法运用到海量的数据上来预测事情发生的可能性B、被视为人工智能的一部C、被视为一种机器学习D、预测与惩罚7、人与人之间沟通信息、传递信息的技术，这指的是（D）。

A、感测技术B、微电子技术C、计算机技术D、通信技术8、数据清洗的方法不包括（D）。

A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理9、下列关于舍恩伯格对大数据特点的说法中，错误的是（D）。

A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高10、规模巨大且复杂，用现有的数据处理工具难以获取、整理、管理以及处理的数据，这指的是（D）。

A、富数据B、贫数据C、繁数据D、大数据11、大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的（D）。

A、新一代信息技术B、新一代服务业态C、新一代技术平台D、新一代信息技术和服务业态12、万维网之父是（C）。

A、彼得·德鲁克B、舍恩伯格C、蒂姆·伯纳斯—李D、斯科特·布朗13、下列演示方式中，不属于传统统计图方式的是（D）。

《大数据技术与应用》考核试题及答案

大数据技术与应用考核试题一、选择题（每小题2分，共20分）1、大数据的定义是（）A. 数据量大B. 数据质量高C. 数据结构复杂D. 数据价值高答案：A2、大数据的特点是（）A. 存储量大B. 运算速度快C. 结构复杂D. 可视化好答案：A3、Hadoop是一个（）A. 数据库B. 操作系统C. 编程语言D. 分布式计算框架答案：D4、MapReduce是一个（）A. 数据库B. 操作系统C. 编程语言D. 分布式计算框架答案：D5、HBase是一个（）A. 关系型数据库B. 非关系型数据库C. 搜索引擎D. 分布式文件系统答案：B二、填空题（每小题2分，共20分）1、Hadoop的核心是________ 和________ 。

答案：HDFS、MapReduce2、MapReduce的两个阶段是________ 和________ 。

答案：Map、Reduce3、HBase是一个________ 的分布式数据库。

答案：非关系型4、Hive是一个________ 的分布式数据仓库。

答案：基于Hadoop5、Spark是一个________ 的分布式内存计算框架。

答案：内存密集型三、问答题（共60分）1、请介绍大数据的定义及特点。

答：大数据是指海量、高速生成和处理的数据，它的特点有存储量大、运算速度快、结构复杂、可视化好。

大数据不仅仅是数量上的海量，还包含了数据的多样性、复杂性和动态性。

大数据可以带来新的商业价值，可以帮助企业做出正确的决策。

2、请介绍Hadoop的特点以及应用场景。

答：Hadoop是一个开源的分布式计算框架，它的特点有：1、可扩展性强，可以通过增加节点来扩展集群的规模；2、容错性强，可以在出现故障时保证数据的安全性和可靠性；3、低成本，使用Hadoop可以节省成本。

Hadoop的应用场景包括：1、大数据存储和分析；2、机器学习和人工智能；3、实时流处理和事件处理；4、图形计算和图形处理。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

大数据技术及应用题库单选题:1从大量数据中提取知识的过程通常称为（A）。

a. . 数据挖掘b. . 人工智能c. . 数据清洗d. . 数据仓库2下列论据中，能够支撑“大数据无所不能”的观点的是（A）。

A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是（D）。

a. . 收集业务需求b. . 建立数据仓库逻辑模型c. . 开发数据仓库的应用分析d. . 为用户和业务部门提供决策支持4大数据处理技术和传统的数据挖掘技术最大的区别是（A）。

a. . 处理速度快（秒级定律）b. . 算法种类更多c. . 精度更高d. . 更加智能化5大数据的起源是（C）。

a. . 金融b. . 电信c. . 互联网d. . 公共管理6大数据不是要教机器像人一样思考。

相反，它是（A）。

a. . 把数学算法运用到海量的数据上来预测事情发生的可能性b. . 被视为人工智能的一部c. . 被视为一种机器学习d. . 预测与惩罚7人与人之间沟通信息、传递信息的技术，这指的是（D）。

a. . 感测技术b. . 微电子技术c. . 计算机技术d. . 通信技术8数据清洗的方法不包括（D）。

a. . 缺失值处理b. . 噪声数据清除c. . 一致性检查d. . 重复数据记录处理9. 下列关于舍恩伯格对大数据特点的说法中，错误的是（D）A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高10规模巨大且复杂，用现有的数据处理工具难以获取、整理、管理以及处理的数据，这指的是（D）。

a. . 富数据b. . 贫数据c. . 繁数据d. . 大数据11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的（D）。

a. . 新一代信息技术b. . 新一代服务业态c. . 新一代技术平台d. . 新一代信息技术和服务业态12万维网之父是（C）A. 彼得·德鲁克B. 舍恩伯格C. 蒂姆·伯纳斯—李D. 斯科特·布朗13下列演示方式中，不属于传统统计图方式的是（D）。

A、柱形图B、饼状图C、曲线图D、网络图14当前社会中，最为突出的大数据环境是（A）。

A、互联网B、物联网C、综合国力D、自然资源15可以对大数据进行深度分析的工具是（C）。

A、浅层神经网络B、ScalaC、深度学习D、MapReduce16大数据的起源是（C）。

A、金融B、电信C、互联网D、公共管理17智慧城市的构建，不包含（C）。

A、数字城市B、物联网C、联网监控D、云计算18大数据的4V特征中的Volume是指（D）。

A、价值密度低B、处理速度快C、数据类型繁多D、数据体量巨大19大数据的4V特征中的Variety是指（C）。

A、价值密度低B、处理速度快C、数据类型繁多D、数据体量巨大20大数据的4V特征中的Velocity是指（B）。

A、价值密度低B、处理速度快C、数据类型繁多D、数据体量巨大21下列关于大数据的分析理念的说法中，错误的是（D）。

A、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析C、在分析效果上更追究效率而不是绝对精确D、在数据规模上强调相对数据而不是绝对数据22大数据技术的战略意义不在于掌握庞大的数据信息，而在于对这些含有意义的数据进行（B）。

A、数据信息B、专业化处理C、速度处理D、内容处理23大数据的核心就是（B）。

A、告知与许可B、预测C、匿名化D、规模化24人与人之间沟通信息、传递信息的技术，这指的是（D）。

A、感测技术B、微电子技术C、计算机技术D、通信技术25大数据的最显著特征是（A）。

A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高28大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的（D）。

A、新一代信息技术B、新一代服务业态C、新一代技术平台D、新一代信息技术和服务业态29 下列关于普查的缺点的说法中，正确的是（A）。

A. 工作量较大，容易导致调查内容有限、产生重复和遗漏现象B. 误差不易被控制C. 对样本的依赖性比较强D. 评测结果不够稳定30 下列关于聚类挖掘技术的说法中，错误的是（B）A不预先设定数据归类类目，完全根据数据本身性质将数据聚合成不同类别B需求同类数据的内容相似度尽可能小C要求不同类数据的内容相似度尽可能小D与分类挖掘技术相似的是，都是要对数据进行分类处理31假设一种基因同时导致两件事情，一是使人喜欢抽烟，二是使这个人和肺癌就是（A）关系，而吸烟和肺癌则是（A）关系。

A因果；相关B相关；因果C并列；相关D因果；并列32下列关于数据交易市场的说法中，错误的是（C）A数据交易市场是大数据产业发展到一定程度的产物B商业化的数据交易活动催生了多方参与的第三方数据交易市场C数据交易市场通过生产数据、研发和分析数据，为数据交易提供帮助D数据交易市场是大数据资源化的必然产物33下列关于计算机存储容量单位的说法中，错误的是（C）A 1KB<1MB<1GBB 基本单位是字节(Byte)C 一个汉字需要一个字节的存储空间D 一个字节能够容纳一个英文字符34当前大数据技术的基础是由（C）首先提出的A微软B百度C谷歌D阿里巴巴35下列国家的大数据发展行动中，集中体现“重视基础，首度先行”的国家是（D）A美国B日本C中国D韩国36可以对大数据进行深度分析的平台工具是（C）A传统的机器学习和数据分析工具B第二代机器学习工具C第三代机器学习工具D未来机器学习工具37智能健康手环的应用开发，体现了（D）的数据采集技术的应用A统计报表B网络爬虫C API接口D传感器38过一系列处理，在基本保持原始数据完整性的基础上，减小数据规模的是（C）A数据清洗B数据融合C数据规约D数据挖掘39制成大数据业务的基础是（A）A数据科学B数据应用C数据硬件D数据人才40面向用户提供大数据一站式部署方案，包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是（A）A大数据解决方案模式B大数据信息分类模式C大数据处理服务模式D大数据资源提供模式41美国海军军官莫里通过对前人航海日志的分析，绘制了新的航海路线图，标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的（B）A在数据基础上倾向于全体数据而不是抽样数据B在分析方法上更注重相关分析而不是因果分析C在分析效果上更追究效率而不是绝对精确D在数据规模上强调相对数据而不是绝对数据42根据不同的业务需求来建立数据模型，抽取最有意义的向量，决定选取哪种方法的数据分析角色人员是（C）A数据管理人员B数据分析员C研究科学家D软件开发工程师43.(D)反映数据的精细化程度，越细化的数据，价值越高。

A规模B活性C关联度D颗粒度44.下列关于数据重组的说法中，错误的是（A）A数据重组是数据的重新产生和重新采集B数据重组能够使数据焕发新的光芒C数据重组实现的关键在于多源数据融合和数据集成D数据重组有利于实现新颖的数据模式创新45 在数据生命周期管理实践中，（B）是执行方法。

A数据存储和备份规范B数据管理和维护C数据价值发觉和利用D数据应用开发和管理46 下列关于网络用户行为的说法中，错误的是（C）A网络公司能够捕捉到用户在其网站上的所有行为B用户离散的交互痕迹能够为企业提升服务质量提供参考C数字轨迹用完即自动删除D用户的隐私安全很难得以规范保护47 Mac OS系统的开发者是（C）A微软公司B惠普公司C苹果公司DIBM公司48 大数据时代，数据使用的关键是（D）A数据收集B数据存储C数据分析D数据再利用49 下列关于数据交易市场的说法中，错误的是（C）A数据交易市场是大数据产业发展到一定程度的产物B商业化的数据交易活动催生了多方参与的第三方数据交易市场C数据交易市场通过生产数据、研发和分析数据，为数据交易提供帮助D数据交易市场是大数据资源化的必然产物50 下列论据中，能够支撑“大数据无所不能”的观点的是（A）A互联网金融打破了传统的观念和行为B大数据存在泡沫C大数据具有非常高的成本D个人隐私泄露与信息安全担忧51数据仓库的最终目的是（D）A收集业务需求B建立数据仓库逻辑模型C开发数据仓库的应用分析D为用户和业务部门提供决策支持52 支撑大数据业务的基础是（B）A数据科学B数据应用C数据硬件D数据人才53、下列关于大数据预测的说法中，错误的是（D）A人类的生活正在被大数据预测深刻改变B预测性分析是大数据最核心的功能C分析从“面向已经发生的过去”转向“面向即将发生的未来”是大数据与传统数据的最大区别D大数据预测则是基本大数据和预测模型去预测过去某件事情的概率54、一切事物及事物运动的状态，不仅销售数据、价格这些客观标准可以形成大数据，甚至连顾客情绪（如色彩、空间的感知等）都可以测得，这体现了大数据思维维度中的（A）A定量思维B相关思维C因果思维D实验思维55、下列国家的大数据发展行动中，坚持原则先行、谨慎发展的国家是（D）A英国B韩国C印度D澳大利亚56、下列论据中，体现“冷眼”看大数据的观点是（B）A互联网金融打破了传统的观念和行为B大数据医疗正在走进平民百姓C数据资产型企业前景光明D个人隐私泄露与信息安全担忧57、下列国家的大数据发展行动中，视大数据为新的自然资源的国家是（D）A中国B韩国C印度D新加坡58、大数据环境下的隐私担忧，主要表现为（A）A个人信息的被识别与暴露B用户画像的生成C恶意广告的推送D病毒侵入59、对线下零售而言，做好大数据分析应用的前提是（C）A增加统计种类B扩大营业面积C增加数据来源D开展优惠促销60、万维网的实施国家是（B）A英国B美国C德国D印度61、一切皆可试，大数据分析的效果好坏，可能通过模拟仿真或者实际运行来验证，这体现大数据思维中的（D）A定量思维B相关思维C因果思维D实验思维62、下列企业中，最有可能成为典型的数据资产运营商的是（D）A物联网企业B互联网企业C云计算企业D电信运营商多选题:1云计算的优势体现在以下哪些方面？（ABCD）a. . 云计算服务更加安全可靠b. . 云计算可以真正实现按需服务c. . 云计算可以有效提高资源利用率d. . 云计算可以大大降低成本和能耗2医疗领域如何利用大数据？（ABCD）a. . 临床决策支持b. . 个性化医疗c. . 社保资金安全d. . 用户行为分析3下列各国大数据发展路径的描述中，对应关系正确的是（ACDE）。

A. 日本：走尖端IT路线B. 英国：视大数据为新的自然资源C. 韩国：重视基础、首都先行D 印度:以IT外包转型为突破口E 澳大利亚:原则先行，谨慎发展4 当前，大数据产业发展的特点是（BCE）A规模较大B规模较小C增速很快D增速缓慢E 多产业交叉融合5 下列关于发数据的说法中，错误的是（AD）A大数据具有体量大、结构单一、时效性强的特征B处理大数据需采用新型计算机架构和智能算法等新技术C大数据的应有注重相关分析而不是因果分析D大数据的应有注重因果分析而不是相关分析E大数据的目的在于发现新的知识与洞察并进行科学决策6 下列关于基于大数据的营销模式和传统营销模式的说法中，错误的是（ABC）A传统营销模式比基于大数据的营销模式投入更小B传统营销模式比基于大数据的营销模式针对性更强C传统营销模式比基于大数据的营销模式转化率低D基于大数据的营销模式比传统营销模式实时性更强E基于大数据的营销模式比传统营销模式标准性更强7 按照服务目的不同，数据流通平台可分为（CDE）A政府数据开放平台B企业数据开放平台C数据交易市场D数据研发市场E数据废弃交易市场8 下列论据中，能够支撑“大数据唔多不能”的观点的是（ADE）A互联网金融打破了传统的观念和行为B大数据存在泡沫C大数据具有非常高的成本D大数据医疗正在走进平民百姓E数据资产型企业前景光明9 大数据的价值体现在（ABCDE）A大数据给思维方式带来了冲击B大数据为政策制定提供科学依据C大数据助力智慧城市提升公共服务水平D大数据实现了精准营销E大数据的发力点在于预测10 当前大数据技术的基础包括（ABD）A分布式文件系统B分布式并行计算C关系型数据库D分布式数据库E非关系型数据库11 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面的作用是（BD）A能够直观反映成对数据之间的空间关系B能够主观反映多维数据之间的空间关系C能够静态演化事物的变化及变化的规律D能够动态演化事物的变化及变化的规律12 下列关于计算机存贮容量单位换算关系的公式中，正确的是（BE）A. 1KB=1012ByteB. 1KB=1024BytesC. 1GB=1024KBD. 1GB=1012MBE. 1GB=1024MB13、在网络爬虫的爬行策略中，应用最为基础的是（AB）A深度优先遍历策略B广度优先遍历策略C高度优先遍历策略D反向链接策略E大战优先策略14、当前，大数据产业发展的特点是（ACE）A规模较大B规模较小C增速很快D增速缓慢E多产业交叉融合15、下列关于数据生命周期管理的核心认识中，正确的是（ABC）A数据从产生到被删除销毁的过程中，具有多个不同的数据存在阶段B在不同的数据存在阶段，数据的价值是不同的C根据数据价值的不同应该对数据采取不同的管路策略D数据生命周期管理旨在产生效益的同时，降低生产成本E数据生命周期管理最终关注的是社会效益16、下列关于基于大数据的营销模式和传统营销模式的说法中，错误的是（AB）A传统营销模式比基于大数据的营销模式投入更小B传统营销模式比基于大数据的营销模式针对性更强C传统营销模式比基于大数据的营销模式转化率低D基于大数据的营销模式比传统营销模式实时性更强E基于大数据的营销模式比传统营销模式精准性更强17、下列关于脏数据的说法中，正确的是（ABCDE）A格式不规范B编码不统一C意义不明确D与实际业务关系不大E数据不完整18、数据再利用的意义在于（ABC）A挖掘数据的潜在价值B实现数据重组的创新价值C利用数据可扩展性拓宽业务领域D优化存储设备，降低设备成本E提高社会效益，优化社会管理19、按照涉及自变量的多少，可以将回归分析分为（CD）A线性回归分析B非线性回归分析C一元回归分析D多元回归分析E综合回归分析20、传统数据密集型行业积极探索和布局大数据应用的表现是（BCE）A投资入股互联网电商行业B打通多源跨域数据C提高分析挖掘能力D自行开发数据产品E实现科学决策与运营21、大数据人才整体上需要具备（ABE）等核心知识。

大数据技术及应用题库

大数据技术及应用试题库

大数据技术与应用考试 选择题 64题

大数据技术及应用题库

大数据技术及应用题库

公需科目-大数据前沿技术及应用-考试与答案(全)

大数据技术原理与应用(管理学门类)_郑州大学中国大学mooc课后章节答案期末考试题库2023年

大数据技术及应用题库

《大数据技术原理及应用》题目

大数据技术及应用题库

大数据技术和应用课后测试及答案

大数据技术及应用试题库

大数据应用技术专题(92分)

大数据技术与数据科学应用考试 选择题 62题

大数据技术及应用题库

《大数据技术与应用》考核试题及答案

大数据技术与应用考试选择题 64题

大数据技术与数据科学应用考试选择题 62题