最新大数据测试题
高级大数据测试题及答案

高级大数据测试题及答案一、选择题(每题5分,共20分)1. 在大数据环境下,以下哪个选项不是Hadoop生态系统的组成部分?A. HBaseB. HiveC. SparkD. MongoDB答案:D2. 在Spark中,RDD的全称是什么?A. Resilient Distributed DatabaseB. Resilient Distributed DatasetC. Resilient Distributed Data StructureD. Resilient Distributed Data Stream答案:B3. 下列哪个选项是Hadoop的分布式文件系统?A. HDFSB. GFSC. ZFSD. NFS答案:A4. 在大数据技术中,以下哪个不是数据清洗的常见步骤?A. 去除重复B. 缺失值处理C. 数据转换D. 数据加密答案:D二、填空题(每题5分,共20分)1. Hadoop的两个主要组件是________和________。
答案:HDFS、MapReduce2. 在Spark中,________操作可以将多个RDDs合并为一个。
答案:union3. 用于数据挖掘的机器学习算法中,________算法是一种监督学习算法。
答案:决策树4. 在大数据存储中,________是一种用于存储半结构化数据的文件格式。
答案:JSON三、简答题(每题10分,共40分)1. 请简述Hadoop的MapReduce工作原理。
答案:Hadoop的MapReduce工作原理包括两个主要步骤:Map阶段和Reduce阶段。
在Map阶段,输入数据被分割成多个独立的数据块,每个数据块由一个Map任务处理。
Map任务读取数据块,将数据映射成键值对形式,然后输出中间结果。
在Reduce阶段,Map阶段输出的中间结果被分组,每个组由一个Reduce任务处理。
Reduce任务对同一键的值进行聚合操作,最终输出最终结果。
大数据技术与数据分析测试 选择题 61题

1. 大数据的4V特征不包括以下哪一项?A. VolumeB. VelocityC. VarietyD. Visibility2. 以下哪个工具不是用于大数据处理的?A. HadoopB. SparkC. ExcelD. Kafka3. 在数据分析中,以下哪种方法最常用于预测分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析4. Hadoop生态系统中的HDFS是用来做什么的?A. 数据处理B. 数据存储C. 数据查询D. 数据可视化5. 以下哪个是NoSQL数据库的例子?A. MySQLB. PostgreSQLC. MongoDBD. Oracle6. 数据仓库的主要目的是什么?A. 实时数据处理B. 数据分析和报告C. 数据存储D. 数据加密7. 在数据分析中,PCA是什么的缩写?A. Principal Component AnalysisB. Primary Component AlgorithmC. Predictive Component AnalysisD. Progressive Component Algorithm8. 以下哪个编程语言最常用于数据分析?A. JavaB. PythonC. C++D. Ruby9. 在数据可视化中,以下哪种图表最适合展示时间序列数据?A. 饼图B. 条形图C. 折线图D. 散点图10. 以下哪个是大数据分析平台?A. TableauB. Microsoft ExcelC. Google AnalyticsD. AWS Redshift11. 数据挖掘的主要目的是什么?A. 数据清洗B. 数据存储C. 发现数据中的模式和关系D. 数据可视化12. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 监督学习需要标签数据,非监督学习不需要B. 监督学习不需要标签数据,非监督学习需要C. 监督学习用于分类,非监督学习用于回归D. 监督学习用于回归,非监督学习用于分类13. 以下哪个算法是用于分类的?A. K-MeansB. Linear RegressionC. Decision TreeD. PCA14. 在数据分析中,以下哪个步骤通常最先进行?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集15. 以下哪个是数据湖的定义?A. 一个用于存储大量结构化数据的数据库B. 一个用于存储大量非结构化数据的数据库C. 一个用于存储大量半结构化数据的数据库D. 一个用于存储大量实时数据的数据库16. 在数据分析中,以下哪个工具最常用于数据清洗?A. RB. SQLC. PythonD. Excel17. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas18. 在数据分析中,以下哪个方法最常用于异常检测?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析19. 以下哪个是数据科学家的主要职责?A. 数据存储B. 数据清洗C. 数据分析和模型构建D. 数据可视化20. 在数据分析中,以下哪个工具最常用于数据可视化?A. TableauB. SQLC. PythonD. Excel21. 以下哪个是用于大数据处理的实时数据流处理平台?A. HadoopB. SparkC. KafkaD. Hive22. 在数据分析中,以下哪个方法最常用于客户细分?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析23. 以下哪个是用于大数据处理的分布式文件系统?A. HDFSB. S3C. GFSD. Azure Blob Storage24. 在数据分析中,以下哪个方法最常用于预测销售额?A. 回归分析C. 关联分析D. 描述性分析25. 以下哪个是用于大数据处理的分布式数据库?A. MongoDBB. MySQLC. PostgreSQLD. Oracle26. 在数据分析中,以下哪个方法最常用于市场篮分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析27. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas28. 在数据分析中,以下哪个方法最常用于文本挖掘?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析29. 以下哪个是用于大数据处理的分布式存储系统?A. HDFSB. S3C. GFSD. Azure Blob Storage30. 在数据分析中,以下哪个方法最常用于时间序列分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析31. 以下哪个是用于大数据处理的分布式查询引擎?A. HiveB. SparkC. KafkaD. Hadoop32. 在数据分析中,以下哪个方法最常用于情感分析?B. 聚类分析C. 关联分析D. 描述性分析33. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas34. 在数据分析中,以下哪个方法最常用于推荐系统?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析35. 以下哪个是用于大数据处理的分布式存储系统?A. HDFSB. S3C. GFSD. Azure Blob Storage36. 在数据分析中,以下哪个方法最常用于网络分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析37. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas38. 在数据分析中,以下哪个方法最常用于图像分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析39. 以下哪个是用于大数据处理的分布式存储系统?A. HDFSB. S3C. GFSD. Azure Blob Storage40. 在数据分析中,以下哪个方法最常用于语音分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析41. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas42. 在数据分析中,以下哪个方法最常用于社交网络分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析43. 以下哪个是用于大数据处理的分布式存储系统?A. HDFSB. S3C. GFSD. Azure Blob Storage44. 在数据分析中,以下哪个方法最常用于生物信息学分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析45. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas46. 在数据分析中,以下哪个方法最常用于金融分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析47. 以下哪个是用于大数据处理的分布式存储系统?A. HDFSB. S3C. GFSD. Azure Blob Storage48. 在数据分析中,以下哪个方法最常用于医疗分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析49. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas50. 在数据分析中,以下哪个方法最常用于能源分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析51. 以下哪个是用于大数据处理的分布式存储系统?A. HDFSB. S3C. GFSD. Azure Blob Storage52. 在数据分析中,以下哪个方法最常用于零售分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析53. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas54. 在数据分析中,以下哪个方法最常用于电信分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析55. 以下哪个是用于大数据处理的分布式存储系统?A. HDFSB. S3D. Azure Blob Storage56. 在数据分析中,以下哪个方法最常用于制造业分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析57. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas58. 在数据分析中,以下哪个方法最常用于物流分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析59. 以下哪个是用于大数据处理的分布式存储系统?A. HDFSB. S3C. GFSD. Azure Blob Storage60. 在数据分析中,以下哪个方法最常用于教育分析?A. 回归分析B. 聚类分析C. 关联分析D. 描述性分析61. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. SparkC. Scikit-learnD. Pandas答案1. D2. C3. A4. B5. C6. B7. A9. C10. D11. C12. A13. C14. D15. B16. B17. B18. B19. C20. A21. C22. B23. A24. A25. A26. C27. B28. B29. A30. A31. A32. B33. B34. C35. A36. B37. B38. B39. A40. B41. B42. B43. A44. B45. B46. A47. A48. B49. B50. A51. A52. B53. B54. B55. A56. B57. B59. A60. B61. B。
大数据测试 试卷及答案 82分

∙ 1.大数据的本质是()。
(单选题1分)得分:0分o A.挖掘o B.搜集o C.洞察o D.联系∙ 2.以下选项中,不属于信息时代的定律的是(单选题1分)得分:1分o A.麦特卡尔夫定律o B.吉尔德定律o C.达律多定律o D.摩尔定律∙ 3.2008年以后,第()信息传输技术:传输2亿路信号。
(单选题1分)得分:0分o A.二代o B.四代o C.一代o D.三代∙ 4.由于有了现代信息技术的支撑,研制一个新型号的航天器,周期缩减到()以内。
(单选题1分)得分:1分o A.6个月o B.12个月o C.18个月o D.24个月∙ 5.根据周琦老师所讲,高德交通信息服务覆盖全国高速()以上。
(单选题1分)得分:1分o A.70%o B.90%o C.50%o D.60%∙ 6.阿兰·图灵在哪一年提出图灵测试的概念?(单选题1分)得分:1分o A.1950年o B.1952年o C.1955年o D.1954年∙7.()指利用计算机处理信息的技术,是现代信息技术的核心。
(单选题1分)得分:1分o A.感测技术o B.通信技术o C.计算机技术o D.微电子技术∙8.淘宝网正式进入台湾市场是在哪一年?(单选题1分)得分:1分o A.2011年o B.2009年o C.2010年o D.2012年∙9.第一个提出大数据概念的公司是(单选题1分)得分:1分o A.脸谱公司o B.谷歌公司o C.麦肯锡公司o D.微软公司∙10.社会成员或者用户之间社会成员之间共同参与信息的处理、信息的分享、信息的传播,这个活动就叫()。
(单选题1分)得分:1分o A.社会计算o B.云计算o C.高强度计算o D.政府计算∙11.根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均()公里驾驶里程覆盖。
(单选题1分)得分:1分o A.50亿o B.100亿o C.80亿o D.150亿∙12.习近平总书记在2016年几月主持召开了网络安全和信息化工作座谈会?(单选题1分)得分:1分o A.2月o B.3月o C.5月o D.4月∙13.未来农业信息化将会取得新突破:在空间上,农业信息化从点状示范向()开发,从区域覆盖向全面推进的格局演变。
数据科学与大数据应用测试 选择题 60题

1. 在数据科学中,什么是“数据清洗”?A. 数据分析的过程B. 数据收集的过程C. 数据预处理的过程,以去除或修正错误和不一致的数据D. 数据存储的过程2. 下列哪个不是大数据的“3V”特征?A. 速度B. 多样性C. 价值D. 体积3. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 监督学习需要标签数据,非监督学习不需要B. 监督学习不需要标签数据,非监督学习需要C. 监督学习用于分类,非监督学习用于回归D. 监督学习用于回归,非监督学习用于分类4. 下列哪个算法是用于分类的?A. 线性回归B. 逻辑回归C. 聚类分析D. 主成分分析5. 在数据可视化中,什么是“热图”?A. 一种显示数据分布的图表B. 一种显示数据趋势的图表C. 一种通过颜色变化来展示数据集中数值大小的图表D. 一种显示数据关系的图表6. 下列哪个是Hadoop的核心组件?A. HiveB. PigC. HDFSD. Spark7. 在数据科学项目中,“特征工程”是指什么?A. 选择和构建数据的最佳特征以供机器学习算法使用B. 数据清洗的过程C. 数据存储的过程D. 数据分析的过程8. 下列哪个工具不是用于大数据处理的?A. Apache KafkaB. Microsoft ExcelC. Apache FlinkD. Apache Storm9. 在数据科学中,“交叉验证”的主要目的是什么?A. 评估模型的泛化能力B. 提高模型的准确性C. 减少数据集的大小D. 增加数据集的多样性10. 下列哪个是深度学习的应用?A. 图像识别B. 数据清洗C. 数据存储D. 数据分析11. 在Python中,用于数据分析的常用库是哪个?A. TensorFlowB. PandasC. DjangoD. Flask12. 下列哪个是NoSQL数据库的例子?A. MySQLB. PostgreSQLC. MongoDBD. Oracle13. 在数据科学中,“过拟合”是什么意思?A. 模型在训练数据上表现不佳B. 模型在测试数据上表现不佳C. 模型在训练数据上表现很好,但在新数据上表现不佳D. 模型在所有数据上表现都很好14. 下列哪个是数据仓库的特征?A. 支持实时数据更新B. 主要用于存储结构化数据C. 支持非结构化数据的存储D. 主要用于实时数据分析15. 在数据科学中,“A/B测试”主要用于什么?A. 比较两个或多个变体的性能B. 数据清洗C. 数据存储D. 数据分析16. 下列哪个是数据湖的特征?A. 存储结构化数据B. 存储非结构化数据C. 主要用于实时数据分析D. 支持实时数据更新17. 在数据科学中,“随机森林”是一种什么类型的算法?A. 回归算法B. 分类算法C. 聚类算法D. 关联规则算法18. 下列哪个是数据科学中的“特征选择”方法?A. 主成分分析B. 线性回归C. 逻辑回归D. 聚类分析19. 在数据科学中,“正则化”的主要目的是什么?A. 减少模型的复杂度B. 增加模型的复杂度C. 提高模型的准确性D. 减少数据集的大小20. 下列哪个是数据科学中的“时间序列分析”应用?A. 预测股票价格B. 图像识别C. 文本分析D. 数据清洗21. 在数据科学中,“集成学习”是什么意思?A. 使用单一模型进行学习B. 使用多个模型进行学习C. 使用单一算法进行学习D. 使用多个算法进行学习22. 下列哪个是数据科学中的“异常检测”应用?A. 检测信用卡欺诈B. 图像识别C. 文本分析D. 数据清洗23. 在数据科学中,“降维”的主要目的是什么?A. 减少数据的维度B. 增加数据的维度C. 提高模型的准确性D. 减少数据集的大小24. 下列哪个是数据科学中的“文本挖掘”应用?A. 情感分析B. 图像识别C. 数据清洗D. 数据存储25. 在数据科学中,“关联规则学习”是什么意思?A. 发现数据集中的关联规则B. 发现数据集中的分类规则C. 发现数据集中的回归规则D. 发现数据集中的聚类规则26. 下列哪个是数据科学中的“推荐系统”应用?A. 电影推荐B. 图像识别C. 文本分析D. 数据清洗27. 在数据科学中,“强化学习”是什么意思?A. 通过试错学习B. 通过监督学习C. 通过非监督学习D. 通过半监督学习28. 下列哪个是数据科学中的“神经网络”应用?A. 图像识别B. 数据清洗C. 数据存储D. 数据分析29. 在数据科学中,“决策树”是一种什么类型的算法?A. 回归算法B. 分类算法C. 聚类算法D. 关联规则算法30. 下列哪个是数据科学中的“回归分析”应用?A. 预测房价B. 图像识别C. 文本分析D. 数据清洗31. 在数据科学中,“聚类分析”是什么意思?A. 将数据分成不同的组B. 将数据分成相同的组C. 将数据分成连续的组D. 将数据分成离散的组32. 下列哪个是数据科学中的“主成分分析”应用?A. 降维B. 分类C. 回归D. 聚类33. 在数据科学中,“逻辑回归”是一种什么类型的算法?A. 回归算法B. 分类算法C. 聚类算法D. 关联规则算法34. 下列哪个是数据科学中的“支持向量机”应用?A. 分类B. 回归C. 聚类D. 关联规则35. 在数据科学中,“朴素贝叶斯”是一种什么类型的算法?A. 回归算法B. 分类算法C. 聚类算法D. 关联规则算法36. 下列哪个是数据科学中的“K-均值聚类”应用?A. 聚类B. 分类C. 回归D. 关联规则37. 在数据科学中,“Apriori算法”是什么意思?A. 发现数据集中的关联规则B. 发现数据集中的分类规则C. 发现数据集中的回归规则D. 发现数据集中的聚类规则38. 下列哪个是数据科学中的“协同过滤”应用?A. 推荐系统B. 图像识别C. 文本分析D. 数据清洗39. 在数据科学中,“深度学习”是什么意思?A. 使用浅层神经网络进行学习B. 使用深层神经网络进行学习C. 使用单一模型进行学习D. 使用多个模型进行学习40. 下列哪个是数据科学中的“卷积神经网络”应用?A. 图像识别B. 数据清洗C. 数据存储D. 数据分析41. 在数据科学中,“循环神经网络”是什么意思?A. 处理序列数据B. 处理静态数据C. 处理图像数据D. 处理文本数据42. 下列哪个是数据科学中的“长短期记忆网络”应用?A. 处理序列数据B. 处理静态数据C. 处理图像数据D. 处理文本数据43. 在数据科学中,“生成对抗网络”是什么意思?A. 生成数据B. 分类数据C. 回归数据D. 聚类数据44. 下列哪个是数据科学中的“自编码器”应用?A. 降维B. 分类C. 回归D. 聚类45. 在数据科学中,“强化学习”是什么意思?A. 通过试错学习B. 通过监督学习C. 通过非监督学习D. 通过半监督学习46. 下列哪个是数据科学中的“Q学习”应用?A. 强化学习B. 监督学习C. 非监督学习D. 半监督学习47. 在数据科学中,“策略梯度”是什么意思?A. 强化学习的一种方法B. 监督学习的一种方法C. 非监督学习的一种方法D. 半监督学习的一种方法48. 下列哪个是数据科学中的“蒙特卡洛方法”应用?A. 强化学习B. 监督学习C. 非监督学习D. 半监督学习49. 在数据科学中,“时间差分学习”是什么意思?A. 强化学习的一种方法B. 监督学习的一种方法C. 非监督学习的一种方法D. 半监督学习的一种方法50. 下列哪个是数据科学中的“深度强化学习”应用?A. 强化学习B. 监督学习C. 非监督学习D. 半监督学习51. 在数据科学中,“迁移学习”是什么意思?A. 在一个任务上学到的知识应用到另一个任务上B. 在一个任务上学到的知识应用到同一个任务上C. 在一个任务上学到的知识应用到多个任务上D. 在一个任务上学到的知识应用到所有任务上52. 下列哪个是数据科学中的“元学习”应用?A. 学习如何学习B. 学习如何分类C. 学习如何回归D. 学习如何聚类53. 在数据科学中,“小样本学习”是什么意思?A. 在少量数据上进行学习B. 在大量数据上进行学习C. 在所有数据上进行学习D. 在无数据上进行学习54. 下列哪个是数据科学中的“主动学习”应用?A. 模型主动选择数据进行学习B. 模型被动选择数据进行学习C. 模型随机选择数据进行学习D. 模型不选择数据进行学习55. 在数据科学中,“半监督学习”是什么意思?A. 使用有标签和无标签数据进行学习B. 使用有标签数据进行学习C. 使用无标签数据进行学习D. 不使用数据进行学习56. 下列哪个是数据科学中的“多任务学习”应用?A. 同时学习多个任务B. 学习一个任务C. 学习所有任务D. 不学习任何任务57. 在数据科学中,“在线学习”是什么意思?A. 随着新数据的出现不断更新模型B. 一次性学习所有数据C. 不学习任何数据D. 学习固定数据58. 下列哪个是数据科学中的“离线学习”应用?A. 一次性学习所有数据B. 随着新数据的出现不断更新模型C. 不学习任何数据D. 学习固定数据59. 在数据科学中,“增量学习”是什么意思?A. 随着新数据的出现不断更新模型B. 一次性学习所有数据C. 不学习任何数据D. 学习固定数据60. 下列哪个是数据科学中的“批量学习”应用?A. 一次性学习所有数据B. 随着新数据的出现不断更新模型C. 不学习任何数据D. 学习固定数据答案1. C3. A4. B5. C6. C7. A8. B9. A10. A11. B12. C13. C14. B15. A16. B17. B18. A19. A20. A21. B22. A23. A24. A25. A26. A27. A28. A29. B30. A31. A32. A33. B34. A35. B36. A37. A38. A39. B40. A41. A42. A43. A44. A45. A46. A47. A48. A49. A50. A51. A53. A54. A55. A56. A57. A58. A59. A60. A。
大数据测试题

大数据测试题大数据测试题1、简介1.1 背景1.2 目的1.3 范围2、测试环境2.1 硬件要求2.2 软件要求2.3 数据源2.4 测试工具3、功能测试3.1 数据采集3.1.1 数据源接入3.1.2 数据提取3.2 数据存储3.2.1 数据存储格式选择 3.2.2 数据安全性3.3 数据处理3.3.1 数据清洗3.3.2 数据转换3.4 数据分析3.4.1 数据统计3.4.2 数据可视化4、性能测试4.1 数据处理速度4.2 数据存储容量4.3 数据处理并发性能5、安全性测试5.1 数据隐私保护5.2 数据传输加密5.3 用户权限管理6、兼容性测试6.1 不同数据源测试 6.2 不同操作系统测试6.3 不同浏览器测试7、可靠性测试7.1 数据完整性7.2 数据可恢复性7.3 系统稳定性8、容错性测试8.1 异常数据处理8.2 网络故障处理8.3 节点故障处理9、用户体验测试9.1 界面易用性9.2 操作流程顺畅性9.3 响应速度10、扩展性测试10.1 数据规模扩展10.2 节点增加10.3 组件插件增加11、结果分析11.1 功能测试结果11.2 性能测试结果11.3 安全性测试结果 11.4 兼容性测试结果 11.5 可靠性测试结果 11.6 容错性测试结果 11.7 用户体验测试结果11.8扩展性测试结果12、结论附件:- 测试计划- 测试用例- 测试数据注释:- 数据采集:从不同的数据源中提取数据并进行清洗和转换的过程。
- 数据存储:将处理后的数据存储在适当的格式中,以供后续分析使用。
- 数据处理:对采集到的数据进行清洗、转换和计算等处理过程。
- 数据分析:通过统计和可视化等手段对数据进行分析和展示。
- 性能测试:测试系统在大数据处理方面的性能表现,包括速度、容量和并发性能等。
- 安全性测试:测试系统对数据安全和隐私保护的能力。
- 兼容性测试:测试系统在不同环境和配置下的兼容性。
- 可靠性测试:测试系统在长时间运行和异常情况下的稳定性和可恢复性。
2024年大数据应用及处理技术能力知识考试题库与答案

2024年大数据应用及处理技术能力知识考试题库与答案一、单选题1.当图像通过信道传输时,噪声一般与()无关。
A、信道传输的质量B、出现的图像信号C、是否有中转信道的过程D、图像在信道前后的处理参考答案:B2.在留出法、交叉验证法和自助法三种评估方法中,()更适用于数据集较小、难以划分训练集和测试集的情况。
A、留出法B、交叉验证法C、自助法D、留一法参考答案:C3.在数据科学中,通常可以采用()方法有效避免数据加工和数据备份的偏见。
A、A/B测试B、训练集和测试集的划分C、测试集和验证集的划分D、图灵测试参考答案:A4.下列不属于深度学习内容的是(_)oA、深度置信网络B、受限玻尔兹曼机C、卷积神经网络D、贝叶斯学习参考答案:D5.在大数据项目中,哪个阶段可能涉及使用数据工程师来优化数据查询性能?A、数据采集B、数据清洗C、数据存储与管理D、数据分析与可视化参考答案:C6.假定你现在训练了一个线性SVM并推断出这个模型出现了欠拟合现象,在下一次训练时,应该采取下列什么措施()A、增加数据点B、减少数据点C、增加特征D、减少特征参考答案:C7.两个变量相关,它们的相关系数r可能为0?这句话是否正确0A、正确B、错误参考答案:A8.一幅数字图像是()。
A、一个观测系统B、一个由许多像素排列而成的实体C、一个2-D数组中的元素D、一个3-D空间中的场景参考答案:C9.以下说法正确的是:()。
一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的如果增加模型复杂度,那么模型的测试错误率总是会降低如果增加模型复杂度,那么模型的训练错误率总是会降低A、1B、2C、3D、land3参考答案:c10.从网络的原理上来看,结构最复杂的神经网络是0。
A、卷积神经网络B、长短时记忆神经网络C、GRUD、BP神经网络参考答案:B11.LSTM中,(_)的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。
A、输入门B、遗忘门G输出门D、更新门参考答案:A12.Matplotiib的核心是面向()。
最新大数据测试题

Java、Python、云计算、大数据120 分钟1、当前大数据技术的基础是由( )首先提出的A. 微软B. 百度C. 谷歌D. 阿里巴巴2、大数据的起源是( )A. 金融B. 电信C. 互联网D. 公共管理3、( )反映数据的精细化程度,越细化的数据,价值越高。
A. 规模B. 活性C. 关联度D. 颗粒度4、数据清洗的方法不包括( )A. 缺失值处理B. 噪声数据清除C. 一致性检查D. 重复数据记录处理5、当程序经过编译或者汇编以后,形成为了一种由机器指令组成的集合,被称为( )A. 源程序B. 目标程序C. 可执行程序D. 非执行程序6、大数据的核心就是( )A. 告知与许可B. 预测C. 匿名化D. 规模化7、大数据不是要教机器像人一样思量。
相反,它是( )A. 把数学算法运用到海量的数据上来预测事情发生的可能性。
B. 被视为人工智能的一部份C. 被视为一种机器学习D. 预测与惩罚8、当前社会中,最为突出的大数据环境是( )A.互联网B.物联网C.综合国力D. 自然资源9、以下哪些技术为大数据常用框架或者技术(多选)( )。
A.HadoopB.SparkC.HbaseD.Linux10、云计算按照服务类型大致可分为以下类(多选)( )A.IaaSB.PaaSC.SaaSD.效用计算11、下列哪个语句在Python 中是非法的?( )A.x=y=z=1B.x=(y=z+1)C.x,y=y,xD.x+=y12、关于数据的潜在价值,说法正确的是(多选)( )A. 数据的真实价值就像飘荡在海洋中的冰山,第一眼只能看到冰山一角,而绝大部份则隐藏在表面之下。
B. 判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途。
C. 在基本用途完成后,数据的价值仍然存在,只是处于休眠状态D. 数据的价值是其所有可能用途的总和13、下列不是 Java 语言面向对象的特点( )A. 封装B.继承C.跨平台D.多态14、大数据人材整体上需要具备(多选)( )等核心知识A. 数学与统计知识B. 计算机相关知识C. 马克思主义哲学知识D. 市场运营管理知识15、观察下图,其中问号选择()16、在Python 中,下列哪种说法是错误的 ( D )A、除字典类型外,所有标准对象均可以用于布尔测试B、空字符串的布尔值是 FalseC、空列表对象的布尔值是 FalseD、值为 0 的任何数字对象的布尔值是 False17、ArrayList 类的底层数据结构是( A )A、数组结构B、链表结构C、哈希表结构D、红黑树结构18、Java 中覆盖与重载的关系是:( A )。
大数据趣味测试题及答案

大数据趣味测试题及答案
1. 什么是大数据?
A. 大量的数据
B. 能够被分析的数据
C. 需要特定技术处理的数据
D. 以上都是
答案:D
2. 大数据的四个V分别代表什么?
A. 体积、速度、多样性、价值
B. 体积、速度、多样性、可视化
C. 体积、速度、价值、可视化
D. 速度、多样性、价值、可视化
答案:A
3. 以下哪个不是大数据技术?
A. Hadoop
B. Spark
C. SQL
D. NoSQL
答案:C
4. 大数据在哪个行业中应用最广泛?
A. 金融
B. 医疗
C. 教育
D. 以上都是
答案:D
5. 大数据可以用于预测什么?
A. 股市趋势
B. 消费者行为
C. 疾病爆发
D. 以上都是
答案:D
6. 以下哪个是大数据的存储技术?
A. 数据库
B. 文件系统
C. 内存
D. 以上都是
答案:D
7. 大数据的分析方法主要包括哪些?
A. 描述性分析
B. 诊断性分析
C. 预测性分析
D. 以上都是
答案:D
8. 大数据的实时分析技术通常被称为什么?
A. 批处理
B. 流处理
C. 机器学习
D. 深度学习
答案:B
9. 大数据的安全性主要面临哪些挑战?
A. 数据泄露
B. 数据篡改
C. 非法访问
D. 以上都是
答案:D
10. 以下哪个是大数据的可视化工具?
A. Tableau
B. Excel
C. PowerPoint
D. Word
答案:A。
大数据考试题及答案

1、下面哪个理论描述了亚马逊的商业模式()(单选题)A。
长尾理论B.二八定律C。
六度空间理论D。
冰山理论回答正确2、大数据的核心是()(单选题)A.告知与许可B.预测C.匿名化D.规模化回答正确3、下面哪一项不属于大数据系统的必备要素( ) (单选题)A.云平台B。
物联网C。
数据D.数据库回答正确4、下面哪项关联不属于购物篮分析()(单选题)A.啤酒和尿布B.湿巾和烧烤C。
咖啡和咖啡伴侣D。
飓风和蛋挞回答正确5、大数据所带来的思维变革不包括( )(单选题)A。
不是随机样本而是全体数据B.。
不是精确性而是混杂性C.。
不是因果关系而是相关关系D。
不是歧视而是平等回答正确6、大数据元年是指( )(单选题)A.2010年B。
2011年C。
2012年D.2013年回答正确7、关于大数据在国家治理中作用,以下理解不正确的是()(单选题)A.大数据的应用能够杜绝抗生素的滥用B。
大数据的运用能够提升应急管理的快速反应C。
大数据的运用能够维护社会治安D.大数据的运用有利于实现以人为本的社会管理回答正确8、信息时代的三大定律不包括()(单选题)A.摩尔定律B.吉尔德定律C。
达律多定律D。
麦特卡尔夫定律回答正确9、2009年,甲型H1N1流感在全球爆发,谷歌测算出的数据与官方最后的数据相关性非常接近,达到了()(单选题)A.67%B.77%C。
97%。
D。
87%10、第一个将大数据上升为国家战略的国家是()(单选题)A。
中国B。
美国C.英国D.法国回答正确11、相比于政府1.0,政府2。
0具有哪些特征( ) (多选题)A。
侧重于“以政府为中心"B.侧重于“以公众为中心”C。
政府扮演单一和主导性的角色D.吸纳多元主体的参与回答正确12、大数据带来的挑战有哪些( ) (多选题)A.会导致数据盲点B。
危及个人隐私C.造成群体歧视D.产生庞大能耗回答正确13、要消除信息孤岛,需要从以下哪几个方面着手( ) (多选题)A.进行纵向信息系统整合B.进行水平的电子政务信息系统整合C。
大数据技术与大数据分析测试 选择题 59题

1. 大数据的“3V”模型不包括以下哪个维度?A. 速度B. 多样性C. 价值D. 体积2. Hadoop生态系统中,用于数据仓库的组件是?A. HBaseB. HiveC. PigD. Spark3. 在数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Online Application ProgrammingC. Offline Analytical ProcessingD. Offline Application Programming4. 以下哪个不是NoSQL数据库的类型?A. 键值存储B. 文档存储C. 关系型数据库D. 图形数据库5. 数据挖掘中的分类算法不包括以下哪种?A. 决策树B. 神经网络C. 关联规则D. 聚类分析6. 在Hadoop中,哪个组件负责数据的存储?A. HDFSB. MapReduceC. YARND. Hive7. 以下哪个工具不是用于大数据处理的?A. Apache KafkaB. Microsoft ExcelC. Apache StormD. Apache Flink8. 数据可视化工具Tableau主要用于什么?A. 数据存储B. 数据分析C. 数据清洗D. 数据传输9. 在数据分析中,ETL代表什么?A. Extract, Transform, LoadB. Encrypt, Transfer, LoadC. Extract, Transfer, LoadD. Encrypt, Transform, Load10. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据加密C. 数据删除D. 数据隐藏11. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 监督学习需要标签数据,非监督学习不需要B. 监督学习不需要标签数据,非监督学习需要C. 监督学习用于分类,非监督学习用于回归D. 监督学习用于回归,非监督学习用于分类12. 以下哪个是Apache Spark的核心组件?A. RDDB. HDFSC. YARND. Hive13. 在数据分析中,PCA代表什么?A. Principal Component AnalysisB. Primary Component AnalysisC. Partial Component AnalysisD. Public Component Analysis14. 以下哪个不是数据仓库的特征?A. 集成性B. 时变性C. 非易失性D. 实时性15. 在数据分析中,RFM模型不包括以下哪个维度?A. 最近一次购买时间B. 购买频率C. 购买金额D. 购买产品种类16. 以下哪个是用于大数据处理的流处理框架?A. Apache KafkaB. Apache HadoopC. Apache CassandraD. Apache Hive17. 在数据分析中,A/B测试主要用于什么?A. 数据清洗B. 数据可视化C. 数据比较D. 数据存储18. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据处理速度D. 所有上述选项19. 在数据分析中,K-means算法属于哪一类算法?A. 分类算法B. 回归算法C. 聚类算法D. 关联规则算法20. 以下哪个是用于大数据分析的编程语言?A. PythonB. HTMLC. CSSD. JavaScript21. 在数据分析中,SQL代表什么?A. Structured Query LanguageB. Standard Query LanguageC. Simple Query LanguageD. System Query Language22. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据加密C. 数据删除D. 数据隐藏23. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 监督学习需要标签数据,非监督学习不需要B. 监督学习不需要标签数据,非监督学习需要C. 监督学习用于分类,非监督学习用于回归D. 监督学习用于回归,非监督学习用于分类24. 以下哪个是Apache Spark的核心组件?A. RDDB. HDFSC. YARND. Hive25. 在数据分析中,PCA代表什么?A. Principal Component AnalysisB. Primary Component AnalysisC. Partial Component AnalysisD. Public Component Analysis26. 以下哪个不是数据仓库的特征?A. 集成性B. 时变性C. 非易失性D. 实时性27. 在数据分析中,RFM模型不包括以下哪个维度?A. 最近一次购买时间B. 购买频率C. 购买金额D. 购买产品种类28. 以下哪个是用于大数据处理的流处理框架?A. Apache KafkaB. Apache HadoopC. Apache CassandraD. Apache Hive29. 在数据分析中,A/B测试主要用于什么?A. 数据清洗B. 数据可视化C. 数据比较D. 数据存储30. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据处理速度D. 所有上述选项31. 在数据分析中,K-means算法属于哪一类算法?A. 分类算法B. 回归算法C. 聚类算法D. 关联规则算法32. 以下哪个是用于大数据分析的编程语言?A. PythonB. HTMLC. CSSD. JavaScript33. 在数据分析中,SQL代表什么?A. Structured Query LanguageB. Standard Query LanguageC. Simple Query LanguageD. System Query Language34. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据加密C. 数据删除D. 数据隐藏35. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 监督学习需要标签数据,非监督学习不需要B. 监督学习不需要标签数据,非监督学习需要C. 监督学习用于分类,非监督学习用于回归D. 监督学习用于回归,非监督学习用于分类36. 以下哪个是Apache Spark的核心组件?A. RDDB. HDFSC. YARND. Hive37. 在数据分析中,PCA代表什么?A. Principal Component AnalysisB. Primary Component AnalysisC. Partial Component AnalysisD. Public Component Analysis38. 以下哪个不是数据仓库的特征?A. 集成性B. 时变性C. 非易失性D. 实时性39. 在数据分析中,RFM模型不包括以下哪个维度?A. 最近一次购买时间B. 购买频率C. 购买金额D. 购买产品种类40. 以下哪个是用于大数据处理的流处理框架?A. Apache KafkaB. Apache HadoopC. Apache CassandraD. Apache Hive41. 在数据分析中,A/B测试主要用于什么?A. 数据清洗B. 数据可视化C. 数据比较D. 数据存储42. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据处理速度D. 所有上述选项43. 在数据分析中,K-means算法属于哪一类算法?A. 分类算法B. 回归算法C. 聚类算法D. 关联规则算法44. 以下哪个是用于大数据分析的编程语言?A. PythonB. HTMLC. CSSD. JavaScript45. 在数据分析中,SQL代表什么?A. Structured Query LanguageB. Standard Query LanguageC. Simple Query LanguageD. System Query Language46. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据加密C. 数据删除D. 数据隐藏47. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 监督学习需要标签数据,非监督学习不需要B. 监督学习不需要标签数据,非监督学习需要C. 监督学习用于分类,非监督学习用于回归D. 监督学习用于回归,非监督学习用于分类48. 以下哪个是Apache Spark的核心组件?A. RDDB. HDFSC. YARND. Hive49. 在数据分析中,PCA代表什么?A. Principal Component AnalysisB. Primary Component AnalysisC. Partial Component AnalysisD. Public Component Analysis50. 以下哪个不是数据仓库的特征?A. 集成性B. 时变性C. 非易失性D. 实时性51. 在数据分析中,RFM模型不包括以下哪个维度?A. 最近一次购买时间B. 购买频率C. 购买金额D. 购买产品种类52. 以下哪个是用于大数据处理的流处理框架?A. Apache KafkaB. Apache HadoopC. Apache CassandraD. Apache Hive53. 在数据分析中,A/B测试主要用于什么?A. 数据清洗B. 数据可视化C. 数据比较D. 数据存储54. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据处理速度D. 所有上述选项55. 在数据分析中,K-means算法属于哪一类算法?A. 分类算法B. 回归算法C. 聚类算法D. 关联规则算法56. 以下哪个是用于大数据分析的编程语言?A. PythonB. HTMLC. CSSD. JavaScript57. 在数据分析中,SQL代表什么?A. Structured Query LanguageB. Standard Query LanguageC. Simple Query LanguageD. System Query Language58. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据加密C. 数据删除D. 数据隐藏59. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 监督学习需要标签数据,非监督学习不需要B. 监督学习不需要标签数据,非监督学习需要C. 监督学习用于分类,非监督学习用于回归D. 监督学习用于回归,非监督学习用于分类答案1. C2. B3. A4. C5. D6. A7. B8. B9. A10. A11. A12. A13. A14. D15. D16. A17. C18. D19. C20. A21. A22. A23. A24. A25. A26. D27. D28. A29. C30. D31. C32. A33. A34. A35. A36. A37. A38. D39. D40. A41. C42. D43. C44. A45. A46. A47. A48. A49. A50. D51. D52. A53. C54. D55. C56. A57. A58. A59. A。
大数据平台与云计算测试 选择题 64题

1. 大数据的核心特征不包括以下哪一项?A. 数据量大B. 数据类型多样C. 数据价值密度高D. 处理速度快2. 云计算的主要服务模型不包括以下哪一项?A. IaaSB. PaaSC. SaaSD. DaaS3. 以下哪个不是大数据处理框架?A. HadoopB. SparkC. DockerD. Flink4. 云计算中的“虚拟化”技术主要用于?A. 提高数据安全性B. 提高资源利用率C. 提高数据处理速度D. 提高数据存储容量5. 以下哪个是Hadoop的核心组件?A. HBaseB. HiveC. HDFSD. Zookeeper6. 在云计算中,IaaS代表什么?A. Infrastructure as a ServiceB. Internet as a ServiceC. Interface as a ServiceD. Integration as a Service7. 以下哪个是Spark的核心组件?A. Spark SQLB. Spark StreamingC. MLlibD. All of the above8. 云计算中的SLA是指什么?A. Service Level AgreementB. System Level ArchitectureC. Software License AgreementD. Storage Level Access9. 以下哪个不是大数据的存储解决方案?A. HDFSB. Amazon S3C. Google Cloud StorageD. Microsoft SQL Server10. 在Hadoop生态系统中,哪个组件用于数据仓库?A. HBaseB. HiveC. PigD. Zookeeper11. 云计算中的PaaS代表什么?A. Platform as a ServiceB. Programming as a ServiceC. Protocol as a ServiceD. Process as a Service12. 以下哪个是NoSQL数据库?A. MySQLB. PostgreSQLC. MongoDBD. Oracle13. 在Spark中,哪个组件用于实时数据处理?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX14. 云计算中的SaaS代表什么?A. Software as a ServiceB. Storage as a ServiceC. Security as a ServiceD. System as a Service15. 以下哪个是大数据的分析工具?A. TableauB. ExcelC. PowerPointD. Word16. 在Hadoop中,哪个组件用于资源管理?A. YARNB. HDFSC. MapReduceD. Hive17. 以下哪个是云计算的部署模型?A. Public CloudB. Private CloudC. Hybrid CloudD. All of the above18. 在Spark中,哪个组件用于机器学习?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX19. 以下哪个是大数据的采集工具?A. FlumeB. KafkaC. SqoopD. All of the above20. 在Hadoop中,哪个组件用于数据查询?A. HBaseB. HiveC. PigD. Zookeeper21. 云计算中的BaaS代表什么?A. Backend as a ServiceB. Block as a ServiceC. Business as a ServiceD. Backup as a Service22. 以下哪个是大数据的可视化工具?A. TableauB. ExcelC. PowerPointD. Word23. 在Spark中,哪个组件用于图计算?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX24. 以下哪个是大数据的处理工具?A. HadoopB. SparkC. FlinkD. All of the above25. 在Hadoop中,哪个组件用于数据存储?A. YARNB. HDFSC. MapReduceD. Hive26. 云计算中的DaaS代表什么?A. Data as a ServiceB. Database as a ServiceC. Desktop as a ServiceD. Development as a Service27. 以下哪个是大数据的存储工具?A. HDFSB. Amazon S3C. Google Cloud StorageD. All of the above28. 在Spark中,哪个组件用于结构化数据处理?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX29. 以下哪个是大数据的分析平台?A. HadoopB. SparkC. FlinkD. All of the above30. 在Hadoop中,哪个组件用于数据处理?A. YARNB. HDFSC. MapReduceD. Hive31. 云计算中的NaaS代表什么?A. Network as a ServiceB. Node as a ServiceC. Notification as a ServiceD. None of the above32. 以下哪个是大数据的采集平台?A. FlumeB. KafkaC. SqoopD. All of the above33. 在Spark中,哪个组件用于流数据处理?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX34. 以下哪个是大数据的可视化平台?A. TableauB. ExcelC. PowerPointD. Word35. 在Hadoop中,哪个组件用于数据仓库?A. HBaseB. HiveC. PigD. Zookeeper36. 云计算中的CaaS代表什么?A. Container as a ServiceB. Compute as a ServiceC. Communication as a ServiceD. Content as a Service37. 以下哪个是大数据的存储平台?A. HDFSB. Amazon S3C. Google Cloud StorageD. All of the above38. 在Spark中,哪个组件用于机器学习?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX39. 以下哪个是大数据的处理平台?A. HadoopB. SparkC. FlinkD. All of the above40. 在Hadoop中,哪个组件用于数据查询?A. HBaseB. HiveC. PigD. Zookeeper41. 云计算中的MaaS代表什么?A. Mobile as a ServiceB. Monitoring as a ServiceC. Management as a ServiceD. Machine as a Service42. 以下哪个是大数据的采集工具?A. FlumeB. KafkaC. SqoopD. All of the above43. 在Spark中,哪个组件用于实时数据处理?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX44. 以下哪个是大数据的可视化工具?A. TableauB. ExcelC. PowerPointD. Word45. 在Hadoop中,哪个组件用于数据存储?A. YARNB. HDFSC. MapReduceD. Hive46. 云计算中的FaaS代表什么?A. Function as a ServiceB. File as a ServiceC. Firewall as a ServiceD. Framework as a Service47. 以下哪个是大数据的存储工具?A. HDFSB. Amazon S3C. Google Cloud StorageD. All of the above48. 在Spark中,哪个组件用于结构化数据处理?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX49. 以下哪个是大数据的分析平台?A. HadoopB. SparkC. FlinkD. All of the above50. 在Hadoop中,哪个组件用于数据处理?A. YARNB. HDFSC. MapReduceD. Hive51. 云计算中的EaaS代表什么?A. Email as a ServiceB. Encryption as a ServiceC. Endpoint as a ServiceD. Event as a Service52. 以下哪个是大数据的采集平台?A. FlumeB. KafkaC. SqoopD. All of the above53. 在Spark中,哪个组件用于流数据处理?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX54. 以下哪个是大数据的可视化平台?A. TableauB. ExcelC. PowerPointD. Word55. 在Hadoop中,哪个组件用于数据仓库?A. HBaseB. HiveC. PigD. Zookeeper56. 云计算中的RaaS代表什么?A. Reporting as a ServiceB. Research as a ServiceC. Resource as a ServiceD. Runtime as a Service57. 以下哪个是大数据的存储平台?A. HDFSB. Amazon S3C. Google Cloud StorageD. All of the above58. 在Spark中,哪个组件用于机器学习?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX59. 以下哪个是大数据的处理平台?A. HadoopB. SparkC. FlinkD. All of the above60. 在Hadoop中,哪个组件用于数据查询?A. HBaseB. HiveC. PigD. Zookeeper61. 云计算中的AaaS代表什么?A. Analytics as a ServiceB. Application as a ServiceC. Automation as a ServiceD. Authentication as a Service62. 以下哪个是大数据的采集工具?A. FlumeB. KafkaC. SqoopD. All of the above63. 在Spark中,哪个组件用于实时数据处理?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX64. 以下哪个是大数据的可视化工具?A. TableauB. ExcelC. PowerPointD. Word答案1. C2. D3. C4. B5. C6. A7. D8. A9. D10. B11. A12. C13. B14. A15. A16. A17. D18. C19. D20. B21. A22. A23. D24. D25. B26. A27. D28. A29. D30. C31. A32. D33. B34. A35. B36. A37. D38. C39. D40. B41. A42. D43. B44. A45. B46. A47. D48. A49. D50. C51. A52. D53. B54. A55. B56. A57. D58. C59. D60. B61. A62. D63. B64. A。
大数据CDA考试(习题卷1)

大数据CDA考试(习题卷1)第1部分:单项选择题,共47题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]在因子分析中,为了帮助解释因子,我们可以使用( )A)因子得分B)因子负载C)因子旋转D)主成分分析答案:C解析:在进行因子分析时,我们可以通过因子旋转来使得最终得到的因子更具有解释性。
2.[单选题]关于Kafka 磁盘容量不足的告警,对于可能的原因以下分析不正确的是?A)业务规划不合理导致数据分配不 均,使部分磁盘达到使用率上限B)数据保存时间配置过长,数据累计 达到磁盘使用率上限C)Broker节点故障导致D)用于存储Kafka 数据的磁盘配置 (如磁盘数目磁盘大小等),无法满 足当前业务数据流量,导致磁盘使 用率达到上限答案:C解析:3.[单选题]基于规则的分类器有Aprior、随机森林,还有()。
A)C4.5B)KNNC)Naive BayesD)ANN答案:A解析:4.[单选题]“将总体中的所有单位( )按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位”,这种抽样方法称为( )A)多阶段抽样(systematicB)分层随机抽样(stratifiedC)集群抽样(clusterD)系统抽样(systematic答案:D解析:根据定义。
5.[单选题]参照以下信息选择能够正确创建orderinfo表的语句A)createB)createC)createD)create答案:A解析:本题考查SQL语句中建表、字段约束条件以及字段数据类型相关知识。
其中建表语句结构为create table 表名(…),字段的约束条件为非空=not null、唯一=unique、主键=primary key。
定长字符串类型为char,可变长字符串类型为varchar,小数类型通常使用float,但“金额”这类对数据精度要求较高的情况,应考虑使用decimal,整数类型为int。
大数据技术与应用考试 选择题 50题

1. 大数据的核心特征不包括以下哪一项?A. 大量性B. 高速性C. 多样性D. 单一性2. Hadoop生态系统中,用于数据仓库的组件是?A. HBaseB. HiveC. PigD. Zookeeper3. 在数据挖掘中,以下哪种技术主要用于分类?A. 聚类分析B. 关联规则C. 决策树D. 回归分析4. 大数据处理框架Apache Spark的核心抽象是?A. RDDB. DataFrameC. DatasetD. GraphX5. 以下哪个不是NoSQL数据库的类型?A. 键值存储B. 文档存储C. 关系数据库D. 图数据库6. 在Hadoop中,负责数据存储的组件是?A. HDFSB. MapReduceC. YARND. Oozie7. 大数据分析中,以下哪个步骤通常最先进行?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集8. 以下哪个编程语言常用于大数据处理?A. PythonB. RubyC. SwiftD. Perl9. 在Spark中,用于处理实时数据流的组件是?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX10. 以下哪个工具不是用于大数据可视化的?A. TableauB. Power BIC. ExcelD. D3.js11. 在数据仓库中,ETL过程指的是?A. 提取、转换、加载B. 加密、传输、登录C. 编辑、测试、发布D. 评估、培训、学习12. 以下哪个是大数据处理中的批处理技术?A. Spark StreamingB. KafkaC. MapReduceD. Storm13. 在Hadoop中,负责资源管理的组件是?A. HDFSB. MapReduceC. YARND. Oozie14. 大数据技术中,以下哪个不是数据存储技术?A. HBaseB. CassandraC. MongoDBD. MapReduce15. 在数据分析中,以下哪个方法用于发现数据中的异常值?A. 聚类分析B. 关联规则C. 异常检测D. 回归分析16. 以下哪个是大数据技术中的内存计算框架?A. HadoopB. SparkC. FlinkD. Storm17. 在数据仓库设计中,以下哪个模型用于表示数据的关系?A. 星型模型B. 雪花模型C. 实体-关系模型D. 维度模型18. 以下哪个不是大数据分析的应用领域?A. 金融B. 医疗C. 教育D. 农业19. 在Spark中,以下哪个组件用于机器学习?A. Spark SQLB. Spark StreamingC. MLlibD. GraphX20. 以下哪个是大数据技术中的流处理框架?A. HadoopB. SparkC. FlinkD. Storm21. 在数据分析中,以下哪个方法用于预测未来趋势?A. 聚类分析B. 关联规则C. 时间序列分析D. 回归分析22. 以下哪个是大数据技术中的图计算框架?A. HadoopB. SparkC. FlinkD. GraphX23. 在数据仓库中,以下哪个步骤用于将数据从源系统转移到数据仓库?A. 数据提取B. 数据转换C. 数据加载D. 数据清洗24. 以下哪个不是大数据技术的优势?A. 提高决策效率B. 降低成本C. 增加数据冗余D. 增强数据洞察力25. 在数据分析中,以下哪个方法用于发现数据中的模式?A. 聚类分析B. 关联规则C. 异常检测D. 回归分析26. 以下哪个是大数据技术中的列存储数据库?A. HBaseB. CassandraC. MongoDBD. HDFS27. 在数据仓库中,以下哪个步骤用于将数据转换为适合分析的格式?A. 数据提取B. 数据转换C. 数据加载D. 数据清洗28. 以下哪个不是大数据技术的挑战?A. 数据安全B. 数据隐私C. 数据冗余D. 数据质量29. 在数据分析中,以下哪个方法用于发现数据中的关联?A. 聚类分析B. 关联规则C. 异常检测D. 回归分析30. 以下哪个是大数据技术中的键值存储数据库?A. HBaseB. CassandraC. MongoDBD. HDFS31. 在数据仓库中,以下哪个步骤用于将数据加载到数据仓库中?A. 数据提取B. 数据转换C. 数据加载D. 数据清洗32. 以下哪个不是大数据技术的应用场景?A. 个性化推荐B. 风险管理C. 数据备份D. 智能分析33. 在数据分析中,以下哪个方法用于将数据分组?A. 聚类分析B. 关联规则C. 异常检测D. 回归分析34. 以下哪个是大数据技术中的文档存储数据库?A. HBaseB. CassandraC. MongoDBD. HDFS35. 在数据仓库中,以下哪个步骤用于将数据从源系统提取出来?A. 数据提取B. 数据转换C. 数据加载D. 数据清洗36. 以下哪个不是大数据技术的特点?A. 数据量大B. 数据种类多C. 数据处理速度快D. 数据处理精度低37. 在数据分析中,以下哪个方法用于预测数值?A. 聚类分析B. 关联规则C. 异常检测D. 回归分析38. 以下哪个是大数据技术中的图存储数据库?A. HBaseB. CassandraC. MongoDBD. Neo4j39. 在数据仓库中,以下哪个步骤用于将数据清洗干净?A. 数据提取B. 数据转换C. 数据加载40. 以下哪个不是大数据技术的应用领域?A. 零售B. 制造C. 娱乐D. 军事41. 在数据分析中,以下哪个方法用于发现数据中的异常?A. 聚类分析B. 关联规则C. 异常检测D. 回归分析42. 以下哪个是大数据技术中的内存数据库?A. HBaseB. CassandraC. MongoDBD. Redis43. 在数据仓库中,以下哪个步骤用于将数据转换为适合分析的格式?A. 数据提取B. 数据转换C. 数据加载D. 数据清洗44. 以下哪个不是大数据技术的优势?A. 提高决策效率B. 降低成本C. 增加数据冗余D. 增强数据洞察力45. 在数据分析中,以下哪个方法用于发现数据中的模式?A. 聚类分析B. 关联规则C. 异常检测D. 回归分析46. 以下哪个是大数据技术中的列存储数据库?A. HBaseB. CassandraC. MongoDBD. HDFS47. 在数据仓库中,以下哪个步骤用于将数据加载到数据仓库中?A. 数据提取C. 数据加载D. 数据清洗48. 以下哪个不是大数据技术的应用场景?A. 个性化推荐B. 风险管理C. 数据备份D. 智能分析49. 在数据分析中,以下哪个方法用于将数据分组?A. 聚类分析B. 关联规则C. 异常检测D. 回归分析50. 以下哪个是大数据技术中的文档存储数据库?A. HBaseB. CassandraC. MongoDBD. HDFS答案:1. D2. B3. C4. A5. C6. A7. D8. A9. B10. C11. A12. C13. C14. D15. C16. B17. C18. D19. C20. D21. C22. D23. A24. C25. A26. B27. B28. C29. B30. A31. C32. C33. A34. C35. A36. D37. D38. D39. D40. D41. C42. D43. B44. C45. A46. B47. C48. C49. A50. C。
数据分析与大数据技术管理测试 选择题 62题

1. 在大数据处理中,Hadoop的核心组件是什么?A. HBaseB. HiveC. MapReduceD. Pig2. 下列哪个不是大数据的5V特征之一?A. VolumeB. VelocityC. VarietyD. Visibility3. 在数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Online Application ProcessingC. Offline Analytical ProcessingD. Offline Application Processing4. 数据仓库的主要目的是什么?A. 实时数据处理B. 数据分析和报告C. 数据备份D. 数据加密5. 下列哪个工具不是用于数据可视化的?A. TableauB. Power BIC. ExcelD. Kafka6. 在Python中,用于数据分析的常用库是哪个?A. NumPyB. DjangoC. FlaskD. TensorFlow7. 下列哪个算法不是机器学习中的监督学习算法?A. 决策树B. 随机森林C. 聚类D. 支持向量机8. 在数据预处理中,缺失值的处理方法不包括以下哪种?A. 删除含有缺失值的记录B. 用平均值填充C. 用中位数填充D. 用最小值填充9. 下列哪个不是NoSQL数据库的类型?A. 键值存储B. 文档存储C. 关系数据库D. 图形数据库10. 在数据分析项目中,ETL过程代表什么?A. Extract, Transform, LoadB. Execute, Transfer, LogC. Encrypt, Transfer, LoadD. Extract, Test, Load11. 下列哪个工具不是用于大数据处理的?A. SparkB. HadoopC. OracleD. Flink12. 在数据分析中,PCA代表什么?A. Principal Component AnalysisB. Public Component AnalysisC. Private Component AnalysisD. Primary Component Analysis13. 下列哪个不是数据挖掘的主要任务?A. 分类B. 回归C. 聚类D. 排序14. 在数据分析中,SQL代表什么?A. Structured Query LanguageB. Standard Query LanguageC. Simple Query LanguageD. Sequential Query Language15. 下列哪个不是数据仓库的组成部分?A. 数据湖B. 数据集市C. 数据立方体D. 数据挖掘16. 在数据分析中,BI代表什么?A. Business IntelligenceB. Business IntegrationC. Business InterpretationD. Business Interaction17. 下列哪个不是数据分析的生命周期阶段?A. 数据收集B. 数据存储C. 数据销毁D. 数据分析18. 在数据分析中,RFM模型代表什么?A. Recency, Frequency, MonetaryB. Range, Frequency, MonetaryC. Recency, Force, MotionD. Range, Force, Motion19. 下列哪个不是数据可视化的主要目的?A. 数据探索B. 数据解释C. 数据加密D. 数据交流20. 在数据分析中,A/B测试主要用于什么?A. 数据清洗B. 数据验证C. 数据比较D. 数据聚合21. 下列哪个不是数据分析的常用工具?A. RB. SASC. JavaD. MATLAB22. 在数据分析中,KPI代表什么?A. Key Performance IndicatorB. Key Process IndicatorC. Key Progress IndicatorD. Key Prediction Indicator23. 下列哪个不是数据分析的主要方法?A. 描述性分析B. 预测性分析C. 规范性分析D. 随机性分析24. 在数据分析中,CRM代表什么?A. Customer Relationship ManagementB. Customer Resource ManagementC. Customer Research ManagementD. Customer Reporting Management25. 下列哪个不是数据分析的主要应用领域?A. 金融B. 医疗C. 教育D. 娱乐26. 在数据分析中,EDA代表什么?A. Exploratory Data AnalysisB. Exhaustive Data AnalysisC. Experimental Data AnalysisD. Extensive Data Analysis27. 下列哪个不是数据分析的主要技术?A. 数据挖掘B. 数据可视化C. 数据加密D. 数据建模28. 在数据分析中,SVM代表什么?A. Support Vector MachineB. Simple Vector MachineC. Standard Vector MachineD. Sequential Vector Machine29. 下列哪个不是数据分析的主要步骤?A. 数据收集B. 数据清洗C. 数据加密D. 数据分析30. 在数据分析中,OLTP代表什么?A. Online Transaction ProcessingB. Online Testing ProcessingC. Offline Transaction ProcessingD. Offline Testing Processing31. 下列哪个不是数据分析的主要工具?A. PythonB. SQLC. C++D. Tableau32. 在数据分析中,ETL代表什么?A. Extract, Transform, LoadB. Execute, Transfer, LogC. Encrypt, Transfer, LoadD. Extract, Test, Load33. 下列哪个不是数据分析的主要技术?A. 数据挖掘B. 数据可视化C. 数据加密D. 数据建模34. 在数据分析中,BI代表什么?A. Business IntelligenceB. Business IntegrationC. Business InterpretationD. Business Interaction35. 下列哪个不是数据分析的主要应用领域?A. 金融B. 医疗C. 教育D. 娱乐36. 在数据分析中,EDA代表什么?A. Exploratory Data AnalysisB. Exhaustive Data AnalysisC. Experimental Data AnalysisD. Extensive Data Analysis37. 下列哪个不是数据分析的主要技术?A. 数据挖掘B. 数据可视化C. 数据加密D. 数据建模38. 在数据分析中,SVM代表什么?A. Support Vector MachineB. Simple Vector MachineC. Standard Vector MachineD. Sequential Vector Machine39. 下列哪个不是数据分析的主要步骤?A. 数据收集B. 数据清洗C. 数据加密D. 数据分析40. 在数据分析中,OLTP代表什么?A. Online Transaction ProcessingB. Online Testing ProcessingC. Offline Transaction ProcessingD. Offline Testing Processing41. 下列哪个不是数据分析的主要工具?A. PythonB. SQLC. C++D. Tableau42. 在数据分析中,ETL代表什么?A. Extract, Transform, LoadB. Execute, Transfer, LogC. Encrypt, Transfer, LoadD. Extract, Test, Load43. 下列哪个不是数据分析的主要技术?A. 数据挖掘B. 数据可视化C. 数据加密D. 数据建模44. 在数据分析中,BI代表什么?A. Business IntelligenceB. Business IntegrationC. Business InterpretationD. Business Interaction45. 下列哪个不是数据分析的主要应用领域?A. 金融B. 医疗C. 教育D. 娱乐46. 在数据分析中,EDA代表什么?A. Exploratory Data AnalysisB. Exhaustive Data AnalysisC. Experimental Data AnalysisD. Extensive Data Analysis47. 下列哪个不是数据分析的主要技术?A. 数据挖掘B. 数据可视化C. 数据加密D. 数据建模48. 在数据分析中,SVM代表什么?A. Support Vector MachineB. Simple Vector MachineC. Standard Vector MachineD. Sequential Vector Machine49. 下列哪个不是数据分析的主要步骤?A. 数据收集B. 数据清洗C. 数据加密D. 数据分析50. 在数据分析中,OLTP代表什么?A. Online Transaction ProcessingB. Online Testing ProcessingC. Offline Transaction ProcessingD. Offline Testing Processing51. 下列哪个不是数据分析的主要工具?A. PythonB. SQLC. C++D. Tableau52. 在数据分析中,ETL代表什么?A. Extract, Transform, LoadB. Execute, Transfer, LogC. Encrypt, Transfer, LoadD. Extract, Test, Load53. 下列哪个不是数据分析的主要技术?A. 数据挖掘B. 数据可视化C. 数据加密D. 数据建模54. 在数据分析中,BI代表什么?A. Business IntelligenceB. Business IntegrationC. Business InterpretationD. Business Interaction55. 下列哪个不是数据分析的主要应用领域?A. 金融B. 医疗C. 教育D. 娱乐56. 在数据分析中,EDA代表什么?A. Exploratory Data AnalysisB. Exhaustive Data AnalysisC. Experimental Data AnalysisD. Extensive Data Analysis57. 下列哪个不是数据分析的主要技术?A. 数据挖掘B. 数据可视化C. 数据加密D. 数据建模58. 在数据分析中,SVM代表什么?A. Support Vector MachineB. Simple Vector MachineC. Standard Vector MachineD. Sequential Vector Machine59. 下列哪个不是数据分析的主要步骤?A. 数据收集B. 数据清洗C. 数据加密D. 数据分析60. 在数据分析中,OLTP代表什么?A. Online Transaction ProcessingB. Online Testing ProcessingC. Offline Transaction ProcessingD. Offline Testing Processing61. 下列哪个不是数据分析的主要工具?A. PythonB. SQLC. C++D. Tableau62. 在数据分析中,ETL代表什么?A. Extract, Transform, LoadB. Execute, Transfer, LogC. Encrypt, Transfer, LoadD. Extract, Test, Load答案:1. C2. D4. B5. D6. A7. C8. D9. C10. A11. C12. A13. D14. A15. D16. A17. C18. A19. C20. C21. C22. A23. D24. A25. D26. A27. C28. A29. C30. A31. C32. A33. C34. A35. D36. A37. C38. A39. C40. A41. C42. A43. C44. A45. D46. A47. C48. A49. C50. A51. C52. A54. A55. D56. A57. C58. A59. C60. A61. C62. A。
数据科学与大数据应用测试 选择题 62题

1. 数据科学的核心目标是什么?A. 数据存储B. 数据分析C. 数据可视化D. 数据收集2. 大数据的“4V”特性不包括以下哪一项?A. VolumeB. VelocityC. VarietyD. Visibility3. 下列哪个不是数据预处理的步骤?A. 数据清洗B. 数据集成C. 数据变换D. 数据加密4. 在数据分析中,什么是描述性分析?A. 预测未来趋势B. 描述数据特征C. 发现数据模式D. 解释数据原因5. 下列哪个算法属于监督学习?A. K-means聚类B. 决策树C. 主成分分析D. 关联规则挖掘6. 数据仓库的主要目的是什么?A. 实时数据处理B. 数据分析和报告C. 数据存储D. 数据传输7. 下列哪个工具常用于大数据处理?A. ExcelB. HadoopC. PowerPointD. Word8. 数据挖掘的主要任务不包括以下哪一项?A. 分类B. 回归C. 聚类9. 下列哪个不是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据存储D. 数据可视化10. 在数据科学中,什么是探索性数据分析(EDA)?A. 使用统计方法验证假设B. 探索数据以发现模式和关系C. 使用机器学习模型预测D. 数据清洗和预处理11. 下列哪个不是数据可视化的工具?A. TableauB. R语言C. PythonD. Photoshop12. 在数据科学项目中,数据清洗的主要目的是什么?A. 提高数据质量B. 增加数据量C. 减少数据维度D. 加速数据处理13. 下列哪个是大数据技术栈的一部分?A. SQLB. NoSQLC. HTMLD. CSS14. 在数据分析中,什么是预测性分析?A. 描述数据特征B. 预测未来趋势C. 发现数据模式D. 解释数据原因15. 下列哪个不是机器学习的主要类型?A. 监督学习B. 无监督学习C. 强化学习D. 自主学习16. 数据科学中,什么是特征工程?A. 选择和转换数据特征C. 数据可视化D. 数据加密17. 下列哪个是数据科学项目的关键步骤?A. 数据收集B. 数据存储C. 数据传输D. 数据删除18. 在数据科学中,什么是交叉验证?A. 一种数据清洗方法B. 一种模型评估技术C. 一种数据集成方法D. 一种数据变换方法19. 下列哪个不是大数据的存储解决方案?A. HDFSB. Amazon S3C. Google Cloud StorageD. Microsoft Access20. 在数据科学中,什么是模型选择?A. 选择最佳的数据模型B. 选择最佳的数据存储C. 选择最佳的数据传输D. 选择最佳的数据删除21. 下列哪个是数据科学中的常用编程语言?A. JavaB. C++C. PythonD. Swift22. 在数据科学中,什么是过拟合?A. 模型在训练数据上表现不佳B. 模型在测试数据上表现不佳C. 模型在训练数据上表现良好,但在新数据上表现不佳D. 模型在所有数据上表现良好23. 下列哪个不是数据科学中的常用工具?A. Jupyter NotebookB. RStudioC. Visual Studio CodeD. Adobe Premiere Pro24. 在数据科学中,什么是数据集市?A. 一个专门的数据存储区域B. 一个专门的数据分析区域C. 一个专门的数据可视化区域D. 一个专门的数据集成区域25. 下列哪个是数据科学中的常用库?A. NumPyB. PandasC. MatplotlibD. 所有上述选项26. 在数据科学中,什么是数据湖?A. 一个专门的数据存储区域B. 一个专门的数据分析区域C. 一个专门的数据可视化区域D. 一个专门的数据集成区域27. 下列哪个不是数据科学中的常用算法?A. 线性回归B. 逻辑回归C. 决策树D. 动态规划28. 在数据科学中,什么是数据标签?A. 数据的分类或标记B. 数据的存储格式C. 数据的传输方式D. 数据的删除方式29. 下列哪个是数据科学中的常用技术?A. 数据挖掘B. 数据清洗C. 数据可视化D. 所有上述选项30. 在数据科学中,什么是数据管道?A. 数据传输的路径B. 数据存储的路径C. 数据处理的路径D. 数据删除的路径31. 下列哪个不是数据科学中的常用平台?A. AWSB. AzureC. Google CloudD. Facebook32. 在数据科学中,什么是数据集?A. 一组相关的数据B. 一组无关的数据C. 一组随机的数据D. 一组错误的数据33. 下列哪个是数据科学中的常用方法?A. 数据收集B. 数据清洗C. 数据分析D. 所有上述选项34. 在数据科学中,什么是数据质量?A. 数据的准确性和完整性B. 数据的存储方式C. 数据的传输方式D. 数据的删除方式35. 下列哪个不是数据科学中的常用工具?A. TensorFlowB. Scikit-learnC. KerasD. AutoCAD36. 在数据科学中,什么是数据集成?A. 将多个数据源合并B. 将数据存储在多个位置C. 将数据传输到多个目的地D. 将数据删除在多个位置37. 下列哪个是数据科学中的常用技术?A. 数据挖掘B. 数据清洗C. 数据可视化D. 所有上述选项38. 在数据科学中,什么是数据变换?A. 改变数据的格式或结构B. 改变数据的存储位置C. 改变数据的传输方式D. 改变数据的删除方式39. 下列哪个不是数据科学中的常用算法?A. 支持向量机B. 随机森林C. 神经网络D. 动态规划40. 在数据科学中,什么是数据清洗?A. 去除数据中的错误和不一致性B. 增加数据量C. 减少数据维度D. 加速数据处理41. 下列哪个是数据科学中的常用工具?A. TableauB. R语言C. PythonD. 所有上述选项42. 在数据科学中,什么是数据可视化?A. 将数据转换为图形或图表B. 将数据存储在图形或图表中C. 将数据传输到图形或图表中D. 将数据删除在图形或图表中43. 下列哪个不是数据科学中的常用技术?A. 数据挖掘B. 数据清洗C. 数据可视化D. 数据输入44. 在数据科学中,什么是数据挖掘?A. 从大量数据中发现模式和知识B. 将数据存储在大量位置C. 将数据传输到大量目的地D. 将数据删除在大量位置45. 下列哪个是数据科学中的常用方法?A. 数据收集B. 数据清洗C. 数据分析D. 所有上述选项46. 在数据科学中,什么是数据分析?A. 使用统计方法和算法处理数据B. 将数据存储在统计方法和算法中C. 将数据传输到统计方法和算法中D. 将数据删除在统计方法和算法中47. 下列哪个不是数据科学中的常用工具?A. TensorFlowB. Scikit-learnC. KerasD. AutoCAD48. 在数据科学中,什么是数据集成?A. 将多个数据源合并B. 将数据存储在多个位置C. 将数据传输到多个目的地D. 将数据删除在多个位置49. 下列哪个是数据科学中的常用技术?A. 数据挖掘B. 数据清洗C. 数据可视化D. 所有上述选项50. 在数据科学中,什么是数据变换?A. 改变数据的格式或结构B. 改变数据的存储位置C. 改变数据的传输方式D. 改变数据的删除方式51. 下列哪个不是数据科学中的常用算法?A. 支持向量机B. 随机森林C. 神经网络D. 动态规划52. 在数据科学中,什么是数据清洗?A. 去除数据中的错误和不一致性B. 增加数据量C. 减少数据维度D. 加速数据处理53. 下列哪个是数据科学中的常用工具?A. TableauB. R语言C. PythonD. 所有上述选项54. 在数据科学中,什么是数据可视化?A. 将数据转换为图形或图表B. 将数据存储在图形或图表中C. 将数据传输到图形或图表中D. 将数据删除在图形或图表中55. 下列哪个不是数据科学中的常用技术?A. 数据挖掘B. 数据清洗C. 数据可视化D. 数据输入56. 在数据科学中,什么是数据挖掘?A. 从大量数据中发现模式和知识B. 将数据存储在大量位置C. 将数据传输到大量目的地D. 将数据删除在大量位置57. 下列哪个是数据科学中的常用方法?A. 数据收集B. 数据清洗C. 数据分析D. 所有上述选项58. 在数据科学中,什么是数据分析?A. 使用统计方法和算法处理数据B. 将数据存储在统计方法和算法中C. 将数据传输到统计方法和算法中D. 将数据删除在统计方法和算法中59. 下列哪个不是数据科学中的常用工具?A. TensorFlowB. Scikit-learnC. KerasD. AutoCAD60. 在数据科学中,什么是数据集成?A. 将多个数据源合并B. 将数据存储在多个位置C. 将数据传输到多个目的地D. 将数据删除在多个位置61. 下列哪个是数据科学中的常用技术?A. 数据挖掘B. 数据清洗C. 数据可视化D. 所有上述选项62. 在数据科学中,什么是数据变换?A. 改变数据的格式或结构B. 改变数据的存储位置C. 改变数据的传输方式D. 改变数据的删除方式答案:1. B2. D3. D4. B5. B6. B7. B8. D9. D10. B11. D12. A13. B14. B15. D16. A17. A18. B19. D20. A21. C22. C23. D24. A25. D26. A27. D28. A29. D30. C31. D32. A33. D34. A35. D36. A37. D38. A39. D40. A41. D42. A43. D44. A45. D46. A47. D48. A49. D50. A51. D52. A53. D54. A55. D56. A57. D58. A59. D60. A61. D62. A。
大数据技术与数据分析管理测试 选择题 61题

1题1. 大数据的“4V”特性不包括以下哪一项?A. 大量(Volume)B. 高速(Velocity)C. 多样(Variety)D. 价值(Value)答案:D2. Hadoop生态系统中,用于数据处理的框架是?A. HBaseB. HiveC. MapReduceD. Zookeeper答案:C3. 在数据分析中,以下哪种方法最适用于处理非结构化数据?A. SQL查询B. 数据挖掘C. 自然语言处理D. 统计分析答案:C4. 数据仓库的主要目的是什么?A. 实时数据处理B. 数据分析和报告C. 在线事务处理D. 数据备份答案:B5. 以下哪个工具不是用于大数据分析的?A. RB. PythonC. ExcelD. Tableau答案:C6. 在数据分析项目中,ETL过程的正确顺序是?A. 抽取、转换、加载B. 转换、抽取、加载C. 加载、抽取、转换D. 抽取、加载、转换答案:A7. 以下哪种算法不是机器学习中的监督学习算法?A. 决策树B. 随机森林C. K-均值聚类D. 支持向量机答案:C8. 在数据可视化中,以下哪种图表最适合展示时间序列数据?A. 饼图B. 散点图C. 折线图D. 条形图答案:C9. 数据湖和数据仓库的主要区别在于?A. 数据湖存储原始数据,数据仓库存储处理后的数据B. 数据湖用于实时分析,数据仓库用于批处理分析C. 数据湖只能存储结构化数据,数据仓库可以存储非结构化数据D. 数据湖不需要数据治理,数据仓库需要严格的数据治理答案:A10. 以下哪个是NoSQL数据库的例子?A. MySQLB. OracleC. MongoDBD. PostgreSQL答案:C11. 在数据分析中,以下哪个步骤通常最先进行?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:D12. 以下哪种技术不是用于大数据存储的?A. HDFSB. S3C. RAIDD. Cassandra答案:C13. 在数据分析中,以下哪个指标通常用于衡量数据的离散程度?A. 平均值B. 中位数C. 标准差D. 众数答案:C14. 以下哪个工具是用于数据挖掘的?A. ExcelB. SPSSC. Power BID. Tableau答案:B15. 在数据分析中,以下哪个步骤通常最后进行?A. 数据清洗B. 数据可视化C. 数据建模D. 数据报告答案:D16. 以下哪个是Apache Spark的主要组件?A. HBaseB. HiveC. YARND. Mesos答案:C17. 在数据分析中,以下哪个方法最适用于处理缺失数据?A. 删除含有缺失数据的记录B. 用平均值填充缺失数据C. 用中位数填充缺失数据D. 所有上述方法答案:D18. 以下哪个是用于数据可视化的开源工具?A. TableauB. QlikViewC. D3.jsD. Power BI答案:C19. 在数据分析中,以下哪个步骤通常涉及数据转换?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A20. 以下哪个是用于大数据处理的分布式计算框架?A. TensorFlowB. PyTorchC. Apache FlinkD. Keras答案:C21. 在数据分析中,以下哪个指标通常用于衡量数据的集中趋势?A. 标准差B. 方差C. 平均值D. 范围答案:C22. 以下哪个是用于数据仓库的工具?A. MySQLB. OracleC. SnowflakeD. MongoDB答案:C23. 在数据分析中,以下哪个步骤通常涉及数据集成?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A24. 以下哪个是用于大数据分析的商业智能工具?A. RB. PythonC. TableauD. Hadoop答案:C25. 在数据分析中,以下哪个步骤通常涉及数据验证?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A26. 以下哪个是用于大数据处理的实时流处理框架?A. Apache KafkaB. Apache StormC. Apache SparkD. Apache Flink答案:D27. 在数据分析中,以下哪个指标通常用于衡量数据的分布形状?A. 偏度B. 峰度C. 标准差D. 平均值答案:A28. 以下哪个是用于大数据分析的机器学习库?A. TensorFlowB. D3.jsC. TableauD. Hadoop答案:A29. 在数据分析中,以下哪个步骤通常涉及数据标准化?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A30. 以下哪个是用于大数据分析的数据库管理系统?A. MySQLB. OracleC. MongoDBD. PostgreSQL答案:C31. 在数据分析中,以下哪个步骤通常涉及数据归一化?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A32. 以下哪个是用于大数据分析的数据湖平台?A. Amazon S3B. Google Cloud StorageC. Azure Data LakeD. All of the above答案:D33. 在数据分析中,以下哪个步骤通常涉及数据抽样?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A34. 以下哪个是用于大数据分析的数据挖掘工具?A. RB. PythonC. SPSSD. Tableau答案:C35. 在数据分析中,以下哪个步骤通常涉及数据分组?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A36. 以下哪个是用于大数据分析的数据仓库工具?A. MySQLB. OracleC. SnowflakeD. MongoDB答案:C37. 在数据分析中,以下哪个步骤通常涉及数据聚合?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A38. 以下哪个是用于大数据分析的数据可视化工具?A. RB. PythonC. TableauD. Hadoop答案:C39. 在数据分析中,以下哪个步骤通常涉及数据过滤?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A40. 以下哪个是用于大数据分析的数据处理框架?A. TensorFlowB. PyTorchC. Apache FlinkD. Keras答案:C41. 在数据分析中,以下哪个步骤通常涉及数据排序?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A42. 以下哪个是用于大数据分析的数据集成工具?A. TalendB. InformaticaC. SSISD. All of the above答案:D43. 在数据分析中,以下哪个步骤通常涉及数据合并?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A44. 以下哪个是用于大数据分析的数据治理工具?A. CollibraB. InformaticaC. TalendD. All of the above答案:D45. 在数据分析中,以下哪个步骤通常涉及数据转换?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A46. 以下哪个是用于大数据分析的数据质量工具?A. TrifactaB. InformaticaC. TalendD. All of the above答案:D47. 在数据分析中,以下哪个步骤通常涉及数据验证?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A48. 以下哪个是用于大数据分析的数据安全工具?A. Apache RangerB. Apache SentryC. Cloudera NavigatorD. All of the above答案:D49. 在数据分析中,以下哪个步骤通常涉及数据标准化?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A50. 以下哪个是用于大数据分析的数据湖管理工具?A. Amazon S3B. Google Cloud StorageC. Azure Data LakeD. All of the above答案:D51. 在数据分析中,以下哪个步骤通常涉及数据归一化?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A52. 以下哪个是用于大数据分析的数据抽样工具?A. RB. PythonC. SPSSD. Tableau答案:C53. 在数据分析中,以下哪个步骤通常涉及数据分组?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A54. 以下哪个是用于大数据分析的数据聚合工具?A. RB. PythonC. SPSSD. Tableau答案:C55. 在数据分析中,以下哪个步骤通常涉及数据过滤?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A56. 以下哪个是用于大数据分析的数据排序工具?A. RB. PythonC. SPSSD. Tableau答案:C57. 在数据分析中,以下哪个步骤通常涉及数据合并?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A58. 以下哪个是用于大数据分析的数据转换工具?A. RB. PythonC. SPSSD. Tableau答案:C59. 在数据分析中,以下哪个步骤通常涉及数据验证?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A60. 以下哪个是用于大数据分析的数据安全工具?A. Apache RangerB. Apache SentryC. Cloudera NavigatorD. All of the above答案:D61. 在数据分析中,以下哪个步骤通常涉及数据标准化?A. 数据清洗B. 数据可视化C. 数据建模D. 数据收集答案:A答案1. D2. C3. C4. B5. C6. A7. C8. C9. A10. C11. D12. C13. C14. B15. D16. C17. D18. C19. A20. C21. C22. C23. A24. C25. A26. D27. A28. A29. A30. C31. A32. D33. A34. C35. A36. C37. A38. C39. A40. C41. A42. D43. A44. D45. A46. D47. A48. D49. A50. D51. A52. C53. A54. C55. A56. C57. A58. C59. A60. D61. A。
云计算与大数据管理测试 选择题 64题

1. 云计算的核心特征是什么?A. 按需自助服务B. 广泛的网络访问C. 资源池化D. 快速弹性E. 以上都是2. 云计算服务模型中,哪一层提供基础设施作为服务(IaaS)?A. 应用层B. 平台层C. 基础设施层D. 存储层3. 以下哪个是云计算的部署模型?A. 私有云B. 公共云C. 混合云D. 社区云E. 以上都是4. 大数据的“4V”特征不包括以下哪一项?A. 容量(Volume)B. 速度(Velocity)C. 多样性(Variety)D. 价值(Value)E. 可视化(Visualization)5. Hadoop生态系统中的哪个组件用于数据存储?A. HBaseB. HiveC. PigD. MapReduce6. 在Hadoop中,哪个组件用于数据处理?A. HDFSB. YARNC. MapReduceD. Oozie7. 以下哪个不是NoSQL数据库的类型?A. 键值存储B. 文档存储C. 列存储D. 关系型数据库8. 大数据分析中,机器学习的主要目的是什么?A. 数据清洗B. 数据存储C. 数据挖掘D. 数据可视化9. 云计算中的“弹性计算”指的是什么?A. 资源的按需分配B. 资源的固定分配C. 资源的随机分配D. 资源的预分配10. 以下哪个是大数据处理框架?A. SparkB. DockerC. KubernetesD. Jenkins11. 在云计算中,SLA(服务级别协议)主要关注什么?A. 服务质量B. 服务价格C. 服务类型D. 服务时间12. 以下哪个是云计算的安全挑战?A. 数据隐私B. 数据备份C. 数据迁移D. 数据压缩13. 大数据技术中的“流处理”主要用于什么?A. 批量数据处理B. 实时数据处理C. 数据存储D. 数据分析14. 以下哪个是云计算的成本优势?A. 高初始投资B. 低运营成本C. 高维护成本D. 高能源消耗15. 在Hadoop中,哪个组件用于资源管理?A. HDFSB. YARNC. MapReduceD. Oozie16. 以下哪个是大数据的可视化工具?A. TableauB. MySQLC. MongoDBD. Redis17. 云计算中的“多租户”指的是什么?A. 多个用户共享同一资源B. 单个用户使用多个资源C. 多个用户使用多个资源D. 单个用户使用单个资源18. 以下哪个是云计算的服务模型?A. SaaSB. PaaSC. IaaSD. 以上都是19. 大数据技术中的“数据湖”主要用于什么?A. 结构化数据存储B. 非结构化数据存储C. 半结构化数据存储D. 以上都是20. 以下哪个是云计算的性能指标?A. 响应时间B. 吞吐量C. 并发用户数D. 以上都是21. 在Hadoop中,哪个组件用于数据查询?A. HBaseB. HiveC. PigD. MapReduce22. 以下哪个是大数据的存储技术?A. HDFSB. NFSC. CIFSD. SMB23. 云计算中的“虚拟化”主要用于什么?A. 资源隔离B. 资源共享C. 资源优化D. 资源备份24. 以下哪个是大数据的分析技术?A. 数据挖掘B. 数据清洗C. 数据存储D. 数据迁移25. 在云计算中,“负载均衡”主要用于什么?A. 提高系统性能B. 降低系统性能C. 增加系统复杂性D. 减少系统可靠性26. 以下哪个是云计算的网络技术?A. VPNB. VLANC. VPCD. VTC27. 大数据技术中的“数据仓库”主要用于什么?A. 结构化数据存储B. 非结构化数据存储C. 半结构化数据存储D. 以上都是28. 以下哪个是云计算的存储服务?A. Amazon S3B. Amazon EC2C. Amazon RDSD. Amazon Lambda29. 在Hadoop中,哪个组件用于作业调度?A. HDFSB. YARNC. MapReduceD. Oozie30. 以下哪个是大数据的处理技术?A. SparkB. DockerC. KubernetesD. Jenkins31. 云计算中的“自动扩展”主要用于什么?A. 提高系统性能B. 降低系统性能C. 增加系统复杂性D. 减少系统可靠性32. 以下哪个是大数据的存储技术?A. HBaseB. HiveC. PigD. MapReduce33. 在云计算中,“容器化”主要用于什么?A. 资源隔离B. 资源共享C. 资源优化D. 资源备份34. 以下哪个是大数据的分析技术?A. 数据挖掘B. 数据清洗C. 数据存储D. 数据迁移35. 在Hadoop中,哪个组件用于数据存储和处理?A. HDFSB. YARNC. MapReduceD. Oozie36. 以下哪个是云计算的网络技术?A. VPNB. VLANC. VPCD. VTC37. 大数据技术中的“数据湖”主要用于什么?A. 结构化数据存储B. 非结构化数据存储C. 半结构化数据存储D. 以上都是38. 以下哪个是云计算的存储服务?A. Amazon S3B. Amazon EC2C. Amazon RDSD. Amazon Lambda39. 在Hadoop中,哪个组件用于作业调度?A. HDFSB. YARNC. MapReduceD. Oozie40. 以下哪个是大数据的处理技术?A. SparkB. DockerC. KubernetesD. Jenkins41. 云计算中的“自动扩展”主要用于什么?A. 提高系统性能B. 降低系统性能C. 增加系统复杂性D. 减少系统可靠性42. 以下哪个是大数据的存储技术?A. HBaseB. HiveC. PigD. MapReduce43. 在云计算中,“容器化”主要用于什么?A. 资源隔离B. 资源共享C. 资源优化D. 资源备份44. 以下哪个是大数据的分析技术?A. 数据挖掘B. 数据清洗C. 数据存储D. 数据迁移45. 在Hadoop中,哪个组件用于数据存储和处理?A. HDFSB. YARNC. MapReduceD. Oozie46. 以下哪个是云计算的网络技术?A. VPNB. VLANC. VPCD. VTC47. 大数据技术中的“数据湖”主要用于什么?A. 结构化数据存储B. 非结构化数据存储C. 半结构化数据存储D. 以上都是48. 以下哪个是云计算的存储服务?A. Amazon S3B. Amazon EC2C. Amazon RDSD. Amazon Lambda49. 在Hadoop中,哪个组件用于作业调度?A. HDFSB. YARNC. MapReduceD. Oozie50. 以下哪个是大数据的处理技术?A. SparkB. DockerC. KubernetesD. Jenkins51. 云计算中的“自动扩展”主要用于什么?A. 提高系统性能B. 降低系统性能C. 增加系统复杂性D. 减少系统可靠性52. 以下哪个是大数据的存储技术?A. HBaseB. HiveC. PigD. MapReduce53. 在云计算中,“容器化”主要用于什么?A. 资源隔离B. 资源共享C. 资源优化D. 资源备份54. 以下哪个是大数据的分析技术?A. 数据挖掘B. 数据清洗C. 数据存储D. 数据迁移55. 在Hadoop中,哪个组件用于数据存储和处理?A. HDFSB. YARNC. MapReduceD. Oozie56. 以下哪个是云计算的网络技术?A. VPNB. VLANC. VPCD. VTC57. 大数据技术中的“数据湖”主要用于什么?A. 结构化数据存储B. 非结构化数据存储C. 半结构化数据存储D. 以上都是58. 以下哪个是云计算的存储服务?A. Amazon S3B. Amazon EC2C. Amazon RDSD. Amazon Lambda59. 在Hadoop中,哪个组件用于作业调度?A. HDFSB. YARNC. MapReduceD. Oozie60. 以下哪个是大数据的处理技术?A. SparkB. DockerC. KubernetesD. Jenkins61. 云计算中的“自动扩展”主要用于什么?A. 提高系统性能B. 降低系统性能C. 增加系统复杂性D. 减少系统可靠性62. 以下哪个是大数据的存储技术?A. HBaseB. HiveC. PigD. MapReduce63. 在云计算中,“容器化”主要用于什么?A. 资源隔离B. 资源共享C. 资源优化D. 资源备份64. 以下哪个是大数据的分析技术?A. 数据挖掘B. 数据清洗C. 数据存储D. 数据迁移答案:1. E2. C3. E4. E5. A6. C7. D8. C9. A10. A11. A12. A13. B14. B15. B16. A17. A18. D19. B20. D21. B22. A23. A24. A25. A26. C27. A28. A29. D30. A31. A32. A33. A34. A35. A36. C37. D38. A39. D40. A41. A42. A43. A44. A45. A46. C47. D48. A49. D50. A51. A52. A53. A54. A55. A56. C57. D58. A59. D60. A61. A62. A63. A64. A。
ict大数据练习题(含参考答案)

ict大数据练习题(含参考答案)一、单选题(共60题,每题1分,共60分)1、Kafka中每种消息类别称为什么?A、TopicB、SubjectC、ThezeD、Object正确答案:A2、关于删除负载均衡,错误的是。
A、除非必要,请不要删除已创建的ELB服务B、删除了ELB服务以后相应,的服务配置和服务地址保留C、如果重新创建ELB服务,可以由系统重新分配一个服务地址D、如果重新创建ELB服务,可以指定原地址正确答案:B3、查询集合操作中,表示交集的是:()。
A、INTERSECTB、MINUSC、EXECPTD、UNION正确答案:A4、在实际工作中,VLAN 能实现的功能是哪个A、属于相同vlan的虚拟机应该使用相同地址段的IP地址,否则无法正常通信。
B、两个部门的虚拟机使用了不同的VLAN 以后,相互之间不能再通信C、属于相同VLAN 的虚拟机可以使用不同地址段的IP 地址,并能使用广播发现彼此D、属于不同VLAN 的虚拟机可以使用相同的IP 地址,且不会发生地址冲突正确答案:A5、以下()属于VDC只读管理员权限。
A、对本 VDC 及其下级 VDC 中资源、用户、项目、自运维等具有操作权限B、对用户、操作日志等具有导出权限C、创建下级VDCD、管理审批流程正确答案:B6、发布基于Docker的容器应用,包含应用构建、配置信息的部件是什么?A、Docker imageB、Docker registryC、DockerfileD、Docker Hub正确答案:C7、代维帐号可以进入被代维的()一级VDC进行代维。
A、1个B、2个C、5个D、1个或多个正确答案:D8、Microsoft SQL Server默认可创建()个数据库。
A、200B、100C、300D、500正确答案:B9、HBase表设计为什么一般不超过两个列簇?A、过多的列簇不适合读写分离B、过多的列簇会导致memstoreflush时I0压力过大C、过多的列簇I0开销大D、过多的列簇StoreFil1e过多,Coapaction压力大正确答案:C10、FusionInsightHD系统中,()不属于集群节点的磁盘分区。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
光环国际大数据测试题
姓名_______ 成绩________
一、单选题(每题2分,共15题)
1、当前大数据技术的基础是由()首先提出的
A. 微软
B. 百度
C. 谷歌
D. 阿里巴巴
2、大数据的起源是()
A. 金融
B. 电信
C. 互联网
D. 公共管理
3、()反映数据的精细化程度,越细化的数据,价值越高。
A. 规模
B. 活性
C. 关联度
D. 颗粒度
4、数据清洗的方法不包括()
A. 缺失值处理
B. 噪声数据清除
C. 一致性检查
D. 重复数据记录处理
5、当程序经过编译或者汇编以后,形成了一种由机器指令组成的集合,被称为()
A. 源程序
B. 目标程序
C. 可执行程序
D. 非执行程序
6、大数据的核心就是()
A. 告知与许可
B. 预测
C. 匿名化
D. 规模化
7、大数据不是要教机器像人一样思考。
相反,它是()
A.把数学算法运用到海量的数据上来预测事情发生的可能性。
B.被视为人工智能的一部分
C.被视为一种机器学习
D.预测与惩罚
8、当前社会中,最为突出的大数据环境是()
A.互联网
B.物联网
C.综合国力
D.自然资源
9、以下哪些技术为大数据常用框架或技术(多选)()。
A.Hadoop
B.Spark
C.Hbase
D.Linux
10、云计算按照服务类型大致可分为以下类(多选)()
A.IaaS
B.PaaS
C.SaaS
D.效用计算
11、下列哪个语句在Python中是非法的?()
A.x=y=z=1
B.x=(y=z+1)
C.x,y=y,x
D.x+=y
12、关于数据的潜在价值,说法正确的是(多选)()
A. 数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,
而绝大部分则隐藏在表面之下。
B. 判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考
虑其目前的用途。
C. 在基本用途完成后,数据的价值仍然存在,只是处于休眠状态
D. 数据的价值是其所有可能用途的总和
13、下列不是Java语言面向对象的特点()
A.封装
B.继承
C.跨平台
D.多态
14、大数据人才整体上需要具备(多选)()等核心知识
A.数学与统计知识
B.计算机相关知识
C.马克思主义哲学知识
D.市场运营管理知识
15、观察下图,其中问号选择()
16、在Python中,下列哪种说法是错误的 ( D )
A、除字典类型外,所有标准对象均可以用于布尔测试
B、空字符串的布尔值是False
C、空列表对象的布尔值是False
D、值为0的任何数字对象的布尔值是False
17、ArrayList类的底层数据结构是( A )
A、数组结构
B、链表结构
C、哈希表结构
D、红黑树结构
18、Java中覆盖与重载的关系是:( A )。
A、覆盖只有发生在父类与子类之间,而重载可以发生在同一个类中
B、覆盖方法可以不同名,而重载方法必须同名
C、final修饰的方法可以被覆盖,但不能被重载
D、覆盖与重载是同一回事
19、下面关于进程、线程的说法不正确的是( C )。
A、进程是程序的一次动态执行过程。
一个进程在其执行过程中,可以产生
多个线程——多线程,形成多条执行线索。
B、线程是比进程更小的执行单位,是在一个进程中独立的控制流,即程序
内部的控制流。
线程本身不能自动运行,栖身于某个进程之中,由进程
启动执行。
C、Java多线程的运行与平台无关。
D、对于单处理器系统,多个线程分时间片获取CPU或其他系统资源来运行。
对于多处理器系统,线程可以分配到多个处理器中,从而真正的并发执
行多任务。
20、请问下列哪些类是定义在java.io包中的抽象类( ABD ) (多选)
A. InputStream
B. OutputStream
C. PrintStream
D. Reader
E. FileInputStream
F. FileWriter
二、填空题(共10题,每题2分)
16、数据库的三大范式______、______、______
17、Linux下__________________命令把某一个文件下的所有的文件分发到其他的机器上。
18、Linux用_______命令查看cpu,硬盘,内存的信息。
19、Java的三大体系分别是______、______、______
20、Java中的变量可分为两种数据类型,分别是______和______。
21、在java中,byte类型数组占_____个字节,short类型数据占____个字节,int类型数据占____个字节,long类型数据占____个字节
22、Python中的可变数据类型有_______,不可变数据类型有_________ 。
23、Python提供了两个对象身份比较操作符_____和______来测试两个变量是否指向同一个对象,也可以通过内建函数_______来测试对象的类型。
24、队列的实现是_______,消费的顺序是________。
25、hadoop的角色中_______负责管理元数据信息、________做namenode冷备份、________主要做储存数据的、_________管理任务、_________执行任务。
三、判断题(每题1分,共10题)
26、数据化就是数字化,是相互等同的关系。
( )
27、即使数据用于基本用途的价值会减少,但潜在价值却依然强大。
()
28、对于大型、中等、小型规模的公司而言,大数据对中等规模的公司帮助最大。
( )
29、大数据的核心思想就是用规模剧增来改变现状。
()
30、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的
数据库。
因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。
()
31、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。
因此,
大数据收集的信息量要尽量精确。
()
32、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这
些样本作为调查对象。
在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。
()
33、大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事
件必然会发生。
()
34、Java 和 c都是面向对象的程序设计语言。
()
35、Hadoop 支持数据的随机读写。
( )
36、Java 静态初始化器是在其所属的类对象实例化时由系统自动调用执行。
( F )
37、Java 线程间通信可通过共享数据使线程互相交流,也可通过线程控制方法
使线程互相等待。
( T )
38、在Python中除字典类型外,所有标准对象均可以用于布尔测试( T )
39、40XL是Python合法的标识符( F )
40、Java中map集合的value值可以重复( T )
四、问答题(每题10分,共4题)
36、简述大数据技术的特点。
37、说下你理解的大数据,以及知道的大数据相关的一些技术和框架;谈谈你对hadoop 的一些理解,包括哪些组件。
38、明一家过一座桥,过桥时是黑夜,所以必须有灯。
现在小明过桥要1秒,小明的弟弟要3秒,小明的爸爸要6秒,小明的妈妈要8秒,小明的爷爷要12秒。
每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30秒就会熄灭。
问:小明一家如何过桥
39、
40、有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90克各一份?
40、多线程实现交替打印1到20?
41、写出你所知道的所有能遍历list和map集合的方法
42、一行把[1,2,3,1,2,3] 中的重复元素剔除。