大数据算法2019尔雅答案

合集下载

大数据算法与模型考试 选择题 60题

大数据算法与模型考试 选择题 60题

1. 在大数据处理中,MapReduce是一种常用的计算模型,它主要由哪两个阶段组成?A. Map和FilterB. Reduce和SortC. Map和ReduceD. Filter和Reduce2. 下列哪个不是大数据的5V特征之一?A. VolumeB. VelocityC. VarietyD. Visibility3. 在数据挖掘中,K-means算法属于哪一类算法?A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法4. 下列哪个工具不是用于大数据处理的?A. HadoopB. SparkC. ExcelD. Hive5. 在机器学习中,过拟合是指模型在训练数据上表现良好,但在新数据上表现不佳。

下列哪个方法可以减少过拟合?A. 增加数据量B. 减少特征数量C. 增加模型复杂度D. 减少训练次数6. 下列哪个算法是基于决策树的集成学习方法?A. K-NNB. Random ForestC. SVMD. Naive Bayes7. 在大数据分析中,ETL代表什么?A. Extract, Transform, LoadB. Encode, Test, LoadC. Extract, Transfer, LinkD. Encode, Transform, Link8. 下列哪个不是NoSQL数据库的类型?A. 键值存储B. 文档存储C. 关系数据库D. 图形数据库9. 在数据预处理中,数据清洗的主要目的是什么?A. 增加数据量B. 减少数据量C. 提高数据质量D. 降低数据质量10. 下列哪个算法是用于推荐系统的?A. AprioriB. PageRankC. Collaborative FilteringD. K-means11. 在大数据环境中,HDFS是哪个框架的文件系统?A. HadoopB. SparkC. HiveD. MongoDB12. 下列哪个不是大数据分析的步骤?A. 数据收集B. 数据存储C. 数据加密D. 数据分析13. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 是否有标签数据B. 是否使用神经网络C. 是否使用决策树D. 是否使用回归分析14. 下列哪个算法是用于异常检测的?A. PCAB. SVMC. K-NND. DBSCAN15. 在大数据处理中,流处理与批处理的主要区别是什么?A. 数据处理的速度B. 数据处理的量C. 数据处理的类型D. 数据处理的频率16. 下列哪个不是大数据技术的优势?A. 提高数据处理速度B. 降低数据存储成本C. 减少数据分析的准确性D. 增强数据分析的能力17. 在数据挖掘中,关联规则挖掘的主要目的是什么?A. 发现数据中的模式B. 预测数据的趋势C. 分类数据D. 聚类数据18. 下列哪个不是数据仓库的特征?A. 面向主题B. 集成性C. 时变性D. 实时性19. 在大数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Offline Analytical ProcessingC. Online Application ProcessingD. Offline Application Processing20. 下列哪个算法是用于文本挖掘的?A. TF-IDFB. K-meansC. SVMD. Random Forest21. 在大数据环境中,Spark与Hadoop的主要区别是什么?A. 数据处理速度B. 数据存储方式C. 数据处理模型D. 数据分析工具22. 下列哪个不是数据可视化的工具?A. TableauB. Power BIC. ExcelD. Hadoop23. 在机器学习中,特征选择的主要目的是什么?A. 增加模型复杂度B. 减少数据量C. 提高模型性能D. 降低数据质量24. 下列哪个算法是用于时间序列分析的?A. ARIMAB. K-NNC. SVMD. Random Forest25. 在大数据处理中,数据湖与数据仓库的主要区别是什么?A. 数据存储方式B. 数据处理速度C. 数据分析工具D. 数据处理模型26. 下列哪个不是大数据分析的应用领域?A. 金融B. 医疗C. 教育D. 娱乐27. 在数据挖掘中,分类与回归的主要区别是什么?A. 输出类型B. 输入类型C. 算法类型D. 数据类型28. 下列哪个不是大数据技术的挑战?A. 数据安全B. 数据隐私C. 数据质量D. 数据简单性29. 在大数据分析中,数据治理的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型30. 下列哪个算法是用于图像识别的?A. CNNB. K-meansC. SVMD. Random Forest31. 在大数据环境中,数据脱敏的主要目的是什么?A. 提高数据质量B. 保护数据隐私C. 增加数据量32. 下列哪个不是大数据分析的工具?A. RB. PythonC. JavaD. Excel33. 在机器学习中,交叉验证的主要目的是什么?A. 提高模型性能B. 减少数据量C. 增加数据类型D. 降低数据质量34. 下列哪个算法是用于序列挖掘的?A. AprioriB. PageRankC. Collaborative FilteringD. K-means35. 在大数据处理中,数据集成的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型36. 下列哪个不是大数据技术的应用场景?A. 智能推荐B. 风险管理C. 数据加密D. 预测分析37. 在数据挖掘中,频繁项集挖掘的主要目的是什么?A. 发现数据中的模式B. 预测数据的趋势C. 分类数据D. 聚类数据38. 下列哪个不是数据仓库的设计原则?A. 面向主题B. 集成性C. 时变性D. 实时性39. 在大数据分析中,数据湖的主要优势是什么?A. 数据存储方式C. 数据分析工具D. 数据处理模型40. 下列哪个算法是用于社交网络分析的?A. PageRankB. K-meansC. SVMD. Random Forest41. 在大数据环境中,数据质量管理的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型42. 下列哪个不是大数据分析的步骤?A. 数据收集B. 数据存储C. 数据加密D. 数据分析43. 在机器学习中,模型评估的主要目的是什么?A. 提高模型性能B. 减少数据量C. 增加数据类型D. 降低数据质量44. 下列哪个算法是用于推荐系统的?A. AprioriB. PageRankC. Collaborative FilteringD. K-means45. 在大数据处理中,数据清洗的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型46. 下列哪个不是大数据技术的优势?A. 提高数据处理速度B. 降低数据存储成本C. 减少数据分析的准确性D. 增强数据分析的能力47. 在数据挖掘中,关联规则挖掘的主要目的是什么?A. 发现数据中的模式B. 预测数据的趋势C. 分类数据D. 聚类数据48. 下列哪个不是数据仓库的特征?A. 面向主题B. 集成性C. 时变性D. 实时性49. 在大数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Offline Analytical ProcessingC. Online Application ProcessingD. Offline Application Processing50. 下列哪个算法是用于文本挖掘的?A. TF-IDFB. K-meansC. SVMD. Random Forest51. 在大数据环境中,Spark与Hadoop的主要区别是什么?A. 数据处理速度B. 数据存储方式C. 数据处理模型D. 数据分析工具52. 下列哪个不是数据可视化的工具?A. TableauB. Power BIC. ExcelD. Hadoop53. 在机器学习中,特征选择的主要目的是什么?A. 增加模型复杂度B. 减少数据量C. 提高模型性能D. 降低数据质量54. 下列哪个算法是用于时间序列分析的?A. ARIMAB. K-NNC. SVMD. Random Forest55. 在大数据处理中,数据湖与数据仓库的主要区别是什么?A. 数据存储方式B. 数据处理速度C. 数据分析工具D. 数据处理模型56. 下列哪个不是大数据分析的应用领域?A. 金融B. 医疗C. 教育D. 娱乐57. 在数据挖掘中,分类与回归的主要区别是什么?A. 输出类型B. 输入类型C. 算法类型D. 数据类型58. 下列哪个不是大数据技术的挑战?A. 数据安全B. 数据隐私C. 数据质量D. 数据简单性59. 在大数据分析中,数据治理的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型60. 下列哪个算法是用于图像识别的?A. CNNB. K-meansC. SVMD. Random Forest答案部分1. C2. D3. B4. C5. B6. B7. A9. C10. C11. A12. C13. A14. A15. D16. C17. A18. D19. A20. A21. A22. D23. C24. A25. A26. D27. A28. D29. A30. A31. B32. C33. A34. A35. A36. C37. A38. D39. A40. A41. A42. C43. A44. C45. A46. C47. A48. D49. A50. A51. A52. D53. C54. A55. A56. D57. A59. A60. A。

大数据考试答案分析(良心出品)

大数据考试答案分析(良心出品)

1、当前大数据技术的基础是由(C)首先提出的。

(单选题,本题2分)A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C )。

(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。

(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。

(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。

(单选题,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、下列关于普查的缺点的说法中,正确的是(A)A、工作量大,容易导致调查内容有限,产生重复和遗漏现象B、误差不易被控制C、对样本的依赖性和比较性D、评测结果不够稳定7、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。

A:统计报表B:网络爬虫C:API接口D:传感器8、智慧城市的智慧之源使(C)A:数字城市B:物联网C:大数据D:云计算9、下列关于数据重组的说法中,错误的是(A)。

(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新10、智慧城市的构建,不包含(C)。

(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算11、大数据的最显著特征是(A)。

(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使(A)。

A:因果相关B:相关因果C:并列相关D:因果并列13、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B )。

信息素养通识教程:数字化生存的必修课2019尔雅答案

信息素养通识教程:数字化生存的必修课2019尔雅答案

课程概述1【判断题】对我们来说,学会检索方法将会受益无穷。

() 答案:√如何适应信息社会?1【单选题】职业面向信息社会的定义不包括()。

答案:云计算A、知识经济B、专业人士C、云计算D、理论知识2【单选题】在信息社会发展阶段的中级阶段时期,面临的问题主要是()。

答案:包容性问题A、基本设施跟不上需求B、包容性问题C、互通问题D、发展不平衡3【单选题】文化面向信息社会的定义不包括()。

答案:信息经济A、新媒体B、信息爆炸C、数字鸿沟D、信息经济4【单选题】科技面向信息社会的定义不包括()。

答案:ISDNA、ICTsB、云计算C、ISDND、大数据【单选题】空间面向信息社会的定义不包括()。

答案:云计算A、网络社会B、云计算C、万物互联D、赛博空间6【多选题】英国学者韦伯在«信息社会理论»一书中,区分出面向()关于信息社会的定义。

ABCDEA、科技B、经济C、职业D、文化E、空间7【多选题】«信息社会理论»一书中面向经济,与信息社会相关的定义有()ABCDA、信息经济B、电子商务C、共享经济D、互联网+8【多选题】信息资源的类型大体包括()。

ABCDA、口语信息资源B、文献信息资源C、实物信息资源D、体语信息资源9【多选题】关于信息社会的共识包括了()。

ABCA、信息数量B、信息角色C、信息化的发展是连续性的【判断题】职业面向的信息社会定义强调职业的变迁,是信息社会的标志。

() 答案:正确11【判断题】香农的信息论认为,信息是用来消除不确定性的东西。

() 答案:√12【判断题】信息资源等同于信息源。

() 答案:×为什么需要信息素养?1【单选题】()就是进行媒体相关信息活动的素养。

答案:媒体素养A、数字素养B、网络素养C、媒体素养D、计算机素养2【单选题】简单说,()就是有关信息的基本知识。

答案:信息知识A、信息意识B、信息能力C、信息伦理D、信息知识3【多选题】信息素养类型包括有()等。

2019年大数据测试答案

2019年大数据测试答案

智慧健康医疗1、CAD在医疗健康领域的英文全称是()Computer Aided Diagnosis2、不属于AI健康医疗生态系统的是()制药生态3、不属于慢性疾病的是()艾滋病4、AI院前管理包括()预测和干预5、AI医疗健康技术体系的基础层不包括()芯片6、AI医疗健康发展的核心要素是()数据7、我国首次研发的AI医疗系统是面向()中医8、第3次AI浪潮的到来主要依赖于()深度学习9、目前AI医疗健康市场最成熟的是()辅助医疗影像诊断10、我国慢性疾病增加,与老龄化加剧的关系()强相关11、AI医疗健康的核心技术体系主要包括()传感器技术存储技术传输技术12、AI辅助诊断属于()院中管理13、婴幼儿时期的环境暴露不会影响个体后期的身体健康。

错误14、以下不属于大数据时代特征的是()数据处理速度迅速提升15、以下哪一项不是人工智能发展的必要条件()机器学习16、以下哪一项不属于健康医疗大数据来源()购物数据17、以下不属于机器学习研究范畴的是()专家系统18、以下属于人工智能在医疗领域应用的是()多选疾病预测辅助诊断药物个性化推荐19、以下对大数据描述正确的是()大数据本质在于数据的关联分析20、以下不属于弱人工智能特点的是()自适应能力21、人工智能技术发展出现几次低潮的原因包括()多选算法研究瓶颈计算能力瓶颈数据有限22、以下说法正确的是()人工智能就是深度学习23、以下说法正确的是()健康医疗领域数据存在孤岛现象24、以下说法正确的是()即使在大数据时代,统计分析仍然具有重要的作用25、以下关于人工智能、机器学习和深度学习说法正确的是()机器学习或深度学习是实现人工智能的一种方法大数据应用1、大数据起源于()互联网2、第一个提出大数据概念的公司是()麦肯锡3、)规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理。

大数据4、大数据的本质是()洞察价值5、大数据的最显著特征()数据规模大6、海军人员通过对前人航海日志的分析,绘制了新的航海路线图,标明大风与洋流可能发生的地点。

大数据算法2019尔雅答案

大数据算法2019尔雅答案

⼤数据算法2019尔雅答案1.11【单选题】以下关于⼤数据的特点,叙述错误的是()。

答案:速度慢?A、速度慢B、多元、异构C、数据规模⼤D、基于⾼度分析的新价值2【单选题】在《法华经》中,“那由他”描写的“⼤”的数量级是()。

答案:10^28A、10^7B、10^14C、10^28D、10^563【多选题】以下选项中,⼤数据涉及的领域中包括()。

答案:社交⽹络计算机艺术医疗数据A、社交⽹络B、医疗数据C、计算机艺术D、医疗数据4【多选题】⼤数据的应⽤包括()。

答案:推荐科学研究预测商业情报分析A、预测B、推荐C、商业情报分析D、科学研究5【判断题】⽬前,关于⼤数据已有公认的确定定义。

答案:×6【判断题】⼤数据种类繁多,在编码⽅式、数据格式、应⽤特征等⽅⾯都存在差异。

()答案:√1.21【单选题】⼤数据求解计算问题过程的第三步⼀般是()。

答案:算法设计与分析?A、判断可计算否B、判断能⾏可计算否C、算法设计与分析D、⽤计算机语⾔实现算法2【多选题】在⼤数据求解计算问题中,判断是否为能⾏可计算的因素包括()。

答案:资源约束数据量时间约束A、数据量B、资源约束C、速度约束D、时间约束3【判断题】⼤数据求解计算问题过程的第⼀步是确定该问题是否可计算。

答案:√4【判断题】⼤数据计算模型与⼀般⼩规模计算模型⼀样,都使⽤的是图灵机模型。

答案:√1.31【多选题】资源约束包括()。

答案:⽹络带宽外存CPU内存A、CPUB、⽹络带宽C、内存D、外存2【多选题】⼤数据算法可以不是()。

答案:精确算法串⾏算法内存算法A、云计算B、精确算法C、内存算法D、串⾏算法3【判断题】⼤数据算法是在给定的时间约束下,以⼤数据为输⼊,在给定资源约束内可以⽣成满⾜给定约束结果的算法。

答案:×4【判断题】MapReduce是⼀种⽐较好实现⼤数据算法的编程架构,在⽣产中得到⼴泛应⽤。

答案:√5【判断题】⼤数据算法是仅在电⼦计算机上运⾏的算法。

大数据试题及答案

大数据试题及答案

大数据试题及答案1. 选择题:1. 下列哪项不属于大数据的四个"V"特点?A. Volume(数据量大)B. Value(数据价值高)C. Velocity(数据处理速度快)D. Variety(数据类型多样)答案:B. Value(数据价值高)2. 下列哪个不是大数据的常见来源?A. 传感器数据B. 金融交易数据C. 社交媒体数据D. 游戏排行榜数据答案:D. 游戏排行榜数据3. 大数据技术中,下列哪个属于数据存储和处理工具?A. Apache HadoopB. Apache SparkC. TableauD. Python答案:A. Apache Hadoop4. 在大数据处理中,下列哪项不属于数据清洗和预处理的步骤?A. 数据收集B. 数据分析C. 数据转换D. 数据集成答案:B. 数据分析2. 填空题:1. 大数据中,_______ 指的是数据的速率和延迟,即数据的产生和消耗速度之间的平衡。

答案:Velocity(数据处理速度快)2. 大数据技术中,________________ 是一种用于处理大规模数据计算的开源集群处理框架。

答案:Apache Hadoop3. 大数据分析常用的编程语言包括____________ 和____________。

答案:Python 和 R4. 在大数据清洗和预处理过程中,数据转换的步骤包括数据筛选、数据归一化和_____________。

答案:数据聚合3. 简答题:1. 请简述大数据的定义和特点。

答:大数据是指数据量庞大、类型多样、处理速度快且具有高价值的数据集合。

大数据的特点主要可以归纳为四个"V",即Volume(数据量大)、Velocity(数据处理速度快)、Variety(数据类型多样)和Value(数据价值高)。

大数据具有海量的数据量,数据来源广泛,包括传感器数据、社交媒体数据等;处理速度快,需要使用专门的大数据技术和工具进行高效的数据存储、处理和分析;数据类型多样,包括结构化数据和非结构化数据;数据具有高价值,可以帮助企业做出更准确的决策和预测。

精选2019公需科目大数据完整题库300题(含标准答案)

精选2019公需科目大数据完整题库300题(含标准答案)

2019公需科目:大数据题库300题[含参考答案]一、选择题1.下列哪项通常是集群的最主要瓶颈a)CPU b)网络 c)磁盘Id)内存答案.C 磁盘首先集群的目的是为了节省成本,用廉价的 pc 机,取代小型机及大型机。

小型机和大型机有什么特点?2.cpu 处理能力强3.内存够大,所以集群的瓶颈不可能是 a 和 d二、填空题4.Map/Reduce框架由一个单独的master JbTracker 和每个集群节点一个slave TaskTracker 共同组成。

5.MapReduce确保每个reducer的输入都是按键排序的。

系统执行排序的过程(即将map 输出作为输入传给reducer)称为shuffle。

三、单选题6.智慧城市的构建,不包含( C)。

(单选题)A.数字城市B.物联网C.联网监控D.云计算大数据的最显著特征是( A)。

(单选题)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高7.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B )。

(单选题)A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据8.下列关于计算机存储容量单位的说法中,错误的是( C)。

(单选题)A.1KB<1MB<1GBB.基本单位是字节(Byte)C.一个汉字需要一个字节的存储空间D.一个字节能够容纳一个英文字符,9.下列关于聚类挖掘技术的说法中,错误的是(B )。

(单选题) A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B.要求同类数据的内容相似度尽可能小C.要求不同类数据的内容相似度尽可能小大数据的最显著特征是( A)。

(单选题)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高10.下列关于网络用户行为的说法中,错误的是( C)。

2019大数据机器学习答案2

2019大数据机器学习答案2

一:单选题(每小题5分)1:模型复杂度越大,训练误差__________ ,测试误差__________A增大减小B增大增大C减小增大D 减小减小A B C D∙答案:C∙正确2:支持向量机的学习策略是__________A间隔最小化B间隔最大化C间隔平均化D间隔随机化A B C D∙答案:B∙正确3:条件随机场采用__________ 计算方法A递归B一次迭代C二次迭代D递进A B C D∙答案:A∙正确4:_______年,在CMU召开的第一次ICML会议,标志机器学习的诞生。

A 1970B 1979C 1980 D1983A B C D∙答案:C∙正确5:概率图推断方法可以被分为__________ 类A 2B 3C 4D 5A B C D∙答案:A∙正确6:EM算法的引入是因为概率模型中包含__________A观测变量B隐变量C随机变量D固定值A B C D∙答案:B∙正确7:学习算法的输入是__________A概念类B假设空间C训练集D以上三种全是A B C D∙答案:C∙错误8:机器学习最重要的应用领域是__________ 。

A预测算法B拟人应用C计算机视觉D深度学习A B C D∙答案:C∙错误9:决策树具有________ 种特点A 3B 4C 5D 6A B C D∙答案:C∙错误10:Adaboost算法的提出是在__________ 年A 1990B 1993C 1995D 1996A B C D∙答案:C∙错误二:判断题(每小题5分)11:序列最小最优化算法在1998年由Platt提出。

A:对B:错∙答案:A∙正确12:监督学习的目的学习一个由输出到输入的映射。

A:对B:错∙答案:B∙错误13:条件随机场的定义是在给定随机变量X条件下,随机变量Y的马尔科夫随机场A:对B:错∙答案:A∙正确14:所有的目标概念所构成的集合称为概念类A:对B:错∙答案:A∙正确15:Adaboost算法的学习算法是前向分布算法的三分类学习算法A:对B:错∙答案:B∙正确三:多选题(每小题5分)16:精确推断法主要包括__________A变量消去法B信念传播法C MCMC采样D变分推断法A B C D∙答案:AB∙正确17:监督学习方法分为__________A预测方法B生成方法C判别方法D总结方法A B C D∙答案:BC∙正确18:半监督学习的正则化方法有__________A 多任务学习B对抗训练C参数绑定和参数共享D稀疏表示A B C D∙答案:ABCD∙错误19:HMM的主要应用__________A人脸识别B语音识别C入侵检测D拟人应用A B C D∙答案:ABC∙正确20:模型学习的最优化算法__________A梯度下降法B迭代尺度法C牛顿法D拟牛顿法A B C D∙答案:ABCD∙正确。

2019继续教育公需科目大数据技术和应用试题答案

2019继续教育公需科目大数据技术和应用试题答案

2019年度大数据技术及应用试题单选题:1、本课程提到,近年来,我国(A)在GDP中占的比例逐年增大。

A互联网经济B信息经济C数码消费D电子商务2、法律大数据演示的结果表明,针对“酒驾”这一查询,相关刑罚中主要的是(A)A以上都是B拘役C罚金D有期徒刑3、根据本课程,取得成功的关键是要从(A)出发A数据B技术C设备D问题4、1965年英特尔公司创始人之一摩尔先生,提出来在之后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度每18个月左右可以翻一番,这被称为(摩尔定律)5、21世纪初,关于查询结果排序我们找到了一种新的方法。

(大数据方法:用户的点击数据)6、根据本课程,(查询结果)排序是一个在搜索引擎中处于核心位置的工作。

7、今天,随着信息科学技术的高速发展,人类对数据的收集和分享能力空前强大,其中,(互联网)可以收集虚拟世界的数据。

8、根据本课程,交通数据采集的来源不包括(A)A通讯信号B视频监控C微波采集D车载RFID9、根据本课程,(实时分析)希望能够全面突破搜索引擎框架所蕴含的3个假设,使得我们能以很快的速度对互联网上出现的数据进行分析,从而发掘出相关的高阶知识,满足用户的信息需求。

10、六度分割理论认为,世界上任何两个人通过最多(六)个人就可以相互认识。

11、新经验主义是用经验数据解决问题,但是这些经验是(群体性的经验)。

12、根据本课程,科学家们认为,2013年全世界储存的大数据容量是(1.2ZB)13、本课程提到,当前(云计算)服务的逐渐成熟,为大数据发展提供了有利的基础设施支撑。

14、(RFID)是一种标签,可以把一个物体身上的各种特征和信息都收集起来。

15、本课程提出,搜索引擎是一个搜索框,输一些关键词,然后出来一些页面的列表,需要用户点开看,这种架构蕴含的基本假设不包括(A)A这些文档彼此不是独立的B这些文档是静态的C假设用户找一个文档,而不是找一个答案D这些文档是独立的16、根据本课程,以下哪项不属于智慧城市的特点(C)A更广泛的互联互通B更深入的智慧化C更传统的方式D更透彻的感知17、“十二五”期间,我国数据总量年均增长率达到了(50%)18、二十世纪五十年代初,阿兰.麦席森.图灵提出(图灵测试)概念,用来测试计算机的智能程度。

2019大数据机器学习答案1

2019大数据机器学习答案1

1:感知机学习算法原始形式迭代是________的。

A震荡B发散C约束D收敛A B C D•答案:D•正确2:机器学习的理论基础是__________A统计论B概率论C计算学习理论D推断论A B C D•答案:C•错误3:PR曲线中P代表的是__________A预测出正例的保证性B预测出正例的正确率A B•答案:B•错误4:支持向量机的学习策略是__________A间隔最小化B间隔最大化C间隔平均化D间隔随机化A B C D•答案:B•正确5:模型复杂度越大,训练误差__________ ,测试误差__________A增大减小B增大增大C减小增大D 减小减小A B C D•答案:C•错误6:多维缩放的主要特点有_______种A 2B 3C 4D 5A B C D•答案:B•正确7:EM算法的引入是因为概率模型中包含__________A观测变量B隐变量C随机变量D固定值A B C D•答案:B•正确8:神经网络作为一个计算模型的理论是在__________ 年提出的A 1941B 1942C 1943D 1944A B C D•答案:C•正确9:介绍了__________种自适应学习率算法A 3B 4C 5D 6A B C D•答案:A•错误10:概率图推断方法可以被分为__________ 类A 2B 3C 4D 5A B C D•答案:A•错误11:概率模型是一种将学习任务归结于计算变量的概率分布的描述框架A:对B:错•答案:A•正确12:没有免费的午餐定理原理称为“如无必要,勿增实体”。

A:对B:错•答案:B•错误13:神经网络的全称是人工神经网络A:对B:错•答案:A•正确14:流形学习可被用于可视化A:对B:错•答案:A•正确15:所有可能概念或模型的集合称为假设类A:对B:错•答案:B•错误16:机器学习方法三要素为__________A模型B策略C空间D算法A B C D•答案:ABD•正确17:隐马尔可夫模型的的三个基本问题__________A概率计算问题B迭代尺度问题C模型学习问题D预测问题A B C D•答案:ABD•错误18:贝叶斯网络是由__________ 结合而成的描述多元统计关系模型A图论B空间论C逼近论D概率论A B C D•答案:AD•正确19:监督学习方法分为__________A预测方法B生成方法C判别方法D总结方法A B C D•答案:BC•错误20:精确推断法主要包括__________A变量消去法B信念传播法C MCMC采样D变分推断法A B C D•答案:AB•错误。

《大数据》答案

《大数据》答案

题目1Python的特点:()。

选择一项或多项:a. 简单高效b. Python是一种动态解释型的编程语言c. Python可以多平台运行d. 弱类型语言正确答案是:Python是一种动态解释型的编程语言, Python可以多平台运行, 简单高效, 弱类型语言题目2云计算、物联网、大数据、人工智能代表了人类IT技术的最新发展趋势。

选择一项:对错正确的答案是“对”。

题目3人类在科学研究上经过了实验科学、理论科学、计算科学()选择一项:a. 思维科学b. 模拟科学c. 数据密集型科学d. 想象科学正确答案是:数据密集型科学题目4大数据的特点有哪些()。

选择一项或多项:a. 价值密度b. 数据类型的多样化c. 时效性d. 海量化的数据正确答案是:海量化的数据, 数据类型的多样化, 时效性, 价值密度题目5随着Web2.0的兴起,()迅速增加。

选择一项:a. 非结构化数据b. 信息c. 结构化数据d. 数字正确答案是:非结构化数据题目6以下关于计算机视觉,描述错误的是:()。

选择一项:a. 计算机视觉是一门研究如何使机器“看”的科学b. 计算机视觉是一门综合性的学科c. 语音识别属于计算机视觉的典型应用d. 是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量的机器视觉正确答案是:语音识别属于计算机视觉的典型应用题目7计算机系统中的数据组织形式主要有两种,分别是:()。

选择一项或多项:a. 数据库b. 音频c. 视频d. 文件正确答案是:文件, 数据库题目8Python和Excel都可以用来处理大数据。

选择一项:对错正确的答案是“对”。

题目9字节是用于存储数据的计量单位,一个字节相当于八位长二进制数据。

选择一项:对错正确的答案是“对”。

题目10Python脚本文件的扩展名为()。

选择一项:a. pgb. pyc. pythond. pt正确答案是:py题目11音频是指存储声音内容的文件,包括MPEG-4、AVI等。

大数据的考试题目和答案

大数据的考试题目和答案

大数据的考试题目和答案一、单项选择题(每题2分,共20分)1. 大数据的核心特征不包括以下哪一项?A. 体量大B. 速度快C. 价值密度高D. 多样性答案:C2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. HiveD. Spark答案:D3. 在大数据时代,以下哪种技术不是处理数据的关键技术?A. 数据挖掘B. 机器学习C. 云计算D. 传统数据库答案:D4. 下列哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C5. 以下哪个不是大数据的存储技术?A. NoSQL数据库B. 云存储C. 传统关系型数据库D. 分布式文件系统答案:C6. 大数据的4V特性中,哪个代表数据的准确性?A. VolumeB. VelocityC. VarietyD. Veracity答案:D7. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据存储D. 数据解释答案:D8. 以下哪个不是大数据的来源?A. 社交媒体B. 传感器数据C. 传统数据库D. 纸质文档答案:D9. 在大数据技术中,以下哪个不是数据挖掘的算法?A. 决策树B. 聚类分析C. 线性回归D. 神经网络答案:C10. 大数据的实时处理技术不包括以下哪一项?A. StormB. FlinkC. HadoopD. Spark Streaming答案:C二、多项选择题(每题3分,共15分)11. 大数据技术可以应用于以下哪些行业?A. 零售B. 交通C. 教育D. 娱乐答案:ABCD12. 大数据的挑战包括以下哪些方面?A. 数据安全B. 数据隐私C. 数据存储D. 数据分析答案:ABCD13. 以下哪些是大数据的存储解决方案?A. 数据仓库B. 数据湖C. 云存储D. 传统数据库答案:ABC14. 以下哪些是大数据处理框架?A. HadoopB. SparkC. StormD. TensorFlow答案:ABC15. 大数据的分析方法包括以下哪些?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术只能用于处理结构化数据。

尔雅课创新中国期末考试答案

尔雅课创新中国期末考试答案

1我国近几十年来在工程方面取得了很大成就,其中不包括()。

(1.0分)1.0分正确答案:B 我的答案:B2下面体现了机器人最高境界的是()。

(1.0分)1.0分正确答案:B 我的答案:B3我国GDP首次全面超过日本是在()。

(1.0分)1.0分正确答案:B 我的答案:B4由数据这种自然资源产生的()称为大数据。

(1.0分)0.0分正确答案:C 我的答案:A5大数据的概念最早由()提出来。

(1.0分)0.0分正确答案:C 我的答案:D6目前无人艇还存在着一些技术难点,下面关于技术难点说法不正确的一项是()。

(1.0分)1.0分正确答案:C 我的答案:C7春秋航空作为民营企业,与东航相比有很多差距,其中不包括()。

(1.0分)0.0分正确答案:B 我的答案:D8下面不属于熊彼特对创新表现的归纳的是()。

(1.0分)0.0分正确答案:D 我的答案:A9PE是()的简称。

(1.0分)1.0分正确答案:C 我的答案:C10中国从一个一穷二白的国家变成现在世界第二大科技实力国,得益于三个内在机制,下面不属于这三个内在机制的是()。

(1.0分)1.0分正确答案:A 我的答案:A11DSK键盘没有QWERTY键盘应用广泛的原因是()。

(1.0分)1.0分正确答案:C 我的答案:C12中国金融发展进程中,()科技创新板正式推出。

(1.0分)1.0分正确答案:D 我的答案:D132012年,俄罗斯人提出要进行以永生为目标的科研计划,其获得永生的方式是()。

(1.0分)1.0分正确答案:D 我的答案:D14根据2015年ESI对上海大学发表期刊论文的统计,上海大学的强势学科集中在自然科学、工程科学和()上。

(1.0分)1.0分正确答案:D 我的答案:D15上海建设科创中心,要以()为主体。

(1.0分)1.0分正确答案:B 我的答案:B16当前上海的创新企业的最大特点是()。

(1.0分)1.0分正确答案:C 我的答案:C17优步对实习生的评价是()。

大数据考试题及答案

大数据考试题及答案

大数据考试题及答案一、单选题(每题2分,共20分)1. 大数据的4V特性不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Value(价值高)答案:D2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. HiveD. Spark答案:D3. 下列哪个不是NoSQL数据库的类型?A. 文档型数据库B. 列族数据库C. 图数据库D. 关系型数据库答案:D4. 在大数据技术中,以下哪个不是数据仓库的构建工具?A. HadoopB. HiveC. PigD. MongoDB答案:D5. 以下哪个不是大数据处理框架?A. HadoopB. StormC. FlinkD. Docker答案:D6. 数据挖掘中的“分类”任务通常使用哪种算法?A. 线性回归B. 决策树C. 聚类D. 异常检测答案:B7. 在大数据中,以下哪个不是数据集成的关键步骤?A. 数据清洗B. 数据转换C. 数据存储D. 数据分析答案:D8. 以下哪个是大数据分析的常用工具?A. ExcelB. RC. PythonD. 以上都是答案:D9. 以下哪个不是大数据安全和隐私保护的挑战?A. 数据泄露B. 数据篡改C. 数据滥用D. 数据共享答案:D10. 在大数据中,以下哪个不是数据可视化的常用工具?A. TableauB. Power BIC. MATLABD. Photoshop答案:D二、多选题(每题3分,共15分)11. 大数据的来源可能包括以下哪些?A. 社交媒体B. 传感器数据C. 传统数据库D. 网络日志答案:ABCD12. 在大数据处理中,以下哪些是MapReduce的特点?A. 高容错性B. 高扩展性C. 适用于实时处理D. 易于编程答案:ABD13. 以下哪些是大数据存储技术的特点?A. 高效性B. 可扩展性C. 成本效益D. 低延迟答案:ABC14. 在大数据中,以下哪些是数据清洗的目的?A. 去除重复数据B. 纠正错误数据C. 填补缺失数据D. 增强数据安全性答案:ABC15. 以下哪些是大数据分析的步骤?A. 数据收集B. 数据预处理C. 数据探索D. 结果解释答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术只能应用于互联网行业。

大数据考试题目及答案

大数据考试题目及答案

大数据考试题目及答案一、单选题(每题2分,共10分)1. 大数据的4V特点不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Visualization(可视化)答案:D2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. MapReduceD. HDFS答案:D3. 下列哪个不是大数据分析工具?A. R语言B. PythonC. ExcelD. Photoshop答案:D4. 在大数据技术中,以下哪个是用于实时处理的框架?A. HadoopB. SparkC. MongoDBD. Cassandra答案:B5. 大数据技术中,以下哪个是用于数据仓库的?A. HadoopB. HiveC. KafkaD. Flume答案:B二、多选题(每题3分,共15分)6. 大数据技术可以应用于以下哪些领域?A. 金融分析B. 医疗健康C. 交通规划D. 社交媒体答案:ABCD7. 以下哪些是Hadoop生态系统中的组件?A. HBaseB. PigC. StormD. Cassandra答案:AB8. 大数据的存储技术包括以下哪些?A. 文件系统B. 列式存储C. NoSQL数据库D. 内存数据库答案:ABCD9. 以下哪些是大数据分析过程中可能用到的步骤?A. 数据清洗B. 数据转换C. 数据挖掘D. 数据可视化答案:ABCD10. 在大数据技术中,以下哪些是用于数据采集的?A. FlumeB. KafkaC. SqoopD. HBase答案:AB三、判断题(每题1分,共5分)11. 大数据技术可以处理结构化数据和非结构化数据。

(对)12. Hadoop只能用于离线数据处理,不能用于实时数据处理。

(错)13. 大数据技术可以减少数据存储的成本。

(对)14. 大数据技术不能用于预测分析。

(错)15. 所有类型的数据都可以用单一的大数据技术进行处理。

大数据算法计算题例题和解答

大数据算法计算题例题和解答

大数据算法计算题例题和解答当谈论大数据算法时,有许多不同的算法可以使用。

以下是一些常见的大数据算法计算题目和解答的示例:1. K均值聚类算法计算题目:假设我们有一个包含1000个数据点的数据集,每个数据点具有2个维度。

我们希望使用K均值聚类算法将这些数据点分为3个簇。

初始时,我们将随机选择3个中心点进行聚类。

给定以下数据点和初始中心点,请计算算法的迭代过程直到收敛。

数据点:(2, 10), (2, 5), (8, 4), (5, 8), (7, 5), (6, 4), (1, 2), (4, 9)初始中心点:(2, 10), (5, 8), (1, 2)解答:这里我们使用欧氏距离作为距离度量。

以下是算法的迭代过程:迭代1:计算每个数据点到中心点的距离:-数据点(2, 10)与中心点的距离:3, 5, 8-数据点(2, 5)与中心点的距离:5, 3, 5-数据点(8, 4)与中心点的距离:10, 2, 7-数据点(5, 8)与中心点的距离:3, 0, 7-数据点(7, 5)与中心点的距离:5, 3, 5-数据点(6, 4)与中心点的距离:8, 2, 4-数据点(1, 2)与中心点的距离:8, 6, 0-数据点(4, 9)与中心点的距离:2, 1, 8根据距离将数据点分配到最近的簇:-数据点(2, 10)分配到第2个簇-数据点(2, 5)分配到第2个簇-数据点(8, 4)分配到第3个簇-数据点(5, 8)分配到第2个簇-数据点(7, 5)分配到第2个簇-数据点(6, 4)分配到第3个簇-数据点(1, 2)分配到第1个簇-数据点(4, 9)分配到第2个簇更新每个簇的中心点:-第1个簇的中心点:(1, 2)-第2个簇的中心点:(3.75, 8)-第3个簇的中心点:(7, 4)迭代2:重复迭代1的步骤,直到达到收敛条件。

在这个例子中,迭代2的结果与迭代1相同,因此算法收敛。

最终结果:-第1个簇包含数据点:(1, 2)-第2个簇包含数据点:(2, 10), (2, 5), (5, 8), (7, 5), (4, 9)-第3个簇包含数据点:(8, 4), (6, 4)注意:实际应用中,K均值聚类算法通常需要多次迭代才能收敛,而且初始中心点的选择可能会影响最终结果。

大数据试题及答案

大数据试题及答案

大数据试题及答案一、选择题1. 以下哪个不属于大数据的四个特点(4V)?A. 体积(Volume)B. 种类(Variety)C. 速度(Velocity)D. 精确度(Accuracy)答案:D。

大数据的四个特点为体积(Volume)、种类(Variety)、速度(Velocity)和价值(Value),精确度(Accuracy)不属于其中。

2. 以下哪个技术不是大数据处理的核心技术?A. 分布式存储B. 分布式计算C. 数据挖掘D. 数据可视化答案:D。

大数据处理的核心技术包括分布式存储、分布式计算和数据挖掘等,数据可视化虽然在大数据分析中起到重要作用,但不属于核心技术。

3. 以下哪个大数据处理框架不是基于MapReduce的?A. HadoopB. SparkC. FlinkD. Storm答案:D。

Hadoop、Spark和Flink都是基于MapReduce的大数据处理框架,而Storm是基于流处理的大数据处理框架。

二、填空题4. 大数据技术体系包括____、____、____和____四个层次。

答案:数据源、数据存储、数据处理、数据分析和应用。

5. 在大数据处理过程中,数据清洗的目的是____。

答案:去除数据中的噪声和异常值,提高数据质量。

三、判断题6. 大数据的处理速度越快,其价值就越高。

()答案:错误。

大数据的价值不仅取决于处理速度,还包括数据的质量、完整性、关联性等因素。

7. 数据挖掘是从大量数据中提取有价值信息的过程。

()答案:正确。

四、简答题8. 简述大数据分析的主要步骤。

答案:大数据分析的主要步骤如下:(1)数据采集:从各种数据源获取原始数据;(2)数据预处理:对原始数据进行清洗、转换、合并等操作;(3)数据存储:将预处理后的数据存储到分布式存储系统中;(4)数据处理:使用分布式计算框架对数据进行计算和分析;(5)数据挖掘:从大量数据中提取有价值的信息;(6)数据可视化:将数据分析结果以图表、报告等形式展示;(7)数据应用:将数据分析结果应用于实际场景。

广东开放大学2019年秋期末考试答案大数据技术答案

广东开放大学2019年秋期末考试答案大数据技术答案

广东开放大学2019年秋期末考试答案大数据技术答案大数据是指(B)及以上级别的数据量。

A. TBB. PBC. GBD. MB大数据的所谓6个V的特征不包括(D)A. VolumeB. VarietyC. VelocityD. Virtual目前所获取的总数据量的80%以上都是(B)数据A. 结构化B. 非结构化C. 半结构化D. 文本大数据的价值密度(C),含有大量的不相关信息。

A. 高B. 大C. 低D. 多单选许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务水平或者避免风险,这是大数据在(C)的技术。

A. 知识搜索B. 数据整合C. 预测分析D. 数据校验国务院于(B)年印发了《促进大数据发展行动纲要》,指出数据已成为国家基础性战略资源。

A. 2014B. 2015C. 2016D. 2017目前,我国互联网、移动互联网用户规模居全球第(A),拥有丰富的数据资源和应用市场优势。

A. 一B. 二C. 三D. 四NoSQL,泛指(A)A. 非关系型的数据库B. 关系型数据库C. 结构型数据库D. 大容量数据库下列哪项不属于NoSQL(D)A. 键值数据库B. 文档型数据库C. 图形数据库D. 关系型数据库以下哪个不属于大数据技术的特征 DA. 全面分析数据B. 重视数据的复杂性C. 关注数据的相关性D. 随机抽样数据的统计特征的分类包括(D)A. 集中趋势度量B. 离中趋势度量C. 数据分布形状D. 以上所有均是(B)表示数据分布的集中位置,如Mean:平均数、Median:中位数、Mode:众数等A. 数据属性B. 集中趋势度量C. 离中趋势度D. 数据分布形状描述数据对象的特征的量叫做(A)A. 数据属性B. 数据筛选C. 数据映射D. 数据分类数据可视化中实现中数据映射指的是(B)A. 从数据源中选取有效数据B. 确定数据到标记和视觉通道的映射C. 视图的选择与用户交互控制的设计D. 概括现实生活中用户遇到的问题可视化的分类包括(D)A. 科学可视化B. 信息可视化C. 可视分析学D. 包含以上所有选项大数据可视化的含义是(D)A. 将不可见现象转换为可见的图形符号,并从中发现规律和获取知识B. 通过可视表达增强人们完成某些任务的效率C. 其实质是用大脑以外的资源增强大脑本身的认知能力D. 以上均是(A)主要包括偏态和峰值,常见的有正态分布、偏态分布等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.1
1
【单选题】
以下关于大数据的特点,叙述错误的是()。

答案:速度慢•A、
速度慢
•B、
多元、异构
•C、
数据规模大
•D、
基于高度分析的新价值
2
【单选题】在《法华经》中,“那由他”描写的“大”的数量级是()。

答案:10^28
•A、10^7
•B、10^14
•C、10^28
•D、10^56
3
【多选题】以下选项中,大数据涉及的领域中包括()。

答案:社交网络计算机艺术医疗数据
•A、社交网络
•B、医疗数据
•C、计算机艺术
•D、医疗数据
4
【多选题】大数据的应用包括()。

答案:推荐科学研究预测商业情报分析
•A、预测
•B、推荐
•C、商业情报分析
•D、科学研究
5
【判断题】目前,关于大数据已有公认的确定定义。

答案:×
6
【判断题】大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。

()答案:√
1.2
1
【单选题】
大数据求解计算问题过程的第三步一般是()。

答案:算法设计与分析•A、
判断可计算否
•B、
判断能行可计算否
•C、
算法设计与分析
•D、
用计算机语言实现算法
2
【多选题】在大数据求解计算问题中,判断是否为能行可计算的因素包括()。

答案:资源约束数据量时间约束
•A、数据量
•B、资源约束
•C、速度约束
•D、时间约束
3
【判断题】大数据求解计算问题过程的第一步是确定该问题是否可计算。

答案:√
4
【判断题】大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。

答案:√
1.3
1
【多选题】资源约束包括()。

答案:网络带宽外存CPU内存
•A、CPU
•B、网络带宽
•C、内存
•D、外存
2
【多选题】大数据算法可以不是()。

答案:精确算法串行算法内存算法
•A、云计算
•B、精确算法
•C、内存算法
•D、串行算法
3
【判断题】大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定约束结果的算法。

答案:×
4
【判断题】MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。

答案:√
5
【判断题】大数据算法是仅在电子计算机上运行的算法。

答案:×
1.4
【单选题】
众包算法是用来解决()。

答案:计算机计算能力不足或知识不足,需要人来帮忙
•A、
访问全部数据时间过长
•B、
数据难于放入内存计算
•C、
单个计算机难以保存全部数据,计算需要整体数据
•D、
计算机计算能力不足或知识不足,需要人来帮忙
2
【单选题】大数据算法存在很多难题,对于访问全部数据时间过长的问题,采用的解决方案是()。

答案:读取部分数据
•A、将数据存储到磁盘上
•B、仅基于少量数据进行计算
•C、读取部分数据
•D、并行处理
3
【多选题】大数据算法的()特点,使其与大数据算法密切相关的。

答案:速度快数据量大
•A、数据量大
•B、基于高度分析的新价值
•C、速度快
•D、多样性、复杂性
4
【判断题】为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技术会涉及到时间亚线性算法。

答案:×
1
【单选题】大数据算法涉及到外存的时候,通常要分析()。

答案:IO复杂性
•A、时间空间复杂性
•B、IO复杂性
•C、结果质量
•D、通讯复杂性
2
【多选题】下列选项中,属于智能仿生算法的是()。

答案:遗传算法模拟退火算法
•A、遗传算法
•B、近似算法
•C、模拟退火算法
•D、数据流算法
3
【判断题】在线算法/数据流算法是面向大数据速度快的特点提出的。

()答案:√
【判断题】对于数据流算法或在线算法,经常要分析结果的近似比。

()答案:×
5
【判断题】随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。

()答案:√
2.1
1
【单选题】计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下,进行精确计算最少需要访问()个顶点。

答案:n-1
•A、n²
•B、n+1
•C、2n
•D、n-1
2
【多选题】亚线性是指()等的消耗是输入规模o。

()答案:空间通讯时间IO
•A、时间
•B、空间
•C、IO
•D、通讯
3
【判断题】性质检测算法属于亚线性空间算法的一类。

()答案:×
2.2
1
【判断题】
在经典的水库抽样中,要求空间复杂性为O(k),是指与抽样大小有关,而与整个数据的数据量无关。

答案:√
2
【判断题】水库抽样算法的采样是均匀的。

答案:√
2.3
1
【单选题】
以下()不是衡量分析近似解代价与优化解代价差距的方法。

答案:绝对误差
•A、
Ratio Bound
•B、
相对误差
•C、
绝对误差
•D、
(1-ℇ)-近似
2
【单选题】利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。

答案:二分之一
•A、二分之一
•B、三分之一
•C、四分之一
•D、十分之一
3
【单选题】采用平面图的直径近似算法的动机是无法在要求的时间内得到()。

答案:精确解
•A、相似解
•B、完整解
•C、精确解
•D、近似解
4
【判断题】在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在i、j、k三个点中,i到j的距离加上j到k的距离小于i到k的距离。

答案:×
5
【判断题】近似算法能给出一个优化问题的优化解。

答案:×6
【判断题】Ratio Bound越大,则近似解越坏。

()答案:√
你可以通过如下方式获取完整版:
方式一:搜狗/百度搜索:萌面人资料铺点击进入即可
方式二:打开手机浏览器扫一扫下方二维码,进入网站:
方式三:打开手机微信扫一扫下方二维码,关注微信公众号:萌面人资料铺。

相关文档
最新文档