智慧树知到《大数据算法》章节测试答案

合集下载

大数据可视化智慧树知到课后章节答案2023年下浙江大学

大数据可视化智慧树知到课后章节答案2023年下浙江大学

大数据可视化智慧树知到课后章节答案2023年下浙江大学第一章测试1.以下不属于可视化的作用的是()A:信息记录 B:数据采集 C:数据分析 D:传播交流答案:数据采集2.数据可视化萌芽于什么时间()A:18世纪 B:17世纪 C:15世纪 D:16世纪答案:16世纪3.可视分析学是何时兴起的()A:19世纪 B:21世纪 C:18世纪 D:20世纪答案:21世纪4.张量场可视化属于可视化的哪个分支学科()A:信息可视化 B:可视分析学 C:科学可视化 D:人机交互学答案:科学可视化5.使用以下哪种可视化工具不需要编程基础()A:Tableau B:Processing C:Vega D:D3.js 答案:Tableau6.数据可视化的原则是细节优先。

A:错 B:对答案:错7.文本可视化属于信息可视化。

A:对 B:错答案:对8.可视分析学涉及到的学科包括()A:计算机图形学 B:数据挖掘C:统计分析 D:人机交互答案:计算机图形学;数据挖掘;统计分析;人机交互9.以下哪些工具是数据可视化工具()A:Matlab B:Tableau C:D3.js D:Vega 答案:Tableau;D3.js ;Vega10.这个视频中体现了可视化的哪些作用()A:数据分析 B:信息记录 C:数据过滤 D:传播交流答案:数据分析;信息记录第二章测试1.有的人在发朋友圈的时候,会把一张图片切成9份,然后再按顺序拼出一个九宫格,如下图所示。

虽然图片被分割开来,但是我们仍旧能够感知到图片原来完整的样子,这体现了格式塔理论的()原则。

A:接近原则 B:相似原则 C:连续原则 D:闭包原则答案:连续原则2.下图所示的图片体现了格式塔理论的()原则。

A:连续原则 B:相似原则 C:接近原则 D:闭包原则答案:接近原则3.下图所示的图片体现了格式塔理论的()接近原则A:接近原则 B:相似原则 C:闭包原则 D:连续原则答案:相似原则4.下图所示的可视化中运用了以下哪个视觉通道?()A:高度 B:形状 C:亮度 D:颜色答案:高度5.下图所示的可视化中体现了哪种类型的视觉通道?()A:分组型B:分类型C:定性型D:定量型答案:分组型6.根据格式塔理论,人们在观看时,眼脑在一开始的时候会先区分一个形象的各个单一的组成部分,然后再将各个部分组合起来,使之成为一个易于理解的统一体。

大数据解析与应用导论知到章节答案智慧树2023年浙江大学

大数据解析与应用导论知到章节答案智慧树2023年浙江大学

大数据解析与应用导论知到章节测试答案智慧树2023年最新浙江大学第一章测试1.下列属于多元统计方法的为()参考答案:回归分析;主元分析2.多元统计分析的图表示法有()参考答案:散布图矩阵;调和曲线图;轮廓图;雷达图3.完整的数据分析过程,包括数据采集、数据清洗和数据分析。

()参考答案:对4.下列场景适用于回归分析的是 ( )参考答案:天气预报5.下面哪一句体现了主元分析的思想()参考答案:牵牛要牵牛鼻子第二章测试1.一般常见的缺失值处理的方法有()参考答案:回归填充法;最近邻插补填充法;插值填充;替换填充法2.一般常见的数据归一化的方法有()参考答案:最小最大规范化;零均值规范化3.少量的异常值完全不会影响数据分析。

()参考答案:错4.下列哪种方法不是数据填补的手段 ( )参考答案:均值标准化5.主成分分析的英文名是()。

参考答案:Principal Component Analysis第三章测试1.下面哪个是SVM在实际生活中的应用()参考答案:图片分类;邮件分类2.以下说法正确的有哪些()参考答案:SVM是一种线性方法;软间隔的引入可以解决轻度线性不可分问题3.拉格朗日乘子法可用于线性可分SVM的模型求解。

()参考答案:对4.SVM的中文全称叫什么?()参考答案:支持向量机5.SVM算法的最小时间复杂度是O(n²),基于此,以下哪种规格的数据集并不适该算法?()参考答案:大数据集第四章测试1.一元线性回归有哪些基本假定?()参考答案:解释变量X是确定性变量,Y是随机变量;;随机误差项和解释变量X不相关;;随机误差项服从零均值、同方差的正态分布。

;随机误差项具有零均值、同方差和序列不相关的性质;2.最典型的两种拟合不佳的情况是()。

参考答案:欠拟合;过拟合3.岭回归适用于样本很少,但变量很多的回归问题。

()参考答案:对4.最小二乘方法的拟合程度衡量指标是()。

参考答案:残差平方和5.关于最小二乘法,下列说法正确的是。

大数据分析与应用知到章节答案智慧树2023年咸阳职业技术学院

大数据分析与应用知到章节答案智慧树2023年咸阳职业技术学院

大数据分析与应用知到章节测试答案智慧树2023年最新咸阳职业技术学院第一章测试1.HDFS 已经成为了大数据磁盘存储的事实标准,针对关系型以外的数据模型,开源社区形成了 K-V( key-value)、列式、()、图这四类 NoSQL 数据库体系。

参考答案:文档2.麦肯锡全球研究所对大数据的定义是()。

参考答案:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征3.大数据应用场景不包括()。

参考答案:人群标签,精准营销4.DataWorks是一个提供了大数据OS能力、并以all in one box的方式提供专业高效、安全可靠的一站式大数据智能云研发平台。

同时能满足用户对数据治理、质量管理需求,赋予用户对外提供数据服务的能力。

()参考答案:对5.云原生数据仓库MySQL版(简称ADB,原AnalyticDB for MySQL)是一种高并发低延时的PB级新一代云原生数据仓库,全面兼容MySQL协议以及SQL:2003 语法标准,可以毫秒级针对万亿级数据进行即时的多维分析透视和业务探索。

()参考答案:对第二章测试1.ETL是Extract、 Transform、 Loading三个字母的缩写,即抽取、转换、()。

参考答案:装载2.HBase是一个构建在HDFS上的分布式列存储系统,用于海量结构化、半结构化数据存储。

()参考答案:对3.数据规约:在尽可能保持数据原貌的前提下,最大限度地精简数据量。

主要包括属性选择和数据抽样两种方法。

()参考答案:对4.数据清洗是针对原始数据,对出现的噪声进行修复、平滑或者剔除。

包括异常值、缺失值、重复记录、错误记录等;同时过滤掉不用的数据,包括某些行或某些列。

()参考答案:对5.使用算法确保历史模型能够用户预测特定的结果。

()参考答案:对第三章测试1.SQL集数据查询、数据操纵、数据定义和数据库控制功能于一体,语句ALTER TABLE实现数据定义功能。

大数据分析与可视化智慧树知到答案章节测试2023年山东交通学院

大数据分析与可视化智慧树知到答案章节测试2023年山东交通学院

第一章测试1.什么是KDD?()A:文档知识发现B:数据挖掘与知识发现C:领域知识发现D:动态知识发现答案:B2.数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的、隐含的、以前没有用但是潜在有用信息的)模式和知识。

()A:对B:错答案:A3.数据挖掘分析的步骤包括()A:创建数据集B:模型评估C:算法分析D:数据预处理答案:ABCD4.当今社会,数据挖掘分析被广泛应用。

()A:对B:错答案:A5.()是未来大数据分析的发展趋势。

A:实时性B:非结构化数据C:简单D:可视化答案:ABD第二章测试1.关于描述统计,包括()。

A:相关分析B:集中趋势分析C:其余选项都不是D:离中趋势分析答案:ABD2.以下属于推断统计的是()。

A:离中趋势分析B:集中趋势分析C:参数估计D:其余选项都不是答案:A3.在数据特征的测度中,描述分布的形状的值为()A:偏态B:峰态C:中位数D:众数答案:AB4.测度集中趋势就是寻找数据水平的代表值或中心值()A:错B:对答案:B5.四分位数可以用于顺序数据、数值数据和分类数据()A:错B:对答案:A第三章测试1.下面哪个属于映射数据到新的空间的方法? ( )A:特征加权B:渐进抽样C:维归约D:傅立叶变换答案:D2.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A:频繁模式挖掘B:分类和预测C:数据预处理D:数据流挖掘答案:C3.影响数据质量问题的因素有哪些()A:可信性、可解释性B:准确性、完整性、一致性C:其余选项都对D:相关性、时效性答案:C4.数据预处理的常见方法有()A:数据集成B:其余选项都不对C:数据清洗D:数据变换答案:ACD5.数据预处理是指在对数据进行挖掘分析以前,需要对原始数据进行清理、集合和变换等一系列处理工作()A:错B:对答案:B第四章测试1.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A:1,2,4,5B:1,2,3,5C:1,2,3,4D:1,3,4,5答案:A2.频繁项集、频繁闭项集、最大频繁项集之间的关系是: ( )A:频繁项集频繁闭项集 =最大频繁项集B:频繁项集 = 频繁闭项集最大频繁项集C:频繁项集 = 频繁闭项集 = 最大频繁项集D:频繁项集频繁闭项集最大频繁项集答案:D3.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )A:关联规则发现B:分类C:聚类D:自然语言处理答案:A4.下面购物篮能够提取的3-项集的最大数量是多少()ID 购买项1 牛奶,啤酒,尿布2 面包,黄油,牛奶3 牛奶,尿布,饼干4 面包,黄油,饼干5啤酒,饼干,尿布6 牛奶,尿布,面包,黄油7 面包,黄油,尿布8 啤酒,尿布9 牛奶,尿布,面包,黄油10 啤酒,饼干A:3B:2C:1D:4答案:A5.Apriori算法的计算复杂度受( )影响。

商业大数据分析智慧树知到答案章节测试2023年上海商学院

商业大数据分析智慧树知到答案章节测试2023年上海商学院

第一章测试1.数据分析的一般流程是()。

A:数据采集->数据预处理->数据管理->数据分析->数据展示B:数据采集->数据分析->数据处理->数据管理->数据产品C:数据采集->数据展示->数据分析->数据管理->数据报告D:数据采集->数据管理->数据分析->数据预处理->数据可视化答案:A2.与大数据密切相关的技术是()。

A:博弈论B:云计算C:WiFiD:蓝牙答案:B3.交通大数据的信息种类包括出行者、位置、车辆、交通流、气象、舆情、活动、用地。

()A:错B:对答案:B4.现在的自动驾驶系统最高可以达到()级别。

A:L1B:L2C:L4D:全自动E:L3答案:C数据是作为信息的重要来源, 信息经过加工转化为知识。

()A:错B:对答案:B第二章测试1.下列属于分布式并行计算框架的是()A:YARNB:HDFSC:MapReduceD:Spark答案:CD2.HDFS集群中至少有3个数据节点, 即DataNode。

()A:对B:错答案:A3.每个HDFS集群有且仅有一个主节点, 即NameNode。

()A:错B:对答案:B4.Harmony是一种移动设备操作系统。

()A:对B:错答案:A5.微信小程序开发提供的是一种()云服务模式。

A:PaaSB:IaaSC:SaaS答案:A第三章测试1.指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串称为()。

A:语法B:正则表达式C:通配符D:字符集答案:B2.图像是以数字()形式存储在计算机中的, 其中每一个数字表示一个像素。

A:向量B:矩阵C:张量D:标量答案:B3.智能健康手环的应用开发, 体现了()的数据采集技术的应用。

A:网络爬虫B:统计报表C:传感器D:API接口答案:C4.在网络爬虫的爬行策略中, 应用最为基础的是()。

A:反向链接策略B:广度优先遍历策略C:大站优先策略D:深度优先遍历策略E:高度优先遍历策略答案:BD5.等级型和数值型数据可以排序和比较大小。

大数据分析及应用智慧树知到答案章节测试2023年云南大学

大数据分析及应用智慧树知到答案章节测试2023年云南大学

第一章测试1.大数据的英文描述是()A:Big dataB:Large dataC:Great dataD:Heavy data答案:A2.下面最大的储存单位是()A:TBB:KBC:PBD:GB答案:C3.大数据之父是()A:维克托·迈尔-舍恩伯格B:姚期智C:查尔斯·巴赫曼D:詹姆斯·高斯林答案:A4.大数据的特点包括()A:ValueB:VarietyC:VelocityD:Volume答案:ABCD5.第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()A:ScienceB:PNASC:NatureD:Cell答案:AC6.大数据是只和互联网相关的计算机技术。

A:错B:对答案:A7.企业中大部分的数据都是非结构化数据。

A:对B:错答案:A8.大数据技术的基础是由阿里巴巴首先提出的。

A:错B:对答案:A9.大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。

A:对B:错答案:A10.大数据对网络安全没有威胁。

A:错B:对答案:A第二章测试1.目前,企业的数据架构存在的最大比例问题是()A:运营成本高B:高耗能C:拓展性差D:资源利用率低答案:C2.目前,企业数据分析处理面临的主要问题是缺少数据全方位分析方法。

A:错B:对答案:B3.地图导航根据以往的行程记录,绘制了最优路程,标明了可能堵车的地点,这表现了大数据分析理念中的()A:注重相关性而不是因果性B:注重效率而不是准确C:注重相对性而不是绝对性D:注重全体而不是局部答案:A4.最早提出大数据研发计划的国家是()A:日本B:美国C:中国D:法国答案:B5.大数据可能被运用的行业有()A:医疗B:农业C:金融D:教育答案:ABCD6.2015年9月18日云南省启动我国首个大数据综合试验区的建设工作。

A:对B:错答案:B7.大数据的价值密度很高。

A:对B:错答案:B8.日本政府将IT产业,尤其是大数据及云计算作为促进经济增长,解决内部矛盾一个关键。

大数据导论智慧树知到答案2024年商丘工学院

大数据导论智慧树知到答案2024年商丘工学院

大数据导论商丘工学院智慧树知到答案2024年第一章测试1.大数据的前沿技术是()。

A:数据定义B:数据结构.C:数据处理D:数据分析答案:D2.大数据赖以生存的土壤是()。

A:互联网B:前沿技术C:物联网D:网络信息答案:A3.第三次信息化浪潮的标志是哪些技术的兴起?( )A:云计算B:大数据C:个人计算机D:物联网答案:ABD4.以下是大数据存储面临的挑战的选项是( )。

A:数据问题B:管理问题C:应用问题D:系统问题答案:BCD5.信息科技为大数据时代提供哪些技术支撑?( )A:网络带宽不断增加B:CPU 处理能力大幅提升C:存储设备容量不断增加D:数据量不断增大答案:ABC6.大数据产业指的是什么()。

A:一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合B:提供分布式计算、数据挖掘、统计分析等服务的各类企业C:提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业D:提供数据分享平台、数据分析平台、数据租售平台等服务的企业答案:A7.万维网之父是 ( )。

A:蒂姆●伯纳斯-李B:彼得●德鲁克C:舍恩伯格D:斯科特布朗答案:A8.以下哪一项不属于大数据的特征()。

A:数据价值密度高B:单位处理数据的速度高C:数据类型复杂D:数据量大答案:A9.大数据存储的特点与挑战有( )。

A:成本问题B:容量问题C:安全问题D:延迟问题答案:ABCD10.大数据可以帮助发现规律,大数据可以帮助解释现象,大数据可以帮助预测未来。

()A:对 B:错答案:A第二章测试1.大数据的最显著特征是( )。

A:数据类型多样B:数据价值密度高C:数据处理速度快D:数据规模大答案:D2.下列不属于 Google云计算平台技术架构的是()。

A:结构化数据表 BigTableB:分布式锁 ChubbyC:并行数据处理 MapReduceD:弹性云计算 EC2答案:D3.物联网的全球发展形势可能提前推动人类进入“智能时代”,也称()。

智慧树答案大数据处理和分析知到课后答案章节测试2022年

智慧树答案大数据处理和分析知到课后答案章节测试2022年

第一章1.大数据分析的最终目的是()答案:通过数据分析来挖掘数据背后的价值2.数据采集的方式包括()答案:主动数据采集;网络下载数据;购买数据3.Wireshark是手机数据的采集软件()答案:对4.手机和手机APP是同时连通网络的()答案:错5.360随身WIFI的目的是()答案:构造局域网,从而让手机连通电脑6.对于电脑+手机+360WIFI而言,它们之间存在的网络包括()答案:360WIFI构成的无线网络;笔记本电脑连接的Internet网络;手机的4G网络7.手机APP的联网效率是指手机联上网络的时间T1和手机APP联上网络的时间T2之差()答案:对8.在上一题中,T1-T2的值越小时,手机APP的联网效率越高。

()答案:错9.开始手机数据收集之前,需要先关闭手机的3G或者4G网络,仅让手机连接360WIFI的网络()答案:对10.在手机断开WIFI之后,手机APP会()答案:立即断开网络第二章1.打开Wireshark软件,可以从主界面的【Open】选项打开*.CSV文件()答案:错2.分析手机APP的联网效率需要用到()答案:ICMPV6协议;IP协议;TCP协议3.双击【我的电脑】,可以查看计算机中的IP地址()答案:错4.打开手机的设置,可以查看到手机的IP地址答案:对5.Wireshark能够记录手机的IP地址并在目标地址位置显示出来()答案:错6.三次握手协议是属于()答案:TCP协议7.TCP协议中的FIN表示建立连接答案:错8.手机APP连接网络时用到()协议答案:三次握手协议9.手机连接网络是用到()协议答案:ICMPv610.手机数据捕获软件是()答案:Wireshark第三章1.在实验中是手机最先连接到网络()答案:错2.手机联网时间可以通过查找三次握手协议获得答案:错3.手机APP联网时间可以通过查找三次握手协议获得答案:错4.当ICMPv6的type为()时,手机连通了网络答案:1365.当TCP的flag为()时,表示手机APP连通了网络答案:06.80端口是TCP协议中加密传输需要用到的端口()答案:错7.TCP协议中非加密传输需要用到的端口()答案:808.大数据分析的一般方法是先对海量数据进行分析,再约减数据答案:错9.手机端的自动数据采集需要()软件答案:Wireshark;Excel10.Wireshark软件能够进行脚本录制()答案:错第四章1.在查找字符串中是否包含字符AB或BA,则应该构造正则表达式()答案:AB|BA2.下列哪个正则表达式能够表示0个或多个空格()答案:\s+3.要匹配A1、A2、A3、…、A9,则需要构造正则表达式( )答案:A[1-9]4.要匹配A0、A12、A123、…、A119,则需要构造正则表达式( )答案:A[1-9]5.正则表达式中符号|的意思是()答案:管道符6.Excel支持通配符查询()答案:对7.Excel中的筛选功能能够约减数据集()答案:错8.Excel中能选出满足条件的所有选项,不论这些选项是否是在同一列中。

智慧树知到大数据分析与应用章节测试答案

智慧树知到大数据分析与应用章节测试答案

第一章单元测试1、单选题:大数据泛指巨量的()。

选项:A:数组集B:数字集C:数据集D:字符集答案: 【数据集】2、单选题:数据分析指的是用适当的()对收集来的大量数据进行分析,提取有用信息并形成结论。

选项:A:统计分析方法B:定性与定量方法C:概率分析方法D:系统分析方法答案: 【统计分析方法】3、单选题:浏览数据这一步骤可以通过对大数据进行()来实现。

选项:A:流程化B:分析化C:简易化D:可视化答案: 【可视化】4、多选题:Gartner将大数据定义为是需要新处理模式才能具有更强的()以及高增长率和多样化的信息资产。

选项:A:流程优化能力B:数据处理能力C:决策力D:洞察发现力答案: 【流程优化能力;决策力;洞察发现力】5、多选题:我们通常用“4V”来反映大数据的特点,4V是指()。

选项:A:VelocityB:VarietyC:VariousD:Valid答案: 【Velocity;Variety】6、多选题:大数据分析可以应用在那些领域()。

选项:A:商业领域B:医疗卫生领域C:交通运输领域D:农业领域答案: 【商业领域;医疗卫生领域;交通运输领域;农业领域】7、多选题:大数据分析的过程包括()。

选项:A:数据理解B:数据处理C:数据优化D:数据准备答案: 【数据理解;数据准备】8、判断题:数据只要有足够的规模就可以称为大数据。

()选项:A:对B:错答案: 【对】9、判断题:大数据分析是大数据到知识,再到信息的关键步骤。

()选项:A:错B:对答案: 【错】10、判断题:大数据分析模型用于描述数据之间的关系。

如确定自变量、因变量,进而通过聚类、回归等方法确定其关系。

()选项:A:对B:错答案: 【对】第二章单元测试1、单选题:数据仓库的定义于哪一年提出()。

选项:A:1991B:2015C:1902D:2002答案: 【1991】2、单选题:符合选择建立数据仓库平台的公认标准的是()。

选项:A:是否提供支持少量数据的数据加载B:是否支持对数据库的管理C:是否支持串联操作D:数据库对大数据量的支持能力答案: 【数据库对大数据量的支持能力】3、单选题:建立数据仓库的首要步骤是()。

云计算与大数据技术智慧树知到答案章节测试2023年北京联合大学

云计算与大数据技术智慧树知到答案章节测试2023年北京联合大学

绪论单元测试1.下列哪些应用属于大数据技术的应用()。

A:音视频网站上通过分析注册用户的浏览习惯,为用户推送感兴趣的音视频。

B:手机银行或网上银行在用户画像基础上,对用户群进行定位,挖掘潜在金融服务需求。

C:政务领域中的智慧城市建设,如智慧交通、智慧医疗、智慧教育等。

D:电商网站上对注册用户浏览信息记录、分析、挖掘,为用户推送感兴趣的商品。

答案:ABCD2.日常我们用到的云服务器、钉钉办公软件、百度网盘等应用都是云计算服务厂商提供的云计算服务。

()A:错B:对答案:B第一章测试1.云计算的服务模式包括()。

A:平台即服务B:软件即服务C:系统即服务D:基础设施即服务答案:ABD2.云计算的劣势有()。

A:风险被集中B:数据泄密的环节增多C:信息技术产业进一步合理分工D:严重依赖网络答案:ABD3.云计算部署模型有()。

A:公有云B:私有云C:PaaS云D:混合云答案:ABD4.云计算是把有形的产品(网络设备、服务器、存储设备、各种软件等)转化为服务产品(IaaS,PaaS,SaaS),并通过网络让人们远程在线使用。

()A:错B:对答案:B5.云计算是一种计算模式,能够提供随时随地、便捷的、随需应变的网络接入,访问可配置的计算资源共享池。

()A:对B:错答案:A第二章测试1.虚拟化技术主要用于云计算物理资源的池化,物理资源不包括()。

A:网络B:存储C:服务器D:操作系统答案:D2.虚拟技术特性有()。

A:隔离B:封装C:分区D:相对于硬件独立答案:ABCD3.虚拟化的益处包括()。

A:实现节能减排B:实现动态负载均衡C:实现资源最优利用D:通过系统自愈功能提升可靠性答案:ABCD4.个人PC上使用比较多的虚拟化工具有()。

A:XenB:KVMC:Virtual BoxD:VMware Workstation答案:CD5.虚拟化是一项技术,而云是一种环境或服务。

()A:对B:错答案:A6.虚拟化的主要功能是把单个资源抽象成多个给用户使用,而云计算则是帮助不同部门或公司访问一个自动置备的资源池。

大数据平台技术智慧树知到答案章节测试2023年山东交通学院

大数据平台技术智慧树知到答案章节测试2023年山东交通学院

第一章测试1.数据,就是所有能输入到计算机,并被计算机程序处理的符号的总称为()。

A:对B:错答案:A2.大数据的4V特征包括()。

A:种类繁多B:规模庞大C:变化频繁D:价值巨大但价值密度低答案:ABCD3.2TB数据等于多少GB()。

A:1024B:2048C:2000D:1000答案:B4.大数据包含下面类型()。

A:非结构化数据B:结构化数据C:纯文本数据D:半结构化数据答案:ABCD5.大数据的生命周期一般会经历这么几个阶段()。

A:可视化B:采集与预处理C:分析与挖掘D:存储与管理答案:ABCD6.大数据平台的基本架构,从技术架构的角度,可划分为这几个层次()。

A:服务封装层B:数据处理层C:数据存储层D:数据采集层答案:ABCD7.linux系统中cd命令的作用是()。

A:移动文件或修改文件名B:将源文件复制至目标文件C:进入指定目录D:删除一个目录中的一个或多个文件答案:C8.vi编辑器的操作模式共分为()。

A:输入模式B:命令模式C:底线命令模式D:编辑模式答案:BCD第二章测试1.Flume的Agent包含这些组成部分()。

A:SinkB:EventC:SourceD:Channel答案:ACD2.Event由这两部分组成()。

A:BodyB:HeadC:ArrayD:K-V答案:AB3.Source是Flume中事件的源头,负责接收数据到Flume Agent,可以处理多种类型、多种格式的数据()A:对B:错答案:A4.Channel是位于Source和Sink之间的缓冲区,对Source和Sink进行一对一处理()A:错B:对答案:A5.在Flume的配置文件中,对某个目录下文件进行监控的命令是()。

A:flume-ngB:/bin/bash -cC:execD:tail -f答案:D第三章测试1.以下说法有误的是()。

A:“元数据”中不包含真正的文件数据B:分布式存储系统需要考虑数据的分块问题C:分布式存储系统可以实现数据容灾D:传统单机存储方式扩容成本较低答案:D2.Hadoop 2.x中HDFS默认的block的大小为()。

大数据与人工智能智慧树知到答案2024年哈尔滨商业大学

大数据与人工智能智慧树知到答案2024年哈尔滨商业大学

大数据与人工智能哈尔滨商业大学智慧树知到答案2024年第一章测试1.在数据量单位中,1PB等于()。

A:256TB B:1024TB C:2048TB D:512TB答案:B2.大数据的最终价值体现()。

A:思想B:理论C:技术D:实践答案:D3.人工智能起源于()。

A:70-80年代 B:40-50年代 C:60-70年代 D:50-60年代答案:D4.被称为XCON的“专家系统”是由()发明。

A:牛津大学 B:麻省理工学院 C:哈佛大学 D:卡内基梅隆大学答案:D5.大数据具有4V特点包括()。

A:密度高 B:大量 C:多样 D:高速 E:精确答案:BCDE6.自然语言处理包括()。

A:翻译 B:理解 C:解析 D:解码 E:编码答案:DE7.在大数据时代,经常使用的数据量衡量单位为TB。

A:错 B:对答案:A8.模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。

A:错 B:对答案:B9.机器学习主要研究如何使计算机能够模拟或实现人类的学习功能。

A:对 B:错答案:A10.在分布式人工智能系统中,每一个Agent又是一个全自治系统。

A:对 B:错答案:B第二章测试1.数据的多样性包括()。

A:数据来源的多样性 B:数据内容的多样性 C:数据表达方式的多样性 D:数据格式的多样性 E:数据用途的多样性答案:ADE2.最普通也是最常见的数据类型是()。

A:视频数据 B:图片 C:音频数据 D:文本答案:D3.将不同数据源的数据自动收集到一个装置中是指()。

A:数据清洗 B:数据建模 C:数据存储 D:数据获取答案:D4.数据分析,是指从海量的数据中利用数据挖掘的方法,获取有用的有价值的数据信息。

A:错 B:对答案:B5.数据量测方法有()。

A:定时式 B:变化地点 C:接触式 D:变化周期 E:非接触式答案:CE6.直接附加存储的英文缩写是()。

A:SAN B:DAS C:NAS D:BAS答案:B7.企业的数据处理大致分为()。

大数据与云计算概论知到章节答案智慧树2023年山东科技大学

大数据与云计算概论知到章节答案智慧树2023年山东科技大学

大数据与云计算概论知到章节测试答案智慧树2023年最新山东科技大学第一章测试1.数据存储单位不包括以下哪个()。

参考答案:QB2.大数据的数据类型包括()。

参考答案:位置信息;邮件;网络日志;音频3.在大数据时代,以下关于大数据思维的说法正确的是()。

参考答案:要追求海量数据的实时分析结果的效率4.传统的关系类型数据占大数据总量的90%。

()参考答案:错5.价值密度高是大数据的一个特征。

()参考答案:错第二章测试1.用户在阿里云提供的操作系统上部署了MySQL数据库服务器,这属于哪一种云计算的服务模式()。

参考答案:PaaS2.用户利用在线数据可视化平台,不需要本地安装数据可视化软件工具就实现了数据的可视化呈现,这可能属于哪一种云计算的服务模式()。

参考答案:SaaS3.可实现虚拟化的有()。

参考答案:网络;I/O;操作系统;CPU4.云计算中云端要有管理工具进行资源管理。

()参考答案:对5.使用云服务的宗旨之一是按需购买。

()参考答案:对第三章测试1.Client 端上传文件的时候下列哪项正确()。

参考答案:Client 端将文件切分为 Block,依次上传2.Hadoop 支持数据的随机读写。

()参考答案:错3.列族数据库HBase物理结构是行存储的。

()参考答案:错4.以下哪一项属于非结构化数据()。

参考答案:日志数据;视频监控数据5.在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明Hadoop主节点启动成功?()参考答案:Namenode,JobTracker, secondaryNameNode第四章测试1.MapReduce技术屏蔽了底层的编程细节,抽象为两个函数()。

参考答案:Map;Reduce2.下列说法错误的是()参考答案:Hadoop框架是用Java实现的,MapReduce一定要用Java来写。

3.对于文本行“hello hadoop hello world”,经过WordCount的Reduce函数处理后的结果是()参考答案:<"hello",2><"hadoop",1><"world",1>4.MapReduce设计的一个理念是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。

大数据技术基础智慧树知到答案章节测试2023年东北石油大学

大数据技术基础智慧树知到答案章节测试2023年东北石油大学

绪论单元测试1.本课程中关于大数据处理与分析部分的学习内容有:()A:Mapreduce的编程模型B:大数据分析的常用算法C:大数据分析过程D:大数据分析分析工具答案:ABCD第一章测试1.大数据的基本特征包括()。

A:数据的价值密度但商业价值高B:数据增长速度快C:数据来源和数据数据类型多样化D:数据规模大答案:ABCD2.下面说法正确的是()。

A:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称B:大数据是第三次信息化浪潮以后产生的数据C:大数据就是数据容量达到1T以上的数据D:大数据指数据而不包括数据的分析结果答案:A3.下面哪些技术属于大数据技术。

()A:快速传输数据的技术。

B:网盘数据存储技术C:从各种数据源中采集数据的技术。

D:人脸识别技术。

答案:ABC4.如何理解“大数据分析是相关性分析而不是因果分析”。

()A:不仅要知其然,还要知其所以然。

B:不仅要进行相关分析分析,也要进行因果关系分析。

C:发现两个现象的相关性后,经过进一步深入研究,找出因果关系,就会实现技术创新。

D:相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。

答案:ABCD5.大数据的特征Variety是指:()A:数据变化多端B:数据来源广泛C:数据格式多样D:数据用途丰富答案:BC第二章测试1.在Python中,语句print(3 < 5 > 2)的输出结果为False。

()A:错B:对答案:A2.已知x是一个足够大的numpy二维数组,那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。

()A:对B:错答案:A3.扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来合并数据。

()A:对B:错答案:B4.已知x = [1,2]和y = [3,4],那么x+y的结果是()。

A:3B:7C:[4, 6]D:[1, 2, 3, 4]答案:D5.Pandas中常用的数据结构包括()。

大数据分析与挖掘智慧树知到课后章节答案2023年下青岛黄海学院

大数据分析与挖掘智慧树知到课后章节答案2023年下青岛黄海学院

大数据分析与挖掘智慧树知到课后章节答案2023年下青岛黄海学院青岛黄海学院第一章测试1.下列选项中,用于搭建数据仓库和保证数据质量的是()。

A:数据展现 B:数据分析 C:数据收集 D:数据处理答案:数据处理2.HTML文档属于()。

A:不是数据 B:结构化数据 C:非结构化数据 D:半结构化数据答案:半结构化数据3.数据挖掘的英文缩写()。

A:DM B:DA C:DC D:DB答案:DM4.Hadoop的基础架构是()。

A:ABC都不正确B:分布式系统 C:操作系统 D:同步系统答案:分布式系统5.一般情况下,计算机处理的数据都是()。

A:无结构化的数据 B:非结构化的数据 C:半结构化的数据 D:结构化的数据答案:结构化的数据第二章测试1.在Python中实现多个条件判断需要用到与if语句的组合语句是()A:ABC均不是 B:elif C:pass D:else答案:elif2.Python 语言属于以下哪种语言()A:机器语言 B:ABC都不正确 C:高级语言 D:汇编语言答案:高级语言3.下列选项中,不是Python关键字的是()A:static B:pass C:yield D:from答案:static第三章测试1.已知x= np.array((1,2,3,4,5)),那么表达(x**2).max()的值为()。

A:20 B:25 C:15 D:30答案:252.已知x= np.array((1,2, 3, 4, 5)),那么表达式(x//5).sum()的值()。

A:2 B:3 C:4 D:1答案:13.已知x=np.array((1,2,3), 4, 5),那么表达式sum(x*x)的值()。

A:50 B:55 C:60 D:65答案:554.在Matplotlib中,用于绘制散点图的函数是()。

A:pie() B:scatter() C:bar() D:hist()答案:scatter()5.下列选项中,不属于Seaborn库特点的是()A:多个内置主题及颜色主题 B:基于网格绘制出更加复杂的图像集合 C:可以处理大量的数据流 D:Seaborn是基于Matplotlib的可视化库答案:可以处理大量的数据流第四章测试1.下列不属于HTTP请求过程的是()A:请求重定向 B:超时设置 C:搜索文档 D:生成请求答案:搜索文档2.下列关于Python爬虫库的功能,描述不正确的是()A:通用爬虫库——urllib B:Html/Xml解析器——pycurl C:爬虫库——Scrapy D:通用爬虫库——requests答案:Html/Xml解析器——pycurl3.下列对于Scrapy常用命令及其作用描述错误的是()A:list是一个全局命令,主要用于列出项目中所有可用的爬虫 B:startproject 是一个全局命令,主要用于运行一个独立的爬虫 C:crawl是一个项目命令,主要用于启动爬虫 D:genspider是一个项目命令,主要用于创建爬虫模板答案:startproject是一个全局命令,主要用于运行一个独立的爬虫4.下列请求头中,可以记载用户信息实现模拟登录的是()A:Connection B:User-Agent C:Cookie D:Host答案:Cookie5.下列不属于Scrapy框架的基本组成部分的是()A:下载器与Spiders B:引擎与调度器 C:Item Pipelnes D:解析中间件答案:引擎与调度器第五章测试1.下列关于Pandas数据读/写说法错误的是()A:to_csv函数能够读取数据库的数据写入.csv文件 B:read_csv能够读取所有文本文档的数据 C:to_excel函数能够将结构化数据写入Excel文件D:read_sql能够读取数据库的数据答案:read_csv能够读取所有文本文档的数据2.下列关于时间相关类错误的是()A:Timestamp是存放某个时间点的类 B:两个数值上相同的Period和Timestamp所代表的意义相同 C:Period是存放某个时间段的类D:Timestamp数据可以使用标准的试卷字符串转换得来答案:两个数值上相同的Period和Timestamp所代表的意义相同3.使用pivot_table函数制作透视表设置行分组键的参数为()。

2020智慧树知到《大数据算法》章节测试[完整答案]

2020智慧树知到《大数据算法》章节测试[完整答案]

2020智慧树知到《大数据算法》章节测试[完整答案]智慧树知到《大数据算法》章节测试答案1.11.以下关于大数据的特点,叙述错误的是()。

答案:速度慢A、速度慢B、多元、异构C、数据规模大D、基于高度分析的新价值2.在《法华经》中,“那由他”描写的“大”的数量级是()。

答案:10A、10B、10C、10D、1083.以下选项中,大数据涉及的领域中包括()。

答案:社交网络计算机艺术医疗数据A、社交网络B、医疗数据C、计算机艺术D、医疗数据4.大数据的应用包括()。

答案:推荐科学研究预测商业情报分析A、预测B、推荐C、商业情报分析D、科学研究5.目前,关于大数据已有公认的确定定义。

×6.大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。

()√1.21.大数据求解计算问题过程的第三步一般是()。

答案:算法设计与分析A、判断可计算否B、判断能行可计算否C、算法设计与分析D、用计算机语言实现算法2.在大数据求解计算问题中,判断是否为能行可计算的因素包括()。

答案:资源约束数据量时间约束A、数据量B、资源约束C、速度约束D、时间约束3.大数据求解计算问题过程的第一步是确定该问题是否可计算。

√4.大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。

√1.31.资源约束包括()。

答案:网络带宽外存CPU内存A、CPUB、网络带宽C、内存D、外存2.大数据算法可以不是()。

答案:精确算法串行算法内存算法A、云计算B、精确算法C、内存算法D、串行算法3.大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定约束结果的算法。

×4.MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。

√5.大数据算法是仅在电子计算机上运行的算法。

大数据分析导论智慧树知到课后章节答案2023年下南京工业大学

大数据分析导论智慧树知到课后章节答案2023年下南京工业大学

大数据分析导论智慧树知到课后章节答案2023年下南京工业大学南京工业大学第一章测试1.下列选项中,哪个工具不是词云工具()。

答案:Highstock2.下列论据中,能够支撑“大数据无所不能”的观点的是( )。

答案:互联网金融打破了传统的观念和行为3.大数据的最显著特征是( )。

答案:数据规模大4.大数据的价值体现在()。

答案:大数据为政策制定提供科学论据;大数据的发力点在于预测;大数据给思维方式带来了冲击;大数据实现了精准营销;大数据助力智慧城市提升公共服务水平5.大数据分析的陷阱,包括:()。

答案:不谨慎的归因,造成“相关性的误解”;只信亲身经历,造成“基于个案的认知”;观测维度有误,造成“精心挑选的数据维度”;比较对象不当,造成“缺失或不匹配的比较”6.总结一下,为什么是大数据,为什么是现在?答案:null7.传统数据和大数据的区别?答案:null第二章测试1.采集一手数据,有两种方式:()。

答案:调查;实验2.当前大数据技术的基础包括()答案:分布式数据库;分布式并行计算;分布式文件系统3.大数据产业发展的特点是()。

答案:规模较大;多产业交叉融合答案:ACE;增速很快4.大数据采集的含义?答案:null5.大数据采集的“六度”原则?答案:null第三章测试1.非需求数据清洗阶段,主要工作就是删除不需要的字段。

()答案:对2.当前,企业提供的大数据解决方案大多基于Hadoop 开源项目。

()答案:对3.大数据可以分析与挖掘前之前人们不知道或者没有注意到的模式,可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值。

()答案:对4.大数据清洗的基本原理?答案:null5.可视大数据清洗?答案:null第四章测试1.CRISP-DM模型,又被称为“跨行业数据挖掘标准流程“,将数据挖掘分为了6个不同的,但顺序并非完全不变的阶段:分别是:商业理解、数据理解、数据预处理、建立模型、模型评估和方案实施。

大数据技术原理与应用知到章节答案智慧树2023年青岛滨海学院

大数据技术原理与应用知到章节答案智慧树2023年青岛滨海学院

大数据技术原理与应用知到章节测试答案智慧树2023年最新青岛滨海学院第一章测试1.大数据的起源是()。

参考答案:互联网2.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的:()。

参考答案:相关分析而非因果分析3.当前社会中,最为突出的大数据环境是()。

参考答案:互联网4.大数据时代,数据使用的关键是()。

参考答案:数据再利用5.智慧城市的智慧之源是()。

参考答案:大数据6.万物皆可连,任何事物之间逻辑上都有可能存在联系,这是()思维的表现。

参考答案:相关7.对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。

因此,大数据收集的信息量要尽量精确。

()参考答案:错8.“大数据”并不等同于“大规模数据”。

()参考答案:对9.大数据的价值是数据本身。

( )参考答案:错10.非结构化数据即行数据,存储在数据库里。

( )参考答案:错第二章测试1.下列关于Hadoop说法正确的是()。

参考答案:Hadoop是一个能够对大量数据进行分布式处理的软件框架2.Hadoop生态系统中开源的数据分析集群计算框架是()。

参考答案:Pig3.在初次启动Hadoop集群时,必须对主节点HDFS进行格式化处理,具体指令为()。

参考答案:hdfs namenode -format4.查看hadoop进程在主节点master的Terminal终端执行()命令。

Jps5.Hadoop的安装模式不包括()。

参考答案:安全模式6.对称加密算法中需要有两个不同的密钥:公钥和私钥。

()参考答案:错7.RSA是目前最有影响力的公钥加密算法,它能够抵抗到目前为止已知的所有密码攻击,已被ISO推荐为公钥数据加密标准。

()参考答案:对8.Hadoop 集群正常启动后,默认开放18088端口,用于监控YARN集群。

()参考答案:对9.Hadoop 默认模式为非分布式模式(本地模式),无需进行其他配置即可运行。

大数据概论智慧树知到课后章节答案2023年下上海商学院

大数据概论智慧树知到课后章节答案2023年下上海商学院

大数据概论智慧树知到课后章节答案2023年下上海商学院上海商学院第一章测试1.下列哪个表述是错误的?答案:在芯片里运行的程序可以是面向对象语言编写。

2.以下哪一种不是计算机操作系统?答案:iOS3.微软对Windows界面的开发主要受到哪家公司的启发?答案:苹果4.Windows和Linux或者iOS和Android之间的最大区别在于什么?答案:思想:前者封闭后者开源5.医疗领域如何利用大数据?答案:用户行为分析;社保资金安全;个性化医疗;临床决策支持6.现在非结构化数据已经占人类数据量的25%。

答案:错7.大数据与云计算结合起来将给世界带来一场深刻的管理技术革命与社会治理创新。

答案:对8.Python是一种面向对象、()计算机程序设计语言。

答案:解释型9.ASCII码使用一个字节编码。

答案:对10.GBK是只用来编码汉字的,GBK全称《汉字内码扩展规范》,使用双字节编码。

答案:对第二章测试1.人类科学主要经过了经验科学、理论科学、计算科学、数据科学四个阶段。

答案:对2.大数据的利用过程是()。

答案:采集-清洗-统计-挖掘3.信息只有通过反思、启发和学习等过程被每个个体予以有效处理,才能有用。

答案:对4.数据是作为信息的重要来源,信息经过加工转化为知识。

答案:对5.在大量知识积累基础上,总结成原理和法则,就形成了智慧。

答案:对6.信息是有时效性的。

答案:对7.在一个系统中,()贯穿整个系统,对信息的管理和控制使系统的运行更加有序。

答案:信息8.系统测试的步骤是()。

答案:单元测试、子系统测试、系统测试、验收测试9.知识阶层中最底层也是最基础的是()。

答案:数据10.信息的主要形式维度有()。

答案:声音;文本;视频;动画;图表第三章测试1.数据分析的三个层次是()。

答案:预测分析;规范分析;描述分析2.数据分析的第一步是()。

答案:需求分析3.收集的数据在处理之前必须经过预处理的步骤。

答案:对4.()是指通过对比分析、分组分析、交叉分析、回归分析答案:数据建模分析5.把()溶入数据挖掘过程是数据挖掘成功的关键。

大数据基础智慧树知到课后章节答案2023年下浙江经贸职业技术学院

大数据基础智慧树知到课后章节答案2023年下浙江经贸职业技术学院

大数据基础智慧树知到课后章节答案2023年下浙江经贸职业技术学院浙江经贸职业技术学院第一章测试1.大数据产生于()。

A:第2次信息化浪潮 B:信息时代 C:第3次信息化浪潮 D:第1次信息化浪潮答案:第3次信息化浪潮2.大数据的起源是()。

A:互联网 B:金融 C:公共管理 D:电信答案:互联网3.当前大数据技术的基础是由()首先提出的。

A:谷歌 B:微软 C:阿里巴巴 D:百度答案:谷歌4.大数据的最显著特征是()。

A:数据类型多样 B:数据规模大 C:数据处理速度快 D:数据价值密度高答案:数据规模大5.大数据时代,数据使用的关键是()。

A:数据收集 B:数据再利用 C:数据分析 D:数据存储答案:数据再利用第二章测试1.在Linux系统中,以下哪个目录是存放用户主目录的?()。

A:/usr B:/var C:/home D:/etc答案:/home2.在Linux系统中,以下哪个命令可以复制文件?()。

A:mv B:rm C:cp D:mkdir答案:cp3.在Linux系统中,以下哪个命令可以创建一个空文件?()。

A:echo B:touch C:cat D:vi答案:touch4.在Linux系统中,以下哪个目录是存放系统配置文件的?()。

A:/bin B:/usr C:/var D:/etc答案:/etc5.在末行模式下,键入什么命令可以不保存退出vi编辑器对文件/etc/inittab的修改?()。

A::q! B::wq C::x! D:在编辑模式下,键入“ESC”键直接退出答案::q!第三章测试1.分布式存储系统可以分为不同类型,属于()的,如Hadoop的HDFS。

A:分布式数据库 B:分布式键值系统 C:分布式表格系统 D:分布式文件系统答案:分布式文件系统2.作为HDFS的基础概念,其中()是指元数据节点。

A:NameNode B:Secondary NameNode C:Block D:DataNode答案:NameNode3.以下命令中的(),是把HDFS系统的文件夹zjiet1内的文件a.txt下载到本地系统的文件夹zjiet2。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.大数据算法的()特点,使其与大数据算法密切相关的。答案:速度快数据量大 A、数据量大 B、基于高度分析的新价值 C、速度快 D、多样性、复杂性 4.为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技 术会涉及到时间亚线性算法。× 1.5 1.大数据算法涉及到外存的时候,通常要分析()。答案:IO 复杂性 A、时间空间复杂性 B、IO 复杂性 C、结果质量 D、通讯复杂性 2.下列选项中,属于智能仿生算法的是()。答案:遗传算法模拟退火算法 A、遗传算法 B、近似算法 C、模拟退火算法 D、数据流算法 3.在线算法/数据流算法是面向大数据速度快的特点提出的。()√ 4.对于数据流算法或在线算法,经常要分析结果的近似比。()× 5.随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。 ()√ 2.1
()√ 4.在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差 的最多值时,可以得到频繁项一个好的估计。√ 3.3 1. 时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。答 案:权重 A、近似值 B、精确值 C、权重 D、界限 2.求最小生成树是一个贪心法,可以用()算法来解决。答案:Prime A、Prime B、并行 C、MG D、内存 3.对联通分量个数的估计可以利用随机化方法。√ 3.4 1. 对于输入 n 个数的数组(x1,x2,x3,……,xn),输出:这个数组是否有序。远离意味 着必须删除大于()个元素才能保证剩下的元素有序。答案:n A、-n B、n C、/n
D、(1-)-近似 2.利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。 答案:二分之一 A、二分之一 B、三分之一 C、四分之一 D、十分之一 3.采用平面图的直径近似算法的动机是无法在要求的时间内得到()。答案:精确 解 A、相似解 B、完整解 C、精确解 D、近似解 4.在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在 i、j、k 三个点中,i 到 j 的距离加上 j 到 k 的距离小于 i 到 k 的距离。× 5.近似算法能给出一个优化问题的优化解。× 6.RatioBound 越大,则近似解越坏。()√ 2.4 1. 在判定问题的近似中,对于近似解需要区分的是()。答案:差得很远是 A、是 B、否 C、差不离 D、差得很远
2.全 0 数组判定的近似算法的证据引理是:如果一次测试以大于等于 p 的概率获 得一个证据,那么 s=2/p 轮测试得到证据的概率大于等于 1/2。× 3.判定问题的近似解是指:输入满足某种性质或近似满足某种性质。× 3.1 1. Zipf 原则是指典型的频率分布是高度偏斜的,存在很多频繁元素。()× 2.在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等, 且处理这些函数时通常使用单个寄存器 s。()√ 3.数据流模型中,数据流是指来自某个域中的元素序列。()√ 4.在数据流模型中,内存远远大于数据的规模。()× 3.2 1. 频繁元素计算算法又称为()算法。答案:MG A、MM B、MG C、GM D、MP 2.频繁元素计算算法有效的原因是源于()。答案:Zipf 原则 A、取近似解 B、证据引理 C、错误界限和 k 成反比 D、Zipf 原则 3.在频繁元素计算算法中,计数器 x 减少的次数依赖于有几个减少计数定定义。× 6.大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。()√ 1.2 1. 大数据求解计算问题过程的第三步一般是()。答案:算法设计与分析 A、判断可计算否 B、判断能行可计算否 C、算法设计与分析 D、用计算机语言实现算法 2.在大数据求解计算问题中,判断是否为能行可计算的因素包括()。答案:资源约 束数据量时间约束 A、数据量 B、资源约束 C、速度约束 D、时间约束 3.大数据求解计算问题过程的第一步是确定该问题是否可计算。√ 4.大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。√ 1.3 1.资源约束包括()。答案:网络带宽外存 CPU 内存 A、CPU B、网络带宽 C、内存 D、外存
2.大数据算法可以不是()。答案:精确算法串行算法内存算法 A、云计算 B、精确算法 C、内存算法 D、串行算法 3.大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生 成满足给定约束结果的算法。× 4.MapReduce 是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。 √ 5.大数据算法是仅在电子计算机上运行的算法。× 1.4 1. 众包算法是用来解决()。答案:计算机计算能力不足或知识不足,需要人来帮忙 A、访问全部数据时间过长 B、数据难于放入内存计算 C、单个计算机难以保存全部数据,计算需要整体数据 D、计算机计算能力不足或知识不足,需要人来帮忙 2.大数据算法存在很多难题,对于访问全部数据时间过长的问题,采用的解决方案 是()。答案:读取部分数据 A、将数据存储到磁盘上 B、仅基于少量数据进行计算 C、读取部分数据 D、并行处理
1.计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下, 进行精确计算最少需要访问()个顶点。答案:n-1 A、n B、n+1 C、2n D、n-1 2.亚线性是指()等的消耗是输入规模 o。()答案:空间通讯时间 IO A、时间 B、空间 C、IO D、通讯 3.性质检测算法属于亚线性空间算法的一类。()× 2.2 1. 在经典的水库抽样中,要求空间复杂性为 O(k),是指与抽样大小有关,而与整个数 据的数据量无关。√ 2.水库抽样算法的采样是均匀的。√ 2.3 1. 以下()不是衡量分析近似解代价与优化解代价差距的方法。答案:绝对误差 A、RatioBound B、相对误差 C、绝对误差
智慧树知到《大数据算法》章节测试答案 1.1 1.以下关于大数据的特点,叙述错误的是()。答案:速度慢 A、速度慢 B、多元、异构 C、数据规模大 D、基于高度分析的新价值 2.在《法华经》中,“那由他”描写的“大”的数量级是()。答案:10^28 A、10^7 B、10^14 C、10^28 D、10^56 3.以下选项中,大数据涉及的领域中包括()。答案:社交网络计算机艺术医疗数据 A、社交网络 B、医疗数据 C、计算机艺术 D、医疗数据 4.大数据的应用包括()。答案:推荐科学研究预测商业情报分析 A、预测 B、推荐 C、商业情报分析 D、科学研究
相关文档
最新文档