2019年大数据测试答案

合集下载

大数据应用竞赛复习题

大数据应用竞赛复习题

大数据应用竞赛复习题136、云是网络的一种比喻说法,传统架构图中用来表示电信网,后续扩展到表示互联网和底层基础设施。

用户通过()等方式接入云数据中心,按自己的需求进行数据处理。

*A台式机(正确答案)B笔记本(正确答案)C手机(正确答案)D服务器137、在数据缺失严重时,会对分析结果造成较大的影响,因此剔除的异常值和缺失值,要采用合理的方法进行填补,常用的方法有()。

*A平均值填充(正确答案)B.K最近邻距离法(正确答案)C回归法(正确答案)D极大似然估计(正确答案)E多重插补法(正确答案)138、在数据资产质量管理中,同一责任人产生的同一数据项一年内出现两次以上质量问题需要进行问责,以下说法正确的是()。

*A体现了数据资产质量管理遵循“谁产生、谁负责”的原则(正确答案)B.对责任单位予以通报批评(正确答案)C.按照公司员工奖惩规定第十二条追究相关人员责任(正确答案)D.具体惩处按照公司员工违规违纪行为惩处细则第十三条执行(正确答案)139、在网络爬虫的爬行策略中,应用最为基础的是() *A深度优先遍历策略(正确答案)B广度优先遍历策略(正确答案)C高度优先遍历策略D反向链接策略E大站优先策略140、在重大活动保电工作准备期间应超前谋划部署,加强对公司重要数据管控,加强漏洞隐患排查整改,妥善做好涉密数据传递及应用有关工作,综合运用()等手段,构建全方位、立体式监管与防护体系。

深 *A人防(正确答案)B物防(正确答案)C技防(正确答案)D监管(正确答案)141、噪声数据的产生原因主要有()。

*A数据采集设备有问题(正确答案)B在数据录入过程中发生了人为或计算机错误(正确答案)C数据传输过程中发生错误(正确答案)D由于命名规则或数据代码不同而引起的不一致(正确答案)142、正在推动能源行业变革的技术有哪些? *A.电网运行技术(正确答案)B.互联网技术C.用户侧技术(正确答案)D.信息技术(正确答案)E.能源技术(正确答案)143、中国大数据产业特征包括()。

2019年高考语文《关于“大数据”》现代文阅读试题及答案汇编

2019年高考语文《关于“大数据”》现代文阅读试题及答案汇编

2019年高考语文《关于“大数据”》现代文阅读试题及答案汇编学校:___________姓名:___________班级:___________考号:___________一、现代文阅读阅读下面的文字,完成后面问题。

近年来伴随着不少国家的宽带化战略的实施、云计算服务的起步、物联网应用的铺开和移动互联网的崛起,数据量与时俱增,数据处理能力也发展迅速,数据量积累到一定程度其资源属性越加明晰,显示出开发的价值。

同时,社会的节奏越来越快,要求快速的反应和精细的管理,急需借助对数据的分析来科学决策,催生了对大数据开发的需求,大数据被称为将引发生活、工作和思维变革的一次革命。

大数据是相对于一般数据而言的,目前对大数据尚缺权威的严格定义,但较普遍的解释是指“难以用常规的软件工具在容许的时间内对其内容进行抓取、管理和处理的数据集合”。

规模大是大数据的标志之一,但大数据之所以难处理不仅在于规模大,更大的挑战是其随时间的变化快和类型的多样性,根据可否用表格或关系数据库的表和视图来表示而区分为结构型和非结构型数据,照片和视频等就是典型的非结构数据。

随时间和类型的变化增加了大数据的复杂性但也同时丰富了大敷据的内涵。

通常用4V (VolumE.Velocity、Variety、Value)来反映大数据的特征,即量大、增长快、多样性和高价值。

从这一点来看,对大数据仅仅冠以“大”这一形容词是不全面的,只不过在大数据的4V中,规模相对于变化和类型这两个特征容易定量,而且即便是单一类型的数据集(例如文本文件),只要有足够的规模也能称得上大数据。

数据的规模越大,通常对数据挖掘所得到的事物演变规律越可信,数据分析的结果也越有代表性,因此对大数据这一词汇突出其规模大这一特征也是可理解的。

大数据不仅是一种资源,也是一种方法,伴随大数据产生数据密集型科学,有人将它称为是继实验科学、理论科学和计算科学之后的第四种科学研究模式,这一研究模式的特点表象为不在意数据的杂乱,但强调数据的量;不要求数据精准,但看重其代表性;不刻意追求因果关系,但重视规律总结。

2019年人工智能考试答案

2019年人工智能考试答案

一、判断题(每题2分)1.智慧养老从老年人本身出发,能够满足老年人不同层面的需求。

正确错误2.智慧养老应把服务需求和供给有效结合,为服务平台提供了生长空间。

正确错误3.根据《大数据在医疗领域的应用》,当今时代信息技术进一步推动了经济的增长和社会的发展,推动了知识传播应用进程的变化。

正确错误4.大数据需要云计算,大数据就等于云计算建设。

正确错误5.“互联网+”医疗服务体系鼓励医疗机构应用互联网等信息技术拓展医疗服务空间和内容,构建一体化医疗服务体系。

正确错误6.2016年9月,国务院印发《促进大数据发展行动纲要》,10月,十八届六中全会将大数据上升为国家战略。

正确错误7.大数据时代要求架构云化,这对网络安全没有威胁。

正确错误8.大数据应用很大程度上是沙里淘金、废品利用、大海捞鱼。

正确错误9.Hadoop分布式文件系统被设计成合适运行在通用硬件(commodity hardware)上的集中式文件系统。

正确错误10.医疗大数据主要来源于制药企业、临床数据、社保基金利用率和患者的数据。

正确错误11.美国在人工智能方面取得了较好的成果。

正确错误12.人工智能在国际关系方面提出了新要求和挑战。

正确错误13.GDPR是人工智能在隐私保护方面典型法律之一。

正确错误14.韩国第四次工业革命在举行的第四次会议上,通过了人工智能研发战略。

正确错误15.1978年,全国科学大会在北京召开,钱学森发表了“科学技术是生产力”的重要讲话。

正确错误16.人工智能在医疗领域还存在一些问题。

正确错误17.对于在医疗领域的AI,我国应提出加大推动创新人工智能应用评估和保障机制、加大政策扶持力度等建议。

正确错误18.中国学者的研究影响力超过了美国,但人工智能领域的论文数量方面尚不及美国和英国同行。

正确错误19.加强人工智能相关法律、伦理和社会问题研究,建立保障人工智能健康发展的法律法规和伦理道德框架。

正确错误20.2016年9月开始,微软的技术与研发部门和人工智能(AI)研究部门相互分离,各司其职。

2019继续教育大数据创新实践考试

2019继续教育大数据创新实践考试

大数据创新实践考试返回上一级单选题(共30题,每题2分)1 . HDFS默认Block Size:∙A.16M∙B.32M∙C.64M∙D.128M我的答案: C参考答案:C答案解析: 64M2 .信息时代的三大定律不包括:∙A.牛顿定理∙B.摩尔定律∙C.麦特卡尔夫定律∙D.吉尔德定律我的答案: A参考答案:A答案解析:牛顿定理3 .美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的:∙A.在数据基础上倾向于全体数据而不是抽样数据∙B.在分析方法上更注重相关分析而不是因果分析∙C.在分析效果上更追究效率而不是绝对精确∙D.在数据规模上强调相对数据而不是绝对数据我的答案: B参考答案:B答案解析:在分析方法上更注重相关分析而不是因果分析4 .下列关于网络用户行为的说法中,错误的是:∙A.网络公司能够捕捉到用户在其网站上的所有行为∙B.用户离散的交互痕迹能够为企业提升服务质量提供参考∙C.数字轨迹用完即自动删除∙D.用户的隐私安全很难得以规范保护我的答案: C参考答案:C答案解析:数字轨迹用完即自动删除5 .智能手环的应用开发,体现了()的数据采集技术的应用。

∙A.网络爬虫∙B.API接口∙C.传感器∙D.统计报表我的答案: C参考答案:C答案解析:传感器6 .在Bigtable中,()主要用来存储子表数据以及一些日志文件。

∙A.GFS∙B.MapReduce∙C.SStable∙D.Chubby我的答案: A参考答案:A答案解析: GFS7 .当前社会中,最为突出的大数据环境是:∙A.互联网∙B.自然环境∙C.综合国力∙D.物联网我的答案: A参考答案:A答案解析:互联网8 .以下哪些可以属于智慧城市的范畴:∙A.智慧政务∙B.智慧交通∙C.智慧医疗∙D.智慧公共安全∙E.以上都是我的答案: E参考答案:E答案解析:以上都是9 .人类利用信息的历史,经历了()次革命,促生了数据大爆炸。

2019大数据机器学习答案2

2019大数据机器学习答案2

一:单选题(每小题5分)1:模型复杂度越大,训练误差__________ ,测试误差__________A增大减小B增大增大C减小增大D 减小减小A B C D∙答案:C∙正确2:支持向量机的学习策略是__________A间隔最小化B间隔最大化C间隔平均化D间隔随机化A B C D∙答案:B∙正确3:条件随机场采用__________ 计算方法A递归B一次迭代C二次迭代D递进A B C D∙答案:A∙正确4:_______年,在CMU召开的第一次ICML会议,标志机器学习的诞生。

A 1970B 1979C 1980 D1983A B C D∙答案:C∙正确5:概率图推断方法可以被分为__________ 类A 2B 3C 4D 5A B C D∙答案:A∙正确6:EM算法的引入是因为概率模型中包含__________A观测变量B隐变量C随机变量D固定值A B C D∙答案:B∙正确7:学习算法的输入是__________A概念类B假设空间C训练集D以上三种全是A B C D∙答案:C∙错误8:机器学习最重要的应用领域是__________ 。

A预测算法B拟人应用C计算机视觉D深度学习A B C D∙答案:C∙错误9:决策树具有________ 种特点A 3B 4C 5D 6A B C D∙答案:C∙错误10:Adaboost算法的提出是在__________ 年A 1990B 1993C 1995D 1996A B C D∙答案:C∙错误二:判断题(每小题5分)11:序列最小最优化算法在1998年由Platt提出。

A:对B:错∙答案:A∙正确12:监督学习的目的学习一个由输出到输入的映射。

A:对B:错∙答案:B∙错误13:条件随机场的定义是在给定随机变量X条件下,随机变量Y的马尔科夫随机场A:对B:错∙答案:A∙正确14:所有的目标概念所构成的集合称为概念类A:对B:错∙答案:A∙正确15:Adaboost算法的学习算法是前向分布算法的三分类学习算法A:对B:错∙答案:B∙正确三:多选题(每小题5分)16:精确推断法主要包括__________A变量消去法B信念传播法C MCMC采样D变分推断法A B C D∙答案:AB∙正确17:监督学习方法分为__________A预测方法B生成方法C判别方法D总结方法A B C D∙答案:BC∙正确18:半监督学习的正则化方法有__________A 多任务学习B对抗训练C参数绑定和参数共享D稀疏表示A B C D∙答案:ABCD∙错误19:HMM的主要应用__________A人脸识别B语音识别C入侵检测D拟人应用A B C D∙答案:ABC∙正确20:模型学习的最优化算法__________A梯度下降法B迭代尺度法C牛顿法D拟牛顿法A B C D∙答案:ABCD∙正确。

2019继续教育公需科目大数据技术及应用试题答案

2019继续教育公需科目大数据技术及应用试题答案

2019年度大数据技术及应用试题单选题:1、本课程提到,近年来,我国(A)在GDP中占的比例逐年增大。

A互联网经济B信息经济C数码消费D电子商务2、法律大数据演示的结果表明,针对“酒驾”这一查询,相关刑罚中主要的是(A)A以上都是B拘役C罚金D有期徒刑3、根据本课程,取得成功的关键是要从(A)出发A数据B技术C设备D问题4、1965年英特尔公司创始人之一摩尔先生,提出来在之后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度每18个月左右可以翻一番,这被称为(摩尔定律)5、21世纪初,关于查询结果排序我们找到了一种新的方法。

(大数据方法:用户的点击数据)6、根据本课程,(查询结果)排序是一个在搜索引擎中处于核心位置的工作。

7、今天,随着信息科学技术的高速发展,人类对数据的收集和分享能力空前强大,其中,(互联网)可以收集虚拟世界的数据。

8、根据本课程,交通数据采集的来源不包括(A)A通讯信号B视频监控C微波采集D车载RFID9、根据本课程,(实时分析)希望能够全面突破搜索引擎框架所蕴含的3个假设,使得我们能以很快的速度对互联网上出现的数据进行分析,从而发掘出相关的高阶知识,满足用户的信息需求。

10、六度分割理论认为,世界上任何两个人通过最多(六)个人就可以相互认识。

11、新经验主义是用经验数据解决问题,但是这些经验是(群体性的经验)。

12、根据本课程,科学家们认为,2013年全世界储存的大数据容量是(1.2ZB)13、本课程提到,当前(云计算)服务的逐渐成熟,为大数据发展提供了有利的基础设施支撑。

14、(RFID)是一种标签,可以把一个物体身上的各种特征和信息都收集起来。

15、本课程提出,搜索引擎是一个搜索框,输一些关键词,然后出来一些页面的列表,需要用户点开看,这种架构蕴含的基本假设不包括(A)A这些文档彼此不是独立的B这些文档是静态的C假设用户找一个文档,而不是找一个答案D这些文档是独立的16、根据本课程,以下哪项不属于智慧城市的特点(C)A更广泛的互联互通B更深入的智慧化C更传统的方式D更透彻的感知17、“十二五”期间,我国数据总量年均增长率达到了(50%)18、二十世纪五十年代初,阿兰.麦席森.图灵提出(图灵测试)概念,用来测试计算机的智能程度。

2019大数据机器学习答案1

2019大数据机器学习答案1

1:感知机学习算法原始形式迭代是________的。

A震荡B发散C约束D收敛A B C D•答案:D•正确2:机器学习的理论基础是__________A统计论B概率论C计算学习理论D推断论A B C D•答案:C•错误3:PR曲线中P代表的是__________A预测出正例的保证性B预测出正例的正确率A B•答案:B•错误4:支持向量机的学习策略是__________A间隔最小化B间隔最大化C间隔平均化D间隔随机化A B C D•答案:B•正确5:模型复杂度越大,训练误差__________ ,测试误差__________A增大减小B增大增大C减小增大D 减小减小A B C D•答案:C•错误6:多维缩放的主要特点有_______种A 2B 3C 4D 5A B C D•答案:B•正确7:EM算法的引入是因为概率模型中包含__________A观测变量B隐变量C随机变量D固定值A B C D•答案:B•正确8:神经网络作为一个计算模型的理论是在__________ 年提出的A 1941B 1942C 1943D 1944A B C D•答案:C•正确9:介绍了__________种自适应学习率算法A 3B 4C 5D 6A B C D•答案:A•错误10:概率图推断方法可以被分为__________ 类A 2B 3C 4D 5A B C D•答案:A•错误11:概率模型是一种将学习任务归结于计算变量的概率分布的描述框架A:对B:错•答案:A•正确12:没有免费的午餐定理原理称为“如无必要,勿增实体”。

A:对B:错•答案:B•错误13:神经网络的全称是人工神经网络A:对B:错•答案:A•正确14:流形学习可被用于可视化A:对B:错•答案:A•正确15:所有可能概念或模型的集合称为假设类A:对B:错•答案:B•错误16:机器学习方法三要素为__________A模型B策略C空间D算法A B C D•答案:ABD•正确17:隐马尔可夫模型的的三个基本问题__________A概率计算问题B迭代尺度问题C模型学习问题D预测问题A B C D•答案:ABD•错误18:贝叶斯网络是由__________ 结合而成的描述多元统计关系模型A图论B空间论C逼近论D概率论A B C D•答案:AD•正确19:监督学习方法分为__________A预测方法B生成方法C判别方法D总结方法A B C D•答案:BC•错误20:精确推断法主要包括__________A变量消去法B信念传播法C MCMC采样D变分推断法A B C D•答案:AB•错误。

智慧树知到《大趋势》2019章节测试答案

智慧树知到《大趋势》2019章节测试答案
B.提高效率
C.改变资源配置方式
D.改变消费习惯
E.文化优势
答案:势网民大国优势,后发优势,制度优势
第三章
1、十九大报告提岀来,要推动什么信息技术和实体经济深度融合?
A.互联网
B.大数据
C.人工智能
D.云计算
答案:ABC
2、全球市值最大的前20位的互联网公司主要分布在哪两个国家?
A.美国
B.中国
C.德国
D.日本 答案:AB
3、智能制造包括以下哪些方面?
A.产品的智能化
B.装备的智能化
C.生产的智能化
D.管理的智能化
E.服务的智能化
答案:ABCDE
4、新一轮产业革命或是智能制造的内在的逻辑是什么
A.优化资源的配置是目标
B.数据的自动流动是关键
C.工业软件是核心
D.新型能力培育是主线
E.平台生态是竞争制高点答案:ABCDE
D.该怎么做
答案:ABCD
10、工业互联网构成的三个方而:
A.网络是基础
B.标准是支撑
C.平台是核心
D.安全是保障
答案:ACD
第四章
1、哪个部门制定了大数据发展战略?
A.工信部
B.国务院
C.商务部
D.科技部
答案:C
2、1950年到1990年互联网基木在政府内部使用,英文简称是什么?
A.G2B
B.G2C
充分说明了什么的重要性?A
A.人才
B.技术
C.资本
D.土地
答案:
8、我们把规律模型化、模型算法化、算法代码化、代码软件化, 再用软件化去优化,构建起了三个世界:
A.数字世界
B.意识世界

2019四川电子科大大数据答案

2019四川电子科大大数据答案

一1、(单选,4分)CAD在医疗健康领域的英文全称是()A、Computer Aided Diagnosis2、(单选,4分)不属于AI健康医疗生态系统的是()D、制药生态3、(单选,4分)不属于慢性疾病的是()A、艾滋病4、(单选,4分)AI院前管理包括()A、预测和干预5、(单选,4分)AI医疗健康技术体系的基础层不包括()C、芯片6、(单选,4分)AI医疗健康发展的核心要素是()B、数据7、(单选,4分)我国首次研发的AI医疗系统是面向()B、中医8、(单选,4分)第3次AI浪潮的到来主要依赖于()C、深度学习9、(单选,4分)目前AI医疗健康市场最成熟的是()D、辅助医疗影像诊断10、(单选,4分)我国慢性疾病增加,与老龄化加剧的关系()B、强相关11、(多选,4分)AI医疗健康的核心技术体系主要包括()A、传感器技术B、存储技术C、传输技术12、(单选,4分)AI辅助诊断属于()B、院中管理13、(单选,4分)婴幼儿时期的环境暴露不会影响个体后期的身体健康。

B、错误14、(单选,4分)以下不属于大数据时代特征的是()D、数据处理速度迅速提升15、(单选,4分)以下哪一项不是人工智能发展的必要条件()D、机器学习16、(单选,4分)以下哪一项不属于健康医疗大数据来源()C、购物数据17、(单选,4分)以下不属于机器学习研究范畴的是()C、专家系统18、(多选,4分)以下属于人工智能在医疗领域应用的是()多选A、疾病预测C、辅助诊断D、药物个性化推荐19、(单选,4分)以下对大数据描述正确的是()C、大数据本质在于数据的关联分析20、(单选,4分)以下不属于弱人工智能特点的是()A、自适应能力21、(多选,4分)人工智能技术发展出现几次低潮的原因包括()多选A、算法研究瓶颈B、计算能力瓶颈D、数据有限22、(单选,4分)以下说法正确的是()D、人工智能就是深度学习23、(单选,4分)以下说法正确的是()D、健康医疗领域数据存在孤岛现象24、(单选,4分)以下说法正确的是()A、即使在大数据时代,统计分析仍然具有重要的作用25、(单选,4分)以下关于人工智能、机器学习和深度学习说法正确的是()B、机器学习或深度学习是实现人工智能的一种方法二1、(单选,4分)大数据起源于()A、金融B、电信C、互联网D、医疗答案:C2、(单选,4分)第一个提出大数据概念的公司是()A、微软B、谷歌C、麦肯锡D、亚马逊答案:C3、(单选,4分)()规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理。

2019继续教育公需科目大数据技术及应用试题答案

2019继续教育公需科目大数据技术及应用试题答案

2019 年度大数据技术及应用试题单选题 :1、本课程提到,近年来,我国(A )在 GDP 中占的比例逐年增大。

A互联网经济B信息经济C数码消费D电子商务2、法律大数据演示的结果表明,针对“酒驾”这一查询,相关刑罚中主要的是(A )A以上都是B拘役C罚金D有期徒刑3、根据本课程,取得成功的关键是要从(A)出发A数据B技术C设备D问题4、1965 年英特尔公司创始人之一摩尔先生,提出来在之后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度每18 个月左右可以翻一番,这被称为(摩尔定律)5、 21 世纪初,关于查询结果排序我们找到了一种新的方法。

(大数据方法:用户的点击数据)6、根据本课程,(查询结果)排序是一个在搜索引擎中处于核心位置的工作。

7、今天,随着信息科学技术的高速发展,人类对数据的收集和分享能力空前强大,其中,(互联网)可以收集虚拟世界的数据。

8、根据本课程,交通数据采集的来源不包括( A )A通讯信号B视频监控C微波采集D车载 RFID9、根据本课程,(实时分析)希望能够全面突破搜索引擎框架所蕴含的 3 个假设,使得我们能以很快的速度对互联网上出现的数据进行分析,从而发掘出相关的高阶知识,满足用户的信息需求。

10、六度分割理论认为,世界上任何两个人通过最多(六)个人就可以相互认识。

11、新经验主义是用经验数据解决问题,但是这些经验是(群体性的经验)。

12、根据本课程,科学家们认为,2013 年全世界储存的大数据容量是( 1.2ZB )13、本课程提到,当前(云计算)服务的逐渐成熟,为大数据发展提供了有利的基础设施支撑。

14 、( RFID )是一种标签,可以把一个物体身上的各种特征和信息都收集起来。

15、本课程提出,搜索引擎是一个搜索框,输一些关键词,然后出来一些页面的列表,需要用户点开看,这种架构蕴含的基本假设不包括(A)A这些文档彼此不是独立的B这些文档是静态的C假设用户找一个文档,而不是找一个答案D这些文档是独立的16 、根据本课程,以下哪项不属于智慧城市的特点(C)A更广泛的互联互通B更深入的智慧化C更传统的方式D更透彻的感知17 、“十二五”期间,我国数据总量年均增长率达到了(50% )18 、二十世纪五十年代初,阿兰 . 麦席森 .图灵提出(图灵测试)概念,用来测试计算机的智能程度。

高中信息技术人教中图版(2019)必修一第1章认识数据与大数据培优训练试题03含答案

高中信息技术人教中图版(2019)必修一第1章认识数据与大数据培优训练试题03含答案

第1章认识数据与大数据培优训练试题2020—2021学年人教中图版(2019)高中信息技术必修一一、选择题1.二进制数10111转换成十进制数是()。

A.53B.32C.23D.462.下列行为可能使用大数据的是()。

①为了避免堵车,利用高德地图,查看道路拥堵情况②利用人脸识别打开门禁道闸,进入校园③水银温度计上显示当前气温是30℃④全民K歌提示你打败了全国90%的人⑤微信运动显示你今天走了10000步A.①②③④B.①②④⑤C.②③④⑤D.①②③④⑤3.某电路如下所示,由三个开关、三个小灯和电源连接组成,开启和闭合开关,小灯共有()种状态。

A.1B.3C.6D.84.下列选项中,属于信息的是()。

A.正在播放新闻的电视机B.学业水平考试成绩C.当天发行的报纸D.DVD光盘5.比如汽车的速度、空气的温度等这些连续变化的信号称为()A.模拟信号B.数字信号C.数据信号D.离散信号6.使用UltraEdit软件观察字符“2020,武汉加油!”的内码,部分界面如图所示。

下列说法正确的是()A.图中内码表示的ASCII码字符共有6个B.字符“!”的十六进制内码为A1C.字符“3”的内码用二进制表示是“00110011”D.存储该段字符需要14个字节7.视频文件常被压缩保存,其目的是A.调整着色B.提高分辨率C.节约存储空间D.改变文件格式8.我们常常要对加工处理的对象进行编码,用一个编码符号代表一条信息或一串数据,下列说法错误的是()A.在航海灯语系统中,灯语就是一种信息编码方式B.车辆的车牌号、居民身份证号都是一种数据编码方式C.ASCH码是由8位二进制数构成的编码D.二维码不是一种数据编码方式9.使用UltraEdit软件观察字符“2018,好运!”的内码,部分界面如图所示。

下列说法正确的是()A.字符“,”的内码占用1个字节B.字符“3”的二进制内码是110010BC.字符“!”的十进制内码值是33DD.全部字符中只有2个字符采用GB2312编码10.已知字符“i”的ASCII码的二进制值是1101001,如果某字符的ASCII码的十进制值是109,那么这个字符是()A.f B.m C.h D.e11.小林要上传的研究性学习的课题资料文件如图所示。

最新2019公需科目大数据完整考试题库300题(含标准答案)

最新2019公需科目大数据完整考试题库300题(含标准答案)

2019公需科目:大数据题库300题[含参考答案]一、选择题1.cpu 处理能力强2.内存够大,所以集群的瓶颈不可能是 a 和 d3.下面哪个程序负责 HDFS 数据存储。

a)NameNdeb)Jbtrackerc)Datanded)SecndaryNameNdee)tasktracker答案.C Datande二、填空题4.Hadp三种运行的模式.单机版 . 伪分布式和分布式。

5.MapReduce任务过程分为两个处理阶段.map阶段和reduce阶段。

6.MapReduce确保每个reducer的输入都是按键排序的。

系统执行排序的过程(即将map 输出作为输入传给reducer)称为shuffle。

三、单选题7.智能健康手环的应用开发,体现了( D)的数据采集技术的应用。

(单选题)A.统计报表B.网络爬虫C.API接口D.传感器8.智慧城市的构建,不包含( C)。

(单选题)A.数字城市B.物联网C.联网监控D.云计算大数据的最显著特征是( A)。

(单选题)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高9.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B )。

(单选题)A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据10.下列关于计算机存储容量单位的说法中,错误的是( C)。

(单选题)A.1KB<1MB<1GBB.基本单位是字节(Byte)C.一个汉字需要一个字节的存储空间D.一个字节能够容纳一个英文字符,11.下列关于计算机存储容量单位的说法中,错误的是( C)。

(单选题)A.1KB<1MB<1GBB.基本单位是字节(Byte)C.一个汉字需要一个字节的存储空间D.一个字节能够容纳一个英文字符,12.下列关于聚类挖掘技术的说法中,错误的是(B )。

2019智慧树知到[大数据工具应用]章节答案

2019智慧树知到[大数据工具应用]章节答案

2019智慧树知到[大数据工具应用]章节答案[第一章测试]1.【单选题】2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和()能力的数据集。

答案:分析2.【单选题】用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和()。

答案:Variety3.【单选题】大数据分析四个方面的工作主要是:数据分类、()、关联规则挖掘和时间序列预测。

答案:数据聚类4.【判断题】新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。

答案:错5.【判断题】目前的大数据处理技术只能处理结构化数据。

答案:错[第二章测试]1.【单选题】我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是()。

答案:mdb2.【单选题】大多数日志文件的后缀名是()。

答案:log3.【单选题】本课程重点介绍的weka软件的专有文件格式是()。

答案:ARFF4.【单选题】数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和()。

答案:一致性5.【单选题】八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个()来作为采集的目标。

答案:网页地址6.【单选题】八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是()。

答案:otd7.【判断题】Excel可以通过“数据有效性”按钮操作来规范数据输入的范围。

答案:对8.【判断题】Excel不能导入txt或csv格式的文件。

答案:错9.【判断题】八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。

答案:错10.【判断题】八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。

答案:对。

南开大学2019年9月大数据导论期末考试答案

南开大学2019年9月大数据导论期末考试答案

《大数据导论》一、单选三、名词解释1.数据变换在对数据进行统计分析时,要求数据必须满足一定的条件,如在方差分析时,要求试验误差具有独立性、无偏性、方差齐性和正态性二但在实际分析中,独立性、无偏性比较容易满足,方差齐性在大多数情况下能满足。

正态性有时不能满足。

有时若将数据经过适当的转换,如平方根转换、对数转换、平方根反正弦转换,则可以使数据满足方差分析的要求。

所进行的此种数据转换,称为数据变换。

2.数据仓库William H. Inmon在1992年出版Building the Data Warehouse一书,第一次给出了数据仓库的清晰定义和操作性极强的指导意见,真正拉开了数据仓库得到大规模应用的序幕。

在该书中,将数据仓库定义为:“一个面向主题的(subject oriented)、集成的(integrate),相对稳定的(non-volatile)、反映历史变化(time variant)的数据集合,用于支持管理决策。

3.大数据分析大数据分析是大数据理念与方法的核心,是指对海量增长快速、内容真实、类型多样的数据进行分析,从中找出可以帮助决策的隐藏模式、未知的相关关系以及其他有用信息的过程。

4.RDD弹性分布式数据集RDD弹性分布式数据集,简单来说,是一种自定义的可并行数据容器,可以存放任意类型的数据。

弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息(Spark中称为“血统”)重构它:分布式指的是能对其进行并行的操作。

除了这两点,它还能通过persist或者cache函数被缓存在内存里或磁盘中,共享给其他计算机,可以避免Hadoop那样存取带来的开销。

四、简答题1. 大数据处理的关键技术都有哪些?并做简要描述。

大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算处理、数据分析和挖掘、数据可视化展示等。

1).数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。

2019继续教育公需科目大数据技术及应用试题答案知识讲解

2019继续教育公需科目大数据技术及应用试题答案知识讲解

2019继续教育公需科目大数据技术及应用试题答案2019年度大数据技术及应用试题单选题:1、本课程提到,近年来,我国(A)在GDP中占的比例逐年增大。

A互联网经济B信息经济C数码消费D电子商务2、法律大数据演示的结果表明,针对“酒驾”这一查询,相关刑罚中主要的是(A)A以上都是B拘役C罚金D有期徒刑3、根据本课程,取得成功的关键是要从(A)出发A数据B技术C设备D问题4、1965年英特尔公司创始人之一摩尔先生,提出来在之后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度每18个月左右可以翻一番,这被称为(摩尔定律)5、21世纪初,关于查询结果排序我们找到了一种新的方法。

(大数据方法:用户的点击数据)6、根据本课程,(查询结果)排序是一个在搜索引擎中处于核心位置的工作。

7、今天,随着信息科学技术的高速发展,人类对数据的收集和分享能力空前强大,其中,(互联网)可以收集虚拟世界的数据。

8、根据本课程,交通数据采集的来源不包括(A)A通讯信号B视频监控C微波采集D车载RFID9、根据本课程,(实时分析)希望能够全面突破搜索引擎框架所蕴含的3个假设,使得我们能以很快的速度对互联网上出现的数据进行分析,从而发掘出相关的高阶知识,满足用户的信息需求。

10、六度分割理论认为,世界上任何两个人通过最多(六)个人就可以相互认识。

11、新经验主义是用经验数据解决问题,但是这些经验是(群体性的经验)。

12、根据本课程,科学家们认为,2013年全世界储存的大数据容量是(1.2ZB)13、本课程提到,当前(云计算)服务的逐渐成熟,为大数据发展提供了有利的基础设施支撑。

14、(RFID)是一种标签,可以把一个物体身上的各种特征和信息都收集起来。

15、本课程提出,搜索引擎是一个搜索框,输一些关键词,然后出来一些页面的列表,需要用户点开看,这种架构蕴含的基本假设不包括(A)A这些文档彼此不是独立的B这些文档是静态的C假设用户找一个文档,而不是找一个答案D这些文档是独立的16、根据本课程,以下哪项不属于智慧城市的特点(C)A更广泛的互联互通B更深入的智慧化C更传统的方式D更透彻的感知17、“十二五”期间,我国数据总量年均增长率达到了(50%)18、二十世纪五十年代初,阿兰.麦席森.图灵提出(图灵测试)概念,用来测试计算机的智能程度。

2019年9月11日四川省大数据中心公开选调工作人员面试真题及解析

2019年9月11日四川省大数据中心公开选调工作人员面试真题及解析

2019年9月11日四川省大数据中心公开选调工作人员面试真题及解析审题5分钟答题10分钟内第一题:谈谈工作中你最成功或者最失败的事,从中的启发。

我在大学曾经是广播台一档节目的主持人。

节目的主题是环保,收听对象是老校区的教师和一些学术研究者,节目风格主要是学术性的。

新校区的成立要求我们成立新的广播台。

可想而知,第一期节目反响并不好,台内甚至有人提议撤销这档节目。

我立即组织小组成员一起讨论我们的改革计划。

在保持节目主旨不变的情况下,我以时尚轻松的谈话方式讲述国内的环保新闻,以流行的片花带领听众去了解国外的环保新法等。

当我带着紧张的心情播出这期节目后,收到的反馈显示我的这档节目在所有节目中排名第一。

而从那次险些被撤的失败风波之后,我们锐意革新,我们的节目一直稳列优秀节目前三,更好地做到了专业性和趣味性的结合。

每当我想起那时的事情,总是记忆犹新,时刻提醒自己:第一,凡事要多考虑,要注意面对不同的对象应该运用不同的策略,要用合适的策略去维持工作的原则性;第二,世上无难事,只要发挥创造性和吃苦耐劳的精神,我们就一定可以创造出自己想象不到的成功。

第二题:你是主考官今天会出什么题。

昨天我在阅读的时候,看到了这么一句话“牵牛花没有挺拔的躯干,却凭借攀附篱笆墙展示了自己的美丽;篱笆墙没有靓丽的外表,却凭借牵牛花的攀附成了一道风景。

”下面就谈谈我的启示吧。

牵牛花有漂亮的花朵,没有挺拔的躯干;篱笆墙有坚固的结构,没有靓丽的外表。

两者互有优缺点,通过取人之长、补己之短,实现了共赢,成就了美丽的风景。

这种互利共生的合作,正是我们应该学习的。

一方面,金无足赤,人无完人。

每个人都有长处和缺点,但我们可以合理借助外力弥补短处,进行突破,就像牵牛花借助篱笆墙,弥补自身局限,展现了自己的美丽。

因此,工作中,我们要学会借助外力。

例如,多向老同事学习工作经验,通过互联网寻找学习资源,积极参加职场技能培训等,抓住机遇找对平台,让自己的才能得到展现和发挥。

大数据算法2019尔雅答案

大数据算法2019尔雅答案

1【单选题】以下关于大数据的特点,叙述错误的是()。

答案:速度慢A、速度慢B、多元、异构C、数据规模大D、基于高度分析的新价值2【单选题】在《法华经》中,“那由他”描写的“大”的数量级是()。

答案:10^28A、10^7B、10^14C、10^28D、10^563【多选题】以下选项中,大数据涉及的领域中包括()。

答案:社交网络计算机艺术医疗数据A、社交网络B、医疗数据C、计算机艺术D、医疗数据4【多选题】大数据的应用包括()。

答案:推荐科学研究预测商业情报分析A、预测B、推荐C、商业情报分析D、科学研究5【判断题】目前,关于大数据已有公认的确定定义。

答案:×6【判断题】大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。

()答案:√1【单选题】大数据求解计算问题过程的第三步一般是()。

答案:算法设计与分析A、判断可计算否B、判断能行可计算否C、算法设计与分析D、用计算机语言实现算法2【多选题】在大数据求解计算问题中,判断是否为能行可计算的因素包括()。

答案:资源约束数据量时间约束A、数据量B、资源约束C、速度约束D、时间约束3【判断题】大数据求解计算问题过程的第一步是确定该问题是否可计算。

答案:√4【判断题】大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。

答案:√1【多选题】资源约束包括()。

答案:网络带宽外存CPU内存A、CPUB、网络带宽C、内存D、外存2【多选题】大数据算法可以不是()。

答案:精确算法串行算法内存算法A、云计算B、精确算法C、内存算法D、串行算法3【判断题】大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定约束结果的算法。

答案:×4【判断题】MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。

答案:√5【判断题】大数据算法是仅在电子计算机上运行的算法。

答案:×【单选题】众包算法是用来解决()。

高中信息技术人教中图版(2019)必修一第1章认识数据与大数据培优训练试题01含答案

高中信息技术人教中图版(2019)必修一第1章认识数据与大数据培优训练试题01含答案

第1章认识数据与大数据培优训练试题2020—2021学年人教中图版(2019)高中信息技术必修一一、选择题1.使用UltraEdit软件查看“AI时代已经到来!”的内码,部分界面如下图所示。

下列说法正确的是()A.图中文字所占字节数为15B.字符“!”的内码为“A1”C.图中既有十六进制内码,也有十进制内码D.“J”的内码为4A2.某学校高一年级开设了9门体育专项课程,每门课程招收学生30人。

用二进制数为每位学生编码,以下叙述正确的是( )A.用3位二进制数表示课程,4位二进制数表示学生B.用4位二进制数表示课程,5位二进制数表示学生C.用3位二进制数表示课程,5位二进制数表示学生D.用4位二进制数表示课程,4位二进制数表示学生3.下列关于汉字机内码和字型码的叙述,错误的是A.汉字机内码需要两个字节的存储空间B.汉字的机内码与对应的字型码存储空间相同C.汉字字形点阵越精细,其字型码需要的存储空间就越大D.汉字的字形点阵为12×12时,存储一个汉字需要的空间为18个字节4.在计算机中,数值其实是以补码的形式保存的。

一个正数的补码是其二进制本身,而一个负数的补码是其二进制按位取反后再加1,比如5是正数,因此它的八位二进制原码和补码都是00000101,按位取反后为:11111010,再加1变成:11111011,而它就是-5的补码。

了解了这一点后,我们根据8的八位二进制补码为00001000可知-8的两位十六进制补码为( )A.08H B.F7HC.F8H D.07H5.(选修)下列声音中属于数字化信息的是()。

A.广播电台播放的音乐B.录音磁带上的英文对话C.钢琴演奏的乐曲D.智能手机上的铃声6.在信息加工的下列四步环节中,首先应该做的是( )A.对资料进行判别、筛选B.分析分类排序后的资料C.确立信息加工目标D.根据目标修改再加工7.某城市运营的地铁线路共有7条,每条线路的站点不超过31个,为统一管理方便将对每个站点用“线路代码+ 站点代码”进行编号,如使用二进制数对线路和站点进行编码,则线路编码至少需要()位,站点编码至少需要()位。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

智慧健康医疗1、CAD在医疗健康领域的英文全称是()Computer Aided Diagnosis2、不属于AI健康医疗生态系统的是()制药生态3、不属于慢性疾病的是()艾滋病4、AI院前管理包括()预测和干预5、AI医疗健康技术体系的基础层不包括()芯片6、AI医疗健康发展的核心要素是()数据7、我国首次研发的AI医疗系统是面向()中医8、第3次AI浪潮的到来主要依赖于()深度学习9、目前AI医疗健康市场最成熟的是()辅助医疗影像诊断10、我国慢性疾病增加,与老龄化加剧的关系()强相关11、AI医疗健康的核心技术体系主要包括()传感器技术存储技术传输技术12、AI辅助诊断属于()院中管理13、婴幼儿时期的环境暴露不会影响个体后期的身体健康。

错误14、以下不属于大数据时代特征的是()数据处理速度迅速提升15、以下哪一项不是人工智能发展的必要条件()机器学习16、以下哪一项不属于健康医疗大数据来源()购物数据17、以下不属于机器学习研究范畴的是()专家系统18、以下属于人工智能在医疗领域应用的是()多选疾病预测辅助诊断药物个性化推荐19、以下对大数据描述正确的是()大数据本质在于数据的关联分析20、以下不属于弱人工智能特点的是()自适应能力21、人工智能技术发展出现几次低潮的原因包括()多选算法研究瓶颈计算能力瓶颈数据有限22、以下说法正确的是()人工智能就是深度学习23、以下说法正确的是()健康医疗领域数据存在孤岛现象24、以下说法正确的是()即使在大数据时代,统计分析仍然具有重要的作用25、以下关于人工智能、机器学习和深度学习说法正确的是()机器学习或深度学习是实现人工智能的一种方法大数据应用1、大数据起源于()互联网2、第一个提出大数据概念的公司是()麦肯锡3、)规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理。

大数据4、大数据的本质是()洞察价值5、大数据的最显著特征()数据规模大6、海军人员通过对前人航海日志的分析,绘制了新的航海路线图,标明大风与洋流可能发生的地点。

这一操作体现大数据思维中的()在分析方法上更注重相关分析而不是因果分析7、下列对大数据特点的说法中,错误的是()数据价值密度高8、当前社会中,最为突出的大数据环境是()互联网9、下列关于大数据中计算机存储容量单位的说法中,错误的是()容纳一个英文字符需要2个字节10、计算机存储容量单位换算中,错误的是()1TB=1024MB11、大数据时代,数据使用的关键是()数据再利用12、下列论据中,能够支撑“大数据无所不能”的观点是()“互联网+医疗”打破传通的观念和行为13、支撑大数据业务的基础是()数据应用14、下列关于数据生命周期管理的核心认识中,错误的是()数据生命周期管理最终关注的是社会效益15、当前大数据技术的基础是由()首先提出的谷歌16、大数据处理流程不包括()数据业务统计17、数据清洗清洗的方法不包括()重复数据记录处理18、数据仓库的最终目的是()为用户和业务部门提供决策支持19、当前大数据技术的基础不包括()关系型数据库20、云计算使用信息的存储是一个()的方式,它会大大地节约网络成本。

分布式21、大数据应用能够实现一场新的革命,提高综合管理水平的原因不包括()从精细化管理走向开放式管理22、医疗健康大数据的基本情况不包括以下哪项()公共安全数据23、医疗健康领域中大数据应用产业不包括()用户行为分析24、智能健康手环的应用开发,体现了()的数据采集技术应用传感器25、假设一种基因同时导致两件事:(1)使人喜欢酗酒,(2)使这个人和肝癌就是()关系,而酗酒和肝癌是()因果相关AI+医疗1、两像素位置分别为(x,y)和(s,t),则两像素间的欧氏距离是()2、下列哪个变换矩阵代表对像素坐标进行旋转变换()3、54、在机器学习领域中,按照数据有无标签分为监督学习和无监督学习,那么聚类任务属于()无标签的无监督学习5、医学影像是指为了医疗或医学研究,对人体或者人体某部分,以非侵入方式去的内部组织影响的技术与处理过程,其中CT是一种重要的影像诊断检查技术,下列哪项不是CT的优点()没有辐射量6、给定一个数据集,对于某一个待分类数据点,找出距离该点最近的K个样本,若它们当中大多数属于A类,则把该数据点也归类为A,这种方法称为K-means算法()错误7、两像素位置分别为(x,y)和(s,t),则两像素间的城区距离是()8、下列哪个变换矩阵代表对像素坐标进行旋转变换()9、在机器学习领域中,按照数据有无标签分为监督学习和非监督学习,那么分类、回归任务属于()有标签的监督学习10、如右图所示,有两类不同的样本数据,分别用小正方形和小三角形表示,现在,我们不知道中间那个圆形的数据是从属于哪一类(正方形或三角形),此时若采用KNN(K近邻)算法解决这个问题,当选取K=3时,圆形待分类点该被判定为();当选取K=5时,圆形待分类点该被判定为()三角形;正方形11、两像素位置分别为(x,y)和(s,t),则两像素间的棋盘距离是()C、12、下图是哪种像素邻域表示()8-邻域13、将下图所示的图像输入到2*2的均值pooling(池化)层(即,取模板内像素灰度值的平均值),stride(步长)为2,则输出值应为()14、操作中属于图像平滑处理的是()中值滤波15、下列机器学习常用算法中哪个是聚类算法而不属于分类算法(C)K-means16、下图是哪种像素邻域表示()8-邻域17、下列哪个变换矩阵代表对像素坐标进行平移变换()18、1119、在有标签数据集上,经常采用简单的线性回归、分类任务从数据中学习获取信息。

在回归任务中,Y变量(预测变量)为(),分类任务中Y变量(预测变量)为()连续型;离散型20、边缘检测的原理:模板(分别代表X和Y方向)在图像上移动并在每个位置计算对应中心像素的灰度值,一般来说,在某个目标(背景)内部计算出的灰度值(),在边缘位置时计算出的灰度值()较小;较大21、下图是哪种像素邻域表示()对角邻域22、下列哪项图像处理操作使用了灰度映射技术()以上都是23、将下图所示的图像输入到2*2的最大值pooling(池化)层(即,取模板内像素灰度值的最大值),stride(步长)为2,则输出值应为()A、C、24、下列算法中属于图像平滑处理的是()均值滤波25、在神经网络中,经常根据特定任务采用不同的激活函数,下图所示的是两个经常使用的激活函数,请分别指出两个函数图像分别是()sigmoid;relu信息检索1、所有检索策略都包含三个要素,以下选项中不属于三要素的一项是()排序函数2、在向量模型中,不可以通过()来衡量文档和查询之间的相似度。

向量间正切值3、T1、T2、T3表示特征项,D1、D2、D3、D4为文档向量,Q为查询向量,其中,D1=4T1+2T2+3T3,D2=T1+4T2+2T3,D3=5T1+2T3,D4= T2+3T3,Q=T1+0T2+2T3 。

以上文档中和Q最大可能相关的是()D14、以下选项中属于概率模型的优点的是()模型具有内在的相关反馈机制,将文档根据相关概率按递减顺序排列5、信息检索模型中,神经网络模型属于()向量模型6、以下关于网络爬虫的描述中,错误的一项是()爬虫程序会抓取所有网页,以保证搜索正确性7、在实际的搜索引擎系统中,通过存储()来存储文档信息文档编号差值8、下面方法中,不是建立索引的方法的是()HITS9、关于PageRank标准算法与简化算法正确的是()PageRank简化算法对G中的每一个节点n,设定其初始值均为1/n10、关于HITS算法描述正确的是(C)、HITS算法核心思想是对网页两个方面的权威程度进行评价,一个是内容权威度,另一个是链接权威度,两者具有相互增强的关系11、网页重定向属于下列哪种作弊方式(C)隐藏作弊12、对网页进行两次抓取,第一次是正常的搜索引擎爬虫抓取,第二次以模拟人工访问页面的方式抓取,如果两次抓取到的内容差异较大,则认为是作弊页面,这属于()识别页面隐藏13、以下不是搜索引擎的主要功能模块的一项是()PageRank14、以下选项中描述不正确的是()根据具体应用的不同,可以将爬虫分为两种类型,即增量型爬虫和垂直型爬虫15、以下选项中描述正确的是()机器学习的四个步骤中,文档特征抽取是指利用抽取算法抽取查询词TF/IDF信息、文档长度、网页PageRank值、网页入链/出链数量等16、以下关于推荐系统和搜索引擎的说法中,错误的是()推荐系统是由用户主导的17、下列关于推荐系统评测中在线实验的说法,错误的是()成本较低,容易部署18、为了覆盖用户的不同兴趣领域,我们需要提高推荐结果的()多样性19、下列各项中为工业界更关注的评测指标的是()点击率20、从商家角度看,推荐系统受欢迎的原因有()可以增加用户信任度和粘性,增加营收21、下列选项中是显性反馈数据的是()用户对某个视频的评分22、下列关于基于用户的协同过滤算法的说法中,错误的是()基于用户的协同过滤算法相对于基于物品的协同过滤算法来说更个性化,反映了用户自己的兴趣传承23、下列关于推荐算法的说法中,错误的是()使用基于内容的推荐算法进行个性化推荐时,由于非结构化特征难以利用,我们通常直接将其舍弃24、针对用户冷启动问题,下列选项中做法错误的是()利用用户手机中其它应用的日志文件分析用户的兴趣点25、下列选项中不是冷启动问题解决方案的是()推荐冷门物品给用户数据挖掘1、以下哪项不属于知识发现的过程?( ) 数据测试2、以下哪些不属于数据挖掘的内容?()递归分析3、以下哪个不是常见的属性类型?()高维属性4、以下哪个度量属于数据散度的描述?()标准差5、以下哪个度量不属于数据中心趋势度描述?(D )四分位数6、对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?( ) 数据预处理7、聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( ) SVM8、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?( ) 预测建模9、当不知道数据所带标签时. 可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( ) 聚类10、在构造决策树时,以下哪种不是选择属性的度量的方法?( ) 距离11、知识发现流程最核心的步骤是什么?( ) 数据挖掘12、将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( ) 数据预处理13、以下哪个度量属于数据中心性的描述?()均值14、类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?( ) KNN15、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( ) 关联规则发现16、以下哪些算法是分类算法?( ) C4.517、K-means算法的缺点不包括?( ) 可伸缩、高效18、机器学习中,下面哪些方法不可以避免分类中的过拟合问题?()增加模型复杂度19、下面那个不属于知识发现过程。

相关文档
最新文档