大数据应用竞赛复习题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据应用竞赛复习题
136、云是网络的一种比喻说法,传统架构图中用来表示电信网,后续扩展到表示互联网和底层基础设施。

用户通过()等方式接入云数据中心,按自己的需求进行数据处理。

*
A台式机(正确答案)
B笔记本(正确答案)
C手机(正确答案)
D服务器
137、在数据缺失严重时,会对分析结果造成较大的影响,因此剔除的异常值和缺失值,要采用合理的方法进行填补,常用的方法有()。

*
A平均值填充(正确答案)
B.K最近邻距离法(正确答案)
C回归法(正确答案)
D极大似然估计(正确答案)
E多重插补法(正确答案)
138、在数据资产质量管理中,同一责任人产生的同一数据项一年内出现两次以上质量问题需要进行问责,以下说法正确的是()。

*
A体现了数据资产质量管理遵循“谁产生、谁负责”的原则(正确答案)
B.对责任单位予以通报批评(正确答案)
C.按照公司员工奖惩规定第十二条追究相关人员责任(正确答案)
D.具体惩处按照公司员工违规违纪行为惩处细则第十三条执行(正确答案)
139、在网络爬虫的爬行策略中,应用最为基础的是() *
A深度优先遍历策略(正确答案)
B广度优先遍历策略(正确答案)
C高度优先遍历策略
D反向链接策略
E大站优先策略
140、在重大活动保电工作准备期间应超前谋划部署,加强对公司重要数据管控,加强漏洞隐患排查整改,妥善做好涉密数据传递及应用有关工作,综合运用()等手段,构建全方位、立体式监管与防护体系。

深 *
A人防(正确答案)
B物防(正确答案)
C技防(正确答案)
D监管(正确答案)
141、噪声数据的产生原因主要有()。

*
A数据采集设备有问题(正确答案)
B在数据录入过程中发生了人为或计算机错误(正确答案)
C数据传输过程中发生错误(正确答案)
D由于命名规则或数据代码不同而引起的不一致(正确答案)
142、正在推动能源行业变革的技术有哪些? *
A.电网运行技术(正确答案)
B.互联网技术
C.用户侧技术(正确答案)
D.信息技术(正确答案)
E.能源技术(正确答案)
143、中国大数据产业特征包括()。

*
A大数据整体解决方案成熟
B区域产业集聚现雏形(正确答案)
C大数据基础研究受到重视(正确答案)
D互联网企业表现强势(正确答案)
144、中国能源转型的必然趋势是()和()的深度融合? *
A.智能革命
B.信息革命
C.互联网革命
D.能源革命(正确答案)
E.数字革命(正确答案)
145、主流的协同推荐算法包括()。

*
A基于用户的协同推荐(正确答案)
B基于商品的协同推荐(正确答案)
C基于关联规则的协同推荐
D基于知识推理的协同推荐
361、数字化企业是泛在电力物联网建设的基础和核心 [判断题] *
对(正确答案)

362、数字化企业是企业信息化建设的初级阶段。

[判断题] *

错(正确答案)
363、算法代表着用系统的方法描述解决问题的策略机制。

[判断题] *对(正确答案)

364、算法是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。

[判断题] *
对(正确答案)

365、随机森林是Bagging的一个扩展变体,在以决策树为基学习器构建Bagging 集成的基础上,进一步在决策树的训练过程中引入了随机属性选择。

[判断题] *对(正确答案)

366、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴。

[判断题] *
对(正确答案)

367、随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化的数据不会威胁到任何人的隐私。

[判断题] *

错(正确答案)
368、特征提取技术并不依赖于特定的领域。

[判断题] *
对(正确答案)

369、提升电网安全经济运行水平,重点应用云计算、移动互联、物联网、人工智能等新技术,试点建设输变电物联网和配电物联网 [判断题] *
对(正确答案)

370、提升客户服务水平,重点以客户为中心,融合交易、金融等需要,实现公司客户服务资源整合共享,试点建设客户服务业务中台。

[判断题] *
对(正确答案)

371、提升企业经营绩效,重点优化并应用统一数据模型,加强企业级主数据管理,推动业务流程在线闭环,实现跨专业信息贯通,提高业务数字化和线上化水平,增强精益化管理能力,支撑市场开拓和价值创造,提升企业经营绩效 [判断题] *
对(正确答案)

372、调控云的云中间件包含云消息总线、云服总线、Web中间件。

[判断题] *
对(正确答案)

373、调控云使用者可管理或控制任何底层的云计算基础设施。

[判断题] *

错(正确答案)
374、通常把分类错误的样本数量与分类正确样本数量的比例称为“错误率” [判断题] *

错(正确答案)
375、通过“三型两网”建设,国网公司将围绕电力生态体系构建,突破“供用电”管道局限,打造更加开放、高效的能源互联网生态圈。

[判断题] *
对(正确答案)

376、通过维度建模的过程,把公司数据标准的建立融入落地到数据仓库,可以充分利用大数据平台能力,满足企业级数据分析和应用需求。

[判断题] *
对(正确答案)

377、通过制定数据标准,统一数据定义,执行各专业各级数据标准代码,规范各专业间同质业务同类代码,逐项梳理并按业务关系确定数据关联关系,实现数据的衔接匹配,确保数据的统一性和贯通性。

[判断题] *
对(正确答案)

378、同步推进组织优化,根据泛在电力物联网建设和发展需要,借鉴“大数据”思维,动态优化各层级组织机构、职责范围和管理权限,打造柔性组织,推动前端融合 [判断题] *

错(正确答案)
379、统一终端和交互标准,研发边缘物联代理和智能业务终端,提升终端接入通信网覆盖广度和深度,建设企业级物联管理中心,深化“国网云”建设和应用,实现终端接入统一管理和能力开放共享,运用人工智能、边缘计算、区块链、5G等新技术,构建智慧物联体系。

[判断题] *
对(正确答案)

380、图片数据属于非结构化数据。

[判断题] *
对(正确答案)

381、推动多元化新兴产业发展,重点发挥公司“枢纽型”企业优势,聚集产业各方,构建多方参与、共商共建共赢的多元产业生态,推动形成各产业链的产业集群,推动公司相关产业快速发展,并积极营造良好的新业态新模式孵化环境。

[判断题] *
对(正确答案)

382、推动利益共享,通过打造能源生态圈,形成利益共同体,使得各成员企业能够实现不同分工下的规模经济,获得单个企业无法达到的最大收益。

[判断题] *对(正确答案)

383、推动资源共享,通过建立协调机制,实现资源的有效流动,满足需求方局部对资源的稀缺性,实现各个参与方的共赢 [判断题] *
对(正确答案)

384、网络安全和信息化是事关国家安全和国家发展、事关广大人民群众工作生活的重大战略问题。

[判断题] *
对(正确答案)

385、网络安全和信息化是事关国家安全和国家发展、事关广大人民群众工作生活的重大战略问题。

[判断题] *
对(正确答案)

386、网上电网应用构建,重点打造“规划、建设、运行”三态联动的“数字电网”,完成电网规划全业务线上作业试点建设,初步实现网上规划设计、计划投资、项目管理和统计分析等业务 [判断题] *

错(正确答案)
387、为贯彻落实用数据说话、用数据治理、用数据决策、用数据创新理念 [判断题] *

错(正确答案)
388、为了保证大数据的可用性,首先必须在数据的源头上把好质量关,做好从原始数据到高质量信息的预处理。

[判断题] *
对(正确答案)

389、围绕对内业务、对外业务、基层减负、基础支撑、技术攻关和安全防护六大领域,2019年国网公司共计开展57项泛在电力物联网建设任务。

[判断题] *

错(正确答案)
390、维度是指度量的环境,如用户电费缴费事件,用户是维度。

[判断题] *
对(正确答案)

391、维度属性隶属于一个维度,如地理维度里面的国家名称、国家ID、省份名称等都属于维度属性。

[判断题] *
对(正确答案)

392、未经公司批准禁止向系统外部单位(如互联网企业、外部技术支持单位等)提供公司的涉密数据和重要数据,禁止将企业相关业务系统部署于公网或托管于外单位。

[判断题] *
对(正确答案)

393、未经公司批准禁止在互联网企业平台(包括第三方云平台)存储公司重要数据。

[判断题] *
对(正确答案)

394、文本挖掘又称信息检索,是从大量文本数据中提取以前未知的、有用的、可理解的、可操作的知识的过程。

[判断题] *

错(正确答案)
395、我们必须以高度的政治站位推动“三型两网”建设,主动服务地方经济社会发展,搭建服务用户、设备商、政府部门等主体的若干平台,实现开放共建、合作共治、互利共赢。

[判断题] *
对(正确答案)

396、无法适应业务发展要求或应当废止的数据资产标准,可以保留一年再停用。

[判断题] *

错(正确答案)
397、无条件共享是指仅限本部门特定人员使用的数据,原则上不对其他人员提供。

[判断题] *

错(正确答案)
398、先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。

[判断题] *

错(正确答案)
399、现代(智慧)供应链体系构建,重点打造电工装备企业生产设备智能物联,建设智慧业务作业系统,推进 e 物资一体化移动应用,开展供应商和产品质量多维精准评价,实现全量库存资源统筹调配,试点建设“智能采购、数字物流、全面管控”智慧运营中心。

[判断题] *

错(正确答案)
400、线上产业链金融。

重点集成各类内外部数据资源,对接各类金融产品服务信息,通过金融科技赋能,创新业务场景、提高交易效率、深化数据运用、拓宽推广渠道、优化客户体验,实现供需的精准对接和价值的高效转换,打造全方位、一站式、个性化、具有电网特色的数字金融系统。

[判断题] *

错(正确答案)
401、线性回归和逻辑回归都可以用来构造神经网络。

[判断题] *
对(正确答案)

402、线性回归模型添加一个不重要的特征可能会造成 R-square 增加。

[判断题] *对(正确答案)

403、相比依赖于小数据和精确性的时代,大数据因为更强调数据的完整性和混杂性,帮助我们进一步接近事实的真相。

[判断题] *
对(正确答案)

404、相互关联的数据资产标准,应确保衔接和匹配。

数据资产标准存在冲突或衔接中断时,后序环节应遵循和适应前序环节的要求,变更相应数据资产标准。

[判断题] *
对(正确答案)

405、向量x=[1,2,3,4,-9,0]的L1范数是1。

[判断题] *

错(正确答案)
406、小数据的复杂算法比大数据的简单算法更有效。

[判断题] *

错(正确答案)
407、协同办公系统属于一级部署系统。

[判断题] *
对(正确答案)

408、协同推进智慧物联,统筹感知层、传输层和平台层关键技术攻关,协同输变电物联网、配电物联网等相关建设任务,联合打造全面感知、高效处理、应用灵活的企业级智慧物联体系 [判断题] *

错(正确答案)
409、协同推进智慧物联重点是统一终端功能设计、接入标准和交互规范,设计面向传感和支撑边缘聚合计算的设备级配用电统一信息模型 [判断题] *
对(正确答案)

410、新一代电力交易平台建设。

重点建成新一代电力交易平台(省间交易),实现统一门户上线,支持各类市场主体接入,支撑省间电力交易全业务在线运行。

[判断题] *
对(正确答案)

411、新一代调度自动化系统建设,重点开展“逻辑分布、物理统一”的新一代调度自动化系统试点建设,完成支撑平台、人机云终端、核心应用功能、核心场景等软件研发、功能测试,完成试点建设方案编制。

[判断题] *

错(正确答案)
412、信通公司是数据资产管理归口部门,负责数据资产的统一规范管理。

[判断题] *

错(正确答案)
413、信息化职能管理部门是数据资产管理相关信息化工作管理部门。

[判断题] *对(正确答案)

414、虚拟电厂运营。

重点研发商业化虚拟电厂应用技术与关键装备,构建虚拟电厂交易运营整体解决方案,开展商业化运作的虚拟电厂运营商示范项目建设,优化虚拟电厂运营业务,探索新的商业模式,建立并优化虚拟电厂参与电力市场、需求侧响应的规则方法。

[判断题] *
对(正确答案)

415、需加快泛在电力物联网建设,在现有基础上,从全息感知、泛在连接、开放共享、融合创新四个方面进行提升,支撑“三型两网、世界一流”战略目标 [判断题] *
对(正确答案)

416、序列数据没有时间戳。

[判断题] *
对(正确答案)

417、严格公司商业秘密数据和重要数据的安全备案和审批,实行总部、省级单位两级审批。

[判断题] *
对(正确答案)

418、严格外部人员访问应用程序,如确需访问,应对允许访问人员实行专人全程陪同或监督,并登记备案。

[判断题] *
对(正确答案)

419、严格遵循国家数据安全管理规定和公司经营范围内境内外个人信息数据保护要求,严格遵守公司保密工作有关规章制度,加强审核,确保数据脱敏,分层分专业实施对外数据提供 [判断题] *

错(正确答案)
420、沿负梯度下降的方向一定是最优的方向。

[判断题] *

错(正确答案)
421、研究制定数据安全应急响应预案,落实数据安全应急演练和事件响应机制。

[判断题] *
对(正确答案)

422、要充分整合数据资源,挖掘客户流量价值,打造电力信息服务平台,建设用能视图、客户画像、能效评估等商业化产品,满足政府、企业、居民等各类群体的差异化服务需求,全方位改善客户体验。

[判断题] *
对(正确答案)

423、要大力推进信息系统整合,深化“网上电网”统一平台建设,打造客户聚合、业务融通、开放共享的互联网服务平台,实现全业务线上办理、全天候“一站式”服务。

[判断题] *

错(正确答案)
424、要尽快完成数据标准在数据仓库中的实施落地,按照客户全渠道服务、项目全过程管理、设备全生命周期等完整业务链条,把各部门各管一段的数据贯通起来,变成实时循环的“活数据”。

[判断题] *
对(正确答案)

425、要真正树立互联网的思维,以用户为中心,把需求导向、应用驱动贯穿泛在电力物联网建设始终, [判断题] *
对(正确答案)

426、业务部门根据批复的对外提供数据方案,依托技术支撑队伍开展数据脱敏,实施数据应用开发部署,形成对外提供数据交付成果,完成交付并履行相关保密和经法手续。

[判断题] *
对(正确答案)

427、业务部门梳理本专业数据资产生成方式,结合业务需要和技术条件,按照数据自动采集范围、采集频度和精度要求,制定本专业数据自动采集需求,提交数据资产管理归口部门审核。

[判断题] *
对(正确答案)

428、业务部门提供数据后5个工作日内向数据资产管理部门报备对外提供数据情况,具体包括提供的具体内容、范围及相关协议 [判断题] *

错(正确答案)
429、业务过程,指企业的业务活动事件,如用户用电申请、计量、缴费都是业务过程。

[判断题] *
对(正确答案)

430、业务过程是一个可拆分的行为事件。

[判断题] *

错(正确答案)
431、业务数据是指源端业务产生的源头数据,识别和应用业务数据可解决数据多头录入、重复存储、不一致等问题。

[判断题] *

错(正确答案)
432、业务中台方面,以业务为导向,优先建设电网资源业务中台和客户服务业务中台. [判断题] *
对(正确答案)

433、一般的,一颗决策树包含一个根节点、若干个内部节点和若干个叶节点 [判断题] *
对(正确答案)

434、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。

因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。

[判断题] *
对(正确答案)

435、一个算法的优劣可以用空间复杂度与时间复杂度来衡量。

[判断题] *
对(正确答案)

436、一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证,这体现了大数据思维维度中的因果思维 [判断题] *

错(正确答案)
437、乙方参与工作的人员不得应用甲方指定以外的计算机、移动存储介质、多功能一体机、打印机、扫描仪、传真机和复印机等设备存储、处理、传递数据。

[判断题] *
对(正确答案)

438、乙方及其参与工作的人员不得在任何时候以泄露、告知、公布、发布、出版、传授、转让或其他任何方式将数据及中间库表、图表文档等过程资料提供给他人。

[判断题] *
对(正确答案)

439、以打通数据链条、提升数据开放共享能力为目标,以快速响应数据需求、支撑业务创新为引导,打造企业中台。

[判断题] *

错(正确答案)
440、以数据分析应用需求为导向,按需推动数据接入和整合贯通,沉淀共性数据服务能力,建设数据中台,健全数据管理体系,强化统一数据模型和企业级主数据应用,面向各专业、各基层单位和外部合作伙伴提供开放共享服务。

[判断题] *
对(正确答案)

441、隐马尔科夫模型是结构最简单的动态贝叶斯网 [判断题] *
对(正确答案)

442、营配贯通优化提升,重点优化营配统一数据模型,试点建设电网资源业务中台,建立营配基础数据维护责任制,推进数据核查治理,提升信息系统支撑能力。

[判断题] *
对(正确答案)

443、营销 2.0 建设,重点围绕客户聚合、互动智能、业务融通、数据共享、架构柔性、迭代敏捷等业务需求,以泛在电力物联网营销服务系统顶层设计成果为基础,进一步融合交易、产业、金融业务需求,依托“云上国网”中台建设,打造客户服务业务中台,支撑试点单位迭代升级和典型应用。

[判断题] *

错(正确答案)
444、应通过签订合同、保密协议、保密承诺书等方式,严格内外部合作单位和供应商的数据安全管控。

[判断题] *
对(正确答案)

445、用于分类的离散化方法之间的根本区别在于是否使用类信息。

[判断题] *
对(正确答案)

446、优化管理体系,实现管理模式从“条块化”向“集约化”转变,向各级组织和业务赋能 [判断题] *

错(正确答案)
447、优化内部管理,促进质效提升重点围绕营配贯通和多维精益管理体系变革两条主线 [判断题] *
对(正确答案)

448、优化营配贯通业务。

重点完善并应用电网统一数据模型,夯实数据同源维护机制,构建各专业共建共享的电网资源业务中台,沉淀形成共性服务能力 [判断题] *
对(正确答案)

449、有一些决策树学习算法可进行"增量学习",即在接收到新样本后可对已学得的模型进行调整,而不用完全重新学习 [判断题] *
对(正确答案)

450、原始业务数据来自多个数据库或数据仓库,它们的结构和规则可能是不同的,这将导致原始数据非常的杂乱、不可用,即使在同一个数据库中,也可能存在重复的和不完整的数据信息,为了使这些数据能够符合数据挖掘的要求,提高效率和得到清晰的结果,必须进行数据的预处理。

[判断题] *
对(正确答案)

451、源头数据是指是由于业务活动在系统直接生成,通过系统接口从其它业务系统传递过来的数据。

[判断题] *

错(正确答案)
452、源网荷储多元协调的泛在调度控制,重点通过大数据,提升集中式新能源场站和分布式电源、储能、电动汽车等新型能源和用能设备采集和感知能力,开展全局优化和协调控制,提升分布式电源柔性消纳、发电与负荷精准控制、源网荷储多元协调和新能源场站精益控制能力,实现泛在调度控制,促进清洁能源消纳,提升电网安全稳定运行水平。

[判断题] *

错(正确答案)
453、源网荷储协同服务,重点开展电动汽车和分布式新能源发展、居民家庭用能、社区多能服务、商业楼宇能效提升和工业企业园区节能降耗等服务,推动源网荷储与市场交易协同服务,推动各类用能设施高效便捷接入、状态全面感知、用能智慧互动,提高电网资产利用率、清洁能源消纳能力和全社会用能效率。

[判断题] *
对(正确答案)

454、在HMM中,如果已知观察序列和产生观察序列的状态序列,那么可以采用极大似然估计直接进行参数估计。

[判断题] *
对(正确答案)

455、在k-fold交叉验证中,相对于期望误差来说,选择较大的K会导致低偏差(因为训练folds会变得与整个数据集相似)。

[判断题] *
对(正确答案)

456、在s=<{1,2},{3,4}>和t=<{1},{2}>中,t不是s的子序列。

[判断题] *
对(正确答案)

457、在采购网络产品和服务时,要与提供者签订保密协议,并审批重要数据的采集过程。

[判断题] *
对(正确答案)

458、在机器学习中,对高维数据进行降维的主要目的是希望找到一个合适的低维空间,在此空间中进行学习能比原始空间性能更好。

[判断题] *
对(正确答案)

459、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式 [判断题] *
对(正确答案)

460、在现实机器学习任务中,获得数据之后通常先进行特征选择,然后再训练学习器。

特征选择是从给定的特征集合中选择出无关特征子集的过程。

[判断题] *对
错(正确答案)
461、在线性回归中,最小二乘法就是试图找到一条曲线,使所有样本到直线上的欧氏距离之和最小 [判断题] *

错(正确答案)
462、在训练神经网络时,损失函数在最初的几个epochs时没有下降,可能的原因是学习率太低。

[判断题] *
对(正确答案)

463、在训练完 SVM 之后,舍去所有非支持向量,只保留支持向量不会影响模型分类能力。

[判断题] *
对(正确答案)

464、针对历史存量数据,结合数据仓库建设逐步完成数据标准制定;针对新增和变更数据,组织业务、数据和技术人员持续开展常态数据标准维护。

[判断题] *对(正确答案)

465、正确率、召回率和 F 值取值都在0和1之间,数值越接近0,查准率或查全率就越高。

[判断题] *

错(正确答案)
466、支持向量机是针对二分类任务设计的,也可直接应用于多分类任务。

[判断题] *

错(正确答案)
467、主成分分析、线性判别分析和矩阵奇异值分解都可以用于特征降维。

[判断题] *
对(正确答案)
错。

相关文档
最新文档