《大数据》题目

合集下载

大数据时代题目及答案(三套试题仅供参考)

大数据时代题目及答案(三套试题仅供参考)

第一套试题1、目前大数据技术的基础是由(C)第一提出的。

(单项选择题,此题2 分)A:微软 B:百度 C:谷歌 D:阿里巴巴2、大数据的发源是( C)。

(单项选择题,此题 2 分)A:金融 B:电信 C:互联网 D:公共管理3、依据不一样的业务需求来成立数据模型,抽取最存心义的向量,决定选用哪一种方法的数据剖析角色人员是( C)。

(单项选择题,此题 2 分)A:数据管理人员B:数据剖析员C:研究科学家 D:软件开发工程师4、( D)反应数据的精美化程度,越细化的数据,价值越高。

(单项选择题,此题 2 分) A:规模 B:活性 C:关系度 D:颗粒度5、数据冲洗的方法不包含(D)。

(单项选择题,此题 2 分)A:缺失值办理 B:噪声数据消除C:一致性检查 D:重复数据记录办理6、智能健康手环的应用开发,表现了(D)的数据采集技术的应用。

(单项选择题,此题 2 分) A:统计报表 B:网络爬虫 C:API 接口 D:传感器7、以下对于数据重组的说法中,错误的选项是(A)。

(单项选择题,此题 2 分)A:数据重组是数据的从头生产和从头采集 B:数据重组能够使数据焕发新的光辉 C:数据重组实现的重点在于多源数据交融和数据集成 D:数据重组有益于实现新奇的数据模式创新 8、智慧城市的建立,不包含( C)。

(单项选择题,此题2分)A:数字城市 B:物联网 C:联网监控 D:云计算 9、大数据的最明显特色是(A)。

(单项选择题,此题 2 分)A:数据规模大 B:数据种类多样 C:数据办理速度快 D:数据价值密度高10、美国海军军官莫里经过对古人航海日记的剖析,绘制了新的航海路线图,1/13标了然狂风与洋流可能发生的地址。

这表现了大数据剖析理念中的( B)。

(单项选择题,此题 2 分)A:在数据基础上偏向于全体数据而不是抽样数据B:在剖析方法上更着重有关剖析而不是因果剖析C:在剖析成效上更追查效率而不是绝对精确D:在数据规模上重申相对数据而不是绝对数据11、以下对于舍恩伯格对大数据特色的说法中,错误的选项是( D)。

大数据应知应会试题及答案

大数据应知应会试题及答案

大数据应知应会试题及答案一、大数据(单选)1、题目:大数据是指不用随机分析法这样的捷径,而采用()的方法 [单选题] *A.所有数据(正确答案)B.绝大部分数据C.适量数据D.少量数据2、题目:大数据环境下的隐私担忧,主要表现为() [单选题] *A.个人信息的被识别与暴露(正确答案)B.用户画像的生成C.恶意广告的推送D.病毒入侵3、题目:大数据基于云计算进行数据的分析,那么云计算按照提供的服务类型进行分类,包括IaaS、PaaS、() [单选题] *A.XenB.SaaS(正确答案)C.KVMD.Docker4、题目:以下哪个不是海量大数据的常用处理工具() [单选题] *A.HadoopB.Excel(正确答案)C.SparkD.Hive5、题目:当前社会中,最为突出的大数据环境是() [单选题] *A.互联网(正确答案)B.物联网C.综合国力D.自然资源6、题目:根据电信客户的特征对客户进行打标分类主要用到()算法 [单选题] *A.分类B.聚类(正确答案)C.降维D.回归7、题目:以下哪一项属于非结构化数据() [单选题] *A.视频监控数据(正确答案)B.企业ERP数据C.财务系统数据D.日志数据8、题目:大数据的起源是() [单选题] *A.金融B.电信C.互联网(正确答案)D.公共管理9、题目:统计分组时,若某标志值刚好等于相邻两组上下限数值时() [单选题] *A.将此数值归入上限所在组B.将此数值归入下限所在组(正确答案)C.归入这两组中任意一组均可D.另立一组10、题目:有200家公司每位职工的工资资料,如果要调查这200家区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是()。

[单选题] *A.普查B.典型调查C.抽样调查D.重点调查(正确答案)11、题目:某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为() [单选题] *A.260B.215C.230(正确答案)D.18512、题目:当一组数据属于左偏分布时.则() [单选题] *A.平均数、中位数与众数是合而为一的B.众数在左边、平均数在右边C.众数的数值较小,平均数的数值较大D.众数在右边、平均数在左边(正确答案)13、题目:要通过移动平均法消除季节变动得到趋势值,则移动平均项数() [单选题] *A.应选择奇数B.应和季节周期长度一致(正确答案)C.应选择偶数D.可取4或1214、题目:不重复抽样平均误差()。

大数据时代题目及答案(三套试题仅供参考)

大数据时代题目及答案(三套试题仅供参考)

第一套试题1、当前大数据技术的基础是由(C)首先提出的。

(单选题,本题2分)A:微软 B:百度 C:谷歌 D:阿里巴巴2、大数据的起源是(C )。

(单选题,本题2分)A:金融 B:电信 C:互联网 D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。

(单选题,本题2分)A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。

(单选题,本题2分)A:规模 B:活性 C:关联度 D:颗粒度5、数据清洗的方法不包括( D)。

(单选题,本题2分)A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。

(单选题,本题2分)A:统计报表 B:网络爬虫 C:API接口 D:传感器7、下列关于数据重组的说法中,错误的是(A)。

(单选题,本题2分)A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含( C)。

(单选题,本题2分)A:数字城市 B:物联网 C:联网监控 D:云计算9、大数据的最显著特征是(A)。

(单选题,本题2分)A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B )。

(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。

大数据时代题目及答案(三套试题仅供参考)111

大数据时代题目及答案(三套试题仅供参考)111

第一套试题1、当前大数据技术的基础是由(C)首先提出的。

(单选题,本题2分)A:微软 B:百度 C:谷歌 D:阿里巴巴2、大数据的起源是(C )。

(单选题,本题2分)A:金融 B:电信 C:互联网 D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。

(单选题,本题2分)A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。

A:规模 B:活性 C:关联度 D:颗粒度5、数据清洗的方法不包括( D)。

(单选题,本题2分)A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。

A:统计报表 B:网络爬虫 C:API接口 D:传感器7、下列关于数据重组的说法中,错误的是(A)。

(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含( C)。

(单选题,本题2分)A:数字城市 B:物联网 C:联网监控 D:云计算9、大数据的最显著特征是(A)。

(单选题,本题2分)A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B )。

(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。

(单选题,本题2分)A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。

大数据面试题试卷

大数据面试题试卷

大数据面试题及答案汇总版第1部分选择题1.1 Hadoop选择题1.1.1 HDFS1.下面哪个程序负责 HDFS 数据存储?A.NameNodeB.JobtrackerC.DatanodeD.secondaryNameNodeE.tasktracker2. HDFS 中的 block 默认保存几份?A.3份B.2份C.1份D.4份3. 下列哪个程序通常与NameNode 在一个节点启动?A. SecondaryNameNodeB.DataNodeC.TaskTrackerD. Jobtracker4. HDFS 默认 Block Size(新版本)B.64MBC.128MBD.256MB5. Client 端上传文件的时候下列哪项正确A. 数据经过 NameNode 传递给 DataNodeB.Client 端将文件切分为 Block,依次上传C.Client 只上传数据到一台 DataNode,然后由 NameNode 负责 Block 复制工作6. 下面与 HDFS 类似的框架是?A.NTFSB.FAT32C.GFSD.EXT37. 的8. 的1.1.2 集群管理1. 下列哪项通常是集群的最主要瓶颈A. CPUB.网络C.磁盘IO2. 关于SecondaryNameNode 哪项是正确的?A.它是 NameNode 的热备B.它对内存没有要求C.它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间D.SecondaryNameNode 应与 NameNode 部署到一个节点3. 下列哪项不可以作为集群的管理?A. Puppet B.Pdsh C.ClouderaManager D.Zookeeper4. 配置机架感知的下面哪项正确A. 如果一个机架出问题,不会影响数据读写B.写入数据的时候会写到不同机架的 DataNode 中C.MapReduce 会根据机架获取离自己比较近的网络数据5. 下列哪个是 Hadoop 运行的模式A. 单机版 B.伪分布式 C.分布式6. Cloudera 提供哪几种安装 CDH 的方法A. Cloudera manager B.Tarball C.Yum D.Rpm7.1.2 Hbase选择题1.2.1 Hbase基础1. HBase 来源于哪篇博文? CA TheGoogle File System BMapReduceCBigTableD Chubby2. 下面对 HBase 的描述是错误的? AA 不是开源的B 是面向列的C 是分布式的D 是一种 NoSQL 数据库3. HBase 依靠()存储底层数据 AA HDFSB HadoopC MemoryDMapReduce4. HBase 依赖()提供消息通信机制 A AZookeeperB ChubbyC RPCD Socket5. HBase 依赖()提供强大的计算能力 DAZookeeperB ChubbyC RPCDMapReduce6. MapReduce 与 HBase 的关系,哪些描述是正确的? B、CA 两者不可或缺,MapReduce 是 HBase 可以正常运行的保证B 两者不是强关联关系,没有 MapReduce,HBase 可以正常运行CMapReduce 可以直接访问 HBaseD 它们之间没有任何关系7. 下面哪些选项正确描述了HBase 的特性? A、B、C、DA 高可靠性B 高性能C 面向列D 可伸缩8. 下面哪些概念是 HBase 框架中使用的?A、CA HDFSB GridFSCZookeeperD EXT39. D1.2.2 Hbase核心1. LSM 含义是?AA 日志结构合并树B 二叉树C 平衡二叉树D 长平衡二叉树2. 下面对 LSM 结构描述正确的是? A、CA 顺序存储B 直接写硬盘C 需要将数据 Flush 到磁盘D 是一种搜索平衡树3. LSM 更能保证哪种操作的性能?BA 读B 写C 随机读D 合并4. LSM 的读操作和写操作是独立的?AA 是。

《大数据》答案

《大数据》答案

题目1Python的特点:()。

选择一项或多项:a. 简单高效b. Python是一种动态解释型的编程语言c. Python可以多平台运行d. 弱类型语言正确答案是:Python是一种动态解释型的编程语言, Python可以多平台运行, 简单高效, 弱类型语言题目2云计算、物联网、大数据、人工智能代表了人类IT技术的最新发展趋势。

选择一项:对错正确的答案是“对”。

题目3人类在科学研究上经过了实验科学、理论科学、计算科学()选择一项:a. 思维科学b. 模拟科学c. 数据密集型科学d. 想象科学正确答案是:数据密集型科学题目4大数据的特点有哪些()。

选择一项或多项:a. 价值密度b. 数据类型的多样化c. 时效性d. 海量化的数据正确答案是:海量化的数据, 数据类型的多样化, 时效性, 价值密度题目5随着Web2.0的兴起,()迅速增加。

选择一项:a. 非结构化数据b. 信息c. 结构化数据d. 数字正确答案是:非结构化数据题目6以下关于计算机视觉,描述错误的是:()。

选择一项:a. 计算机视觉是一门研究如何使机器“看”的科学b. 计算机视觉是一门综合性的学科c. 语音识别属于计算机视觉的典型应用d. 是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量的机器视觉正确答案是:语音识别属于计算机视觉的典型应用题目7计算机系统中的数据组织形式主要有两种,分别是:()。

选择一项或多项:a. 数据库b. 音频c. 视频d. 文件正确答案是:文件, 数据库题目8Python和Excel都可以用来处理大数据。

选择一项:对错正确的答案是“对”。

题目9字节是用于存储数据的计量单位,一个字节相当于八位长二进制数据。

选择一项:对错正确的答案是“对”。

题目10Python脚本文件的扩展名为()。

选择一项:a. pgb. pyc. pythond. pt正确答案是:py题目11音频是指存储声音内容的文件,包括MPEG-4、AVI等。

大数据题目及参考答案

大数据题目及参考答案

公需科目大数据培训考试考试时间:120分钟选择题中红色代表正确答案,判断题X为错,R为对。

1.根据涂子沛先生所讲,摩尔定律是在哪一年提出的?(单选题1分)A.1988年B.2004年C.1965年D.1989年2.2015年,贵阳市的呼叫服务产业达到()坐席。

(单选题1分)A.3万B.5万C.10万D.20万3.以下说法错误的是哪项?(单选题1分)A.大数据的思维方式遵循因果逻辑推理B.摩尔定律是戈登•摩尔提出的C.图灵测试是阿兰•图D.ENIAC于1946年诞生4.茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?(单选题1分)A.北大B.清华C.浙大D.复旦5.促进大数据发展部级联席会议在哪一年的4月13日召开了第一次会议?(单选题1分)A.2014年B.2015年C.2013年D.2016年6.根据涂子沛先生所讲,哪一年被称为大数据元年?(单选题1分)A.2012年B.2010年C.2008年D.2006年7.数据、信息与知识三者之间的变化趋势是(单选题1分)A.价值先增后减B.价值递减C.价值递增D.价值不变8.具体来说,摩尔定律就是每()个月,产品的性能将提高一倍。

(单选题1分)A.18B.16C.12D.69“.()大数据交易所”2015年4月14日正式运营,目前,交易所已有包括京东、华为、阿里巴巴等超过300家会员企业,交易总金额突破6000万元。

(单选题1分)A.毕节B.安顺C.贵阳D.遵义10.()说明如果联网越多,从介入方式、技术上越来越突破,则网络规模越大、成本越低,网络的成本可能会趋向于零。

(单选题1分)A.吉尔德定律B.摩尔定律C.梅特卡尔夫定律D.新摩尔定律11.以下说法错误的是哪项?(单选题1分)A.大数据会带来机器智能B.大数据不仅仅是讲数据的体量大C.大数据的英文名称是large dataD.大数据是一种思维方式12.美国首个联邦首席信息官是下列哪位总统任命的?(单选题1分)A.克林顿B.奥巴马C.小布什D.老布什13.截至2015年年底,全国电话用户总数达到()。

大数据本科毕业设计题目大全

大数据本科毕业设计题目大全

大数据本科毕业设计题目大全
1. 基于大数据分析的电商平台用户行为预测与个性化推荐系统设计
2. 基于大数据的金融风险预测与控制系统设计
3. 基于大数据的医疗数据挖掘与健康管理系统设计
4. 基于大数据分析的社交媒体用户情感分析与舆情监测系统设计
5. 基于大数据的交通拥堵预测与优化系统设计
6. 基于大数据分析的旅游行业市场需求预测与智能推荐系统设计
7. 基于大数据的智能家居控制与能源管理系统设计
8. 基于大数据分析的电力供应与需求预测与调度系统设计
9. 基于大数据的智能农业监测与决策支持系统设计
10. 基于大数据分析的城市人口流动与社会经济发展预测系统设计。

大数据考试题目答案

大数据考试题目答案

∙ 1.根据周琦老师所讲,高德交通信息服务覆盖全国高速(A)以上。

(单选题1分)得分:1分o A.90%o B.60%o C.70%o D.50%∙ 2.2015年,贵阳市的呼叫服务产业达到(B)坐席。

(单选题1分)得分:1分o A.3万o B.10万o C.20万o D.5万∙ 3.美国首个联邦首席信息官是下列哪位总统任命的?B(单选题1分)得分:1分o A.小布什o B.奥巴马o C.克林顿o D.老布什∙ 4.社会成员或者用户之间社会成员之间共同参与信息的处理、信息的分享、信息的传播,这个活动就叫(B)。

(单选题1分)得分:1分o A.政府计算o B.社会计算o C.高强度计算o D.云计算∙ 5.数据、信息与知识三者之间的变化趋势是(B )。

(单选题1分)得分:0分o A.小课程o B.宏课程o C.大课程o D.微课程∙ 6.(B)时代,使得信息智慧解读时代到来。

(单选题1分)得分:1分o A.Web2.0o B.Web3.0o C.Web1.0o D.Web4.0∙7.根据涂子沛先生所讲,以下说法错误的是哪项?B(单选题1分)得分:0分o A.搜索就是计算o B.数据的内涵发生了改变o C.计算的内涵发生了改变o D.计算就是物理计算∙8.2015年“双11”:阿里平台每秒钟订单创建(B)笔。

(单选题1分)得分:1分o A.34万o B.14万o C.4万o D.24万∙9.Web2.0强调(C)。

(单选题1分)得分:1分o A.网站o B.机构o C.个人o D.单位∙10.人类利用信息的历史,经历了(D )次革命,媒介革命催生了数据大爆炸。

(单选题1分)得分:1分o A.六o B.四o C.三o D.五∙11.2014年,阿里平台完成农产品销售(D)元。

(单选题1分)得分:1分o A.283亿o B.383亿o C.183亿o D.483亿∙12.截至2012年,淘宝和天猫经营农产品类目的网店数为(B)。

【大数据经典题目】思考与练习答案

【大数据经典题目】思考与练习答案

大数据思考与练习一、单选题1.当前大数据技术的基础是由()首先提出的。

A.微软B.百度C.谷歌D.阿里巴巴2.大数据的起源是()。

A.金融B.电信C.互联网D.公共管理3.智能健康手环的应用开发,体现了()的数据采集技术的应用。

A.统计报表B.网络爬虫C.API接口D.传感器4.2012年,()政府发布了《大数据研究和发展倡议》,标志着大数据已经成为重要的时代特征。

A.中国B.美国C.日本D.英国5.大数据的最显著特征是()。

A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高6.下列关于大数据特点的说法中,错误的是()。

A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高7.当前社会中,最为突出的大数据环境是()。

A.互联网B.物联网C.综合国力D.自然资源8.医疗健康数据的基本情况不包括以下哪项?()A.诊疗数据B.个人健康管理数据C.健康档案数据D.公共安全数据8.下列关于计算机存储容量单位的说法中,错误的是()。

A.1KB<1MB<1GBB.基本单位是字节(Byte)C.一个汉字需要一个字节的存储空间D.一个字节能够容纳一个英文字符9.在数据生命周期管理实践中,()是执行方法。

A.数据存储和备份规范B.数据管理和维护C.数据价值发觉和利用D.数据应用开发和管理10.大数据时代,数据使用的关键是()。

A.数据收集B.数据存储C.数据分析D.数据再利用11.大数据的本质是()A.联系B.挖掘C.洞察D.搜集12.规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是()。

A.大数据B.贫数据C.富数据D.繁数据13.信息技术的发展非常快,表现在()。

A.集成电路的规模每18到24个月翻一倍B.信息的存储能力每9个月翻一番C.信息的存储能力每9个月翻一番D.光通讯的速率和容量每年翻一番14.与大数据密切相关的技术是()。

A.蓝牙B.云计算C.博弈论D.WiFi15.大数据应用需依托的新技术有()。

大大数据的考试试的题目及问题解释

大大数据的考试试的题目及问题解释

公需科目大数据培训考试1.以下选项中,不属于信息时代的定律的是( d)。

(单选题1分)得分:1分A.吉尔德定律B.摩尔定律C.麦特卡尔夫定律D.达律多定律2.根据周琦老师所讲,高德交通信息服务覆盖全国高速(b)以上。

(单选题1分)得分:1分A.60%B.90%C.70%D. 50%3.根据周琦老师所讲,以下哪项不属于数据挖掘的容?(单选题1分)分 a得分:0A.补充与完善路网属性B.多维分析统计用户出行规律C.高德地图导航有躲避拥堵功能D.建立道路拥堵概率与拥堵趋势变化模型4.2012年全国各城市支付宝人均支出排名中,位居第二位的是(a)(单选题1分)得分:1分A.市B.市C.高雄市D.嘉义市5.第一个提出大数据概念的公司是(d )。

(单选题1分)得分:1分A.微软公司B.谷歌公司C.脸谱公司D.麦肯锡公司6.“(b)阿里巴巴·年货节”销售额突破8.5亿元,促进了电子商务加快发展。

(单选题1分)得分:1分A.2015B.2016C.2013D.20147.关于大数据在社会综合治理中的作用,以下理解不正确的是(c )。

(单选题1分)得分:1分A.大数据的运用能够维护社会治安 oB.大数据的运用能够加强交通管理 oC.大数据的运用能够杜绝抗生素的滥用 oD.大数据的运用有利于走群众路线8.根据周琦老师所讲,大数据加速道路网络快速更新,高德(b)完成全国10万公里15万处更新。

(单选题1分)得分:1分A.2006年B.2014年C.2008年D.2010年9.第一个提出大数据概念的公司是d(单选题1分)得分:1分A.谷歌公司B.微软公司C.脸谱公司D.麦肯锡公司10.以下选项中,不属于大数据对人才能力的要c(单选题1分)得分:0分A.业务能力 oB.数学统计能力 oC.IT技术能力 oD.逻辑思维能力11.根据周琦老师所讲,高德交通报告针对全国(d)个城市交通状态进行挖掘分析。

(单选题1分)得分:1分A.30B.21C.25D.3812.以下选项中,不属于大数据对人才能力的要( c)(单选题1分)得分:1分A.业务能力B.数学统计能力C.逻辑思维能力D.IT技术能力13.Web2.0强调(c)。

大数据时代试题综合题库

大数据时代试题综合题库
21)智慧地球中 指( 36 ) B
A.新锐洞察B.智慧运作C. 动态架构D.绿色未来
22)根据(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8,而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有的数据量( 37 ),增长近( 38 )倍。
A. 10B.20C. 35D. 20
A.B.C.D.
30)大数据平台和应用程序框架,( 48 )以经济高效的方式分析级的结构化和非结构化信息B
A. 流计算B.C.数据仓库D.语境搜索
31)临床决策支持系统通过电子病历、医学指导的比较等提高手术质量,降低错误治疗和( 49 )。C
A.医疗事故B.病患投诉C.民事诉讼D. 手术费用
A.采取行动()B.获取洞察()
C. 掌握信息()D. 应用管理()
7)在云生态环境中,用户需求相当于(14 ),云数据中心相当于(15 ),云服务相当于(16 )。
A.降水B.水滴C. 水库D.阳光
8)尿布啤酒是大数据分析的(17 )C
A.测试B.分类C. 关联规则挖掘D.数据聚类
9)在的 & 中,中国在什么区域(18 )B
A.大数据网络发展和运营过程B.规划建设运营管理
C. 规律和验证D.发现和验证
26)大数据科学关注大数据网络发展和运营过程中( 43 )大数据的规律及其与自然和社会活动之间的关系。D
A.大数据网络发展和运营过程B.规划建设运营管理
Байду номын сангаасC. 规律和验证D.发现和验证
27)大数据的价值是通过数据共享、( 44 )后获取最大的数据价值D
A.全民健康计划B. 5亿C. 大数据研发计划D.2亿
24)大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并( 41 )成为帮助企业经营决策更积极目的的信息。B

大数据考试题库

大数据考试题库

大数据考试题库1.数据管理与处理题题目一:请列举三种常见的数据存储方式,并对它们进行比较和分析。

解析:数据存储方式是指将数据存储在不同的介质中以满足不同的需求和要求。

常见的数据存储方式包括关系型数据库、非关系型数据库和分布式文件系统。

1)关系型数据库:关系型数据库使用表格结构来组织和存储数据,具有严格的数据模式和数据约束。

它使用SQL语言进行数据操作和查询,能够提供复杂的数据关系和事务支持。

但是,关系型数据库在处理大规模数据时性能较差,并且扩展性有限。

2)非关系型数据库:非关系型数据库以键值对、文档、列族等形式存储数据,结构灵活且具备良好的可扩展性。

它可以处理非结构化和半结构化数据,适用于大规模和高并发的数据存储和访问。

但是,非关系型数据库对数据一致性和事务支持较差。

3)分布式文件系统:分布式文件系统将大量数据分散存储在多个节点上,实现数据的分布式管理和处理。

它具有良好的可扩展性和容错性,支持高并发和大规模数据处理。

但是,分布式文件系统在数据一致性和事务管理方面存在一定的挑战。

综上所述,不同的数据存储方式适用于不同的场景和需求。

关系型数据库适合处理事务性和结构化数据;非关系型数据库适合处理非结构化和大规模数据;分布式文件系统适合处理分布式和并行计算。

题目二:大数据处理常常需要进行数据清洗操作,请介绍至少三种常见的数据清洗技术,并说明其应用场景和优缺点。

解析:数据清洗是指对原始数据进行处理和过滤,去除错误、冗余或不完整的数据,以提高数据质量和可用性。

常见的数据清洗技术包括数据去重、数据格式化、数据填充。

1)数据去重:数据去重是对数据进行重复项的识别和删除。

它可以帮助保证数据的一致性和准确性,避免重复计算和冗余存储。

数据去重常用于数据清洗、数据集成和数据仓库等场景。

但是,数据去重技术对数据量较大时性能较差。

2)数据格式化:数据格式化是将数据转化为统一的格式,以方便后续的处理和分析。

格式化可以包括数据类型转换、日期格式化等操作。

大数据题目多项选择

大数据题目多项选择

21.农业部发布的《关于推进农业农村大数据发展的实施意见》提出,到 2020 年 底前,实现农业农村历史资料的数据化、 (BCD) 。

(多选题 3 分)o o o o得分:0 分A.数据分发的定期化 B.数据共享的便捷化 C.数据使用的智能化 D.数据采集的自动化 得分:22.基于信息数据的管理和服务创新主要表现在(ABCD ) 。

(多选题 3 分) 3分o o o o A.认知方式的变化 B.高强度的计算 C.个性化的管理服务 D.数据驱动的创新 得分:3 分23.大数据处理流程可以概括为以下哪几步?ABCD (多选题 3 分)o o o oA.统计和分析 B.挖掘 C.导入和预处理 D.采集 得分:0 分 ABCD24.信息技术的发展非常快,表现在() 。

(多选题 3 分)o o o oA.信息的存储能力每 9 个月翻一番 B.光通讯的速率和容量每年翻一番 C.集成电路的规模每 18 到 24 个月翻一倍 D.信息的存储能力每 9 个月翻一番 得分:25.根据吴军博士所讲,在保护个人隐私方面有哪些方法?(多选题 3 分) 3 分 BCDo oA.文化的方法 B.法律的方法o o C.技术的方法 D.双向监督的方法 得分:26.贵州发展大数据的顶层设计要坚持(ABCD )的理念。

(多选题 3 分) 3分o o o o A.安全是保障 B.数据是资源 C.应用是核心 D.产业是目的 得分:27.美国大的猎头公司储备人才考虑的因素包括(ABCD ) 。

(多选题 3 分) 3分o o o o A.价值观 B.经历 C.智商 D.情商 得分:0 分 ABCD28.关于大数据的内涵,以下理解正确的是(多选题 3 分)o o o oA.大数据就是很大的数据 B.大数据在不同领域,又有不同的状况 C.大数据里面蕴藏着大知识、大智慧、大价值和大发展 D.大数据还是一种思维方式和新的管理、治理路径 得29.根据涂子沛先生所讲,有哪些因素推动了大数据的出现?(多选题 3 分) 分:0 分 ABCDo o o o A.社交媒体 B.数据挖掘 C.普适计算 D.摩尔定律 得分:0 分 ACD30.信息社会经历的发展阶段包括( ) 。

大数据专业毕业设计题目大全

大数据专业毕业设计题目大全

大数据专业毕业设计题目大全1. 题目一:基于大数据的航空公司客户价值分析系统设计与实现1.1 题目描述本课题旨在通过运用大数据技术,设计和实现一个航空公司客户价值分析系统。

通过对航空公司海量的客户数据进行挖掘和分析,帮助航空公司了解客户的价值,并制定相应的营销策略。

1.2 研究内容•收集并整理航空公司的客户数据•运用大数据分析技术,挖掘客户特征和行为模式•建立客户价值评估模型,量化客户的价值•设计和实现一个可视化的客户价值分析系统1.3 预期成果•完整的航空公司客户数据集•客户特征和行为模式的分析报告•客户价值评估模型•可视化的客户价值分析系统原型2. 题目二:基于大数据的交通拥堵预测与优化调度研究2.1 题目描述本课题旨在通过运用大数据技术,研究交通拥堵预测与优化调度问题。

通过对交通数据的分析和建模,预测拥堵情况,并提出优化的调度方案,以减少交通拥堵,提高交通效率。

2.2 研究内容•收集并整理城市交通数据•运用大数据分析技术,建立交通拥堵预测模型•提出基于预测结果的交通优化调度方案•通过仿真实验验证方案的有效性2.3 预期成果•完整的城市交通数据集•交通拥堵预测模型及其评估报告•优化调度方案及其仿真实验结果3. 题目三:基于大数据的电商用户行为分析与个性化推荐系统设计3.1 题目描述本课题旨在通过运用大数据技术,研究电商用户行为分析与个性化推荐问题。

通过对电商平台海量的用户行为数据进行挖掘和分析,设计和实现一个个性化推荐系统,提升用户体验和销售额。

3.2 研究内容•收集并整理电商平台的用户行为数据•运用大数据分析技术,挖掘用户购买行为和兴趣偏好•建立用户画像和推荐模型,实现个性化推荐•设计和实现一个电商个性化推荐系统3.3 预期成果•完整的电商用户行为数据集•用户购买行为和兴趣偏好分析报告•用户画像和推荐模型•个性化推荐系统原型4. 题目四:基于大数据的金融风控模型研究与应用4.1 题目描述本课题旨在通过运用大数据技术,研究金融风控模型并应用于实际场景。

《大数据》题目

《大数据》题目

《大数据》题目1:简介1.1 背景和概述1.2 目的和目标2:大数据概述2.1 定义和特点2.2 大数据生态系统2.3 大数据应用领域3:大数据技术架构3.1 批处理和实时处理3.2 数据存储和管理3.3 数据处理和分析3.4 数据可视化和报告4:大数据处理框架4.1 Apache Hadoop4.2 Apache Spark4.3 Apache Kafka4.4 Apache HBase4.5 其他大数据处理框架5:大数据采集与存储5.1 数据采集和获取5.2 数据清洗和预处理5.3 数据存储和管理5.4 数据安全和隐私保护6:数据处理和分析6.1 数据挖掘和机器学习6.2 文本分析和自然语言处理 6.3 图像和视频处理6.4 数据可视化和交互分析7:大数据应用案例7.1 金融行业7.2 零售行业7.3 健康医疗行业7.4 交通运输行业7.5 其他行业应用8:大数据挑战与发展趋势8.1 数据隐私和安全8.2 数据质量和一致性8.3 数据治理和合规性8.4 人才培养和技术突破9:附件:(所涉及的附件及简要说明)法律名词及注释:1:数据隐私:个人信息保护的法律意义,指个人信息的收集、使用、存储和传输应受到合法、正当和必要的限制。

2:数据治理:对数据全生命周期的管理,包括数据的收集、存储、加工、分析、传输和销毁等环节。

3:数据质量:数据的准确性、完整性、一致性和可靠性,是数据可信度和决策支持的基础。

4:数据合规性:数据使用、处理和传输的合法性,符合法律法规和相关政策要求。

(文档结束)附件:1:大数据应用案例报告2:数据隐私保护政策范本3:大数据处理框架比较报告法律名词及说明:1:数据隐私:个人信息保护的法律意义,指个人信息的收集、使用、存储和传输应受到合法、正当和必要的限制。

2:数据治理:对数据全生命周期的管理,包括数据的收集、存储、加工、分析、传输和销毁等环节。

3:数据质量:数据的准确性、完整性、一致性和可靠性,是数据可信度和决策支持的基础。

大数据面试题试卷

大数据面试题试卷

大数据面试题及答案汇总版第1部分选择题1.1 Hadoop选择题1.1.1 HDFS1.下面哪个程序负责 HDFS 数据存储?A.NameNodeB.JobtrackerC.DatanodeD.secondaryNameNodeE.tasktracker2. HDFS 中的 block 默认保存几份?A.3份B.2份C.1份D.4份3. 下列哪个程序通常与NameNode 在一个节点启动?A. SecondaryNameNodeB.DataNodeC.TaskTrackerD. Jobtracker4. HDFS 默认 Block Size(新版本)A. 32MBB.64MBC.128MBD.256MB5. Client 端上传文件的时候下列哪项正确A. 数据经过 NameNode 传递给 DataNodeB.Client 端将文件切分为 Block,依次上传C.Client 只上传数据到一台 DataNode,然后由 NameNode 负责 Block 复制工作6. 下面与 HDFS 类似的框架是?A.NTFSB.FAT32C.GFSD.EXT37. 的8. 的1.1.2 集群管理1. 下列哪项通常是集群的最主要瓶颈A. CPUB.网络C.磁盘IOD.存2. 关于SecondaryNameNode 哪项是正确的?A.它是 NameNode 的热备B.它对存没有要求C.它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间D.SecondaryNameNode 应与 NameNode 部署到一个节点3. 下列哪项不可以作为集群的管理?A. Puppet B.Pdsh C.ClouderaManager D.Zookeeper4. 配置机架感知的下面哪项正确A. 如果一个机架出问题,不会影响数据读写B.写入数据的时候会写到不同机架的 DataNode 中C.MapReduce 会根据机架获取离自己比较近的网络数据5. 下列哪个是 Hadoop 运行的模式A. 单机版 B.伪分布式 C.分布式6. Cloudera 提供哪几种安装 CDH 的方法A. Cloudera manager B.Tarball C.Yum D.Rpm7.1.2 Hbase选择题1.2.1 Hbase基础1. HBase 来源于哪篇博文? CA TheGoogle File System BMapReduceCBigTableD Chubby2. 下面对 HBase 的描述是错误的? AA 不是开源的B 是面向列的C 是分布式的D 是一种 NoSQL 数据库3. HBase 依靠()存储底层数据 AA HDFSB HadoopC MemoryDMapReduce4. HBase 依赖()提供消息通信机制 A AZookeeperB ChubbyC RPCD Socket5. HBase 依赖()提供强大的计算能力 DAZookeeperB ChubbyC RPCDMapReduce6. MapReduce 与 HBase 的关系,哪些描述是正确的? B、CA 两者不可或缺,MapReduce 是 HBase 可以正常运行的保证B 两者不是强关联关系,没有 MapReduce,HBase 可以正常运行CMapReduce 可以直接访问 HBaseD 它们之间没有任何关系7. 下面哪些选项正确描述了HBase 的特性? A、B、C、DA 高可靠性B 高性能C 面向列D 可伸缩8. 下面哪些概念是 HBase 框架中使用的?A、CA HDFSB GridFSCZookeeperD EXT39. D1.2.2 Hbase核心1. LSM 含义是?AA 日志结构合并树B 二叉树C 平衡二叉树D 长平衡二叉树2. 下面对 LSM 结构描述正确的是? A、CA 顺序存储B 直接写硬盘C 需要将数据 Flush 到磁盘D 是一种搜索平衡树3. LSM 更能保证哪种操作的性能?BA 读B 写C 随机读D 合并4. LSM 的读操作和写操作是独立的?AA 是。

大数据理论题目多选题

大数据理论题目多选题

大数据理论题目多选题日期: [填空题] *1. 审计工作流平台包括() *A.Microsoft Office 系列软件(正确答案)B.专业审计软件(正确答案)C.数据库软件(正确答案)D.数据统计分析软件(正确答案)1. 用户对数据库表的操作权限有哪些() *A. SELECT:对表或试图执行查询语句的权限(正确答案)B. INSERT:对表或试图执行插入语句的权限(正确答案)C. UPDATE:对表或试图执行更新语句的权限(正确答案)D. DELETE:对表或试图执行删除语句的权限(正确答案)1.在数据库系统中,有哪几种数据模型()。

*A.实体联系模型B.关系模型(正确答案)C.网状模型(正确答案)D.层次模型(正确答案)2.关系型数据库的事务和现实世界中的交易很类似,它有如下()原则,简称ACID原则。

*A.原子性(正确答案)B.一致性(正确答案)C.隔离性(正确答案)D.持久性(正确答案)2.数据标准化包括() *A.最小最大标准化(正确答案)B.绝对值最小最大标准化(正确答案)C.零均值标准化(正确答案)D.Log函数标准化(正确答案)3.专业审计软件有() *A.ACL(正确答案)B.IDEA(正确答案)C.Microsoft OfficeD.Qlik View4.属于数值函数的函数为() *A.ArrayputB.Constant(正确答案)C.Pi(正确答案)D.Random(正确答案)4. 常见的数据源类工作流节点有哪些() *A. 关系数据库(正确答案)B. MongoDB(正确答案)C. 转换D.系统Hive(正确答案)5. 缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。

对于缺失值的处理方法包括()。

*A. 复制元B.删除元组(正确答案)C.缺值补齐(正确答案)D.不处理(正确答案)6. 数据分析及展示软件() *A.Tableau(正确答案)B.Qlik View(正确答案)C.ACLD.IDE7.事务是特性包括()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《大数据》题目一、单选题1)大数据的4V特点:Volume、Velocity、Variety、Veracity,其中他们的含义分别是( 1 )、( 2 )、( 3 )、( 4 )。

A.价值密度低B.处理速度快C.数据类型繁多D.数据体量巨大2)大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行( 5 )。

A. 数据信息B. 专业化处理C.速度处理D. 内容处理3)随着谷歌( 6 )和( 7 )的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的( 8 )。

6: A.Map B.Docs C. YouTube D. MapReduce7: A. Google Mobile B. iGoogle C. GoogleFile System D. Google Docs8: A.质量 B. 速度 C.精度 D. 进度4)斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的2.5米口径望远镜进行的红移巡天项目,2012年4月发布的关于Quasar spectra的数据为( 9 )。

A.932,891,133B. 228,468C. 1,457,002D. 668,0545)下列哪一项不属于大数据的治理:( 10 )A. 安全问题B. 成本问题C. 针对大用户D. 信息生命周期管理6)IBM的大数据战略以其在2012年5月发布智慧分析洞察“3A5步”动态路线图作为基础,指的是在( 11 )的基础上( 12 )、,进而( 13 ),优化决策策划能够救业务绩效。

A. 采取行动(Act)B. 获取洞察(Anticipate)C. 掌握信息(Align)D. 应用管理(management)7)在云生态环境中,用户需求相当于( 14 ),云数据中心相当于( 15 ),云服务相当于( 16 )。

A. 降水B. 水滴C. 水库D. 阳光8)尿布啤酒是大数据分析的( 17 )A. A/B测试B. 分类C. 关联规则挖掘D. 数据聚类9)在GAPMINDER的Wealth & Health of Nations 中,中国在什么区域( 18 )A.黄色B.红色C.绿色D. 蓝色10)舆情研判,信息科学侧重( 19 ),社会和管理科学侧重突发群体事件管理中的群体心理行为及( 20 ),新闻传播学侧重对( 21 )。

A. 舆论的本体进行规律性的探索和研究B.舆论控制研究C. 互联网文本挖掘和分析技术11)物联网是在计算机的( 22 )基础上,利用( 23 )、( 24 )等技术,构造一个覆盖世界上万事万物的“Internet of Things”。

在这个网络中,物品(商品)能够彼此进行“交流”,而无需人的干预。

A. 有线数据通信B. 无线数据通信C. RFIDD. 互联网12)数据挖掘工作的四个阶段,数据挖掘占总时间的百分比%( 25 ),对于成功重要性的百分比%( 26 )A. 50B. 20C.80D. 6013)MapReduce的Map函数产生很多的( 27 )A. keyB. valueC. <key,value>D. Hash14)PageRank是一个函数,它对Web中的每个网页赋予一个实数值。

它的意图在于网页的PageRank越高,那么它就( 28 )。

A. 相关性越高B.越不重要C.相关性越低D. 越重要15)购物篮模型(market-basket model):用于描述两类对象之间的一种常见形式的( 29 )关系。

A.一对一B.一对多C. 多对多D. 多对一16)AdWords 是一种快速简单的购买广告服务的方式,这种广告服务的针对性强,无论您的预算是多少,它都按( 30 )。

A.每个广告计费B. 每次点击计费C.每显示一次计费D. 每浏览一次计费17)协同过滤分析用户兴趣,在用户群中找到指定用户的( 31 )用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度( 32 ),并将这些用户喜欢的项推荐给有相似兴趣的用户。

A. 相似B.相同C.推荐D. 预测18)2012年12月28日,全国人大三次会议通过的( 33 )A. 《互联网行业的自律公约》B.《治安管理处罚条例》C. 《关于加强网络信息保护的决定》D. 《信息安全保护条例》19)Google 收集的信息不包括( 34 )A. 日志信息B. 位置信息C.你的家庭成员D. Cookie 和匿名标识符20)大数据的取舍与( 35 )不相关。

A. 易于提取B.家庭信息C. 数字化D. 廉价的存储器21)IBM智慧地球中Smart Work指( 36 )A. 新锐洞察B. 智慧运作C. 动态架构D. 绿色未来22)根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB,而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有的数据量( 37 ),增长近( 38 )倍。

A. 10B. 20C. 35ZBD. 20ZB23)2012年3月29日奥巴马政府公布了( 39 )。

该计划的目标是改进现有人们从海量和复杂的数据中获取知识的能力,从而加速美国在科学与工程领域发明的步伐,增强国家安全,转变现有的教学和学习方式。

首批共有6个联邦部门宣布投资( 40 )美元,共同提高收集、储存、保留、管理、分析和共享海量数据所需核心技术的先进性,并形成合力;扩大大数据技术开发和应用所需人才的供给。

A.全民健康计划B. 5亿C. 大数据研发计划D. 2亿24)大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并( 41 )成为帮助企业经营决策更积极目的的信息。

A.收集B. 整理C.规划D.聚集25)大数据工程指大数据的( 42 )的系统工程。

A. 大数据网络发展和运营过程B. 规划建设运营管理C. 规律和验证D. 发现和验证26)大数据科学关注大数据网络发展和运营过程中( 43 )大数据的规律及其与自然和社会活动之间的关系。

A. 大数据网络发展和运营过程B. 规划建设运营管理C. 规律和验证D. 发现和验证27)大数据的价值是通过数据共享、( 44 )后获取最大的数据价值A.算法共享B.共享应用C. 数据交换D. 交叉复用28)社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的( 45 ),通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。

A.地址B.行为C.情绪D.来源29)IBM的“3A5步”除Align、Anticipate、Act外,还需要不断地( 46 )从每一次业务结果中获得反馈,改善基于信息的决策流程,从而实现( 47 )。

A. CreateB. TransformC. LearnD. Modify30)IBM大数据平台和应用程序框架,( 48 )以经济高效的方式分析PB级的结构化和非结构化信息A. 流计算B. HadoopC.数据仓库D.语境搜索31)临床决策支持系统通过电子病历、医学指导的比较等提高手术质量,降低错误治疗和( 49 )。

A.医疗事故B.病患投诉C. 民事诉讼D. 手术费用32)《数据新闻学手册》的作者们认为,通过数据的使用,记者工作的重点从“第一个报道者”转化成为对特定事件的影响的( 50 )。

A.拍摄者B.知情者C.记录者D. 阐释者33)通过( 51 )和展示数据背后的( 52 ),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。

A.数据收集B. 数据挖掘C.真相D. 关联与模式34)CRISP-DM 模型中Evaluation表示对建立的模型进行评估,重点具体考虑得出的结果是否符合( 53 )的商业目的。

A. 第二步B. 第三步C. 第一步D. 最后一步35)发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备;给定( 54 )和( 55 ),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则54:A. 最大兴趣度 B. 最小置信度 C. 最小支持度 D. 最大可信度55:A. 最小兴趣度 B. 最小置信度 C. 最大支持度 D. 最小可信度36)规则I->j,“有可能”,等于所有包含I的购物篮中同时包含J的购物篮的比例,为( 56 )。

A. 置信度B.可信度C. 兴趣度D. 支持度37)如果一个匹配中,任何一个节点都不同时是两条或多条边的端点,也称作( 57 )A. 极大匹配B.二分匹配C完美匹配 D.极小匹配38)国防部高级研究计划局(DARPA)的网络内部威胁(CINDER)计划,旨在开发新的方法来检测军事计算机网络与( 58 )。

作为一种揭露隐藏操作的手段,CINDER将适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检测的准确性、和速度。

A. 内部网络活动B. 网络间谍活动C. 网络威胁检测D. 网络漏洞检测39)只要具有适当的政策推动,大数据的使用将成为未来提高竞争力、生产力、创新能力以及( 59 )的关键要素。

A.提高消费B.提高GDPC.提高生活水平D. 创造消费者盈余40)个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助( 60 )为其顾客购物提供完全个性化的决策支持和信息服务。

A.公司B.各单位C.跨国企业D. 电子商务网站二、多选题41)大数据的治理包括( 1 )A. 容量问题B. 延迟问题C. 安全问题D. 成本问题42)Hadoop项目包括( 2 )A. Hadoop Distributed File System(HDFS)B. HadoopMapReduce编程模型C. HadoopStreamingD. Hadoop Common43)基于“3A5步”动态路线图,IBM提出了“大数据平台”架构。

该平台的核心能力包括( 3 )A. Hadoop系统B. 流计算(StreamComputing)C.数据仓库(Data Warehouse)D. 信息整合与治理(Information Integration andGovernance)44)大数据在医疗与健康的临床应用包括( 4 )A. 疗效比较研究方案CERB. 临床决策支持系统C. 远程患者监测系统D. 患者家庭情况分析45)《数据新闻学手册》为我们提供了一些简单的搜索建议。

现在的网络技术允许我们进行精准搜索,比如( 5 )A. 电子数据表B. 地理数据C. 数据库抽取D. PDF文件46)物联网, 2010年中国政府工作报告把物联网定义为通过信息传感设备,按照约定的协议,把任何物品与互联网连接起来,进行通信和信息交换,以实现智能化( 6 )A. 识别B. 定位C. 跟踪D. 监控和管理的一种网络47)数据挖掘的挖掘方法包括:( 7 )A. 聚类分析B. 回归分析C. 神经网络D. 决策树算法48)Web内容挖掘实现技术( 8 )。

相关文档
最新文档