探索大数据和人工智能复习题及答案
中国移动网络大学全员5G+通用知识《探索大数据与人工智能》题库答案
中国移动网络大学全员5G+通用知识《探索大数据与人工智能》题库答案一、单选题1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A. 数量越多处理时间越长B. 数量越多处理时间越短C. 数量越小处理时间越短D. 没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
大数据与人工智能试题及答案
大数据与人工智能试题及答案下列数据中不属于大数据的是() [单选题] *A.某同学网上高考报名的数据(正确答案)B.电商平台的用户浏览、交易时产生的数据C.全体手机用户的联网信息、实时定位数据D.各地交通摄像头记录的全部数据下列不属于大数据的特征是() [单选题] *A.数据规模大B.数据类型多样C.数据迅变性D.数据价值密度高(正确答案)答案:D监控不间断地录制视频产生了大量的视频数据,而有价值的数据仅有十几秒,这主要体现了大数据的( )特征。
[单选题] *A.价值密度低(正确答案)B.数据体量大C.数据变化速度快D.数据类型多对于大数据特征的描述,错误的是()。
[单选题] *A.价值性(价值密度低)B.海量的数据规模(巨量性)C.快速的数据变化(迅变性)D.单一的数据类型(单一性)(正确答案)大数据的特征有() [单选题] *①价值性②巨量性③迅变性④多样性A.①②③B.①②④C.①③④D.①②③④(正确答案)下列大数据服务中,没有应用电商大数据的是() [单选题] *A.农业灾害预警(正确答案)B.商品精准营销C.商品自动补货D.商品智能推荐以下说法正确的是() [单选题] *大数据技术可以优化社会管理模式②大数据技术创新可以提升服务质量③大数据技术可以开辟科学研究的新途径④通过时大数据的挖掘以及对分析结果的应用,可以给生活带来便利A.①②④.B.①②③C.②③④D.①②③④(正确答案)大数据在我们的生活中无处不在,下列说法正确的是() [单选题] *A.大数据带给我们的全部都是正面的影响B.大数据给我们的生活带来便捷的同时也会产生负面影响(正确答案)C.大数据可能会带来个人信息泄露,我们应该全盘否定D.大数据只会给我们带来信息伤害与诈骗答案:B电商网站收集客户的个人数据,通过分析,根据客户的喜好推荐不同的商品属于大数据的哪一种典型应用() [单选题] *A.医疗健康B.社区管理C.智慧城市D.生活服务(正确答案)人工智能的英文缩写是( ) [单选题] *A.ATC.ITD.AI(正确答案)人工智能的目的是让机器能够( ),以实现某些脑力劳动的机械化. [单选题] *A.完全代替人的大脑B.模拟、延伸和扩展人的智能(正确答案)C.完全代替人的工作D.具有像人一样的高级智能“ 测试”是测试机器智能的一种方法() [单选题] *A.冯•诺侬曼B.明斯基C.麦卡锡D.图灵(正确答案)进行身份认证的技术手段很多,下列属于生物特征识别认证方式的是() [单选题] *A. USB KeyU证B.账号加密码认证C.短信验证码认证D.指纹识别认证(正确答案)下列应用,没有体现人工智能技术的是() [单选题] *A.通过指纹识别打开智能门锁B.无人驾驶汽车实现自动驾驶C.使用Word “自动更正”功能(正确答案)D.停车收费系统扫描识别车牌生物特征识别技术是指通过个体生理特征或行为特征对个体身份进行识别认证的技术。
大数据与人工智能试卷 带答案
大数据与人工智能试卷带答案1、当前大数据技术的基础是由(C)首先提出的。
A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C )。
A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、数据清洗的方法不包括(D)。
A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理5、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。
A:统计报表B:网络爬虫C:API接口D:传感器6、智慧城市的构建,不包含(C)。
A:数字城市B:物联网C:联网监控D:云计算7、大数据的最显著特征是(A)。
A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高8、Mac OS系统的开发者是(C )。
(A:微软公司B:惠普公司C:苹果公司D:IBM公司9、大数据时代,数据使用的关键是(D)。
A:数据收集B:数据存储C:数据分析D:数据再利用10、基础设施即服务的英文简称是(A)A、IaaSB、PaaSC、SaaS二、填空题(本大题共10小题,每题2分,共20分)1、语⾳识别是指识别语⾳(说出的语⾳)并将其转换成对应⾳本的技术。
2、机器翻译(MT)是利⾳机器的⾳量⾳动将⾳种⾳然语⾳(源语⾳)的⾳本翻译成另⾳种语⾳(⾳标语⾳)。
3、机器⾳学(Robotics)研究的是机器⾳的设计、制造、运作和应⾳,以及控制它们的计算机系统、传感反馈和信息处理。
4、机器学习是从数据中⾳动分析获得模型,并利⾳模型对未知数据进⾳预测。
5、数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。
6、元数据被定义为:描述数据的数据,对数据及信息资源的描述性信息。
7、数据的存储是借助存储工具或者媒介,对数据进行永久性存储。
8、关系型数据库,是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,以便于用户理解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。
中国移动探索大数据与人工智能试题
中国移动探索大数据与人工智能试题嘿,伙计们!今天我们要聊聊一个非常热门的话题——大数据与人工智能。
你们知道吗?这两者可是当今科技界的两大宠儿,它们的力量可是无穷无尽哦!让我们一起来揭开它们神秘的面纱吧!让我们来聊聊大数据。
大数据,顾名思义,就是指那些量大、种类繁多的数据。
这些数据就像是一座座金矿,等待着我们去挖掘。
而人工智能,就像是一位聪明绝顶的矿工,它可以帮助我们从这些金矿中提炼出宝贵的财富。
大数据和人工智能究竟是如何相互配合的呢?其实,它们之间的关系就像是一对默契的搭档。
大数据就像是原材料,而人工智能则是加工这些原材料的工具。
在大数据的基础上,人工智能可以通过各种算法和模型,为我们提供各种各样的解决方案。
比如说,我们可以通过大数据分析出某个地区的人口密度、消费水平等信息,然后利用人工智能技术,为这个地区的商家提供更加精准的广告投放策略。
这样一来,商家就可以更加有效地吸引顾客,提高销售额了。
大数据和人工智能的结合并不仅仅局限于商业领域。
在医疗、教育、交通等各个方面,它们都有着广泛的应用前景。
比如说,在医疗领域,大数据可以帮助医生分析患者的病历、基因等信息,从而为患者提供更加个性化的治疗方案。
而人工智能则可以通过模拟人类的思维过程,帮助医生更快地做出判断。
这样一来,患者就可以得到更加精准的治疗,提高了治愈率。
不过,大数据和人工智能的发展也面临着一些挑战。
随着数据的不断积累,如何保证数据的安全和隐私成为了一个亟待解决的问题。
人工智能虽然可以帮助我们解决很多问题,但它毕竟还是一种工具,它的决策并不总是完全正确的。
因此,在使用人工智能的时候,我们还需要保持谨慎的态度。
大数据和人工智能作为当今科技领域的两大宠儿,它们的发展前景是非常广阔的。
只要我们善于利用它们的力量,相信未来一定会有更多的惊喜等待着我们。
今天的分享就到这里啦!希望大家能够从中受益匪浅,也期待大家在未来的日子里,能够见证大数据和人工智能带来的更多奇迹!再见啦!。
探索大数据与人工智能 试题答案整理
(一)大数据基础大数据特征有几种目前电信运营商大数据发展仍处在什么阶段不是大数据的一部分是数据真实性具备哪两种特质电信行业的企业运营管理中,经营分析和市场监测中,我们可以通过数据分析对业务和市场经营状况进行总结和分析,主要分为哪些种类EMC World是哪一年在拉斯维加斯著名的威尼斯人酒店开幕的随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商在改变商业模式,向着什么靠拢下列选项中正确说明价值密度低的是?语音识别产品体系有四部分,下列哪项不是体系之一?IBM的深蓝在1997年的决定胜负的第六个回合中,用了多少步BP神经网络的学习规则是?下列选项中,哪项是分布式文件存储系统mareduce计算模型适用于哪种任务?Spark的Client端,在本地写为spark程序后,通过spark submit命令提交到什么地方执行?美国软件公司Splunk是第一家上市的大数据处理公司,它是在哪一年上市的?以下不是大数据特征的是?电信行业的客户关系管理中,客户生命周期管理包括几个阶段?2014年4月,世界经济论坛以世界经济论坛以人工智能经过60多年的螺旋上升式发展,在移动互联网、大数据下列选项中,不是自然语言处理的解决IBM的深蓝在1991年的决定胜负的第六个回合中在智能投顾领域,人工智能可以结合投资者目前主流研究仍然集中于弱人工智能发展阶段因为我们SQL需要更轻量,更激进地获取资源语音识别常用的应用有四个下列选项中,人工智能的基础实现有?(二)人工智能下列选项中,不是人工智能的基础设施的是?卷积神经网络主要用于图像处理特征人工智能在医疗健康领域应用广泛,下列不是主要应用场景的是?目前主流研究仍然集中在弱人工智能发展阶段监督学习的回归方法包括(三)大数据技术介绍哪项是分布式文件存储系统?Mapreduce计算模型适用于哪种任务?RDD是由多个什么组成MapReduce本质上只是个简单模型,使用起来很是繁琐Hive是不适用于实时要求较高的应用场景正确描述Flume对数据源的支持的是?Spark是在哪一年开源的?Spark Streaming是什么软件栈中的流计算?HDFS在哪些场景中表现很差?通过地理位置信息可以分析除哪些信息?电信行业的企业运营管理中,经营分析和市场监测中,我们可以用过数据分析对业务人工智能在交通领域,有利的点是?人工智能可以做到的事情有下列选项中,哪项是可以用于数据采集的技术Spark适用于哪些场景今年,大数据分析将出现革命性的新方法,从前的很多算法物流行业,利用大数据优化了什么,从而达到提高了物流效率正确说明价值密度低的是?大数据应用领域成就瞩目的有?2010年12月,工信部发布的物联网十二五规划上人工智能经过60多年的螺旋上升式发展不是人工智能的算法中的学习方法的是人工智能的技术方向一共有三种自然语言处理产生的对话系统,对企业有哪些好处HDFS的备份机制,默认会生成几种备份?不是Flume的特点的是?MPP是由许多松耦合的处理单元组成的Kafak最主要有三个概念HDFS适用于哪些场景?不是用于数据存储的技术是哪一个大数据的数据来源于方方面面,下列不可以哪些不是电信行业的市场于精准营销包含的方向?电信行业的精准营销中,个性化推荐基于2010年12月,工信部发布的物联网十二五规划上,把信息处理技术作为1、MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系? OA. 数量越多处理时间越长B.数量越多处理时间越短OC. 数星越小处理时间越短0 D. 没什么关系2、下列选项中,不是kafka适合的应用场景是?()A.日志收集B.消息系统C.业务系统0 D. 流式处理美国软件公司Splunk是第一家上市的大数据处理公司以下不是非结构化数据的项是?下列选项中正确说明价值密度低的是大数据应用领域成就瞩目的有?电信行业的精准营销中人工智能经过60多年的螺旋上升式发展总体来说,人工智能发展的未来趋势是?阿尔法狗是第一个击败人类职位围棋选手人工智能按照发展层级划分可以分为哪几层?在智能投顾领域HDFS的Block块的默认大小是多大?哪像是分布式文件存储系统大数据生态中HBase是在Hadoop之上构建的开源分布式结构化数据存储系统HDFS在哪些场景中表现很差?1、大数据特征有几种(不包括IBM提出的新特征) ?OA.1O B.2O C.3D.42、目前电信运营商大数据发展仍处在什么阶段?A.探索O B.应用OC.成熟OD.扩展3.下列选项中,不是大数据的-部分的是?OA.海量计算:O B. 大量数据管理O C. 数据分析◎D. 单机计算1、数据真实性具备哪两种特质?V A. 准确性口B. 不确定性口C. 可信赖度口D. 杂乱性2.电信行业的企业运营:理中。
探索大数据和人工智能最全试题
探索大数据和人工智能最全试题1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A首席数据官B.首席科学家C.首席执行官D.首席架构师2、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A. ReduceB.HashC. CleanD. Loading3、在Spak的软件栈中,用于交互式查询的是A. SparkSQLB.MllibC.GraphXD. Spark Streaming4、在数据量一定的情况下, MapReduce是一个线性可扩展模型,请问服务器数量与处( )理时间是什么关系?A数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系5、下列选项中,不是kafka适合的应用场景是?A.日志收集B.消息系统C.业务系统D.流式处理6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是A.结构化数据B.非结构化数据C.半结构化数据D.全结构化数据7、下列选项中,不是人工智能的算法中的学习方法的是?A.重复学习B.深度学习C.迁移学习D.对抗学习8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A.机器性能B.语言歧义性C.知识依赖D.语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归10、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC.移娃D.大云11、HDFS中Namenodef的Metadata的作用是?A.描述数据的存储位置等属性B.存储数据C.调度数据D.12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么技术实现的?A大数据技术B.互联网技术C.游戏技术D.影像技术13、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B.开源C.独立D.封闭14、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D.视频15、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC.1TB=1000GBD. 1MB=1024KB16、下列选项中,不是Flume的特点的是?A.可靠性B.集中式架构C.可扩展性D.可管理性17、BP神经网络模型拓扑结构不包括A.输入层B.隐层C.翰出层D.显层18、以下哪个不是语音识别的范畴?A.语音听写B.语音台成C.语音转写D.语音唤醒19、以下哪个场景可以称为大数据场景?A.故宫游客人B.故宫门票收入C.美团APP的定位信息D.文章内容20、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯21、下列选项中,哪项是分布式文件存储系统?A.HDFSB. FlumeC. KafkaD. Zookeeper22、下列选项中,正确描述Flume对数据源的支持的是A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式23、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表24、下列选项中,不是人工智能的算法中的学习方法的是A.重复学习B.深度学习C.迁移学习D.对抗学习25、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解26、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论級别的突破。
探索大数据和人工智能题库
序号题型试题参考答案以下哪个属于大数据在电信行业的数据商业化方面的应用?1单选A. 精准广告AB. 网络管理C. 网络优化D. 客服中心优化IBM提出的大数据 5V特征包括()、更快(Velocity)、更多( Variety )、更值钱(Value)和更真实( Veracity )。
2单选A, 更有效BB.更大( Volume)C.更充分D.更直观下列选项中能够正确说明大数据价值密度低的是()?3单选 A. 100TB 数据中有 50TB有效数据BB.1TB 数据中有 1KB有效数据C.100PB数据中有 100PB有效数据电信行业的网络管理和优化包含了两部分的优化,这两项优化是下列选项中的哪两个?4多选A. 网络速度的优化BC B. 基础设施建设的优化C. 网络运营管理和优化D. 并发性的优化世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》,通过该报告,各国政府逐渐认识到大数据在哪些方面有5多选重大意义?ABCDA. 推动经济发展B. 改善公共服务C. 增进人民福祉中国移动自主研发、发布的首个人工智能平台叫做()6单选 A. 九天AB. OneNETC. 移娃自然语言处理难点目前有四大类,下列选项中不是其中之一的是?7单选A. 机器性能A B. 语言歧义性C. 知识依赖D. 语境Alpha Go 是第一个击败人类职业()选手的人工智能程序。
8单选A. 国际象棋BB. 围棋C. 中国象棋D. 五子棋人工智能目前在以下哪三个领域有了长足的发展?9多选 A. 健康ABDB. 教育C. 探索太空人工智能关键技术的基础设施中包含下面哪两项?10多选 A. 算法框架ABB. 基础硬件C. 人员下列选项中,不是 kafka 适合的应用场景是?A.日志收集11单选 B. 消息系统CC.业务系统D.流式处理下列选项中,不是 Flume的特点的是?A.可靠性12单选 B. 集中式架构BC.可扩展性D.可管理性MPP是指?A.大规模并行处理系统13单选 B. 受限的分布式计算模型AC.集群计算资源管理框架D.分布式计算编程框架下列选项中,哪两项是可以用于数据采集的技术?14多选 A. Flume ACB.HiveC.KafkaHBASE的应用场景有哪些?A.半结构化或非结构化数据15多选 B. 记录非常稀疏ABDC.结构化数据D.超大数据量mapreduce计算模型适用于哪种任务?A. 多线程处理16单选 B. 有关联的行处理CC. 批处理D. 实时数据变化处理以下不是大数据特征的是()?A. 数据体量大17单选 B. 数据种类多CC. 价值密度高D. 处理速度快最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂18单选商?AA. 谷歌B. 百度C. 360大数据的数据来源于方方面面,下列不可以作为数据源的是?19单选A. APP应用C B. 地理信息C. 一块石头D. 商店订单2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
人工智能复习题(含答案)
人工智能复习题(含答案)1、以下属于计算机视觉的经典模型的有:()。
A、VGGNetB、ResNetC、RNND、GoogleNet答案:ABD2、关于连接主义,描述正确的是()A、基础理论是神经网络B、深度学习属于连接主义C、又称为仿生学派D、产生在20实际50年代答案:ABCD3、在自然语言处理任务中,首先需要考虑字、词如何在计算机中表示。
通常,有两种表示方式:()表示和()表示A、on-hotB、one-hotC、分布式D、集中式答案:BC4、人工智能研究的主要因素有()。
A、计算能力B、算法C、数据D、天气答案:ABC5、决策树的生成是一个递归过程.在决策树基本算法中导致递归返回的情况包括()A、当前属性集为空,无法划分B、当前结点包含的样本全属于同一类别,无需划分C、所有样本在所有属性上取值相同,无法划分D、当前结点包含的样本集合为空,不能划分答案:ABCD6、下列关于词袋模型说法正确的是()。
A、词袋模型可以忽略每个词出现的顺序B、词袋模型不可以忽略每个词出现的顺序C、TensorFlow支持词袋模型D、词袋模型可以表出单词之间的前后关系答案:AC7、以下哪些网络结构具有反馈连接功能,即将前一层的输出和当前层自身作为输入()A、循环神经网络B、卷积神经网络C、LSTM网络D、多层感知机答案:AC8、下列关于极大似然估计(Maximum Likelihood Estimate,MLE),说法正确的是A、MLE可能并不存在B、MLE总是存在C、如果MLE存在,那么它的解可能不是唯一的D、如果MLE存在,那么它的解一定是唯一的答案:AC9、常用的损失函数有哪些()。
A、均方差B、Sigmoid交叉熵C、Sofmax交叉熵D、Sparse交叉熵答案:ABCD10、赋范线性空间满足()A、正定型B、不定性C、正齐次性D、次可加性答案:ACD11、关于卷积神经网络池化成层以下描述正确的是?A、经过池化的特征图像变小了B、池化操作采用扫描窗口实现C、池化层可以起到降维的作用D、常用的池化方法有最大池化和平均池化答案:ABCD12、下面哪项技巧可用于关键词归一化(keyword normalization),即把关键词转化为其基本形式?A、词形还原(Lemmtiztion)B、LevenshteinC、词干提取(Stemming)D、探测法(Sounex)答案:AC13、数据不平衡问题由于数据分布不平衡造成的,解决方法如下()A、对小样本加噪声采样B、对大样本进行下采样C、进行特殊的加权D、采用对不平衡数据集不敏感的算法答案:ABCD14、常见的聚类技术有()A、分层聚类B、K平均值聚类C、两步聚类D、Konhonennetwork答案:ABCD15、关于缺失值处理,说法正确的是()A、数据缺失是指在数据采集传输和处理过程中,由于某些原因导致的数据不完整的情况。
探索大数据和人工智能考试题
一、小测验部分1、大数据基础100#目前电信运营商大数据发展仍处在什么阶段?答:探索¥EMC world是哪一年在拉斯维加斯注明的威尼斯人酒店开幕的?答:2011#下列选项中正确说明价值密度低的是?答:1TB数据中有1kb的有效数据#电信行业的网络管理和优化包含了两个部分的优化,下列选项中不在这两项优化之内的是?答:网络速度的优化,并发性的优化;下列选项中,不是用于数据存储的技术是哪一个?以下哪个属于大数据在电信行业的客户关系管理方面的应用?不是大数据特征的是价值密度高大数据在电信行业应用世界经济论坛以IBM提出的大数据5V特征包括()、更快()、更多、更值钱和更真实在非电信领域,大数据可被应用到的以下哪些方面以下应用使用了你的地理位置信息的是2、概述100IBM的深蓝在1997年的人工智能经过60多年的螺旋上升下列选项中,不是自然语言处理的解决方法BP神经网络模型拓扑结构不包括中国移动自主研发、发布的首个人工智能平台叫做下列选项属于人工智能的基本概念有人工智能技术的基础设施不包括哪两部分属于“”人造智能“,具有意识,达到或超越人类智慧水平的人工智能称为在智能投顾领域,人工智能可以目前主流研究仍然集中于弱人工智能3、大数据技术介绍100数据采集的基本流程下列选项中,哪项是分布式文件MPP是由许多松耦合的处理单元组成的在数据清洗的过程中MapReduce本质上只是个简单模型以下不是非结构化数据的项是?答:数据库表数据下列选项中,不是大数据的一部分的是?答:单机计算世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》,通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义?答:ABCD以下哪两个属于大数据特征?答:数据体量大、数据种类多二、人工智能真题部分下列选项中,不是人工智能的基础设施的是?答:专用显卡IBM的深蓝在1997年的决定胜负的第六个回合中,用了多少步迫使卡斯帕罗夫投子认输答:22监督学习的回归方法包括答:线性回归、逻辑回归、多项式回归人工智能可以做到的事情有:答:ABCDmapreduce计算模型适用于电信行业的客户关系管理中,客服中心优化最初的大数据概念还比较模糊,搜索引擎方面最大的厂商以下哪个场景可以称为大数据场景随着闭源软件在数据分析领域的地盘不断缩小今年,大数据分析将出现革命性的新方法,大数据智能分析的核心技术下列选项中,不是kafka适合的应用场景Spark的Client端,本地写好程序spark submit命令提交整个reduce的过程大致分为在FS中存在namemode DataNode client 管理者文件储存者正确是客户端下列选项中,不是大数据的一部分人工智能是研究、开发用于模拟、延伸和拓展英文缩写识别BP神经网络模型生成式对抗网络核心是对抗式互相竞争生成样本BP神经网络的学习规则人工智能60多年螺旋上升式发展主要是基于什么的在智能投顾领域,人工智能投资者在人工智能发展历程中低谷期最主要的原因人工智能在民用安防领域个性化差异化的服务安全感大数据的处理需要经过几个流程采用了三层架构水平扩展分别是kafak最主要有三个概念麦肯锡全球研究数据集合这些方面分别是的备份机制生成几份备份人工智能在哪些领域应用广泛电信行业的网络管理和优化下列选项中2010年12月,工信部信息处理技术重要组成技术电信行业的企业运营管理中数据分析对业务和市场经营状态以下数据量不能说成大数据--- by 蔡旭#电信行业的客户关系管理中,客户生命周期包括几个阶段?答:5#当前世界生产的数据总量的单位是?答:ZBHDFS适用于大数据多样化三种数据结构下列选项中不是HBASERDD是由多个以下哪两个属于大数据麦肯锡IBM提出的更快更多更值钱大数据来源于方方面面数据源互联网行业大数据技术商品推荐广告投放2011年5月全球知名咨询公司生产因素HDFS适用于哪些场景?答:存储和管理PB级别数据、一次写入,多次读取数据清洗的过程中,总共可以归为三个阶段,它们分别是?答:数据质量检查、数据校对、数据标准化以下哪个大数据电信行业数据商业化大数据应用到的行业自然语言处理难点下列选项中FlumeHBASE 特点spark 软件栈图计算那么下列哪些技术适合流处理RDD 说法正确。
人工智能复习题汇总(附答案)
D.小贝喜欢可爱的东西;哈士奇可爱;所以小贝喜欢哈士奇。 9、以下哪一项没有发生冲突(D) A、一个已知事实可以与知识库中多个知识匹配成功 B、多个已知事实与知识库中的一个知识匹配成功 C、多个已知事实可以与知识库中多个知识匹配成功 D、已知事实不能与知识库中的任何知识匹配成功 10. 下列选项中那一种情况不是发生冲突(BC) A. 已知事实能与知识库中的任何知识匹配成功; B. 已知事实不能与知识库中的任何知识匹配成功; C. 已知事实恰好只与知识库中的一个知识匹配成功; D. 已知事实可以与知识库中的多个知识匹配成功;或者有多个(组) 已知事实都可与知识库中的一个知识匹配成功;或者有多个(组)已知事实可与知识库中的多个知识匹配成功。 1.人工智能中用“如果....则....”关联起来的知识称为(B) A. 产生式 B. 规则 C. 关系式 D. 模式 2.下列那一项不是知识的标识方法(C) A. 一阶谓词表示法 B. 状态空间法 C. 关系式表示法 D. 框架表示法 3.INSTANCE槽是用来建立(B)槽的逆关系。 A. ISA B. AKO C. SUBCLASS D. MEMBEROF 4.下图代表的关系是(B)
2、下列说法不正确的是(C) A、永真性:如果谓词公式P对个体域D上的任何一个解释都取得真值T,则称P在D上是永真的 B、可满足性:对于谓词公式P,如果至少存在一个解释使得公式P 在此解释下的真值为T,则称公式P是可满足的 C、永真性:如果谓词公式P在个体域D上,存在一个解释都取得真值T,则称P在D上是永真的 D、不可满足性:如果谓词公式P对于个体域D上的任何一个解释都取得真值F,则称P在D上是永久假的,如果P在每个非空个 体域上均永假,则称P永假 3、下列哪个符合著名的Bayes公式(A) A、P(Ai/B)=P(Ai)×P(B/Ai)/∑(P(Aj)×P(B/Aj)) B、P(Ai/B)=P(Ai)×P(Ai/B)/∑(P(Aj)×P(B/Aj)) C、P(Ai/B)=P(B)×P(B/Ai)/∑(P(Aj)×P(B/Aj)) D、P(Ai/B)=P(Ai)×P(B/Ai)/∑(P(Bj)×P(A/Bj)) 6、下列哪个不是框架表示法的特点(C) A、结构化深层知识表示 B、易附加过程信息 C、层次间相互独立 D、组织结构化 10、演绎推理的三段论式不包括(A) A、推理 B、结论 C、大前提 D、小前提 2、智力具有 B 、记忆与思维能力、学习及自适应能力、行为能力。 A自我提高能力B感知能力 C改变能力D认知能力 3、归结策略大致可分为两大类:、。(D) A 、递归策略 循环策略 B 、限制策略 循环策略 C 、删除策略 递归策略 D 、删除策略 限制策略 4、太阳从东边升起是_A _ A 必然事件 B 不确定事件 C 不可能事件 D 不可能事件 5、以下哪一个公式是正确的(B) A P ∧(P ∧ R) ←→P
探索大数据和人工智能最全试题
探索大数据和人工智能最全试题1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A首席数据官B.首席科学家C.首席执行官D.首席架构师2、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A. ReduceB.HashC. CleanD. Loading3、在Spak的软件栈中,用于交互式查询的是A. SparkSQLB.MllibC.GraphXD. Spark Streaming4、在数据量一定的情况下, MapReduce是一个线性可扩展模型,请问服务器数量与处( )理时间是什么关系?A数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系5、下列选项中,不是kafka适合的应用场景是?A.日志收集B.消息系统C.业务系统D.流式处理6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是A.结构化数据B.非结构化数据C.半结构化数据D.全结构化数据7、下列选项中,不是人工智能的算法中的学习方法的是?A.重复学习B.深度学习C.迁移学习D.对抗学习8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A.机器性能B.语言歧义性C.知识依赖D.语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归10、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC.移娃D.大云11、HDFS中Namenodef的Metadata的作用是?A.描述数据的存储位置等属性B.存储数据C.调度数据D.12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么技术实现的?A大数据技术B.互联网技术C.游戏技术D.影像技术13、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B.开源C.独立D.封闭14、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D.视频15、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC.1TB=1000GBD. 1MB=1024KB16、下列选项中,不是Flume的特点的是?A.可靠性B.集中式架构C.可扩展性D.可管理性17、BP神经网络模型拓扑结构不包括A.输入层B.隐层C.翰出层D.显层18、以下哪个不是语音识别的范畴?A.语音听写B.语音台成C.语音转写D.语音唤醒19、以下哪个场景可以称为大数据场景?A.故宫游客人B.故宫门票收入C.美团APP的定位信息D.文章内容20、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯21、下列选项中,哪项是分布式文件存储系统?A.HDFSB. FlumeC. KafkaD. Zookeeper22、下列选项中,正确描述Flume对数据源的支持的是A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式23、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表24、下列选项中,不是人工智能的算法中的学习方法的是A.重复学习B.深度学习C.迁移学习D.对抗学习25、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解26、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论級别的突破。
人工智能相关知识点考试题及答案
人工智能相关知识点考试题及答案一、单项选择题(每题2分,共10分)1. 人工智能的英文缩写是?A. AIB. MLC. DLD. NLP答案:A2. 以下哪个不是机器学习的主要应用领域?A. 语音识别B. 图像识别C. 自然语言处理D. 量子计算答案:D3. 神经网络的灵感来源于哪个生物结构?A. 神经元B. 心脏C. 肝脏D. 骨骼答案:A4. 下列哪项技术不属于深度学习?A. 卷积神经网络B. 循环神经网络C. 决策树D. 长短期记忆网络答案:C5. 人工智能的“图灵测试”是由谁提出的?A. 艾伦·图灵B. 马文·闵斯基C. 约翰·麦卡锡D. 艾伦·纽厄尔答案:A二、多项选择题(每题3分,共15分)1. 人工智能研究的主要内容包括哪些?A. 机器学习B. 自动推理C. 知识表示D. 机器视觉E. 语音识别答案:ABCDE2. 下列哪些属于人工智能的典型应用?A. 智能客服B. 无人驾驶汽车C. 智能家居D. 电子游戏E. 医疗诊断答案:ABCDE3. 深度学习在以下哪些领域有显著应用?A. 语音识别B. 图像识别C. 自然语言处理D. 游戏AIE. 推荐系统答案:ABCDE4. 人工智能的伦理问题包括哪些?A. 数据隐私B. 算法偏见C. 工作替代D. 决策透明度E. 责任归属答案:ABCDE5. 人工智能的发展历程中,哪些事件具有里程碑意义?A. 艾伦·图灵提出图灵测试B. 达特茅斯会议C. 深蓝战胜国际象棋冠军D. 谷歌AlphaGo战胜围棋冠军E. IBM Watson在医疗领域应用答案:ABCDE三、判断题(每题1分,共10分)1. 人工智能的发展依赖于大数据。
(对)2. 机器学习是人工智能的一个子集。
(对)3. 深度学习是机器学习的一个子集。
(对)4. 人工智能可以完全替代人类工作。
(错)5. 人工智能的发展不会引发伦理问题。
(错)6. 神经网络是由多个神经元组成的。
人工智能基础复习题与答案
人工智能基础复习题与答案1、以下关于词性标注的描述错误的是:A、词性是词汇基本的语法属性,通常称为词类。
B、词性标注是在给定句子中判断每个词的语法范畴,确定其词性并加以标注的过程。
C、通常将词性标注作为序列标注问题来解决。
D、词性标注最主流的方法是从预料库中统计每个词对应的高频词性, 将其作为默认的词性。
答案:D2、以下哪个数据集常备用于信息检索任务A、MNISTB、ImageNetC、TRECD、IMDB-Face答案:C3、下面哪个是NLP用例A、从图像中检测物体B、面部识别C、语音生物识别D、文本摘要答案:D4、自然语言处理能在以下哪些领域发挥作用A、自动文本摘要B、自动问答系统C、信息检索D、以上所有答案:D5、对“The kid runs”使用ngram后得到“The kid”,“kid runs”A、UnigramB、BigramC、TrigramD、Quadrigrams答案:B6、关于CTC最佳路径解码说法错误的是A、通过在每个时间步中选择最可能的字符来计算最佳路径B、它先删除重复的字符,再从路径中删除所有空格C、它先从路径中删除所有空格,再删除重复的字符D、它可以直接用于表示已识别的文本答案:C7、“在KBQA中,设计问题回复模板可以用来生成自然语言的回复”是正确的吗?A、正确B、错误答案:A8、以下关于逻辑表达式的说法错误的是:A、逻辑表达式是区别于语义解析方法与模板匹配方法的根本差异。
B、逻辑表达式不适用于知识库的结构化查询方式。
C、逻辑表达式适合查找知识库中的实体及实体关系等信息。
D、逻辑表达式具备逻辑运算能力以及将原子级别的逻辑表达式组合成更复杂的逻辑表达形式的能力。
答案:B9、以下哪种词向量模型为静态词向量模型,且使用了全局统计信息进行模型训练A、ONE-HOTB、Word2vecC、GloVeD、ELMo答案:C10、Faster RCNN中用于区分前景背景和修正proposals的组件是什么?A、VGGB、RPNC、Roi PoolingD、Classifier答案:B11、MNIST数据集包含内容以及建立时间A、手写数字识别,2013B、手写数字识别,2011C、标准字符识别,2013D、标准字符识别,2011答案:A12、BERT预训练任务中,有关N-gram掩码和原始掩码语言模型(MLM)的难度关系,下列哪个描述是正确的A、难度一样B、N-gram masking比MLM难C、MLM比N-gram masking难D、无法比较答案:B13、以下哪种单词表示方法仅使用了局部共现信息A、ONE-HOTB、Word2vecC、GloVeD、ELMo答案:B14、以下可以对弯曲文本进行检测的方法为?A、TextBoxes++算法B、EAST算法C、CTD算法D、MOST算法答案:C15、以下哪个是BERT中的掩码标记A、CLS]B、SEP]C、MASK]D、TAG]答案:C16、以下哪个NLP工具包处理速度最快A、NLTKB、CoreNLPC、LTPD、HanLP答案:D17、卷积核通常写成()形式。
《探索大数据和人工智能》题库整理
《探索大数据和人工智能》题库整理Flume采用了三层架构,分别为agent,collector和(B)A.MapB.storageC.ShuffleD.HashSpark是在哪一年开源的?(B)A.1980B.2010C.1990D.2000在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢?(B)A.连接器B.客户端C.接口提供者D.数据采集学习没有标签的数据集的机器学习方法是?(B)A.监督学习B.无监督学习C.半监督学习D.强化学习以下不是非结构化数据的项是?(C)A.图片B.音频C.数据库二维表数据D.视频2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立(A)一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A首席数据官B.首席科学家C.首席执行官D.首席架构师整个MapReduce的过程大致分为Map、Shuffle、Combine、(A)?A.ReduceB.HashC.CleanD.Loading在Spak的软件栈中,用于交互式查询的是(A)A.SparkSQLB.MllibC.GraphXD.Spark Streaming在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?(B)A数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系下列选项中,不是kafka适合的应用场景是?(C)A.日志收集B.消息系统C.业务系统D.流式处理大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是(D)A.结构化数据B.非结构化数据C.半结构化数据D.全结构化数据下列选项中,不是人工智能的算法中的学习方法的是?(A)A.重复学习B.深度学习C.迁移学习D.对抗学习自然语言处理难点目前有四大类,下列选项中不是其中之一的是(A)A.机器性能B.语言歧义性C.知识依赖D.语境传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
人工智能复习题集及答案
人工智能复习题集及答案在此提供一份人工智能复习题集及答案,帮助大家巩固相关知识。
请注意,以下题目并非出自真实考试,仅供复习之用。
一、选择题(每题2分,共30分)1. 人工智能(AI)是指:A. 人类的智能表现B. 计算机的智能表现C. 机器具有的类似人类智能的能力D. 机器的高速计算能力2. 下列哪个不属于人工智能的应用领域?A. 自动驾驶B. 语音识别C. 股票交易D. 图像识别3. 以下哪个算法被认为是人工智能的"父亲"?A. 卷积神经网络(CNN)B. 决策树(Decision Tree)C. 逻辑回归(Logistic Regression)D. 感知机(Perceptron)4. 人工智能的发展受到计算能力和以下哪个因素的制约?A. 数据量B. 算法复杂度C. 硬件性能D. 领域专家5. 在机器学习中,监督学习是指:A. 给模型提供明确的输入和输出标签B. 让模型自行学习数据的模式C. 通过奖励和惩罚教导模型D. 在模型训练过程中提供实时反馈6. 以下哪个不是强化学习中的组成部分?A. 环境B. 代理(Agent)C. 奖励信号(Reward Signal)D. 训练数据7. 在自然语言处理中,词嵌入(Word Embedding)用于:A. 将文本转化为离散的词汇序列B. 将文本转化为连续向量表示C. 生成语法正确的句子D. 实现机器翻译功能8. AlphaGo是一款成功击败人类围棋大师的人工智能程序,其核心技术是:A. 深度强化学习B. 迁移学习C. 遗传算法D. 逻辑推理9. 机器学习中的交叉验证是用来评估模型的:A. 泛化能力B. 训练速度C. 拟合程度D. 特征选择能力10. 在图像识别中,卷积神经网络(CNN)的核心操作是:A. 卷积B. 加法运算C. 乘法运算D. 激活函数二、填空题(每题2分,共20分)11. 人工智能的发展密切相关的一个领域是__________。
人工智能基础概念复习题含参考答案
人工智能基础概念复习题含参考答案一、单选题(共60题,每题1分,共60分)1、决策树中,同一路径上的所有属性之间是()关系A、逻辑与B、因果C、逻辑或D、相关正确答案:A2、CRISP-DM将数据挖掘的过程抽象为四个层次:阶段、一般任务、()和过程实例A、分析B、建模C、具体任务D、规划正确答案:C3、智能机器人可以根据()得到信息。
A、感知能力B、学习能力C、思维能力D、行为能力正确答案:A4、学习器的实际预测输出与样本的真实输出之间的差异称为A、精度B、误差C、查准率D、错误率正确答案:B5、()是将人类语言经过处理转化为机器所能理解语言的一门技术。
A、大数据B、自然语言处理C、语音识别D、计算机视觉正确答案:B6、大数据的最显著特征是()A、数据价值密度高B、数据处理速度快C、数据类型多样D、数据规模大正确答案:D7、假设你在卷积神经网络的第一层中有5个卷积核,每个卷积核尺寸为7×7,具有零填充且步幅为1。
该层的输入图片的维度是224×224×3。
那么该层输出的维度是多少?()A、217x217x3B、218x218x5C、220x220x7D、217x217x8正确答案:B8、图像灰度的方差表示图像的哪种属性A、图像细节B、图像饱和度C、图像整体亮度D、图像对比度正确答案:D9、专用人工智能的简称是()。
A、AIGB、AINC、ANID、AGI正确答案:C10、数据管理以()活动为基础。
A、数据预处理B、数据处理C、数据分析D、数据可视化正确答案:A11、避免由于过拟合造成貌似线性可分的结果,一个解决的办法是允许支持向量机在一些样本上出错,为此引入()的概念。
A、正则化B、软间隔C、核函数D、硬间隔正确答案:B12、有三种方法可以帮助决策者确定决策的作用:()、场景分析和What-If分析A、回归分析B、测试C、建模D、假设分析正确答案:B13、关于表述数据可视化在数据科学中重要地位说法中,下列不正确的是()。
探索大数据和人工智能复习题及答案
当前世界产生的数据总量的单位是? A. EB B. ZB C. PB D. TB随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模B 式,向着什么靠拢? A. 闭源 B. 开源 C. 开放 D. 封闭HBASE通过Zookeeper避免什么问题? A. HMaster的单点问题 B. HRegionServer的单点问题 C. HRegion的单点问题 D. Client的单点问题大数据本身是一个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过什么尺度的数据而诞生的? A. 单机 B. 20GB C. 100GB D. 500GB传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的数字,又称为什么呢? A. 给定标签 B. 离散 C. 分类 D. 回归目前主流研究仍然集中于弱人工智能发展阶段,那么在下列哪些方面取得显著进步? A. 语音识别 B. 图像处理 C. 探索太空 D. 机器翻译目前主流研究仍然集中于弱人工智能发展阶段,那么在下列哪些方面取得显著进步? A. 语音识别 B. 图像处理 C. 探索太空 D. 机器翻译下列选项中,哪项是可以用于数据采集的技术? A. Flume B. Hive C. Kafka D.Mahout麦肯锡全球研究所对大数据的定义是一种规模大到在某些方面大大超出了传统数据库软件工具能力范围的数据集合,那么这些方面分别是? A. 获取 B. 存储C. 管理D. 分析计算机视觉本身又包括了诸多不同的研究方向,比较基础和热门的几个方向主要包括了: A. 物体识别 B. 运动 C. 形态 D. 轮廓。
信息技术人工智能与大数据分析考核试卷
C. Storm
D. Kafka
20.以下哪些方法可以用于评估机器学习模型的性能?()
A.准确率B.精确率C召回率D. F1分数三、填空题(本题共10小题,每小题2分,共20分,请将正确答案填到题目空白处)
1.人工智能(AI)的研究领域包括机器学习、自然语言处理和______。()
标准答案
一、单项选择题
1. D
2. D
3. D
4. B
5. C
6. D
7. B
8. B
9. B
10. B
11. D
12. B
13. D
14. C
15. C
16. D
17. C
18. D
19. C
20. A
二、多选题
1. ABC
2. ABCD
3. ABCD
4. ABC
5. ABC
6. ABCD
7. ABC
D. Logit
6.以下哪些是大数据处理框架Hadoop的主要组件?()
A. HDFS
B. MapReduce
C. YARN
D. Hive
7.以下哪些是大数据分析中常用的数据可视化工具?()
A. Tableau
B. Power BI
C. Matplotlib
D. Excel
8.以下哪些技术可以用于数据的分布式存储?()
B.数据速度(Velocity)
C.数据多样性(Variety)
D.数据真实性(Veracity)
4.以下哪些技术属于机器学习中的集成学习方法?()
A.随机森林
B.提升算法
C.梯度提升决策树
D.线性回归
《探索大数据与及人工智能》习题及答案
《探索大数据与及人工智能》习题及答案单选1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是? A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
探索大数据和人工智能1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A首席数据官B.首席科学家C.首席执行官D.首席架构师2、整个 MapReduce的过程大致分为Map、 Shuffle、Combine、()?A. ReduceB.HashC. CleanD. Loading3、在Spak的软件栈中,用于交互式查询的是A. SparkSQLB.MllibC.GraphXD. Spark Streaming4、在数据量一定的情况下, MapReduce是一个线性可扩展模型,请问服务器数量与处( )理时间是什么关系?A数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系5、下列选项中,不是 kafka适合的应用场景是?A.日志收集B.消息系统C.业务系统D.流式处理6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是A.结构化数据B.非结构化数据C.半结构化数据D.全结构化数据7、下列选项中,不是人工智能的算法中的学习方法的是?A.重复学习B.深度学习C.迁移学习D.对抗学习8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A.机器性能B.语言歧义性C.知识依赖D.语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归10、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC.移娃D.大云11、HDFS中 Namenodef的 Metadata的作用是?A.描述数据的存储位置等属性B.存储数据C.调度数据D.12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么技术实现的?A大数据技术B.互联网技术C.游戏技术D.影像技术13、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT 厂商正在改变商业模式,向着什么靠拢?A.闭源B.开源C.独立D.封闭14、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D.视频15、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC.1TB=1000GBD. 1MB=1024KB16、下列选项中,不是Flume的特点的是?A.可靠性B.集中式架构C.可扩展性D.可管理性17、BP神经网络模型拓扑结构不包括A.输入层B.隐层C.翰出层D.显层18、以下哪个不是语音识别的范畴?A.语音听写B.语音台成C.语音转写D.语音唤醒19、以下哪个场景可以称为大数据场景?A.故宫游客人B.故宫门票收入C.美团APP的定位信息D.文章内容20、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯21、下列选项中,哪项是分布式文件存储系统?A.HDFSB. FlumeC. KafkaD. Zookeeper22、下列选项中,正确描述Flume对数据源的支持的是A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式23、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表24、下列选项中,不是人工智能的算法中的学习方法的是A.重复学习B.深度学习C.迁移学习D.对抗学习25、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解26、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论級别的突破。
而哪项技术将继续成为大数据智能分析的核心技术A机器学习B.智能物流C.脑科学D.智能终端27、以下哪个不属于大数据在电信行业的数据商业化方面的应用A.精准广告B.网络管理C.营销洞察D.大数据检测和决策28、RDD是由多个什么组成?A.partitionB. computerC. ActionD. Transformation29、下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析D.单机计算30、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工看能称为()A.高人工智能B.低人工智能C.强人工智能D.弱人工智能31、 mapreduce计算模型适用于哪种任务?A.多线程处理B.有关联的行处理C.批处理D.实时数据变化处理32、当前世界产生的数据总量的单位是?A.KBB. ZBC.GBD.TB33、IBM提出的大数据5V特征包括更大( Volume)、更快( Velocity)、更多Variety)、更值钱(Value)和()A.更有效B.更充分C.更真实( Veracity)D.更直观34、 Spark.是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小A.内存B.硬盘C.磁带35、下列选项中,不是 kafka适合的应用场景是?A.日志收集B.消息系统C.业务系統D.流式处理36、数据采集的基本步骤(ETL)中不包括哪项?A.抽取转换B.加载C.计算D.37、以下哪种学习方法不属于人工智能算法?A.迁移学习B.对抗学习C.强化学习D.自由学习38、语音识别常用的应用有四个,下列不是常用应用的是? A聊天C.导航D.设备控制39、下列选项中,哪项是由谷歌开发的人工能箅法框架?A. KafkaB. TensorflowC. CaffeD. Torch40、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高増长率和多样化的信息资产。
A.海量B.少数C.小量D.结构化41、MPP是指A.大规模并行处理系统B.受限的分布式计算模型C.集群计算资源管理框架D.分布式计算编程框架42、 Hadoop是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201643、在 Spark的软件栈中,用于流计算的是?A. GraphXB. MllibC. Spark StreamingD. SparkSQL44、以下数据量可以称为大数据的是A. 100MBB.100KBC. 100PBD.100MB45、人工智能通过输入的图片,解析出图片的内容,这种技术叫什么?A.图片识别B.语音识别C.自动驾驶D.消费金融46、IBM的()是第一个在国际象棋上战胜人类人工智能计算机。
A.AlphagoB.深蓝C.图灵机模型D.深度学习机器人47、下列选项中,不是人工智能的基础设施的是?A.CPU服务器B.GPU服务器C.专用芯片D.游戏显卡48、以下哪个不属于大数据在电信行业的应用?A数据商业化B.物流网络C.企业运营管理D.客户关系管理49、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。
A.大数据技术B.客户画像C.客户状态D.客户心情50、IBM提出的大数据5V特征包括()、更快( velocity)、更多( Variety)、更值钱(Value)和更真实( Veracity)A.更有效B.更大(Volume)C.更充分D.更直观51、Fume采用了三层架构,分别为 agent, collector和()A.MapB. storageC. ShuffleD.Hash52、 Hadoop2系列版本中默认的HDFS的block是多大?A32MBB.64MBC.128MBD. 16MB53、工信部官网正式发布大数据产业“一三五“发展规划是在哪一年A.1987B.1997C.2007D.201754、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C.梯度提升法D.梯度曲线法55、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。
A.精灵B.阿尔法蛋C.小度D.移娃56、对抗学习中两个网络互相竟争,一个负责生成样本,那么另一个负责做什么?A.判别样本B.计算样本C.统计样本D.生成样本57、以下应用没有使用你的地理位置信息的是?A.美团B.滴滴C.高德地图D.word58、下列选项中,不是大数据发展趋势的是A.大数据分析的革命性方法出现B.大数据与云计算将深度融合C.大数据一体机将陆续发布D.大数据未来可能会被淘汰59、在 Spark的软件栈中,用于图计算的是A. Spark StreamingB.MllibC. GraphXD. SparkSQL60、 HBASE的特点不包括哪些?A.面向行B.稀疏性C.多版本D.高可靠性61、总体来说,人工智能发展的未来趋势是?A.上升B.下降C.不动D.大幅度下降62、以下数据单位从小到大排列的顺序是?A.GB、B、KBB.B、KB、MBC.KB、ZB、PBD. B、 MB、KB63、最初的大数据概念还比较模湖,只是隐约的知道像个性化推荐、搜索引擎之类的处理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A.谷歌B.百度C.360D.bing64、下列选项中,哪个不是 HBASE的特点?A面向行B.多版本C.扩展性D.稀疏性65、下列选项中,不是用于数据存储的技术是哪一个?A.MongoDBB.MySQLC.HDFSD.Java二、多选题1、在数据清洗的过程中,总共可以归为三个阶段,它们分别是?A.数据加工B.数据质量检查C.数据校对D.数据标准化2、 HBASE的特点不包括哪些?A.面向行B.稠密性C.多版本D.高可靠性3、麦肯锡全球研究所对大数据的定义是—种规模大到在获取、存储、管理、分析方面大大超出了传統数据库软件工具能力范围的数据集合,具有以下哪些特征?A.海量的数据规模B.快速的数据流转C.多样的数据类型D.价值密度低4、以下哪两项是人工智能发展的标志性产品?A.深蓝alphagoC.智能门禁D.智能手机5、在非电信领域,大数据可被应用到的以下哪些方面A.公共安全B.无明显应用C.智能运输D.智能建筑6、大数据应用领域成就有哪些?A.金融B.互联网电子商务C.工业生产D.没有明显成就7、以下属于计算机视觉的研究方向的有?A.物体识别和检测B.语音导航C.视觉问答(看图说话)D.机器翻译8、传统的机器学习算法可以分为哪三类?A.监督学习B.无监督学习C.半监督学习D.强化学习9、在人工智能发展历程中有过多次低谷期,这些低谷期最主要的两项原因是什么?A.运算力不足B.人员不足C.技术瓶颈D.费用太高10、 HBASE的应用场景有哪些?A.半结构化或非结构化数据B.记录非常稀疏C.结构化数据D.超大数据量11、使用有监督学习的问题可以被分为哪两类?A.回归问题B.抽样问题C.聚类问题D.分类问题12、下列选项属于人工智能的基本概念有A.机器学习B.深度学习C.BP神经网络D.卷积神经网络13、 HBASE的应用场景有哪些?A.半结构化或非结构化数据B.记录非常稀疏C.结构化数据D.超大数据量14、下列选项中,是大数据发展趋势的是A.开源大数据商业化进一步深化B.打包的大数据行业分析应用开拓新市场C.大数据细分市场规模进一步增大D.大数据推动公司并购的规模和数量进一步提升15、人工智能关键技术框架主要包括哪两层?A.基础设施B.算法C.技术D.人员16、2010年12月,工信部发布的物联网十二五规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了哪些大数据的重要组成技术?A.海量数据存储B.数据挖掘C.图像视频智能分析D. python17、世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》,通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义?A.推动经济发展B.改善公共服务C.增进人民福祉D.保障国家安全18、下列选项中,哪两项是可以用于数据采集的技术?A. FlumeB. HiveC. KafkaD.Mahout19、关于RDD,说法正确的两项是?A.RDD不能由多个分区( partition)组成B.弹性、集中式内存集C.RDD能生成 ChildrenRDDD.是一个容错的、并行的数据结构20、以下用到语音识别技术的应用包括:A.苹果手机siriB.微信C.百度地图D.word21、人工智能目前在以下哪三个领域有了长足的发展?A.健康B.教育C.探索太空D.理财22、HDFS适用于什么样的应用场景?A.存储和管理PB级别的数据B.处理非结构化数据C.注重数据处理的吞吐量D.大量小文件23、Flume采用了三层架构,每一层均可以水平扩展,它们分别是?A. agentB. collectorC.storageD. source24、 KAfak的总体数据流有三个关键角色,它们分别是A. ProducerB.MessageC. ClusterD. Consumer25、业务运营监控,可以基于大数据分析从下列哪三个维度为运营商监控管道和客户运营情况?A.网络B.业务C.气候D.用户26、自然语言处理的主要难点不包括以下哪两项A.语言独立性B.语言歧义性C.多国语言D.语境27.以下数据量不能说成大数据的是?A.100MBB.1000KBC.100PBD. 1EB28、以下哪些属于大数据在电信行业的应用?A.网络管理和优化B.数据商业化C.客户关系管理D.企业运营管理29、通过地理位置信息可以分析出哪些信息?A.颜值B.家庭住址C.工作地址D.体重30、人工智能技术的基础设施不包括哪两部分?A.系统应用B.机器学习算法C.基础硬件D.算法框架31、自然语言处理需要解决的难点有哪些?A.语言歧义性B.语言鲁棒性C.知识依赖D.语境32、HDFS在哪些场景中表现很差?A.大量小文件B.随机读取C.修改文件D.存储和管理PB级别数据33、大数据的业务应用处理需要经过哪些流程?A.数据采集B.数据清洗C.数据建模D.数据加工34、HDFS适用于哪些场景?A.大量小文件B.存储和管理PB级别数据C.一次写入,多次读取D.低延迟读取35、人工智能在哪些领域应用广泛?A.健康医疗B.智能投顾C.智能教育D.智能法务36、以下哪两个属于大数据特征?A.数据体量大B.价值密度高C.数据种类多D.处理速度慢37、数据建模目前有两种比较通用的方式,分别是?A.通用建模B.专属建模C.范式建模D.维度建模38、以下应用使用了你的地理位置信息的是?A.滴滴B.百度地图C. wordD. excel39、BP神经网络模型拓扑结构包括?A.输入层B.隐层C.输出层D.显层40、 HBase是在 Hadoop之上构建的开源分布式结构化数据存储系统,它有哪些特点?面向列存储A.非关系型B.面向列存储C.关系型D.面向行存储41、大数据可以被应用到的行业有?A.电信B.工业C.政府D.金融参考答案单选题1、A2、A3、A4、B5、C6、D7、A8、A9、D10、A 11、A 12、A 13、B 14、C 15、C 16、D 17、D18、B 19、C 20、B 21、A 22、B 23、A 24、A 25、B 26、A 27、B 28、A 29、D 30、C 31、C 32、B 33、C 34、A 35、C 36、C 37、D 38、D 39、B 40、A 41、A42、C 43、C 44、C 45、A 46、B 47、D 48、B 49、A50、B 51、B 52、C 53、D 54、B 55、D 56、A 57、D 58、D 59、C 60、A 61、A 62、B 63、A 64、A 65、D多选题1、BCD2、AB3、ABCD4、CD5、ACD6、ABC7、AC8、ABC 9、AC 10、ABD 11、AD 12、ABCD 13、ABD14、AC 15、BC 16、ABC 17、ABCD 18、AC 19、CD20、ABC 21、ABD22、AC 23、ABC 24、ACD 25、ABD 26、AC 27、AB 28、ABCD 29、BC 30、AC 31、ACD 32、AC33、ABCD 34、BC 35、ABCD 36、AC 37、CD 38、AB39、ABC 40、AB 41、ABCD。