《探索大数据与人工智能》题库
中国移动网络大学全员5G+通用知识《探索大数据与人工智能》题库答案

中国移动网络大学全员5G+通用知识《探索大数据与人工智能》题库答案一、单选题1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A. 数量越多处理时间越长B. 数量越多处理时间越短C. 数量越小处理时间越短D. 没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
《数据科学与大数据通识导论》题库及答案

《数据科学与大数据通识导论》题库及答案1.数据科学的三大支柱与五大要素是什么?答:数据科学的三大主要支柱为:Datalogy (数据学):对应数据管理 (Data management)Analytics (分析学):对应统计方法 (Statistical method)Algorithmics (算法学):对应算法方法 (Algorithmic method)数据科学的五大要素:A-SATA模型分析思维 (Analytical Thinking)统计模型 (Statistical Model)算法计算 (Algorithmic Computing)数据技术 (Data Technology)综合应用 (Application)2.如何辨证看待“大数据”中的“大”和“数据”的关系?字面理解Large、vast和big都可以用于形容大小Big更强调的是相对大小的大,是抽象意义上的大大数据是抽象的大,是思维方式上的转变量变带来质变,思维方式,方法论都应该和以往不同计算机并不能很好解决人工智能中的诸多问题,利用大数据突破性解决了,其核心问题变成了数据问题。
3.怎么理解科学的范式?今天如何利用这些科学范式?科学的范式指的是常规科学所赖以运作的理论基础和实践规范,是从事某一科学的科学家群体所共同遵从的世界观和行为方式。
第一范式:经验科学第二范式:理论科学第三范式:计算科学第四范式:数据密集型科学今天,是数据科学,统一于理论、实验和模拟4.从人类整个文明的尺度上看,IT和DT对人类的发展有些什么样的影响和冲击?以控制为出发点的IT时代正在走向激活生产力为目的的DT(Data Technology)数据时代。
大数据驱动的DT时代由数据驱动的世界观大数据重新定义商业新模式大数据重新定义研发新路径大数据重新定义企业新思维5.大数据时代的思维方式有哪些?“大数据时代”和“智能时代”告诉我们:数据思维:讲故事→数据说话总体思维:样本数据→全局数据容错思维:精确性→混杂性、不确定性相关思维:因果关系→相关关系智能思维:人→人机协同(人 + 人工智能)6.请列举出六大典型思维方式;直线思维、逆向思维、跳跃思维、归纳思维、并行思维、科学思维7.大数据时代的思维方式有哪些?同58.二进制系统是如何实现的?计算机用0和1来表示和存储所有的数据,它的基数为2,进位规则是“逢二进一”,用1表示开,0表示关9.解释比特、字节和十六进制表示。
大数据与人工智能考试题

大数据与人工智能考试题一、判断题1.在用智能工具解决问题时,除了使用智能平台上已经设计好的智能工具以外,还可以编程自主开发,这样可以提高智能工具的灵活性。
例如,通过Python语言调用人工智能工具库可以较方便地开发智能工具。
[判断题] *对(正确答案)错2.从互联网产生大数据的角度来看,大数据具有的特征是“4V”特征:大量、多样、高价值密度、低速。
[判断题] *对错(正确答案)3.网络数据采集法主要通过网络爬虫或网站公开API的方式获取网络爬虫,从网页的URL开始获取。
[判断题] *对(正确答案)错4.数据采集的基本方法包括系统日志采集、网络数据采集等方法。
[判断题] *对(正确答案)错5.数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征。
[判断题] *对(正确答案)错6.K-平均算法属于聚类分析方法。
[判断题] *对(正确答案)错7.可以用于分析数据趋势的可视化呈现类型包括折线图、分组柱形图、堆叠柱形图和柱线混合图等。
[判断题] *对(正确答案)错8. 2016年阿尔法围棋程序(AlphaGo)在与围棋世界冠军李世石进行的围棋人机博弈中以4:1的总比分获胜,这是人工智能发展史上一个新的里程碑。
AlphaGo主要采用了人工智能研究须域中的深度学习技术。
[判断题] *对(正确答案)错9 停车场车牌识别系统能将车牌从复杂背景中识别出来,通过车牌提取、图像预处理、特征狸取、车牌字符识别等技术,识别车辆牌号、颜色等信息。
该系统属于典型的数据库应用系统,不涉及人工智能技术。
[判断题] *对错(正确答案)10. 由于学校计算机教室的服务器硬盘损坏,导致学生微电影作品丢失。
该案例中的数据安全威胁属于个人失误。
[判断题] *对错(正确答案)二、填空题1.小明家里有一个智能的小音箱,就像是个贴心的“小管家”,有什么需求告诉它就行了,例如:想看电视了,对小音箱说:“打开电视机并调到新闻频道”;上学出门时,对它说:“我去上学了”,家里所有的灯、空调就会关闭,扫地机则自己开始工作:晚上睡前,跟小音箱说一声“晚安”,家里的灯就会关掉,空调自动设置成睡眠模式。
2019年人工智能考试参考答案

1.信息化社会的显著特征是计算机、互联网、物联网技术发展,人工智能技术进步。
正确错误2.智慧社区指标体系涉及保障体系、基础设施与建筑结构、社区治理与公共服务、市场管理、便民服务和主题社区等六个领域。
正确错误3.智慧社区信息服务平台的作用比较全面,为生活带来更多便利。
正确错误4.由服务业主导向工业主导转型是发展智慧养老的原因之一。
正确错误5.从老龄研究的角度,智慧养老能够解决根本性的问题。
正确错误6.目前在我国,收集到的老年人在生活自理能力服务需求方面的数据,都是掌握在不同的部门手里,没有能够实现数据的共享,信息孤岛的情况严重。
正确错误7.智慧养老绩效评估的建立可以有效地提高老年人在获取服务方面的便利性和准确性。
正确错误8.根据《大数据在医疗领域的应用》,当今时代信息技术进一步推动了经济的增长和社会的发展,推动了知识传播应用进程的变化。
正确错误9.当前社会中,最为突出的大数据环境是物联网。
正确错误10.大数据等于传统的数据库建设、传统的普查、数据中心建设、云计算建设。
正确错误11.“互联网+”行动将重点促进以移动互联网、云计算、物联网、大数据等与现代制造业相结合。
正确错误12.沃尔玛的尿布啤酒效应体现了大数据时代的关联性。
正确错误13.以大数据来促进我们健康管理的个性化和多元化。
正确错误14.医疗大数据主要来源于制药企业、临床数据、社保基金利用率和患者的数据。
正确错误年9月,德国通过“自动与互联汽车”国家战略。
正确错误16.我国目前已经明确了隐私内容条目。
正确错误17.在中国,人工智能已被纳入国家科研计划。
正确错误18.从国家内部来看,人工智能通过优化自动化的方式能够提升社会运行效率。
正确错误19.当前,新一轮科技革命与产业变革正在萌发,为了抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,2017年7月8日国务院出台了《新一代创新科技发展规划》,为推动我国人工智能的长期发展指明了方向。
《探索大数据与人工智能》习题库

探索大数据与人工智能》习题库单选1、 Spark Streaming 是什么软件栈中的流计算 ? A. Spark B. Storm C. Hive D. Flume2、下列选项中 ,不是大数据发展趋势的是 ?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、 2011 年 5 月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation,competition and productivity 》研究报告中指出 ,数据已经渗透到每一个行业和业务职能之中 逐渐成为重要的生产因素的 ?A.比尔•恩门B.麦肯锡C.扎克伯格D.乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用 ? A. 精准广告 B. 网络管理 C. 网络优化 D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用 ?A. 数据商业化B. 物流网络C. 企业运营D. 客户关系管理 6、2012 年 7 月,为挖掘大数据的价值 ,阿里巴巴集团在管理层设立 ()一职 ,负责全面推进 “数据分享平台 ”战略 ,并推出大型的数据分享平台。
A. 首席数据官B. 首席科学家C. 首席执行官D. 首席架构师 7、下列选项中 ,不是 kafka 适合的应用场景是 ? A.日志收集B.消息系统C.业务系统D.流式处理 &下列选项中,哪个不是HBASE 的特点? A. 面向行 B. 多版本 C. 扩展性 D. 稀疏性 ,MapReduce 是一个线性可扩展模型 ,请问服务器数量与处理时间是什么关系?10、在Spark 的软件栈中,用于机器学习的是A. Spark StreamingB. MllibC. GraphXD.SparkSQL 11、Spark 是在哪一年开源的? A. 1980 B. 2010 C. 1990 D. 200012、大数据的多样性使得数据被分为三种数据结构 ,那么以下不是三种数据结构之一的是A 结构化数据B.非结构化数据 C.半结构化数据 D.全结构化数据13、 自然语言处理难点目前有四大类,下列选项中不是其中之一的是 ?9、在数据量一定的情况下 A. 数量越多处理时间越长 B.数量越小处理时间越短 B. 数量越多处理时间越短 D •没什么关系A.机器性能B.语言歧义性C.知识依赖D.语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B.拨号C.导航D.设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B.对抗学习C.强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表17、总体来说,人工智能发展的未来趋势是?A.上升B.下降C.不动D.大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC.移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB.B、KB MBC. KB ZB PBD.B MB、KB20、以下数据单位换算错误的是?A. 1KB=1024BB. 1GB=1024MB C/IT B=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D.视频22、整个MapReduce 的过程大致分为Map、Shuffle、Combine、()?A. ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A. AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A. KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C.梯度提升法D.梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A. TezB. SparkC. Pig DMapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
人工智能基础(习题卷1)

人工智能基础(习题卷1)第1部分:单项选择题,共53题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]声明1:可以通过将所有权重初始化为0来训练网络。
声明2:可以通过将偏差初始化为0来很好地训练网络以上哪些陈述是真实的?A、1对2错A)1错2对B)1和2都对C)1和2都错答案:B解析:2.[单选题]下列哪个函数可以组合估计器?A)RepeatedKFoldB)KFoldC)LeaveOneOutD)make_pipeline答案:D解析:3.[单选题]输入图像已被转换为大小为28×28的矩阵和大小为7×7的步幅为1的核心/滤波器。
卷积矩阵的大小是多少?A)22X22B)21X21C)28X28D)7X7答案:A解析:4.[单选题]人工神经网络的相关研究最早可以追溯到上世纪40年代,由心理学家麦卡洛克和数学逻辑学家皮茨提出的( )。
A)M-P神经元模型B)B-P神经元模型C)M-N神经元模型D)N-P神经元模型答案:A解析:5.[单选题]要在某一台机器上为某种语言构造一个编译程序,必须掌握哪些内容()A)汇编语言、高级语言、编译方法B)程序设计方法、测试方法、编译方法C)源语言、目标语言、编译方法D)高级语言、程序设计方法、机器语言答案:C解析:C)奇异点阈值D)点云分辨率答案:A解析:7.[单选题]Hadoop生态系统中,HBase是一种()。
A)分布式文件系统B)数据仓库C)实时分布式数据库D)分布式计算系统答案:C解析:HBase是一个面向列的实时分布式数据库。
8.[单选题]人工神经元网络与深度学习的关系是A)人工神经元网络是深度学习的前身B)深度学习是人工神经元网络的一个分支C)深度学习是人工神经元网络的一个发展D)深度学习与人工神经元网络无关答案:C解析:深度学习是实现机器学习的一种技术,现在所说的深度学习大部分都是指神经网络9.[单选题]在编制自动化需求时,实践证明采用()时最有效的方式A)流程图B)视频说明C)电子表格D)流程图加视频说明答案:D解析:10.[单选题]关于用4V来表示大数据的主要特征,描述错误的是A)大数据的时间分布往往不均匀,近几年生成数据的占比最高B)“如何从海量数据中洞见(洞察)出有价值的数据”是数据科学的重要课题之一C)数据类型的多样性往往导致数据的异构性,进而加大数据处理的复杂性,对数据处理能力提出了更高要求D)数据价值与数据量之间存在线性关系答案:D解析:11.[单选题]常用的的灰度内插法不包括()。
中国移动探索大数据与人工智能试题

中国移动探索大数据与人工智能试题嘿,伙计们!今天我们要聊聊一个非常热门的话题——大数据与人工智能。
你们知道吗?这两者可是当今科技界的两大宠儿,它们的力量可是无穷无尽哦!让我们一起来揭开它们神秘的面纱吧!让我们来聊聊大数据。
大数据,顾名思义,就是指那些量大、种类繁多的数据。
这些数据就像是一座座金矿,等待着我们去挖掘。
而人工智能,就像是一位聪明绝顶的矿工,它可以帮助我们从这些金矿中提炼出宝贵的财富。
大数据和人工智能究竟是如何相互配合的呢?其实,它们之间的关系就像是一对默契的搭档。
大数据就像是原材料,而人工智能则是加工这些原材料的工具。
在大数据的基础上,人工智能可以通过各种算法和模型,为我们提供各种各样的解决方案。
比如说,我们可以通过大数据分析出某个地区的人口密度、消费水平等信息,然后利用人工智能技术,为这个地区的商家提供更加精准的广告投放策略。
这样一来,商家就可以更加有效地吸引顾客,提高销售额了。
大数据和人工智能的结合并不仅仅局限于商业领域。
在医疗、教育、交通等各个方面,它们都有着广泛的应用前景。
比如说,在医疗领域,大数据可以帮助医生分析患者的病历、基因等信息,从而为患者提供更加个性化的治疗方案。
而人工智能则可以通过模拟人类的思维过程,帮助医生更快地做出判断。
这样一来,患者就可以得到更加精准的治疗,提高了治愈率。
不过,大数据和人工智能的发展也面临着一些挑战。
随着数据的不断积累,如何保证数据的安全和隐私成为了一个亟待解决的问题。
人工智能虽然可以帮助我们解决很多问题,但它毕竟还是一种工具,它的决策并不总是完全正确的。
因此,在使用人工智能的时候,我们还需要保持谨慎的态度。
大数据和人工智能作为当今科技领域的两大宠儿,它们的发展前景是非常广阔的。
只要我们善于利用它们的力量,相信未来一定会有更多的惊喜等待着我们。
今天的分享就到这里啦!希望大家能够从中受益匪浅,也期待大家在未来的日子里,能够见证大数据和人工智能带来的更多奇迹!再见啦!。
人工智能应用技术练习题库(含参考答案)

人工智能应用技术练习题库(含参考答案)1、以下 CNN网络模型中,最早用于手写数字识别的是A、LeNet-5B、AlexNetC、ResNet50D、ResNet152答案:A2、以下关于机器学习说法错误的是A、机器学习可以解决图像识别问题B、目前机器学习已经可以代替人类C、机器学习在一定程度上依赖于统计学习D、监督学习和非监督学习都属于机器学习答案:B3、华为昇腾 AI芯片是 NPU(神经网络处理器)的典型代表之一。
A、TRUEB、FALSE答案:A4、下列哪些包不是图像处理时常用的A、timeB、sklearnC、os1D、opencv答案:C5、现代的卷积神经网络,常用的模块包括哪些A、多分枝结构B、残差连接C、BatchNormalizationD、Sigmoid激活函数答案:C6、下列算法哪些属于 K-means的变种?A、kNNB、MeanshiftC、k-means++D、以上都不是答案:C7、大数据的最显著特征是()A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高答案:A8、以下关于人工智能系统架构的表述,不正确的是A、人工智能分为应用层、技术层、基础层B、数据处理一般都是在应用层完成C、应用层聚焦人工智能技术和各个领域的结合D、基础层提供计算能力和数据资源答案:B9、护照识别服务的图像数据是不需要用 base64编码的。
A、TRUEB、FALSE答案:B10、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的数字,又称为什么呢?A、给定标签B、离散C、分类D、回归答案:B11、在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力A、贪心策略B、蒙特卡洛采样C、动态规划D、Bellman方程答案:A12、机器学习中,模型需要输入什么来训练自身,预测未知?A、人工程序B、神经网络C、训练算法D、历史数据答案:D13、计算机的运算是计算机的主要性能指标之一,与主要性能无关的是A、字长B、主频C、互联网的宽带D、内存和硬盘的工作速度答案:C14、图像处理一般指数字图像处理。
探索大数据与人工智能试题

(一)大数据基础(二)人工智能(三)大数据技术介绍1、MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系? OA. 数量越多处理时间越长B.数量越多处理时间越短OC. 数星越小处理时间越短0 D. 没什么关系2、下列选项中,不是kafka适合的应用场景是?()A.日志收集B.消息系统C.业务系统0 D. 流式处理1、大数据特征有几种(不包括IBM提出的新特征) ? OA.1O B.2O C.3D.42、目前电信运营商大数据发展仍处在什么阶段?A.探索OC.成熟OD.扩展3.下列选项中,不是大数据的-部分的是?OA.海量计算:O B. 大量数据管理O C. 数据分析◎D. 单机计算1、数据真实性具备哪两种特质?V A. 准确性口B. 不确定性口C. 可信赖度口D. 杂乱性2.电信行业的企业运营:理中。
经营分析和市场监测中。
我们可以通过数据分析对业务和市场经营状况进行总结和分析。
主要分为哪些种类?A日报口B.周报C月报口0.专暨分析1。
EMC World是哪年在拉斯维加聯著名的威尼斯人店开畔的?口A 2009。
B. 2011◎C.2012◎D. 20102.随着闭源软件在数据分析领域的地盘不断缩小,老牌T厂高正在改变商业模式,向着什么靠拢?OA团源◎B.开源OC开放OD.封闭3.下列造项中正情说明价已度低的是?。
A. 100万数据中有50万有效数据。
B.1TB数据中有1KB有效数据。
C. 100万0数据中南100万有效数据◎D. 10万条数据中有1万有效数据1.语音识别产品体系有四部分,下列哪项不是体系之- ?◎A.语音合成◎B.请音擴放◎C. 语音识剔0 D.適义理解2. IBM的深蓝在1997年的决定胜负的第六个回台中,用了多少步迫使和斯帕罗夫投子认输OA.15◎B.22◎D.283. BP神经网络的学习规则是?O A梯度上升法。
B.梯度下降法。
C梯度提升法。
D.梯度曲线法、下列选项中,寒项是分布式文件存储系统?o A HDFSO B Flume0 c Katla◎D. Zokeepe2. mapreduceit算模型近用于哪种任务?( ) A. 多线程处理◎B. 有关联的行处理。
中国移动探索大数据与人工智能试题

中国移动探索⼤数据与⼈⼯智能试题(⼀)⼤数据基础1、⽝數捋特征育5(不包括】E IV 提出的新持紅)? O A . 1 O B ,? o C. 3D. 42、吕前电⾔运营筍⼤数握发展仍辻在什么阶啟?@ A. 索 0 E ,应⽤O C 咸懸O D 扩展头下列选项中,不是⼤数堯出⼀部廿皓是?■ A.海昼.⼗隽 ''C.1啡真实性真备邸丙序贯?A.准确性Q c 可信赖度2.电?M 的拴业运三它理⼬⼖⼠」U 于⽐⼝⼆凭I ⼯划盼PiT :川⽦.咗='⼟巳⼆Li 吒札:苗「主5盼为輕L wocti ■寵⼀⼲託扭:昕ism 序吾名的园⼝斯⼈陶开isenFO 此O G 2DI2運 1 3. 2011C' D. ?DI0⽐北苍1豚:5⼩也5?⼨护锁磁克出和床叽在埠H ⼚却正注的?吭.⽹⽯⼚⼳总⽐?O C-⾎ O D 封邇□ B.不确左性 Z 0粗性k E 咅识*沪品保廡奇⼝郭分,下列伏曲盛之⼀7 O A.涪吉台瑜 O C.曲酣别@ B.佬备砖 ? J D.恒义理餐2、IBM 的深适左1997毎曲決定>5%旷為六个回合G,弔了⾟少步启快卡斷餐<歩天⾈⼦认?O A 15 @ B ? 22 O C. 30 O D ? 282. mapreduu 计854兰⽤于挪K 無? O A 券眈处理 @ C.农理 3 SparkS^CIIentS.在$堆写好spar 媲丰M 進过spark submit 命刽g 交⾄什么地⽅也⾏?O A. HDFS@ a s“y C B. HBASE O D ? Zookeeper 1、養国软件公司Splunk 是第⼀家上市的⼊数据处理公司,它罡在啷⼀年上您的? O A. 2009 o B- 2011 O D ? 2010@ C. 2012、以"FF是⼤敎花是?O A. 1 O B. 3@ C. 5 O D. 73、电信⾏业的客户关系管理中f肓户⽣命周期管理包括⼏个阶段?1. ⽉?世畀俎齐论以■⼈~⼼怡任)贱念与刃仝⼟4⼱了 g球苗曲怜C ?13?: >??在"⼏?冲刑⼔岀的⾃0遇信找仙BL*?5^Z?Hn.±5.丙3下审椰曲甌颐幵唄覆⼑谄?Q A.昨沁Q B. ?<8wej□ c?⽤户⾏为□ D.数有⾄2、嗤肄乔论坛UTK?瘦矩冬三砸-妾冇"全孩頸加渕⾆⾫1圾)》尼过龙古各⾢師珈越夭蜒$1些⽅乖莖X? 义?Q A. Q 3.改竺吨Q c砂冲吐Q D?恥匪安全I ⼼廖够三王魅I三:禎W匏辭、施.传胡坯為按博穌尿為引虾,外似I琵冬⼆W芜游酣,⼈朴振、聲F奇涓主雒郴F⿃當H3Z峯茫1題刊t妙?A.盘舐0 B?轴率0 csw影0 D? AST52、下列选顶中.不是⽬空i吾⾔处理的解决⽅法的呈?O A.规则⽅法? C週归⽅法O B.统H⽅法O D?深度字号⽅法3、IBM的深蓝在1997年的决定胜负的第六个回合中r⽤了多少步迫使卡斯怕罗夫投⼦认输O A. 15 ? B 22 O C. 30 O D. 281、在晋謝⽎颐領域r⼈⼯彗能可以结台按费告的?E些⽅⾯进^运算?A.财务状况SB.风险侯好C.芟财吕标□D.⾝体状况2,⼔前主许曲記5你異亡⾍苗⼈⼯書能发艇阶段,曲眩在⼘列葺些万tWY寻显善进于/A.進⾳⾅!|B.圉像上理U拧索太空D*叽器駐译2. a^Nd$QliH££S . £MttAMMS .更骄了电対SQUMO讹”⽽⽬科霑■^團■倒6迈.⽤切曲⾋帘r Prerto r DrtllE^T (岂植柯⽆皐:卒碎尬晅Wig "就不⼀⼀列¥7■: ,M那只丽*哼IHK*釧孚"忖<(?制和R+fJucHl=7Tffiqfj FQ A 丸it11!3%语⾳识别常⽒的壹⽤有四个?下列不杲當冃应庄芒罡?O c.导航1 、下列知t中,⽌⼯替⽼壬)基础字零有7c, BPmeas(⼆)⼈⼯智能1.下列谨頊中,不是⼈⼯昔能的基⾯设葩的是?A⼕咖务器 b GPU服务器C.专尽芯⽚i?D.专胃显悵2.总曲祚咗刁弟上更习于匿燦辻是存正⽍昌耙i⼯总£三⼘⾍它电鎏⽯兰.看EP⽍囲中.狰林屋三种堵构IB?B之⼀?■- c.蚩睾样>i D.令逍M ⼈⼯替能在更疗键辭域应⽤⼴泛,下列不是主妄应⽤圾录养是?O 4虚拟耻理O氐医芋影傑◎C圭⼑机昶O D,宫葬学1.巨前主流哥克仍然集中升昌⼈⼯替蚩⾐展航彦,那么在下列啣些⽅⾯取律昱苜谨歩?E.图像C挥索太空2 监膏学习的回⽈⽅注崗⾆:⼝A炭性回归B c券项武回归Q B.进辑回归D.单⼀回归(三)⼤数据技术介绍1.下列造项中,郡项是疔朽式⽂件存储磁?@ A- HDFS O E Flume'_ " C, Kafka O D. Zookeeper2. uidp educell算慎型运円于鄆种任务?()X塞线程上理C.批则< ROD是⽩多个什么俎成/|:电)A. palition B. computer C* Action D. T r ansfornnatio31. MapReduce⼼质上兵呈个港单悽型.便⽤起集很昱筆坡?那么下列珈些技相tMapReduce的便⽤简单化?X YARN B. OozieQ C? Hive Q D. Presto2、Hive是不适台⽤于卖时要求较⾼的应⽤场黒?有舜些原因?□ A.计莫速度慢Q B.C.计其速⽪快D.淞低1、下列歴项中r正瀚描it Flume刃谿S芳的⽀陆是?O A.只能佼⽤HDFS坯斷O c不就烦⽂昨琢@) B.可以配季据溥O D?不輙⽤⽬2. Spark是在i專⼀年开诗的?0 A. 2011 (§) B? 2010 0 c 2009 O D? 20123、Spark Streaming是什么钦件栈中的流计算?'?) A. Spark O C. Hadoop O B. Storm O D? Rume1、HDFS在骑箜场旦中表現识堂?2 ⽦后?予..mGiYr谆中丰坊监?忡.我们可以盘⼖敷病分帀?⾍島垃芍空汨厅少祢今析丈匪分先龛申*?□A.⼝R 恶Q C. A)& □ D.专逻分祈Q B.?Kgiis^^nT□ D.⽹⼔交咨P理爭核⼆1. 今年.枷盼桁務岀现⽦給住的新⽅法?从处液多d占(理E埋论込喘会产⽣理论駆!的姬商炉刘$5唤£为刘畑⼖咖忻如⼼按 *? @)A.机砂习O 吐AI??O G KM*7 O 0.習他■2、⽵郁现.利⽤⼤昨优化了什么.从停到柠⾼了枷私古,K?低徇魔6E本的⽬的7O⼈授⽊应⽤@B.擁蚀aO c. 车O D? wrss^3、下列选项中正确说明价砖质低的是7久100万数头{中肖50万肖效斑;1000万字憨拇中⾃100万⾃O D?10万仪敛35中化1万<5x5?2JS3MB. lTEJS头;中有1KB⾃。
大数据与人工智能答案

大数据与人工智能答案人工智能与深度学习1. 正确单选机器学习处理后,将垃圾邮件标注为1。
2. 正确单选垃圾邮件的特定来源特征属性为,如被标记为垃圾邮件的发件人,发件人为不规则长邮箱名等。
3. 正确单选垃圾邮件一般带有附件且附件大小在一定范围内。
4. 错误单选贝叶斯分类算法简单,但准确率低。
5. 正确单选贝叶斯分类是一种传统的机器学习方法。
6. 正确单选调节人工神经元之间连接权值的方法,这指的是赫布法则。
7. 错误单选唐纳德·赫布推动了多层神经网络的反向传播。
8. 正确单选和机器学习方法有关的两个概念是云计算和大数据。
9. 正确单选机器学习可分为监督学习、无监督学习、半监督学习等。
10. 错误单选人工智能从技术层面可划分为生物特征、人脸识别、智能客服、机器翻译、舆情监测。
11. 正确单选机器学习是实现人工智能的一大类方法。
12. 正确单选机器学习可以应用在识别垃圾邮件上。
13. 错误单选监督学习、无监督学习、半监督学习之间没有重合和交叉。
14. 正确单选贝叶斯分类是一种特征属性训练。
15. 正确单选在发展、应用阶段,机器学习方法的引入,使得人工智能技术有了飞跃式的提升。
16. D 单选垃圾邮件的发送时间特征属性为,(午夜0点到次日4点)间发送的邮件。
A 午夜3点到次日4点B 午夜2点到次日4点C 午夜1点到次日4点D 午夜0点到次日4点17. D 单选贝叶斯分类训练数据超过10000封,垃圾邮件识别准确率达到(0.99)以上。
A 0.69B 0.79C 0.89D 0.9918. A 单选深度学习之父是(Hinton)。
A HintonB 图灵C 贝叶斯D Jordan19. B 单选人工神经元是在哪一年提出的?1943年A 1942年B 1943年C 1944年D 1945年20. C 单选“赫布法则”是在哪一年提出的?1949年A 1947年B 1948年C 1949年D 1950年21. A 单选感知器模型是由谁提出的?罗森布拉特A 罗森布拉特B HintonC 唐纳德·赫布D 沃尔特·皮茨22. B 单选在2012年的ImageNet竞赛中,深度学习将错误率控制在(0.15)左右。
人工智能知识竞赛题库及答案

全国大学生人工智能知识竞赛原题资料(满分版考试原题)大数据的价值重在挖掘,而挖掘就是分析(正确)3.机器人能与人对话,主要是用了人工智能中的(D )机器翻译自然语言处理多媒体技术语音识别5.工业机器人最早出现在日本。
(否)是否12.深度学习不是机器学习。
(否)是否15.机器人之父是指:(D )阿兰.图灵伯纳斯.李莎佩克英格伯格和德沃尔16.世界上第一个将芯片植入体内的人是(A)凯文·沃里克布鲁克斯罗斯·昆兰杰弗里·辛顿17.大数据仅仅是指数据的体量大。
(否)是否18.(B)被誉为信息论的创始人。
诺伯特·维纳克劳德·香农贝塔朗菲查尔斯·巴贝奇1.以下哪些不是人工智能概念的正确表述(D)人工智能是为了开发一类计算机使之能够完成通常由人类所能做的事人工智能是研究和构建在给定环境下表现良好的智能体程序人工智能是通过机器或软件展现的智能人工智能将其定义为人类智能体的研究3.不必使机器人动作,通过数值、语言等对机器人进行示教,机器人根据示教后的信息进行作业是数控型机器人。
(是)是否5.人工智能研究的先驱者认为人的智能主要表现在人能学习知识和运用知识上,知识是智能的基础。
于是学者们把专门的知识集、规则集和附加过程组成知识库,开发出许多专家系统(英文缩写为ES),在领域获得成功。
(是)是否7.(A)年,捷克剧作家Capek在他的《罗萨姆万能机器人公司》剧本中,第一次用了机器人Robot这个词。
192019591930194010.大数据会带来机器智能,提升计算机的智能程度,但它永远不会超过人类的智能。
(否)是否11.被称为“神经网络之父”和“人工智能教父”的是(A )。
辛顿赫布明斯基鲁梅尔哈特12.人工智能的发展历程可以划分为(B)。
诞生期和成长期形成期和发展期初期和中期初级阶段和高级阶段13.1943年,神经网络的开山之作《A logical calculus of ideas immanent in nervous activity》,由(A)和沃尔特.皮茨完成。
中国移动探索大数据与人工智能试题

口B. Oozie
口C. Hive
V D. Presto
2、Hive是不适合用于实时要求较高的应用场景,有哪些原因?
V A.计算速度慢
口B.延迟大
口C.计算速度快
口D.延迟低
1、下列选项中,正确描述Flume对数据源的支持的是?
OA.只能使用HDFS数据源
●B.可以配置数据源
O C.不能使用文件系统
(一)大数据基础
(二)人工智能
(三)大数据技术介绍
1、MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?
OA.数量越多处理时间越长
B.数量越多处理时间越短
OC.数星越小处理时间越短
0 D.没什么关系
2、下列选项中,不是kafka适合的应用场景是?
()A.日志收集
B.消息系统
1、数据真实性具备哪两种特质?
V A.准确性
口B.不确定性
口C.可信赖度
口D.杂乱性
2.电信行业的企业运营:理中。经营分析和市场监测中。我们可以通过数据分析对业务和市场经营状况进行总结和分析。主要分为哪些种类?
A日报
口B.周报
C月报
口0.专暨分析
1。EMC World是哪年在拉斯维加聯著名的威尼斯人店开畔的?
1.人工智能在交通领域,有利的点是?
口! A调整红蝟灯问隔
B.缩蛆车辆嚀待时间
V C提升通行率
V D:帮助交警处理事故
2.人工智能可以做到的事情有:
V A图片识别
B.语音识别
C自动解驶
M D.消费金融
1、下列选项中,都项是可以用于数据采集的技术?
A flume
口B.Hive
中国移动网络大学--《探索大数据和人工智能》习题库

论? A. 数据保密 B. 网络管制 C. 用户行为 D. 数据量
21
语音识别的技术框架阶段顺序是? A. 训练、编码、解码 、解码 C. 解码、训练、编码 D. 训练、解码、编码
B.
编码、训练
22
语音识别常用的应用有四个,下列不是常用应用的是? C. 导航 D. 设备控制
A.
聊天
B.
拨号
23
人工智能在处理视频内容时有着天然的优势,请问是哪些方面的天然优 势? A. 特征提取 B. 内容理解 C. 计算大小 D. 计算分辨率
56 Hadoop是()年诞生的? A. 2003 B. 2004 C. 2005 D. 2006
57
下列选项中,不是用于数据存储的技术是哪一个? C. HDFS D. Sqoop
A.
MongoDB
B.
MySQL
58
以下数据单位换算错误的是? 1TB=1000GB D. 1MB=1024KB
A.
1KB=1024B
中国移动网络大学--《探索大数据和人工智能》习题库
序
题目及选项
号
1
美国软件公司Splunk是第一家上市的大数据处理公司,它是在哪一年上市 的? A. 2009 B. 2011 C. 2012 D. 2010
2
下列选项中,哪些不是电信行业的市场与精准营销包含的方向? A. 客户 画像 B. 单一推荐 C. 精准营销 D. 实时营销
A.
多线程处理
B.
有关联的行处
14
MapReduce本质上只是个简单模型,使用起来很是繁琐,那么下列哪些技 术让MapReduce的使用简单化? A. YARN B. Oozie C. Hive D. Presto
探索大数据和人工智能考试题

一、小测验部分1、大数据基础100#目前电信运营商大数据发展仍处在什么阶段?答:探索¥EMC world是哪一年在拉斯维加斯注明的威尼斯人酒店开幕的?答:2011#下列选项中正确说明价值密度低的是?答:1TB数据中有1kb的有效数据#电信行业的网络管理和优化包含了两个部分的优化,下列选项中不在这两项优化之内的是?答:网络速度的优化,并发性的优化;下列选项中,不是用于数据存储的技术是哪一个?以下哪个属于大数据在电信行业的客户关系管理方面的应用?不是大数据特征的是价值密度高大数据在电信行业应用世界经济论坛以IBM提出的大数据5V特征包括()、更快()、更多、更值钱和更真实在非电信领域,大数据可被应用到的以下哪些方面以下应用使用了你的地理位置信息的是2、概述100IBM的深蓝在1997年的人工智能经过60多年的螺旋上升下列选项中,不是自然语言处理的解决方法BP神经网络模型拓扑结构不包括中国移动自主研发、发布的首个人工智能平台叫做下列选项属于人工智能的基本概念有人工智能技术的基础设施不包括哪两部分属于“”人造智能“,具有意识,达到或超越人类智慧水平的人工智能称为在智能投顾领域,人工智能可以目前主流研究仍然集中于弱人工智能3、大数据技术介绍100数据采集的基本流程下列选项中,哪项是分布式文件MPP是由许多松耦合的处理单元组成的在数据清洗的过程中MapReduce本质上只是个简单模型以下不是非结构化数据的项是?答:数据库表数据下列选项中,不是大数据的一部分的是?答:单机计算世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》,通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义?答:ABCD以下哪两个属于大数据特征?答:数据体量大、数据种类多二、人工智能真题部分下列选项中,不是人工智能的基础设施的是?答:专用显卡IBM的深蓝在1997年的决定胜负的第六个回合中,用了多少步迫使卡斯帕罗夫投子认输答:22监督学习的回归方法包括答:线性回归、逻辑回归、多项式回归人工智能可以做到的事情有:答:ABCDmapreduce计算模型适用于电信行业的客户关系管理中,客服中心优化最初的大数据概念还比较模糊,搜索引擎方面最大的厂商以下哪个场景可以称为大数据场景随着闭源软件在数据分析领域的地盘不断缩小今年,大数据分析将出现革命性的新方法,大数据智能分析的核心技术下列选项中,不是kafka适合的应用场景Spark的Client端,本地写好程序spark submit命令提交整个reduce的过程大致分为在FS中存在namemode DataNode client 管理者文件储存者正确是客户端下列选项中,不是大数据的一部分人工智能是研究、开发用于模拟、延伸和拓展英文缩写识别BP神经网络模型生成式对抗网络核心是对抗式互相竞争生成样本BP神经网络的学习规则人工智能60多年螺旋上升式发展主要是基于什么的在智能投顾领域,人工智能投资者在人工智能发展历程中低谷期最主要的原因人工智能在民用安防领域个性化差异化的服务安全感大数据的处理需要经过几个流程采用了三层架构水平扩展分别是kafak最主要有三个概念麦肯锡全球研究数据集合这些方面分别是的备份机制生成几份备份人工智能在哪些领域应用广泛电信行业的网络管理和优化下列选项中2010年12月,工信部信息处理技术重要组成技术电信行业的企业运营管理中数据分析对业务和市场经营状态以下数据量不能说成大数据--- by 蔡旭#电信行业的客户关系管理中,客户生命周期包括几个阶段?答:5#当前世界生产的数据总量的单位是?答:ZBHDFS适用于大数据多样化三种数据结构下列选项中不是HBASERDD是由多个以下哪两个属于大数据麦肯锡IBM提出的更快更多更值钱大数据来源于方方面面数据源互联网行业大数据技术商品推荐广告投放2011年5月全球知名咨询公司生产因素HDFS适用于哪些场景?答:存储和管理PB级别数据、一次写入,多次读取数据清洗的过程中,总共可以归为三个阶段,它们分别是?答:数据质量检查、数据校对、数据标准化以下哪个大数据电信行业数据商业化大数据应用到的行业自然语言处理难点下列选项中FlumeHBASE 特点spark 软件栈图计算那么下列哪些技术适合流处理RDD 说法正确。
《探索1 互联网应用与新技术》精品教案

问题导入:
不断涌现的新技术是互联网发展的动力源泉,为创新应用带来了无限可能。那么,目前正在影响着互联网发展的新技术有哪些呢?
学生听教师引导生活中的案例,学生讨论,回答提问。
体会互联网带来的创新、变革、潜力和机会,领会创新意识对国家发展的重大意义。
项目分析:
图谱是指系统地编辑起来的、根据实物描绘或摄制的图。运用数字化工具或在线学习平台,可以制作形式多样的图谱,有的还能形成知识图谐。制作数字化变革全景图谱可以让我们在梳理互联网技术创新的过程中,理解行业创新的时代意义,并进一步意识到思维创新的重要性。
数字孪生是源自工业界的概念,随着新一代信息技术的发展和广泛应用,数字孪生的应用范国不断扩大。数字孪生在产品设计、产品制造、医学分析、工程建设等领域应用较多。其中,工程建设是目前我国国内关注度最高、研究最热的智能制造领域。
利用物联网和人工智能可以设计新的智能应用。物联网是互联网的延伸与拓展,借助物联网可以实现“万物互联”:而人工智能技术经历几起几落之后,正处于一个新的发展期。人工智能与物联网的结合,使智能应用随处发生,使人工智能的应用场景随处可见。
1.学生能够理解云存储与云计算的基本概念,了解云服务的日常应用。
2.学生能够初步了解大数据的定义、特点及应用领域。
3.学生能够对智能技术有一定的认识,包括人工智能、机器学习等基本概念。
二、过程与方法:
1.通过案例分析、小组讨论等形式,引导学生主动探索、合作学习。
2.培养学生的信息搜集、整理与分析能力。
探索1 互联网应用与新科技
课题
2024最新国开电大《人工智能专题》形考任务1-3答案(西安)

专题一测验一、判断题1.战胜李世石的谷歌Alpha Go,是弱人工智能的典型代表。
判断题 (2 分)A.对B.错2.1965年,美国MIT人工智能实验室的Roberts编制了多面体识别程序,开创了计算机视觉的新领域。
判断题 (2 分)A.对B.错3.计算机不具有理性和逻辑思维。
判断题 (2 分)A.对B.错4.超级智能时代是机器智能与移动互联网的深度结合。
判断题 (2 分)A.对B.错5.在超级智能时代,人类需要学会适应机器。
判断题 (2 分)A.对B.错6.世界上第一台通用计算机"ENIAC"于1956年在美国宾夕法尼亚大学诞生。
判断题 (2 分)A.对B.错7.机器智能是人脑的延伸。
判断题 (2 分)A.对B.错8.强人工智能被认为是有自我意识的。
判断题 (2 分)A.对B.错9.弱人工智能具备自我思考、自我推理和解决问题的能力。
判断题 (2 分)A.对B.错10.智能agent是一个会感知环境并作出行动以达到目标的系统。
判断题 (2 分)A.对B.错11.图灵测试一词来源于艾伦·图灵发表于1956年的一篇论文《计算机器与智能》。
判断题 (2 分)A.对B.错12.谷歌为Alpha Go设计了两个关键的神经网络,其中策略网络选择下棋步法,价值网络评估棋盘位置。
判断题 (2 分)A.对B.错13.机器学习的目的是通过数据掌握事物的规律性。
判断题 (2 分)A.对B.错14.第一台电子计算机的设计目的是:在二战中计算长程火炮的弹道轨迹。
判断题 (2 分)A.对B.错15.首次通过图灵测试的人工智能软件是聊天程序尤金·古斯特曼”(Eugene Go ostman)。
判断题 (2 分)A.对B.错16.认知模拟是指使用心理学实验的结果开发模拟人类解决问题方法的程序。
判断题 (2 分)A.对B.错17.强人工智能观点认为有可能制造出真正推理和解决问题的智能机器。
《探索大数据与人工智能》题库

《探索大数据与人工智能》习题库一、单选题1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短 D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据 B. 非结构化数据 C. 半结构化数据 D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《探索大数据与人工智能》习题库一、单选题1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短 D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据 B. 非结构化数据 C. 半结构化数据 D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小;A.内存B. 硬盘C. 磁带D. 显卡29、下列选项中,哪项是分布式文件存储系统?A.HDFSB. FlumeC. KafkaD. Zookeeper30、工信部官网正式发布大数据产业”十三五“发展规划是在哪一年?A.1987B. 1997C.2007D. 201731、学习没有标签的数据集的机器学习方法是?A.监督学习B. 无监督学习C. 半监督学习D. 强化学习32、当前世界产生的数据总量的单位是?A.KBB. ZBC. GBD. TB33、下列选项中正确说明价值密度低的是?A.100TB数据中有50TB有效数据B. 1TB数据中有1KB有效数据C.100PB数据中有100PB有效数据D. 10EB数据中有10EB有效数据34、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。
A.精灵B. 阿尔法蛋C. 小度D. 移娃35、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。
A.AlphaGoB. 深蓝C. 图灵机模型D. 深度学习机器人36、在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢?A.连接器B. 客户端C. 接口提供者D. 数据采集37、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D. 实时数据变化处理38、大数据特征有几种(不包括IBM提出的新特征)?A.1B.2C.3D.439、Hadoop是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201640、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A.精准广告B.网络管理C.营销洞察D.大数据检测和决策41、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归42、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式43、IBM提出的大数据5V特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)A.更有效B.更大(Volume)C.更充分D.更直观44、下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析D.单机计算45、Flume采用了三层架构,分别为agent,collector和()A.MapB.storageC.ShuffleD.Hash46、HBASE的特点不包括?A.面向列B.稀疏性C.多版本D.低可靠性47、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D.实时数据变化处理48、最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商? A.谷歌 B. 百度 C. 360 D. bing49、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。
而哪项技术将继续成为大数据智能分析的核心技术?A.机器学习B. 智能物流C. 脑科学D. 智能终端50、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B. 可以配置数据源C. 不能使用文件系统D. 不能使用目录方式51、HBASE的特点不包括哪些?A.面向行B. 稀疏性C. 多版本D. 高可靠性52、下列选项中,不是用于数据存储的技术是哪一个?A.MongoDBB. MySQLC. HDFSD. Java53、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工智能称为()A. 高人工智能B. 低人工智能C. 强人工智能D. 弱人工智能54、下列选项中,不是人工智能的基础设施的是?A. CPU服务器B. GPU服务器C. 专用芯片D. 游戏显卡54、以下不是大数据特征的是?A.数据体量大B. 数据种类多C. 价值密度高D. 处理速度快55、以下应用没有使用你的地理位置信息的是?A.美团B. 滴滴C. 高德地图D. word56、下列选项中,不是Flume的特点的是?A. 可靠性B. 集中式架构C. 可扩展性D. 可管理性57、在Spark的软件栈中,用于交互式查询的是A.SparkSQLB. MllibC. GraphXD. Spark Streaming58、下列选项中,不是大数据的一部分的是?A.海量计算B. 大量数据管理C. 数据分析 D单机计算59、人工智能、机器学习、深度学习的包含关系是()A.机器学习>深度学习>人工智能B. 人工智能>深度学习>机器学习C.人工智能>机器学习>深度学习D. 深度学习>人工智能>机器学习60、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A. 机器性能B. 语言歧义性C. 知识依赖D. 语境61、BP神经网络模型拓扑结构不包括A.输入层B. 隐层C. 输出层D. 显层62、以下哪个不是语音识别的范畴?A.语音听写B. 语音合成C. 语音转写D. 语音唤醒63、Alpha Go是第一个击败人类职业()选手的人工智能程序。
A. 国际象棋B. 围棋C. 中国象棋D. 五子棋64、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B. 开源C. 独立D. 封闭65、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。
A. 海量B. 少数C. 小量D. 结构化66、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume67、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。