探索大数据与人工智能习题库
探索大数据和人工智能题库

序号题型试题参考答案1单选以下哪个属于大数据在电信行业的数据商业化方面的应用?A. 精准广告B. 网络管理C. 网络优化D. 客服中心优化A2单选IBM提出的大数据5V特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)。
A, 更有效B. 更大(Volume)C. 更充分D. 更直观B3单选下列选项中能够正确说明大数据价值密度低的是()?A. 100TB数据中有50TB有效数据B. 1TB数据中有1KB有效数据C. 100PB数据中有100PB有效数据B4多选电信行业的网络管理和优化包含了两部分的优化,这两项优化是下列选项中的哪两个?A. 网络速度的优化B. 基础设施建设的优化C. 网络运营管理和优化D. 并发性的优化BC5多选世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》,通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义?A. 推动经济发展B. 改善公共服务C. 增进人民福祉ABCD6单选中国移动自主研发、发布的首个人工智能平台叫做()A. 九天B. OneNETC. 移娃A7单选自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A. 机器性能B. 语言歧义性C. 知识依赖D. 语境A8单选Alpha Go是第一个击败人类职业()选手的人工智能程序。
A. 国际象棋B. 围棋C. 中国象棋D. 五子棋B9多选人工智能目前在以下哪三个领域有了长足的发展?A. 健康B. 教育C. 探索太空ABD10多选人工智能关键技术的基础设施中包含下面哪两项?A. 算法框架B. 基础硬件C. 人员AB11单选下列选项中,不是kafka适合的应用场景是?A. 日志收集B. 消息系统C. 业务系统D. 流式处理C12单选下列选项中,不是Flume的特点的是?A. 可靠性B. 集中式架构C. 可扩展性D. 可管理性B13单选MPP是指?A. 大规模并行处理系统B. 受限的分布式计算模型C. 集群计算资源管理框架D. 分布式计算编程框架A14多选下列选项中,哪两项是可以用于数据采集的技术?A. FlumeB. HiveC. KafkaAC15多选HBASE的应用场景有哪些?A. 半结构化或非结构化数据B. 记录非常稀疏C. 结构化数据D. 超大数据量ABD16单选mapreduce计算模型适用于哪种任务?A. 多线程处理B. 有关联的行处理C. 批处理D. 实时数据变化处理C17单选以下不是大数据特征的是()?A. 数据体量大B. 数据种类多C. 价值密度高D. 处理速度快C18单选最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A. 谷歌B. 百度C. 360A19单选大数据的数据来源于方方面面,下列不可以作为数据源的是?A. APP应用B. 地理信息C. 一块石头D. 商店订单C20单选2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
中国移动网络大学全员5G+通用知识《探索大数据与人工智能》题库答案

中国移动网络大学全员5G+通用知识《探索大数据与人工智能》题库答案一、单选题1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A. 数量越多处理时间越长B. 数量越多处理时间越短C. 数量越小处理时间越短D. 没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
《探索大数据与人工智能》习试题库完整

《探索大数据与人工智能》习题库单选1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、20xx5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、20xx7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立<>一职,负责全面推进"数据分享平台"战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是? A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做<>A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、<>?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术与应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.T orch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
大数据与人工智能考试题

大数据与人工智能考试题一、判断题1.在用智能工具解决问题时,除了使用智能平台上已经设计好的智能工具以外,还可以编程自主开发,这样可以提高智能工具的灵活性。
例如,通过Python语言调用人工智能工具库可以较方便地开发智能工具。
[判断题] *对(正确答案)错2.从互联网产生大数据的角度来看,大数据具有的特征是“4V”特征:大量、多样、高价值密度、低速。
[判断题] *对错(正确答案)3.网络数据采集法主要通过网络爬虫或网站公开API的方式获取网络爬虫,从网页的URL开始获取。
[判断题] *对(正确答案)错4.数据采集的基本方法包括系统日志采集、网络数据采集等方法。
[判断题] *对(正确答案)错5.数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征。
[判断题] *对(正确答案)错6.K-平均算法属于聚类分析方法。
[判断题] *对(正确答案)错7.可以用于分析数据趋势的可视化呈现类型包括折线图、分组柱形图、堆叠柱形图和柱线混合图等。
[判断题] *对(正确答案)错8. 2016年阿尔法围棋程序(AlphaGo)在与围棋世界冠军李世石进行的围棋人机博弈中以4:1的总比分获胜,这是人工智能发展史上一个新的里程碑。
AlphaGo主要采用了人工智能研究须域中的深度学习技术。
[判断题] *对(正确答案)错9 停车场车牌识别系统能将车牌从复杂背景中识别出来,通过车牌提取、图像预处理、特征狸取、车牌字符识别等技术,识别车辆牌号、颜色等信息。
该系统属于典型的数据库应用系统,不涉及人工智能技术。
[判断题] *对错(正确答案)10. 由于学校计算机教室的服务器硬盘损坏,导致学生微电影作品丢失。
该案例中的数据安全威胁属于个人失误。
[判断题] *对错(正确答案)二、填空题1.小明家里有一个智能的小音箱,就像是个贴心的“小管家”,有什么需求告诉它就行了,例如:想看电视了,对小音箱说:“打开电视机并调到新闻频道”;上学出门时,对它说:“我去上学了”,家里所有的灯、空调就会关闭,扫地机则自己开始工作:晚上睡前,跟小音箱说一声“晚安”,家里的灯就会关掉,空调自动设置成睡眠模式。
人工智能题库(附答案)

人工智能题库(附答案)一、单选题(共103题,每题1分,共103分)1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?A、自然语言处理B、分类C、聚类D、关联规则发现正确答案:D2.预测分析过程包括:数据的准备、预测模型开发、模型验收和评估、使用PMML实现大数据预测的有效部署。
()是指对数据的采集和整理A、预测模型开发B、评估C、模型验收D、数据的准备正确答案:D3.Google与Facebook分别提出SimCLR与MoCo两个算法,实现在()上学习图像数据表征。
两个算法背后的框架都是对比学习(contrastivelearning)A、标注数据B、无标注数据C、二维数据D、图像数据正确答案:B4.()是一种模拟人类专家解决领域问题的计算机程序系统。
A、进化算法B、专家系统C、遗传算法D、禁忌搜索正确答案:B5.()的输入为对弈的线路或历史记录,而其输出为目标函数的一系列训练样本。
A、实验生成器B、泛化器C、执行器D、评价器正确答案:D6.话题模型中的几个概念不含有?(___)A、话题B、句C、词D、文档正确答案:B7.主成分分析是一种数据降维和去除相关性的方法,它通过()将向量投影到低维空间。
A、非线性变换B、拉布拉斯变换C、z变换D、线性变换正确答案:D8.查看 Atlas300 (3000)加速卡驱动是否安装成功应该使用哪条命令?A、npusim infoB、npu infoC、atlas-Driver infoD、atlas info正确答案:A9.根据机器智能水平由低到高,正确的是()A、计算智能、感知智能、认知智能B、机器智能、感应智能、认知智能C、机器智能、感知智能、认知智能D、计算智能、感应智能、认知智能正确答案:A10.Python中有这样一个示例:types=['娱乐','体育','科技'],在使用列表时,以下哪个选项,会引起索引错误A、types[0]B、types[-1]C、types[-2]D、types[3]正确答案:D11.剪枝分为前剪枝和后剪枝,前剪枝本质就是早停止,后剪枝通常是通过衡量剪枝后()变化来决定是否剪枝。
人工智能习题库与参考答案

人工智能习题库与参考答案一、多选题(共100题,每题1分,共100分)1.字典a={'k1':'v1','k2':'v2','k3':'v3'},执行完a.setdefault('k1','v99')语句后,a的值为();执行完a.setdefault('k4','v4')语句后,a的值为()。
A、{'k1':'v4','k2':'v4','k3':'v4'}B、{'k1': 'v99', 'k2': 'v2', 'k3': 'v3'}C、{'k1': 'v1', 'k2': 'v2', 'k3': 'v3', 'k4': 'v4'}D、{'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}正确答案:CD2.公司级人工智能平台应集成()、()、()、模型管理、模型验证、基础模型服务及部分实时性要求不高的业务模型服务模块A、样本管理B、数据训练C、语音识别D、推理计算正确答案:ABD3.基因遗传算法的组成部分包括()。
A、初始化编码B、交叉和变异C、适应度函数D、选择正确答案:ABCD4.为加强人工智能领域标准化顶层设计,推动人工智能产业技术研发和标准制定,促进产业健康可持续发展,国家标准化管理委员会、中央网信办、国家发展改革委、()等部门近日联合印发《国家新一代人工智能标准体系建设指南》A、教育部B、科技部C、商务部D、工业和信息化部正确答案:BD5.机器学习的要素有哪些?A、泛化能力B、样本空间划分C、一致性假设正确答案:ABC6.关于OLAP和OLTP的区别描述,正确的是?A、OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同B、与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.C、OLAP的特点在于事务量大,但事务内容比较简单且重复率高.D、OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的.正确答案:ABD7.常用的数据归约方法有()。
大数据与人工智能试卷 带答案

大数据与人工智能试卷带答案1、当前大数据技术的基础是由(C)首先提出的。
A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C )。
A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、数据清洗的方法不包括(D)。
A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理5、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。
A:统计报表B:网络爬虫C:API接口D:传感器6、智慧城市的构建,不包含(C)。
A:数字城市B:物联网C:联网监控D:云计算7、大数据的最显著特征是(A)。
A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高8、Mac OS系统的开发者是(C )。
(A:微软公司B:惠普公司C:苹果公司D:IBM公司9、大数据时代,数据使用的关键是(D)。
A:数据收集B:数据存储C:数据分析D:数据再利用10、基础设施即服务的英文简称是(A)A、IaaSB、PaaSC、SaaS二、填空题(本大题共10小题,每题2分,共20分)1、语⾳识别是指识别语⾳(说出的语⾳)并将其转换成对应⾳本的技术。
2、机器翻译(MT)是利⾳机器的⾳量⾳动将⾳种⾳然语⾳(源语⾳)的⾳本翻译成另⾳种语⾳(⾳标语⾳)。
3、机器⾳学(Robotics)研究的是机器⾳的设计、制造、运作和应⾳,以及控制它们的计算机系统、传感反馈和信息处理。
4、机器学习是从数据中⾳动分析获得模型,并利⾳模型对未知数据进⾳预测。
5、数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。
6、元数据被定义为:描述数据的数据,对数据及信息资源的描述性信息。
7、数据的存储是借助存储工具或者媒介,对数据进行永久性存储。
8、关系型数据库,是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,以便于用户理解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。
人工智能习题库含参考答案

人工智能习题库含参考答案一、单选题(共103题,每题1分,共103分)1.表达式 3 and not 5 的值为_______。
A、FALSEB、3C、TRUED、$2正确答案:A2.预测分析过程包括:数据的准备、预测模型开发、模型验收和评估、使用PMML实现大数据预测的有效部署。
()是指对数据的采集和整理A、评估B、预测模型开发C、模型验收D、数据的准备正确答案:D3.关于级联相关网络描述错误的是(___)A、属于结构自适应网络,网络结构也是其优化目标;B、主要成分为级联、相关、归约;C、无需设置网络层数、隐层神经元数目;D、训练速度快,但数据较小时容易陷入过拟合;正确答案:B4.下面()不是有效的变量名。
A、NumbrB、my-scoreC、bananaD、_demo正确答案:B5.下面关于随机森林和集成学习的说法,正确的是()A、随机森林只能用于解决分类问题B、集成学习通过构建多个模型,并将各个模型的结果使用求平均数的方法集成起来,作为最终的预测结果,提高分类问题的准确率C、随机森林由随机数量的决策树组成D、随机森林的弱分类器(基分类器)的特征选择不是随机的正确答案:B6.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题()A、关联规则发现B、自然语言处理C、分类D、聚类正确答案:A7.批规范化(Batch Normalization)的好处都有啥?A、让每一层的输入的范围都大致固定B、它将权重的归一化平均值和标准差C、它是一种非常有效的反向传播(BP)方法D、这些均不是正确答案:A8.C(B|A) 表示在规则A->B中,证据A为真的作用下结论B为真的A、可信度B、信度C、信任增长度D、概率正确答案:B9.以下()的说法是正确。
A、术语NoSQL是“No!SQL”的缩写B、术语NoSQL可以理解为“NotOnlySQL”的缩写C、NoSQL数据库始终遵循ACID原则D、NoSQL数据库属于关系数据库技术正确答案:B10.关于贝叶斯网的学习描述错误的为(___)A、网络结构为已知;B、贝叶斯的学习过程为对训练样本计数;C、评分搜索为求解的常用办法;D、估计出每个结点的条件概率;正确答案:A11.下面算法中哪个不是回归算法A、岭回归B、随机森林C、线性回归D、逻辑回归正确答案:D12.TensorFlow程序开发时经常会使用到placeholder,placeholder是指?A、张量B、常量C、占位符D、变量正确答案:C13.考虑某个具体问题时,你可能只有少量数据来解决这个问题。
中国移动探索大数据与人工智能试题

中国移动探索大数据与人工智能试题嘿,伙计们!今天我们要聊聊一个非常热门的话题——大数据与人工智能。
你们知道吗?这两者可是当今科技界的两大宠儿,它们的力量可是无穷无尽哦!让我们一起来揭开它们神秘的面纱吧!让我们来聊聊大数据。
大数据,顾名思义,就是指那些量大、种类繁多的数据。
这些数据就像是一座座金矿,等待着我们去挖掘。
而人工智能,就像是一位聪明绝顶的矿工,它可以帮助我们从这些金矿中提炼出宝贵的财富。
大数据和人工智能究竟是如何相互配合的呢?其实,它们之间的关系就像是一对默契的搭档。
大数据就像是原材料,而人工智能则是加工这些原材料的工具。
在大数据的基础上,人工智能可以通过各种算法和模型,为我们提供各种各样的解决方案。
比如说,我们可以通过大数据分析出某个地区的人口密度、消费水平等信息,然后利用人工智能技术,为这个地区的商家提供更加精准的广告投放策略。
这样一来,商家就可以更加有效地吸引顾客,提高销售额了。
大数据和人工智能的结合并不仅仅局限于商业领域。
在医疗、教育、交通等各个方面,它们都有着广泛的应用前景。
比如说,在医疗领域,大数据可以帮助医生分析患者的病历、基因等信息,从而为患者提供更加个性化的治疗方案。
而人工智能则可以通过模拟人类的思维过程,帮助医生更快地做出判断。
这样一来,患者就可以得到更加精准的治疗,提高了治愈率。
不过,大数据和人工智能的发展也面临着一些挑战。
随着数据的不断积累,如何保证数据的安全和隐私成为了一个亟待解决的问题。
人工智能虽然可以帮助我们解决很多问题,但它毕竟还是一种工具,它的决策并不总是完全正确的。
因此,在使用人工智能的时候,我们还需要保持谨慎的态度。
大数据和人工智能作为当今科技领域的两大宠儿,它们的发展前景是非常广阔的。
只要我们善于利用它们的力量,相信未来一定会有更多的惊喜等待着我们。
今天的分享就到这里啦!希望大家能够从中受益匪浅,也期待大家在未来的日子里,能够见证大数据和人工智能带来的更多奇迹!再见啦!。
中国移动探索大数据与人工智能试题

中国移动探索⼤数据与⼈⼯智能试题(⼀)⼤数据基础1、⽝數捋特征育5(不包括】E IV 提出的新持紅)? O A . 1 O B ,? o C. 3D. 42、吕前电⾔运营筍⼤数握发展仍辻在什么阶啟?@ A. 索 0 E ,应⽤O C 咸懸O D 扩展头下列选项中,不是⼤数堯出⼀部廿皓是?■ A.海昼.⼗隽 ''C.1啡真实性真备邸丙序贯?A.准确性Q c 可信赖度2.电?M 的拴业运三它理⼬⼖⼠」U 于⽐⼝⼆凭I ⼯划盼PiT :川⽦.咗='⼟巳⼆Li 吒札:苗「主5盼为輕L wocti ■寵⼀⼲託扭:昕ism 序吾名的园⼝斯⼈陶开isenFO 此O G 2DI2運 1 3. 2011C' D. ?DI0⽐北苍1豚:5⼩也5?⼨护锁磁克出和床叽在埠H ⼚却正注的?吭.⽹⽯⼚⼳总⽐?O C-⾎ O D 封邇□ B.不确左性 Z 0粗性k E 咅识*沪品保廡奇⼝郭分,下列伏曲盛之⼀7 O A.涪吉台瑜 O C.曲酣别@ B.佬备砖 ? J D.恒义理餐2、IBM 的深适左1997毎曲決定>5%旷為六个回合G,弔了⾟少步启快卡斷餐<歩天⾈⼦认?O A 15 @ B ? 22 O C. 30 O D ? 282. mapreduu 计854兰⽤于挪K 無? O A 券眈处理 @ C.农理 3 SparkS^CIIentS.在$堆写好spar 媲丰M 進过spark submit 命刽g 交⾄什么地⽅也⾏?O A. HDFS@ a s“y C B. HBASE O D ? Zookeeper 1、養国软件公司Splunk 是第⼀家上市的⼊数据处理公司,它罡在啷⼀年上您的? O A. 2009 o B- 2011 O D ? 2010@ C. 2012、以"FF是⼤敎花是?O A. 1 O B. 3@ C. 5 O D. 73、电信⾏业的客户关系管理中f肓户⽣命周期管理包括⼏个阶段?1. ⽉?世畀俎齐论以■⼈~⼼怡任)贱念与刃仝⼟4⼱了 g球苗曲怜C ?13?: >??在"⼏?冲刑⼔岀的⾃0遇信找仙BL*?5^Z?Hn.±5.丙3下审椰曲甌颐幵唄覆⼑谄?Q A.昨沁Q B. ?<8wej□ c?⽤户⾏为□ D.数有⾄2、嗤肄乔论坛UTK?瘦矩冬三砸-妾冇"全孩頸加渕⾆⾫1圾)》尼过龙古各⾢師珈越夭蜒$1些⽅乖莖X? 义?Q A. Q 3.改竺吨Q c砂冲吐Q D?恥匪安全I ⼼廖够三王魅I三:禎W匏辭、施.传胡坯為按博穌尿為引虾,外似I琵冬⼆W芜游酣,⼈朴振、聲F奇涓主雒郴F⿃當H3Z峯茫1題刊t妙?A.盘舐0 B?轴率0 csw影0 D? AST52、下列选顶中.不是⽬空i吾⾔处理的解决⽅法的呈?O A.规则⽅法? C週归⽅法O B.统H⽅法O D?深度字号⽅法3、IBM的深蓝在1997年的决定胜负的第六个回合中r⽤了多少步迫使卡斯怕罗夫投⼦认输O A. 15 ? B 22 O C. 30 O D. 281、在晋謝⽎颐領域r⼈⼯彗能可以结台按费告的?E些⽅⾯进^运算?A.财务状况SB.风险侯好C.芟财吕标□D.⾝体状况2,⼔前主许曲記5你異亡⾍苗⼈⼯書能发艇阶段,曲眩在⼘列葺些万tWY寻显善进于/A.進⾳⾅!|B.圉像上理U拧索太空D*叽器駐译2. a^Nd$QliH££S . £MttAMMS .更骄了电対SQUMO讹”⽽⽬科霑■^團■倒6迈.⽤切曲⾋帘r Prerto r DrtllE^T (岂植柯⽆皐:卒碎尬晅Wig "就不⼀⼀列¥7■: ,M那只丽*哼IHK*釧孚"忖<(?制和R+fJucHl=7Tffiqfj FQ A 丸it11!3%语⾳识别常⽒的壹⽤有四个?下列不杲當冃应庄芒罡?O c.导航1 、下列知t中,⽌⼯替⽼壬)基础字零有7c, BPmeas(⼆)⼈⼯智能1.下列谨頊中,不是⼈⼯昔能的基⾯设葩的是?A⼕咖务器 b GPU服务器C.专尽芯⽚i?D.专胃显悵2.总曲祚咗刁弟上更习于匿燦辻是存正⽍昌耙i⼯总£三⼘⾍它电鎏⽯兰.看EP⽍囲中.狰林屋三种堵构IB?B之⼀?■- c.蚩睾样>i D.令逍M ⼈⼯替能在更疗键辭域应⽤⼴泛,下列不是主妄应⽤圾录养是?O 4虚拟耻理O氐医芋影傑◎C圭⼑机昶O D,宫葬学1.巨前主流哥克仍然集中升昌⼈⼯替蚩⾐展航彦,那么在下列啣些⽅⾯取律昱苜谨歩?E.图像C挥索太空2 监膏学习的回⽈⽅注崗⾆:⼝A炭性回归B c券项武回归Q B.进辑回归D.单⼀回归(三)⼤数据技术介绍1.下列造项中,郡项是疔朽式⽂件存储磁?@ A- HDFS O E Flume'_ " C, Kafka O D. Zookeeper2. uidp educell算慎型运円于鄆种任务?()X塞线程上理C.批则< ROD是⽩多个什么俎成/|:电)A. palition B. computer C* Action D. T r ansfornnatio31. MapReduce⼼质上兵呈个港单悽型.便⽤起集很昱筆坡?那么下列珈些技相tMapReduce的便⽤简单化?X YARN B. OozieQ C? Hive Q D. Presto2、Hive是不适台⽤于卖时要求较⾼的应⽤场黒?有舜些原因?□ A.计莫速度慢Q B.C.计其速⽪快D.淞低1、下列歴项中r正瀚描it Flume刃谿S芳的⽀陆是?O A.只能佼⽤HDFS坯斷O c不就烦⽂昨琢@) B.可以配季据溥O D?不輙⽤⽬2. Spark是在i專⼀年开诗的?0 A. 2011 (§) B? 2010 0 c 2009 O D? 20123、Spark Streaming是什么钦件栈中的流计算?'?) A. Spark O C. Hadoop O B. Storm O D? Rume1、HDFS在骑箜场旦中表現识堂?2 ⽦后?予..mGiYr谆中丰坊监?忡.我们可以盘⼖敷病分帀?⾍島垃芍空汨厅少祢今析丈匪分先龛申*?□A.⼝R 恶Q C. A)& □ D.专逻分祈Q B.?Kgiis^^nT□ D.⽹⼔交咨P理爭核⼆1. 今年.枷盼桁務岀现⽦給住的新⽅法?从处液多d占(理E埋论込喘会产⽣理论駆!的姬商炉刘$5唤£为刘畑⼖咖忻如⼼按 *? @)A.机砂习O 吐AI??O G KM*7 O 0.習他■2、⽵郁现.利⽤⼤昨优化了什么.从停到柠⾼了枷私古,K?低徇魔6E本的⽬的7O⼈授⽊应⽤@B.擁蚀aO c. 车O D? wrss^3、下列选项中正确说明价砖质低的是7久100万数头{中肖50万肖效斑;1000万字憨拇中⾃100万⾃O D?10万仪敛35中化1万<5x5?2JS3MB. lTEJS头;中有1KB⾃。
探索大数据和人工智能最全试题

探索大数据和人工智能最全试题1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A首席数据官B.首席科学家C.首席执行官D.首席架构师2、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A. ReduceB.HashC. CleanD. Loading3、在Spak的软件栈中,用于交互式查询的是A. SparkSQLB.MllibC.GraphXD. Spark Streaming4、在数据量一定的情况下, MapReduce是一个线性可扩展模型,请问服务器数量与处( )理时间是什么关系?A数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系5、下列选项中,不是kafka适合的应用场景是?A.日志收集B.消息系统C.业务系统D.流式处理6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是A.结构化数据B.非结构化数据C.半结构化数据D.全结构化数据7、下列选项中,不是人工智能的算法中的学习方法的是?A.重复学习B.深度学习C.迁移学习D.对抗学习8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A.机器性能B.语言歧义性C.知识依赖D.语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归10、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC.移娃D.大云11、HDFS中Namenodef的Metadata的作用是?A.描述数据的存储位置等属性B.存储数据C.调度数据D.12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么技术实现的?A大数据技术B.互联网技术C.游戏技术D.影像技术13、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B.开源C.独立D.封闭14、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D.视频15、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC.1TB=1000GBD. 1MB=1024KB16、下列选项中,不是Flume的特点的是?A.可靠性B.集中式架构C.可扩展性D.可管理性17、BP神经网络模型拓扑结构不包括A.输入层B.隐层C.翰出层D.显层18、以下哪个不是语音识别的范畴?A.语音听写B.语音台成C.语音转写D.语音唤醒19、以下哪个场景可以称为大数据场景?A.故宫游客人B.故宫门票收入C.美团APP的定位信息D.文章内容20、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯21、下列选项中,哪项是分布式文件存储系统?A.HDFSB. FlumeC. KafkaD. Zookeeper22、下列选项中,正确描述Flume对数据源的支持的是A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式23、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表24、下列选项中,不是人工智能的算法中的学习方法的是A.重复学习B.深度学习C.迁移学习D.对抗学习25、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解26、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论級别的突破。
人工智能、云计算、大数据知识考试题库

人工智能、云计算、大数据知识考试题库
1. 人工智能的定义是什么?
2. 人工智能的应用领域有哪些?
3. 机器学习和深度学习有何区别?
4. 请解释一下监督学习和无监督学习的概念。
5. 云计算是什么?它的优势和应用场景是什么?
6. 请比较私有云、公有云和混合云的特点和适用场景。
7. 大数据的定义是什么?
8. 大数据有什么特点和挑战?
9. 请解释一下数据挖掘的概念和作用。
10. 请描述一下大数据分析的流程。
11. 人工智能如何与云计算和大数据相结合?
12. 请列举一些人工智能、云计算和大数据在实际应用中的案例。
13. 人工智能、云计算和大数据在未来的发展趋势是什么?
14. 人工智能和大数据在个人隐私保护方面可能产生的问题有哪些?如何应对这些问题?
15. 请解释一下自然语言处理和计算机视觉在人工智能中的作用。
16. 请描述一下人工智能在医疗领域的应用。
17. 请解释一下物联网与人工智能的关系。
18. 请解释一下区块链与人工智能的关系。
19. 请描述一下人工智能对传统行业的影响和变革。
20. 请谈谈你对人工智能、云计算和大数据的发展前景的看法。
中国移动探索大数据与人工智能试题

口B. Oozie
口C. Hive
V D. Presto
2、Hive是不适合用于实时要求较高的应用场景,有哪些原因?
V A.计算速度慢
口B.延迟大
口C.计算速度快
口D.延迟低
1、下列选项中,正确描述Flume对数据源的支持的是?
OA.只能使用HDFS数据源
●B.可以配置数据源
O C.不能使用文件系统
(一)大数据基础
(二)人工智能
(三)大数据技术介绍
1、MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?
OA.数量越多处理时间越长
B.数量越多处理时间越短
OC.数星越小处理时间越短
0 D.没什么关系
2、下列选项中,不是kafka适合的应用场景是?
()A.日志收集
B.消息系统
1、数据真实性具备哪两种特质?
V A.准确性
口B.不确定性
口C.可信赖度
口D.杂乱性
2.电信行业的企业运营:理中。经营分析和市场监测中。我们可以通过数据分析对业务和市场经营状况进行总结和分析。主要分为哪些种类?
A日报
口B.周报
C月报
口0.专暨分析
1。EMC World是哪年在拉斯维加聯著名的威尼斯人店开畔的?
1.人工智能在交通领域,有利的点是?
口! A调整红蝟灯问隔
B.缩蛆车辆嚀待时间
V C提升通行率
V D:帮助交警处理事故
2.人工智能可以做到的事情有:
V A图片识别
B.语音识别
C自动解驶
M D.消费金融
1、下列选项中,都项是可以用于数据采集的技术?
A flume
口B.Hive
中国移动网络大学--《探索大数据和人工智能》习题库

论? A. 数据保密 B. 网络管制 C. 用户行为 D. 数据量
21
语音识别的技术框架阶段顺序是? A. 训练、编码、解码 、解码 C. 解码、训练、编码 D. 训练、解码、编码
B.
编码、训练
22
语音识别常用的应用有四个,下列不是常用应用的是? C. 导航 D. 设备控制
A.
聊天
B.
拨号
23
人工智能在处理视频内容时有着天然的优势,请问是哪些方面的天然优 势? A. 特征提取 B. 内容理解 C. 计算大小 D. 计算分辨率
56 Hadoop是()年诞生的? A. 2003 B. 2004 C. 2005 D. 2006
57
下列选项中,不是用于数据存储的技术是哪一个? C. HDFS D. Sqoop
A.
MongoDB
B.
MySQL
58
以下数据单位换算错误的是? 1TB=1000GB D. 1MB=1024KB
A.
1KB=1024B
中国移动网络大学--《探索大数据和人工智能》习题库
序
题目及选项
号
1
美国软件公司Splunk是第一家上市的大数据处理公司,它是在哪一年上市 的? A. 2009 B. 2011 C. 2012 D. 2010
2
下列选项中,哪些不是电信行业的市场与精准营销包含的方向? A. 客户 画像 B. 单一推荐 C. 精准营销 D. 实时营销
A.
多线程处理
B.
有关联的行处
14
MapReduce本质上只是个简单模型,使用起来很是繁琐,那么下列哪些技 术让MapReduce的使用简单化? A. YARN B. Oozie C. Hive D. Presto
大数据与人工智能应用考核试卷

B. MongoDB
C. Cassandra
D. Redis
12.以下哪个不是人工智能在医疗领域的应用?()
A.疾病诊断
B.基因测序
C.药物研发
D.网络安全
13.以下哪个不是机器学习中的一种常见优化算法?()
A.梯度下降
B.牛顿法
C.网格搜索
D.神经网络
14.在人工智能领域,以下哪个概念指的是赋予机器学习历史数据的能力?()
A.强化学习
B.深度学习
C.迁移学习
D.集成学习
15.以下哪个不是人工智能的一种学习方法?()
A.监督学习
B.无监督学习
C.半监督学习
D.数据挖掘
16.在大数据分析中,以下哪个概念指的是从不同数据源整合和统一数据的过程?()
A.数据集成
B.数据清洗
C.数据转换
D.数据聚合
17.以下哪个不是大数据分析中的数据可视化工具?()
2.人工智能是模拟人类智能行为的技术。机器学习是基于数据的学习,深度学习是使用深层神经网络的学习,强化学习是学习如何在环境中做出决策以获得最大回报。
3.数据分析包括数据收集、清洗、探索、建模和评估。数据预处理是关键,因为它决定了数据质量,进而影响模型效果。
4.保护数据隐私的策略包括数据加密、匿名化、访问控制等。挑战包括数据量庞大、技术快速发展、法律法规滞后等。
2.人工智能的发展主要依赖于算法的进步,硬件的提升对其发展没有直接影响。()
3.在机器学习中,无监督学习不需要使用标注的训练数据。()
4.数据挖掘和数据仓库是同一种技术。()
5.深度学习中的神经网络通常需要大量的训练数据才能获得较好的性能。()
数据库与人工智能、机器学习结合考试

数据库与人工智能、机器学习结合考试(答案见尾页)一、选择题1. 数据库与人工智能结合的主要方式有哪些?A. 利用AI技术优化数据库性能B. 使用AI进行数据挖掘和预测分析C. 利用机器学习算法改进数据库管理系统D. 结合深度学习技术处理复杂的数据查询2. 在数据库中,人工智能和机器学习可以用来提高哪些方面的效率?A. 数据存储和检索B. 数据分析C. 数据库优化D. 数据安全3. 以下哪个选项是关于数据库与人工智能结合的一个实际应用场景?A. 智能客服系统,通过自然语言处理(NLP)和机器学习技术回答用户问题B. 自动化数据迁移,利用机器学习算法优化数据转换过程C. 智能交通系统,通过分析传感器数据预测交通流量和拥堵情况D. 以上都是4. 在数据库管理中,人工智能和机器学习可以用来解决哪种类型的数据质量问题?A. 数据不一致性B. 数据缺失C. 数据冗余D. 数据格式转换5. 以下哪个选项是关于数据库与人工智能结合的一个技术挑战?A. 如何处理大规模数据集B. 如何确保数据隐私和安全C. 如何实现高效的算法部署D. 如何选择合适的AI框架和工具6. 在数据库系统中,人工智能和机器学习可以用来自动化哪些日常任务?A. 数据备份和恢复B. 数据审查和监控C. 报表生成和可视化D. 以上都是7. 数据库与人工智能结合的发展趋势是什么?A. 更多的AI技术被引入数据库领域B. 数据库变得更加智能化和自适应C. 数据库管理变得更加简单和自动化D. 以上都是8. 在数据库中,机器学习可以用来预测和优化哪些业务流程?A. 供应链管理B. 客户关系管理C. 金融风险评估D. 以上都是9. 数据库与人工智能结合后,可能带来的法律和伦理问题包括:A. 数据隐私和安全问题B. 算法偏见和歧视问题C. 对传统数据库技术的冲击D. 以上都是10. 在未来的数据库技术中,人工智能和机器学习将如何改变数据库的基本架构和功能?A. 数据库将变得更加分布式和横向扩展B. 数据库将变得更加智能化和自适应,能够自动学习和优化C. 数据库将变得更加简单和易用,降低技术门槛D. 数据库将更加关注数据质量和准确性11. 在数据库中,人工智能和机器学习可以用来提高哪些方面的查询效率?A. 数据索引优化B. 查询结果的排序和分组C. 数据库表的连接操作D. 数据库的空间管理和优化12. 以下哪个选项是数据库与人工智能结合的一个实际应用场景?A. 智能化的数据仓库B. 自动化的数据迁移和同步C. 使用机器学习进行实时数据处理D. AI驱动的数据库安全防护13. 在数据库管理中,人工智能和机器学习可以用来解决哪种类型的数据丢失问题?A. 硬件故障导致的数据丢失B. 磁盘损坏导致的数据丢失C. 人为误操作导致的数据丢失D. 数据在传输过程中的加密传输14. 数据库与人工智能结合后,如何保证数据的安全性和隐私性?A. 加密存储数据B. 访问控制列表(ACL)C. 使用AI技术检测异常访问行为D. 数据脱敏和匿名化处理15. 以下哪个选项不是数据库与人工智能结合后可能带来的好处?A. 提高数据库查询和处理的效率B. 降低数据库系统的维护成本C. 提高数据库系统的可靠性D. 减少人工干预和维护工作量16. 在数据库系统中,人工智能和机器学习可以用来优化哪种类型的查询?A. 大数据量的复杂查询B. 高并发的查询请求C. 需要实时响应的查询D. 需要进行数据挖掘和分析的查询17. 以下哪个选项是数据库与人工智能结合后可能遇到的挑战?A. 技术集成和兼容性问题B. 数据安全和隐私保护问题C. 性能瓶颈和优化问题D. 人才短缺和技能培训问题18. 在数据库系统中,人工智能和机器学习可以用来改进哪种类型的错误检测和纠正?A. 语法错误B. 逻辑错误C. 数据库表之间的不一致性D. 硬件故障导致的错误19. 以下哪个选项是数据库与人工智能结合后可能带来的法律和伦理问题?A. 数据隐私和合规性问题B. 数据所有权和访问控制问题C. AI模型的可解释性和透明度问题D. 数据偏见和不公平问题20. 以下哪个选项不是数据库与人工智能结合的应用场景?A. 智能化数据检索系统B. 自动化数据迁移和同步C. AI驱动的数据仓库D. 静态网页托管21. 在数据库系统中,人工智能如何帮助提高查询效率?A. AI可以优化查询语句的编写,提高执行效率B. AI可以预测查询需求,从而减少不必要的数据扫描C. AI可以智能分析查询结果,提供更精确的查询建议D. AI可以动态调整数据库配置,以适应不同的查询负载22. 以下哪个选项不是数据库与人工智能结合的技术趋势?A. 数据库内置AI功能B. 使用AI技术开发新的数据库管理系统C. AI在数据库监控和管理中的应用D. 数据库与外部AI服务之间的通信23. 在数据库中,机器学习如何用于预测未来的数据趋势?A. 通过时间序列分析预测未来值B. 基于历史数据进行因果预测C. 利用分类算法识别数据模式D. 通过聚类分析发现数据中的异常点24. 以下哪个选项不是数据库与人工智能结合的风险和挑战?A. 数据安全和隐私问题B. AI模型的可解释性和透明度C. 数据库和AI系统的兼容性问题D. AI在处理大量数据时的资源消耗25. 在数据库系统中,如何利用AI技术实现自动化运维?A. 利用AI进行故障自动检测和修复B. AI辅助数据库性能调优C. 自动化数据备份和恢复D. 利用AI进行数据库架构设计26. 以下哪个选项不是数据库与人工智能结合的商业应用案例?A. 智能化的电子商务推荐系统B. AI驱动的供应链管理C. 数据驱动的金融市场分析D. 利用AI进行客户关系管理27. 在数据库中,如何利用机器学习技术进行数据清洗?A. 利用机器学习算法识别并修正错误数据B. 基于机器学习模型预测数据异常值C. 利用机器学习对数据进行分类和标签化D. 利用机器学习进行数据聚合和总结28. 以下哪个选项不是数据库与人工智能结合的未来发展方向?A. 更强大的AI集成和优化B. 更广泛的数据源接入和整合C. 更加智能的数据分析和决策支持D. 更加普及的自助式数据分析和可视化工具29. 在数据库中,以下哪个功能通常不是机器学习工作负载的关键组成部分?A. 数据清洗和预处理B. 特征工程C. 模型训练和评估D. 模型部署和监控30. 数据库管理系统(DBMS)对人工智能和机器学习的支持主要体现在哪些方面?A. 提供结构化数据存储B. 支持复杂的数据查询和数据处理C. 提供数据安全性和隐私保护机制D. 提供与机器学习框架的集成能力31. 在数据库与人工智能结合的场景中,以下哪个选项是常见的数据预处理步骤?A. 特征选择B. 数据归一化C. 数据分割D. 数据平衡32. 以下哪个数据库特性对机器学习模型的训练和推理至关重要?A. 索引B. 事务处理C. 数据完整性D. 并发控制33. 在数据库中,以下哪个操作通常不是由机器学习模型直接执行的?A. 数据查询B. 数据分析C. 数据预测D. 数据可视化34. 数据库与人工智能结合可以带来哪些优势?A. 提高数据处理的效率B. 增强数据分析和决策制定的准确性C. 降低机器学习模型的存储成本D. 扩展机器学习模型的功能35. 在数据库管理中,以下哪个功能通常不是数据库管理员(DBA)在机器学习项目中的职责?A. 数据清洗和预处理B. 模型训练和调优C. 数据安全和隐私保护D. 系统性能监控和优化36. 在数据库中,如何利用机器学习技术实现数据特征提取?A. 使用决策树算法对数据进行分类和预测B. 应用支持向量机(SVM)进行数据模式识别C. 利用神经网络模型自动提取数据特征D. 应用关联规则挖掘技术发现数据内在联系37. 人工智能在数据库领域的应用有哪些?A. 自动化查询优化B. 智能数据备份与恢复C. 异常检测与处理D. 数据安全与隐私保护38. 数据库与机器学习结合在金融领域的应用场景有哪些?A. 信用评分B. 欺诈检测C. 客户细分D. 风险管理39. 在数据库系统中,如何利用AI技术提高查询响应速度?A. 应用索引优化技术B. 使用AI驱动的查询缓存机制C. 利用AI预测查询负载并动态调整系统资源分配D. 应用数据压缩技术减少I/O操作40. 数据库与机器学习结合在医疗领域的应用有哪些?A. 疾病预测与预防B. 药物研发C. 患者分群与个性化治疗D. 医疗资源优化41. 在数据库管理系统中,如何利用机器学习技术进行数据安全性和完整性检查?A. 应用数据哈希算法确保数据完整性B. 利用异常检测技术识别潜在的安全威胁C. 应用加密技术保护数据隐私D. 使用机器学习模型自动修复数据错误42. 数据库与人工智能结合在物联网(IoT)中的应用场景有哪些?A. 智能家居系统B. 工业自动化控制系统C. 农业智能化管理D. 交通流量预测与管理43. 在数据库系统中,如何利用机器学习技术优化数据存储和管理?A. 应用数据分区和分片技术提高存储效率B. 利用AI驱动的数据压缩和编码技术减少存储空间占用C. 应用机器学习模型预测数据访问模式以优化存储布局D. 使用AI辅助的数据归档和清理策略44. 数据库与人工智能结合在教育领域的应用有哪些?A. 智能辅助教学B. 学生评估与成绩预测C. 课程推荐与个性化学习路径规划D. 教育资源优化分配二、问答题1. 什么是数据库与人工智能、机器学习的结合?2. 数据库中的人工智能和机器学习技术有哪些应用场景?3. 数据安全:利用机器学习算法检测异常行为和潜在威胁,提高数据安全性。
人工智能试题库(附参考答案)

人工智能试题库(附参考答案)一、单选题(共103题,每题1分,共103分)1.数据挖掘技术主要有分类、估计、()、关联分析和预报。
A、假设B、回归C、统计D、聚类正确答案:D2.深度学习可以用在下列哪些NLP任务中?A、情感分析B、问答系统C、机器翻译D、所有选项正确答案:D3.关于Python和Numpy的切片,以下说法正确的是()A、python对列表的切片得到的是列表的副本,numpy数组切片得到的是指向相同缓冲区的视图B、numpy数组切片得到的是数组的副本,python对列表的切片得到的是指向相同缓冲区的视图C、python对列表的切片和numpy数组切片得到的都是指向相同缓冲区的视图D、python对列表的切片和numpy数组切片得到的都是原对象的副本正确答案:A4.当在内存网络中获得某个内存空间时,通常选择读取矢量形式数据而不是标量,这里需要的哪种类型的寻址来完成A、基于位置的寻址B、基于内容的寻址C、都可以D、都不行正确答案:B5.随着卷积层数的增加,下面描述正确的是:①.在一定层数范围内,效果越来越好②.能够抽取的特征更加复杂③.层数越多越容易发生梯度消失A、②③B、①②③C、①②D、①③正确答案:B6.模型有效的基本条件是能够()已知的样本A、结合B、聚集C、拟合D、联合正确答案:C7.不属于深度学习模型的选项是?A、朴素贝叶斯B、深度残差网络C、卷积神经网络 CNND、循环神经网络 RNN正确答案:A8.ONE-HOT-ENCODING 可用于什么特征处理A、类别型特征B、有序性特征C、数值型特征D、字符串型特征正确答案:A9.衡量模型预测值和真实值差距的评价函数被称为()A、损失函数B、激活函数C、无参数函数D、矩阵拼接函数正确答案:A10.生成式方法是直接基于(___)的方法?A、生成式模型B、生成式数据C、生成式场景D、生成式学习正确答案:A11.以下哪类算法属于关联分析()。
《探索大数据与人工智能》题库

《探索大数据与人工智能》习题库一、单选题1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短 D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据 B. 非结构化数据 C. 半结构化数据 D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
《探索大数据与人工智能》习题库教学资料

《探索大数据与人工智能》习题库《探索大数据与人工智能》习题库单选1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短 D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据 B. 非结构化数据 C. 半结构化数据 D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《探索大数据与人工智能》习题库单选1、Spark Streaming是什么软件栈中的流计算A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphX11、Spark是在哪一年开源的A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是A.GB、B、KBB. B、KB、MBC. KB、ZB、PB 、MB、KB20、以下数据单位换算错误的是A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架A.KafkaB. TensorflowC. Caffe25、BP神经网络的学习规则是A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是A.TezB. SparkC. Pig28、Spark是基于什么的迭代计算框架它适用于需要多次操作特定数据集的应用场合。
需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小;A.内存B. 硬盘C. 磁带D. 显卡29、下列选项中,哪项是分布式文件存储系统A.HDFSB. FlumeC. KafkaD. Zookeeper30、工信部官网正式发布大数据产业”十三五“发展规划是在哪一年A.1987B. 1997 D. 201731、学习没有标签的数据集的机器学习方法是A.监督学习B. 无监督学习C. 半监督学习D. 强化学习32、当前世界产生的数据总量的单位是A.KBB. ZBC. GBD. TB33、下列选项中正确说明价值密度低的是数据中有50TB有效数据 B. 1TB数据中有1KB有效数据数据中有100PB有效数据 D. 10EB数据中有10EB有效数据34、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。
A.精灵B. 阿尔法蛋C. 小度D. 移娃35、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。
A.AlphaGoB. 深蓝C. 图灵机模型D. 深度学习机器人36、在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢A.连接器B. 客户端C. 接口提供者D. 数据采集37、mapreduce计算模型适用于哪种任务A.多线程处理B. 有关联的行处理C. 批处理D. 实时数据变化处理38、大数据特征有几种(不包括IBM提出的新特征)39、Hadoop是()年诞生的40、以下哪个不属于大数据在电信行业的数据商业化方面的应用A.精准广告B.网络管理C.营销洞察D.大数据检测和决策41、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么A.给定标签B.离散C.分类D.回归42、下列选项中,正确描述Flume对数据源的支持的是A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式43、IBM提出的大数据5V特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)A.更有效B.更大(Volume)C.更充分D.更直观44、下列选项中,不是大数据的一部分的是A.海量计算B.大量数据管理C.数据分析D.单机计算45、Flume采用了三层架构,分别为agent,collector和()A.Map46、HBASE的特点不包括A.面向列B.稀疏性C.多版本D.低可靠性47、mapreduce计算模型适用于哪种任务A.多线程处理B. 有关联的行处理C. 批处理D.实时数据变化处理48、最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商A.谷歌B. 百度C. 360D. bing49、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。
而哪项技术将继续成为大数据智能分析的核心技术A.机器学习B. 智能物流C. 脑科学D. 智能终端50、下列选项中,正确描述Flume对数据源的支持的是A.只能使用HDFS数据源B. 可以配置数据源C. 不能使用文件系统D. 不能使用目录方式51、HBASE的特点不包括哪些A.面向行B. 稀疏性C. 多版本D. 高可靠性52、下列选项中,不是用于数据存储的技术是哪一个A.MongoDBB. MySQLC. HDFSD. Java53、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工智能称为()A. 高人工智能B. 低人工智能C. 强人工智能D. 弱人工智能54、下列选项中,不是人工智能的基础设施的是A. CPU服务器B. GPU服务器C. 专用芯片D. 游戏显卡54、以下不是大数据特征的是A.数据体量大B. 数据种类多C. 价值密度高D. 处理速度快55、以下应用没有使用你的地理位置信息的是A.美团B. 滴滴C. 高德地图D. word56、下列选项中,不是Flume的特点的是A. 可靠性B. 集中式架构C. 可扩展性D. 可管理性57、在Spark的软件栈中,用于交互式查询的是A.SparkSQLB. MllibC. GraphXD. Spark Streaming58、下列选项中,不是大数据的一部分的是A.海量计算B. 大量数据管理C. 数据分析D单机计算59、人工智能、机器学习、深度学习的包含关系是()A.机器学习>深度学习>人工智能B. 人工智能>深度学习>机器学习C.人工智能>机器学习>深度学习D. 深度学习>人工智能>机器学习60、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A. 机器性能B. 语言歧义性C. 知识依赖D. 语境61、BP神经网络模型拓扑结构不包括A.输入层B. 隐层C. 输出层D. 显层62、以下哪个不是语音识别的范畴A.语音听写B. 语音合成C. 语音转写D. 语音唤醒63、Alpha Go是第一个击败人类职业()选手的人工智能程序。
A. 国际象棋B. 围棋C. 中国象棋D. 五子棋64、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢A.闭源B. 开源C. 独立D. 封闭65、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。
A. 海量B. 少数C. 小量D. 结构化66、Spark Streaming是什么软件栈中的流计算A. SparkB. StormC. HiveD. Flume67、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。
A. 大数据技术B.客户画像C. 客户状态D. 客户心情67、下列选项中正确说明价值密度低的是数据中有50TB有效数据 B. 1TB数据中有1KB有效数据数据中有100PB有效数据 D. 10EB数据中有10EB有效数据68、学习没有标签的数据集的机器学习方法是A.监督学习B. 无监督学习C. 半监督学习D. 强化学习69、当前世界产生的数据总量的单位是A.KBB. ZBC. GBD. TB70、对抗学习中两个网络互相竞争,一个负责生成样本,那么另一个负责做什么A.判别样本B. 计算样本C. 统计样本D. 生成样本71、hdfs中namenode的metadata的作用是A.描述数据的存储位置等属性B.存储数据C.调度数据72、rdd是由多个什么组成a.partition73、IBM提出的大数据5V特征包括更大(Volume)、更快(Velocity)、更多(Variety)、更值钱(Value)和()A.更有效B. 更充分C. 更真实(Veracity)D. 更直观74、在Spark的软件栈中,用于流计算的是A.GraphXB. MllibC. Spark StreamingD. SparkSQL75、以下数据量可以称为大数据的是A.100MBB. 100KBC. 100PBD. 100MB76、学习没有标签的数据集的机器学习方法是A.监督学习B. 无监督学习C. 半监督学习D. 强化学习77、大数据的数据来源于方方面面,下列不可以作为数据源的是A.APP应用B. 地理信息C. 一块石头D. 商店订单78、数据采集的基本步骤(ETL)中不包括哪项A.抽取转换B. 加载C. 计算79、整个MapReduce的过程大致分为Map、Shuffle、Combine、()A. ReduceB. HashC. CleanD. Loading80、人工智能通过输入的图片,解析出图片的内容,这种技术叫什么A. 图片识别B. 语音识别C. 自动驾驶D. 消费金融81、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。