人工智能基础复习题含参考答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人工智能基础复习题含参考答案
1、在“小米的创始⼈是谁”这个问题中,关系词是:
A、谁
B、小米
C、创始人
答案:C
2、以下哪个任务通常不可以通过词向量实现
A、单词相似性计算
B、文本相似性计算
C、词语类比
D、中文分词
答案:D
3、利用下游任务的有标注数据,对GPT模型进行精调时,通常使用模型中的哪一层来完成预测任务
A、第1层
B、第2层
C、中间层
D、最后一层
答案:D
4、在神经网络中,()通过反向传播计算得到的梯度来更新网络的参数,达到训练的目的,从而降低目标函数的值。
A、优化器
B、损失函数
C、激活函数
D、迭代次数
答案:A
5、BERT主要使用了什么模型作为基本结构
A、RNN
B、LSTM
C、Transformer
D、GRU
答案:C
6、OpenAI提出的GPT主要使用了什么模型作为基本结构
A、RNN
B、LSTM
C、Transformer
D、GRU
答案:C
7、以下关于端到端的问答系统说法错误的是:
A、可以通过基于深度学习的方法来实现。
B、无需人工编写大量模板。
C、中间的过程类似于黑盒操作。
D、中间的过程类似于白盒操作。
答案:D
8、常见的CBOW词向量模型有几层神经网络组成
A、1
B、2
C、3
D、4
答案:C
9、以下哪个函数能实现将深度神经网络的输出分布标准化,且加和为1
A、sigmoid
B、softmax
C、relu
D、adam
答案:B
10、()通过残差块构建跨层的数据通道,是计算机视觉中最流行的体系架构。
A、VGG
B、AlexNet
C、ResNet
D、DenseNet
答案:C
11、()是指模型的描述能力太弱,以至于不能很好地学习到数据中的规律。
A、模型退化
B、欠拟合
C、过拟合
D、梯度爆炸
答案:B
12、以下哪项属于OCR技术落地难点
A、文字弯曲
B、实时处理
C、背景干扰
D、尺度过小
答案:B
13、首次将 Attention 引入文本识别领域的算法为?
A、SAR算法
B、R^2AM算法
C、NRTR算法
D、Mask TextSpotter 算法
答案:B
14、自然语言处理包括语言识别、语音合成和()
A、语言翻译
B、语言理解
C、语言交流
D、语言训练
答案:B
15、有关图像融合评价指标的说法中,不正确的是:
A、一般可以从主客观结合的角度进行评价
B、以熵为标准的评价指标都是越大越好
C、不存在标准的一套量化指标用于评估图像质量
D、可以从信息论角度入手进行图像质量评估
答案:B
16、OpenAI提出的GPT全称是什么
A、Generative Pre-Training
B、Generative Pre-Tuning
C、Generative Post-Training
D、Generative Post-Tuning
答案:A
17、以下哪个任务不属于词法分析
A、中文分词
B、词性标注
C、命名实体识别
D、文本分类
答案:D
18、下列算法中减少了常用词的权重,增加了文档集合中不常用词的权重的是
A、词频
B、逆文档频率
C、Word2Vec
D、隐狄利克雷分布
答案:B
19、什么是机器翻译
A、将一门人类语言转换成另一门人类语言
B、将人类语言转换成机器语言
C、将任意一门人类语言转换成英语
D、将机器语言转换成人类语言
答案:A
20、可以从新闻文本数据中分析出名词短语,动词短语,主语的技术是?
A、词性标注
B、依存分析和句法分析
C、N-Gram抽取
D、词袋模型
答案:B
21、以下关于问答系统与对话系统的说法错误的是:
A、问答系统是一种特殊的对话系统。
B、问答系统是一种特殊的任务型对话系统。
C、问答系统是一种特殊的闲聊式对话系统。
D、问答系统通常在一次对话中完成用户的信息获取需求。
答案:C
22、下列不属于Roi Pooling作用的是?
A、减少region proposals
B、统一region proposals的形状
C、加快模型的处理速度
D、实现端到端训练
答案:A
23、在BERT开展掩码语言模型预训练过程中,会对15%的输入文本进行mask,其中不属于常规mask的操作是哪一个
A、替换为mask]标记
B、替换为词表中的任意一个随机词
C、保持原词不变
D、删除原词
答案:D
24、哪一个组件在CTPN与通用Faster RCNN中完全一致
A、CNN特征提取模块
B、RPN模块
C、双向LSTM
D、分类器
答案:A
25、LSTM的输入态不包含哪个?
A、t-1时刻的细胞状态C
B、t-1时刻隐层状态h
C、t-1时刻输入向量x
D、t时刻输入向量x
答案:C
26、一个基础的transformer模型的输入是什么
A、词向量
B、编码器
C、解码器
D、神经元
答案:A
27、以下哪个不是目标跟踪技术研究的主要难点?
A、目标外观形变
B、背景嘈杂
C、目标尺寸太大
D、目标被部分遮挡
答案:C
28、Transformer中通过什么方式引入单词顺序信息
A、词向量
B、位置编码
C、自注意力机制
D、softmax
答案:B
29、自然语言处理是用()技术的一种应用
A、语音识别
B、虚拟现实
C、人工智能
D、自然语言
答案:D
30、以下哪个模型不是BERT模型的改进版本
A、RoBERTa
B、MacBERT
C、BiLSTM
D、DistilBERT
答案:C
31、属于知识检索常用手段的有:
A、基于查询语言的知识检索
B、基于语义的知识检索
C、基于模板的知识检索
D、语义搜索
答案:ABD
32、对于任意两个相邻的proposals: Bj 和 Bi,需要满足哪些条件才能连接?
A、Bj在水平距离上离Bi最近
B、它们的水平重叠vertical overlap > 0.7
C、该距离小于50 pixels
D、它们的垂直重叠vertical overlap > 0.7
答案:ACD
33、以下说法正确的是
A、目标跟踪的目的是在第一帧给定感兴趣目标的状态位置和大小,在视频的后续帧中自动地预测该目标状态
B、图像风格转换技术只能处理单张图像
C、行为识别任务是要求识别出数据中人或动物等的行为
D、视频目标分割技术能与图像风格转换技术结合起来,如对图像背景进行某种艺术风格转换,对前景进行另外一种不同的艺术风格转换
答案:ACD
34、在进行问句分析时,以下属于实体词的是:
A、名字
B、地点
C、何时
D、时间
答案:ACD
35、深度学习OCR主要分为以下哪几步?
A、文本行检测
B、字符分割
C、单字符识别
D、行文本识别
答案:AD
36、在KBQA中,构建查询语句的方法有:
A、基于语义解析的方法
B、基于机器学习的方法
C、基于模板的方法
D、基于问句分析的方法
答案:ABCD
37、批量归一化层可以作用在()。
A、全连接层和卷积层输出上,激活函数前
B、全连接层和卷积层输出上,激活函数后
C、全连接层和卷积层输入上
D、随时都可以
答案:AC
38、下列哪些网络属于循环神经网络(RNN)?
A、门控循环单元(GRU)
B、卷积神经网络(CNN)
C、Transformer网络
D、长短期记忆网络(LSTM)
答案:AD
39、可以用来进行词性标注的工具有:
A、LTP
B、jieba
C、HanLP
D、CRF
答案:ABC
40、以下属于问句分析任务需要做的是:
A、识别问题类型词
B、识别实体词
C、识别中心词
D、构建查询语句
答案:ABC
41、人工评估机器翻译的结果具有以下哪些缺点?
A、具有主观偏差性
B、成本昂贵
C、效率低
D、不能反映语义信息
答案:ABC
42、根据使用的方法划分,以下哪些可用于文本情感分析
A、基于情感词典
B、基于机器学习
C、基于深度学习
D、基于凸优化
答案:ABC
43、关于视频目标分割以下说法正确的是?
A、目标分割技术的目的是将感兴趣的目标分割出来
B、视频目标分割毫无研究价值
C、视频目标分割的输出是二进制的前景背景分割空间
D、视频目标分割技术只能在视频的每一帧图像中分割出一个目标出来
答案:AC
44、传统OCR方法首先检测出文本行,然后利用以下哪种对文本行中的单个字符进行字符分割
A、连通域算法
B、垂直投影算法
C、MSER算法
D、BM3D算法
答案:AB
45、以下哪些场景可以用到情感分析技术?
A、关系抽取
B、情感对话
C、产品分析
D、舆情监控
答案:BCD
46、以下哪项是图像二值化的全域值方法?
A、自适应阈值法
B、固定阈值法
C、NiBlack算法
D、Otus算法
答案:BD
47、半监督学习方法中,以下说法正确的有:
A、半监督学习方法班阔基于种子的启发式方法和远程监督方法。
B、基于种子的启发式方法对初始种子的质量要求高,总体准确率较高。
C、远程监督方法存在错误传递问题,影响分类器的效果。
D、基于种子的启发式方法构建成本低,适合大规模的数据构建,并且可能发现新的隐含关系。
答案:ACD
48、下列哪项不属于复杂类问题?
A、刘德华和周润发谁的年龄更大?
B、腾讯是什么性质的企业?
C、周杰伦是魔羯座吗?
D、拼多多有多少名员工?
答案:BCD
49、以下哪些模型属于循环神经网络
A、RNN
B、LSTM
C、GRU
D、CNN
答案:ABC
50、如何衡量OCR的好坏
A、拒识率
B、误识率
C、识别速度
D、产品稳定性
答案:ABCD
51、以下哪些特征提取技术常用于目标跟踪技术中提取样本特征?
A、灰度特征
B、图像梯度直方图特征(HOG)
C、颜色名特征(CN)
D、深度卷积特征
答案:ABCD
52、以下属于问答系统的主要模块的是:
A、信息抽取
B、问句分析
C、查询构建
D、短语映射
答案:BCD
53、以下哪项任务属于OCR范畴
A、车牌识别
B、身份证信息识别
C、手写汉字识别
D、文本翻译
答案:ABC
54、以下关于句法分析的说法正确的是:
A、句法是研究句子的每个组成部分和它们之间的组合方式。
B、句法分析就是指对句子中的词语语法功能进行分析。
C、在自然语言或者计算机语言中,句法分析是利用形式化的文法规则对一个符号串进行分析的过程。
D、一般来说,句法和语言是无关的。
答案:ABC
55、LSTM由一个单元模块由哪些门组成?
A、输入们
B、遗忘门
C、更新门
D、输出们
答案:BCD
56、出现过拟合的情况时,模型可能过于简单了,没有很好地学习到数据中的规律。
A、正确
B、错误
答案:B
57、计算机视觉的任务是用图像创建或恢复现实世界模型,然后认知现实世界。
A、正确
B、错误
答案:A
58、二值图像的每个像素只有两种取值:0、255,0表示白色,255表示黑色。
A、正确
B、错误
答案:B
59、版面恢复的主要内容是识别原文档的排版,按原排版格式将识别结果输出到文本文档。
A、正确
B、错误
答案:A
60、为了在预测过程中得到确切的结果,我们通常对训练样本只进行数据增强,而在预测过程中不使用带随机操作的数据增强。
A、正确
B、错误
答案:A
61、TF-IDF能够找出文档中出现频率最高的词
A、正确
B、错误
答案:B
62、Transformer里没有用到注意力机制
A、正确
B、错误
答案:B
63、相比于LSTM,双向GRU有利于获取上下文信息,使用多层结构有利于获取高级语义
A、正确
B、错误
答案:B
64、在机器学习中,聚类任务属于监督学习
A、正确
B、错误
答案:B
65、VGG-11使用可复用的卷积块构造网络。
不同的VGG模型可通过每个块中卷积层数量和输出通道数量的差异来定义。
A、正确
B、错误
答案:A
66、RoI Pooling收集输入的feature maps和proposals,综合这些信息后提取proposal feature maps,送入后续全连接层判定目标类别。
A、正确
B、错误
答案:A
67、卷积神经网络中边界填充(padding)的作用是增加提取的特征个数。
A、正确
B、错误
答案:B
68、后续研究表明,BERT最初提出的预训练方式中,下一个句子预测任务是非常重要,对模型性能有重要作用,不可取代的
A、正确
B、错误
答案:B
69、OCR识别的关键路径在于文字检测和文本识别部分,这也是深度学习技术可以充分发挥功效的地方。
A、正确
B、错误
答案:A
70、NLP是人类和机器之间沟通的桥梁
A、正确
B、错误
答案:A
71、可以使用BERT中的SequenceClassification实现文本情感分类任务
A、正确
B、错误
答案:A
72、现代NLP算法都是基于机器学习,尤其是统计机器学习
A、正确
B、错误
答案:A
73、在基于词典的中文分词中,词典中的字符串就是词
A、正确
B、错误
答案:A
74、对于文本分类来说,使用余弦相似度来计算KNN中的相似度比使用欧式距离更合适
A、正确
B、错误
答案:A
75、CRNN算法是基于Sequence2Sequence 的文本识别算法。
A、正确
B、错误
答案:B。