人工智能基础复习题含参考答案

合集下载

相关主题

人工智能经典习题集

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

人工智能基础复习题含参考答案
1、在“小米的创始⼈是谁”这个问题中，关系词是：
A、谁
B、小米
C、创始人
答案：C
2、以下哪个任务通常不可以通过词向量实现
A、单词相似性计算
B、文本相似性计算
C、词语类比
D、中文分词
答案：D
3、利用下游任务的有标注数据，对GPT模型进行精调时，通常使用模型中的哪一层来完成预测任务
A、第1层
B、第2层
C、中间层
D、最后一层
答案：D
4、在神经网络中，（）通过反向传播计算得到的梯度来更新网络的参数，达到训练的目的，从而降低目标函数的值。

A、优化器
B、损失函数
C、激活函数
D、迭代次数
答案：A
5、BERT主要使用了什么模型作为基本结构
A、RNN
B、LSTM
C、Transformer
D、GRU
答案：C
6、OpenAI提出的GPT主要使用了什么模型作为基本结构
A、RNN
B、LSTM
C、Transformer
D、GRU
答案：C
7、以下关于端到端的问答系统说法错误的是：
A、可以通过基于深度学习的方法来实现。

B、无需人工编写大量模板。

C、中间的过程类似于黑盒操作。

D、中间的过程类似于白盒操作。

答案：D
8、常见的CBOW词向量模型有几层神经网络组成
A、1
B、2
C、3
D、4
答案：C
9、以下哪个函数能实现将深度神经网络的输出分布标准化，且加和为1
A、sigmoid
B、softmax
C、relu
D、adam
答案：B
10、（）通过残差块构建跨层的数据通道，是计算机视觉中最流行的体系架构。

A、VGG
B、AlexNet
C、ResNet
D、DenseNet
答案：C
11、（）是指模型的描述能力太弱，以至于不能很好地学习到数据中的规律。

A、模型退化
B、欠拟合
C、过拟合
D、梯度爆炸
答案：B
12、以下哪项属于OCR技术落地难点
A、文字弯曲
B、实时处理
C、背景干扰
D、尺度过小
答案：B
13、首次将 Attention 引入文本识别领域的算法为？
A、SAR算法
B、R^2AM算法
C、NRTR算法
D、Mask TextSpotter 算法
答案：B
14、自然语言处理包括语言识别、语音合成和（）
A、语言翻译
B、语言理解
C、语言交流
D、语言训练
答案：B
15、有关图像融合评价指标的说法中，不正确的是：
A、一般可以从主客观结合的角度进行评价
B、以熵为标准的评价指标都是越大越好
C、不存在标准的一套量化指标用于评估图像质量
D、可以从信息论角度入手进行图像质量评估
答案：B
16、OpenAI提出的GPT全称是什么
A、Generative Pre-Training
B、Generative Pre-Tuning
C、Generative Post-Training
D、Generative Post-Tuning
答案：A
17、以下哪个任务不属于词法分析
A、中文分词
B、词性标注
C、命名实体识别
D、文本分类
答案：D
18、下列算法中减少了常用词的权重，增加了文档集合中不常用词的权重的是
A、词频
B、逆文档频率
C、Word2Vec
D、隐狄利克雷分布
答案：B
19、什么是机器翻译
A、将一门人类语言转换成另一门人类语言
B、将人类语言转换成机器语言
C、将任意一门人类语言转换成英语
D、将机器语言转换成人类语言
答案：A
20、可以从新闻文本数据中分析出名词短语，动词短语，主语的技术是？
A、词性标注
B、依存分析和句法分析
C、N-Gram抽取
D、词袋模型
答案：B
21、以下关于问答系统与对话系统的说法错误的是：
A、问答系统是一种特殊的对话系统。

B、问答系统是一种特殊的任务型对话系统。

C、问答系统是一种特殊的闲聊式对话系统。

D、问答系统通常在一次对话中完成用户的信息获取需求。

答案：C
22、下列不属于Roi Pooling作用的是？
A、减少region proposals
B、统一region proposals的形状
C、加快模型的处理速度
D、实现端到端训练
答案：A
23、在BERT开展掩码语言模型预训练过程中，会对15%的输入文本进行mask，其中不属于常规mask的操作是哪一个
A、替换为mask]标记
B、替换为词表中的任意一个随机词
C、保持原词不变
D、删除原词
答案：D
24、哪一个组件在CTPN与通用Faster RCNN中完全一致
A、CNN特征提取模块
B、RPN模块
C、双向LSTM
D、分类器
答案：A
25、LSTM的输入态不包含哪个？
A、t-1时刻的细胞状态C
B、t-1时刻隐层状态h
C、t-1时刻输入向量x
D、t时刻输入向量x
答案：C
26、一个基础的transformer模型的输入是什么
A、词向量
B、编码器
C、解码器
D、神经元
答案：A
27、以下哪个不是目标跟踪技术研究的主要难点？
A、目标外观形变
B、背景嘈杂
C、目标尺寸太大
D、目标被部分遮挡
答案：C
28、Transformer中通过什么方式引入单词顺序信息
A、词向量
B、位置编码
C、自注意力机制
D、softmax
答案：B
29、自然语言处理是用（）技术的一种应用
A、语音识别
B、虚拟现实
C、人工智能
D、自然语言
答案：D
30、以下哪个模型不是BERT模型的改进版本
A、RoBERTa
B、MacBERT
C、BiLSTM
D、DistilBERT
答案：C
31、属于知识检索常用手段的有：
A、基于查询语言的知识检索
B、基于语义的知识检索
C、基于模板的知识检索
D、语义搜索
答案：ABD
32、对于任意两个相邻的proposals： Bj 和 Bi，需要满足哪些条件才能连接？
A、Bj在水平距离上离Bi最近
B、它们的水平重叠vertical overlap > 0.7
C、该距离小于50 pixels
D、它们的垂直重叠vertical overlap > 0.7
答案：ACD
33、以下说法正确的是
A、目标跟踪的目的是在第一帧给定感兴趣目标的状态位置和大小，在视频的后续帧中自动地预测该目标状态
B、图像风格转换技术只能处理单张图像
C、行为识别任务是要求识别出数据中人或动物等的行为
D、视频目标分割技术能与图像风格转换技术结合起来，如对图像背景进行某种艺术风格转换，对前景进行另外一种不同的艺术风格转换
答案：ACD
34、在进行问句分析时，以下属于实体词的是：
A、名字
B、地点
C、何时
D、时间
答案：ACD
35、深度学习OCR主要分为以下哪几步？
A、文本行检测
B、字符分割
C、单字符识别
D、行文本识别
答案：AD
36、在KBQA中，构建查询语句的方法有：
A、基于语义解析的方法
B、基于机器学习的方法
C、基于模板的方法
D、基于问句分析的方法
答案：ABCD
37、批量归一化层可以作用在（）。

A、全连接层和卷积层输出上，激活函数前
B、全连接层和卷积层输出上，激活函数后
C、全连接层和卷积层输入上
D、随时都可以
答案：AC
38、下列哪些网络属于循环神经网络（RNN）？
A、门控循环单元（GRU）
B、卷积神经网络（CNN）
C、Transformer网络
D、长短期记忆网络（LSTM）
答案：AD
39、可以用来进行词性标注的工具有：
A、LTP
B、jieba
C、HanLP
D、CRF
答案：ABC
40、以下属于问句分析任务需要做的是：
A、识别问题类型词
B、识别实体词
C、识别中心词
D、构建查询语句
答案：ABC
41、人工评估机器翻译的结果具有以下哪些缺点？
A、具有主观偏差性
B、成本昂贵
C、效率低
D、不能反映语义信息
答案：ABC
42、根据使用的方法划分，以下哪些可用于文本情感分析
A、基于情感词典
B、基于机器学习
C、基于深度学习
D、基于凸优化
答案：ABC
43、关于视频目标分割以下说法正确的是？
A、目标分割技术的目的是将感兴趣的目标分割出来
B、视频目标分割毫无研究价值
C、视频目标分割的输出是二进制的前景背景分割空间
D、视频目标分割技术只能在视频的每一帧图像中分割出一个目标出来
答案：AC
44、传统OCR方法首先检测出文本行，然后利用以下哪种对文本行中的单个字符进行字符分割
A、连通域算法
B、垂直投影算法
C、MSER算法
D、BM3D算法
答案：AB
45、以下哪些场景可以用到情感分析技术？
A、关系抽取
B、情感对话
C、产品分析
D、舆情监控
答案：BCD
46、以下哪项是图像二值化的全域值方法？
A、自适应阈值法
B、固定阈值法
C、NiBlack算法
D、Otus算法
答案：BD
47、半监督学习方法中，以下说法正确的有：
A、半监督学习方法班阔基于种子的启发式方法和远程监督方法。

B、基于种子的启发式方法对初始种子的质量要求高，总体准确率较高。

C、远程监督方法存在错误传递问题，影响分类器的效果。

D、基于种子的启发式方法构建成本低，适合大规模的数据构建，并且可能发现新的隐含关系。

答案：ACD
48、下列哪项不属于复杂类问题？
A、刘德华和周润发谁的年龄更大？
B、腾讯是什么性质的企业？
C、周杰伦是魔羯座吗？
D、拼多多有多少名员工？
答案：BCD
49、以下哪些模型属于循环神经网络
A、RNN
B、LSTM
C、GRU
D、CNN
答案：ABC
50、如何衡量OCR的好坏
A、拒识率
B、误识率
C、识别速度
D、产品稳定性
答案：ABCD
51、以下哪些特征提取技术常用于目标跟踪技术中提取样本特征？
A、灰度特征
B、图像梯度直方图特征（HOG）
C、颜色名特征（CN）
D、深度卷积特征
答案：ABCD
52、以下属于问答系统的主要模块的是：
A、信息抽取
B、问句分析
C、查询构建
D、短语映射
答案：BCD
53、以下哪项任务属于OCR范畴
A、车牌识别
B、身份证信息识别
C、手写汉字识别
D、文本翻译
答案：ABC
54、以下关于句法分析的说法正确的是：
A、句法是研究句子的每个组成部分和它们之间的组合方式。

B、句法分析就是指对句子中的词语语法功能进行分析。

C、在自然语言或者计算机语言中，句法分析是利用形式化的文法规则对一个符号串进行分析的过程。

D、一般来说，句法和语言是无关的。

答案：ABC
55、LSTM由一个单元模块由哪些门组成？
A、输入们
B、遗忘门
C、更新门
D、输出们
答案：BCD
56、出现过拟合的情况时，模型可能过于简单了，没有很好地学习到数据中的规律。

A、正确
B、错误
答案：B
57、计算机视觉的任务是用图像创建或恢复现实世界模型，然后认知现实世界。

A、正确
B、错误
答案：A
58、二值图像的每个像素只有两种取值：0、255，0表示白色，255表示黑色。

A、正确
B、错误
答案：B
59、版面恢复的主要内容是识别原文档的排版，按原排版格式将识别结果输出到文本文档。

A、正确
B、错误
答案：A
60、为了在预测过程中得到确切的结果，我们通常对训练样本只进行数据增强，而在预测过程中不使用带随机操作的数据增强。

A、正确
B、错误
答案：A
61、TF-IDF能够找出文档中出现频率最高的词
A、正确
B、错误
答案：B
62、Transformer里没有用到注意力机制
A、正确
B、错误
答案：B
63、相比于LSTM,双向GRU有利于获取上下文信息，使用多层结构有利于获取高级语义
A、正确
B、错误
答案：B
64、在机器学习中，聚类任务属于监督学习
A、正确
B、错误
答案：B
65、VGG-11使用可复用的卷积块构造网络。

不同的VGG模型可通过每个块中卷积层数量和输出通道数量的差异来定义。

A、正确
B、错误
答案：A
66、RoI Pooling收集输入的feature maps和proposals，综合这些信息后提取proposal feature maps，送入后续全连接层判定目标类别。

A、正确
B、错误
答案：A
67、卷积神经网络中边界填充(padding)的作用是增加提取的特征个数。

A、正确
B、错误
答案：B
68、后续研究表明，BERT最初提出的预训练方式中，下一个句子预测任务是非常重要，对模型性能有重要作用，不可取代的
A、正确
B、错误
答案：B
69、OCR识别的关键路径在于文字检测和文本识别部分，这也是深度学习技术可以充分发挥功效的地方。

A、正确
B、错误
答案：A
70、NLP是人类和机器之间沟通的桥梁
A、正确
B、错误
答案：A
71、可以使用BERT中的SequenceClassification实现文本情感分类任务
A、正确
B、错误
答案：A
72、现代NLP算法都是基于机器学习，尤其是统计机器学习
A、正确
B、错误
答案：A
73、在基于词典的中文分词中，词典中的字符串就是词
A、正确
B、错误
答案：A
74、对于文本分类来说，使用余弦相似度来计算KNN中的相似度比使用欧式距离更合适
A、正确
B、错误
答案：A
75、CRNN算法是基于Sequence2Sequence 的文本识别算法。

A、正确
B、错误
答案：B。