人工智能机器学习技术练习(习题卷27)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人工智能机器学习技术练习(习题卷27)
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。

1.[单选题]下面哪些对「类型 1(Type-1)」和「类型 2(Type-2)」错误的描述是错误的?
A)类型 1 通常称之为假正类,类型 2 通常称之为假负类
B)类型 2 通常称之为假正类,类型 1 通常称之为假负类
C)类型 1 错误通常在其是正确的情况下拒绝假设而出现
答案:B
解析:在统计学假设测试中,I 类错误即错误地拒绝了正确的假设即假正类错误,II 类错误通常指错误地接受了错误的假设即假负类错误。

2.[单选题]聚类的结果是将数据分成了多个簇,()
A)每个簇有确切的含义
B)单个簇要再次进行统计分析
C)簇与簇之间差异巨大
答案:B
解析:
3.[单选题]以下哪种方法不属于特征选择的标准方法:
A)嵌入
B)过滤
C)包装
D)抽样
答案:D
解析:
4.[单选题]以下哪种方法不能防止过拟合?
A)交叉验证
B)低维嵌入
C)剪枝
D)集成学习
答案:B
解析:1、交叉检验,通过交叉检验得到较优的模型参数; 2、特征选择,减少特征数或使用较少的特征组合,对于按区间离散化的特征,增大划分的区间。

3、正则化,常用的有 L_1、L_2 正则。

而且 L_1 正则还可以自动进行特征选择。

4、如果有正则项则可以考虑增大正则项参数 lambda. 5、增加训练数据可以有限的避免过拟合。

6、Bagging ,将多个弱学习器Bagging 一下效果会好很多,比如随机森林等。

5.[单选题]下列激活函数中,能够实现将特征限制到区间[-1,1]的是哪一个
A)Tanh
B)Logistic
C)ReLU
D)Sigmoid
答案:A
解析:
B)算法只要知道上一层神经元的阈值梯度,就能计算当前层神经元的阈值梯度和连接权值梯度
C)隐层的阈值梯度只跟本层的神经元输出值有关
D)隐层阈值梯度取决于隐层神经元输出、输出层阈值梯度和隐层与输出层的连接权值
答案:C
解析:
7.[单选题]RNN不同于其它神经网络的地方在于()。

A)实现了记忆功能
B)速度快
C)精度高
D)易于搭建
答案:A
解析:
8.[单选题]默认的存储级别 ()。

A)MEMORY_ONLY
B)MEMORY_ONLY_SER
C)MEMORY_AND_DISK
D)MEMORY_AND_DISK_SER
答案:A
解析:
9.[单选题](__)是根据数据采样来估计概率分布参数的经典方法。

A)贝叶斯判定准则
B)贝叶斯决策论
C)贝叶斯分类器
D)极大似然估计
答案:D
解析:
10.[单选题]一般来说,下列哪种方法常用来预测连续独立变量?
A)线性回归
B)逻辑回顾
C)线性回归和逻辑回归都行
D)以上说法都不对
答案:A
解析:线性回归一般用于实数预测,逻辑回归一般用于分类问题。

11.[单选题]欠拟合通常是由于__而造成的。

A)权值学习迭代次数足够多
B)学习能力低下
C)训练集过多模型复杂
D)数据有噪声
答案:B
解析:
12.[单选题]关于维数灾难说法错误的是?
A)高维度数据可使得算法泛华能力变得越来越弱
解析:
13.[单选题]多分类图像识别任务常采用()作为输出的编码方式。

A)二进制编码
B)one-hot编码
C)霍夫曼编码
D)曼切斯特编码
答案:B
解析:
14.[单选题]下列有关核函数不正确的是:
A)可以采用cross-va1idalion方法选择最佳核函数
B)满足Mercer条件的函数不一定能作为支持向量机的核函数
C)极大地提高了学习机器的非线性处理能力
D)函数与非线性映射并不是一一对应的关系
答案:B
解析:
15.[单选题]在马尔科夫随机场中,(__)个变量之间的联合概率分布能基于团分解为多个因子的乘积。

A)2
B)3
C)4
D)多
答案:D
解析:
16.[单选题]如果对相同的数据进行逻辑回归,将花费更少的时间,并给出比较相似的精度(也可能不一样),怎么办? (假设在庞大的数据集上使用Logistic回归模型。

可能遇到一个问题,Logistic回归需要很长时间才能训练。

)
A)降低学习率,减少迭代次数
B)降低学习率,增加迭代次数
C)提高学习率,增加迭代次数
D)增加学习率,减少迭代次数
答案:D
解析:如果在训练时减少迭代次数,就能花费更少的时间获得相同的精度,但需要增加学习率。

17.[单选题]有N个样本,一般用于训练,一般用于测试。

若N增大,则训练误差和测试误差之间的差距会( )。

A)增大
B)减小
C)无法确定
D)无明显变化
答案:B
解析:增加数据,能够有效减小过拟合,减小训练样本误差和测试样本误差之间的差距。

18.[单选题]若A为假命题, B为真命题,以下命题中假命题有( )
A)A
B)A ! B
C)A ! B
19.[单选题]多分类LDA将样本投影到N-1维空间,N-1通常远小于数据原有的属性数,可通过这个投影来减小样本点的维数,且投影过程中使用了类别信息,因此LDA 也常被视为一种经典的()技术。

A)无监督特征选择
B)无监督降维
C)监督特征选择
D)监督降维
答案:D
解析:
20.[单选题]RGB色彩空间转到GRAY色彩空间的方法为()
A)cv2.cvtColor()
B)cv2.CvtColor()
C)cv2.CVTColor()
D)cv2.cvtcolor()
答案:A
解析:
21.[单选题]一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为y=7.19x+73.93,据此可以预测这个孩子10岁时的身高,则正确的叙述是()
A)身高一定是145.83cm
B)身高超过146.00cm
C)身高低于145.00cm
D)身高在145.83cm左右
答案:D
解析:
22.[单选题]下列选项中,关于drop_duplicates()方法描述错误的是( )。

A)仅支持单一特征数据的去重
B)仅对Series和DataFrame对象有效
C)数据去重时默认保留第一个数据
D)该方法不会改变原始数据排列
答案:A
解析:
23.[单选题]下列关于分类器的说法中不正确的是()
A)SVM的目标是找到使得训练数据尽可能分开且分类间隔最大的超平面,属于结构风险最小化
B)Naive Bayes是一种特殊的Bayes分类器,其一个假定是每个变量相互条件独立。

C)Xgboost是一种优秀的集成算法,其优点包括速度快、对异常值不敏感、支持自定义损失函数等等
D)随机森林中列采样的过程保证了随机性,所以就算不剪枝,也不容易出现过拟合。

答案:C
解析:
24.[单选题]从给定的特征集合中选择出相关特征子集的过程,称为
A)特征抽取
B)特征选择
C)特征降维
D)特征简化
25.[单选题]()可在保证训练精度的情况下降低模型的复杂度。

A)正则化系数无穷大
B)正则化系数几乎为0
C)选择合适的正则化参数
D)以上答案都不正确
答案:C
解析:选择合适的正则化参数可在保证训练精度的情况下降低模型的复杂度。

26.[单选题]在其它条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题( )
A)增加训练集数量
B)减少神经网络隐藏层节点数
C)删除稀疏的特征
D)SVM算法中使用高斯核/RBF核代替
答案:D
解析:机器学习中发生过拟合的主要原因有:
1 使用过于复杂的模型;
2 数据噪声较大;
3 训练数据少。

由此对应的降低过拟合的方法有:
1 简化模型假设,或者使用惩罚项限制模型复杂度;
2 进行数据清洗,减少噪声;
3 收集更多训练数据。

本题中,A对应于增加训练数据,B为简化模型假设,C为数据清洗。

D选项中,高斯核的使用增加了模型复杂度,容易引起过拟合。

选择合适的核函数以及软边缘参数C就是训练SVM的重要因素。

一般来讲,核函数越复杂,模型越偏向于过拟合;C越大模型越偏向于过拟合,反之则拟合不足。

27.[单选题]关于BP算法信号前向传播的说法正确的是( )。

A)BP算法在计算正向传播输出值时需要考虑激活函数
B)BP算法信号前向传播的计算量跟输入层神经元数目无关
C)BP算法只有在隐层才有激活函数
D)BP算法信号传播的顺序是输出层、隐层、输入层。

答案:A
解析:
28.[单选题]多层感知机方法中,可用作神经元的非线性激活函数( )
A)logistic
B)范数
C)线性内积
D)加权求和
答案:A
解析:
29.[单选题]与科学可视化相比,(__)更关注抽象且应用层次的可视化问题。

A)信息可视化
B)可视化理论
C)可视分析学
D)数据可视化
答案:A
coef的作用是( )
A)sigmoid函数
B)激活函数
C)模型的参数
D)以上都不是
答案:C
解析:
31.[单选题]图片是训练数据集(样本非常少)的快照(属性x、y分别用“+” 和 “o”表示),设定kNN的k=1,那么留一法交叉验证的误差是
A)0%
B)100%
C)0 到 100%
D)以上均不正确
答案:B
解析:留一交叉验证法中,如果有N个样本数据。

将每个样本单独作为测试集,其余N-1个样本作为训练集,这样得到了N个模型,用这N个模型的分类准确率的平均数作为此分类器的性能指标。

因此每一个模型都是用几乎所有的样本来训练得到最接近样本,这样评估所得的结果没有随机因素,所以答案选择B。

32.[单选题]混合高斯聚类中,运用了以下哪种过程( )
A)EM算法
B)集合运算
C)密度可达
D)样本与集合运算
答案:A
解析:
33.[单选题]下列表示Pandas类别统计函数的是()。

A)value_Counts()
B)Value_Counts()
C)values_counts()
D)value_counts()
答案:D
解析:
34.[单选题]主成分分析的优化目标是一个(__)。

A)不含约束条件的二次规划问题
B)含有约束条件的二次规划问题
C)不含约束条件的线性规划问题
D)含有约束条件的线性规划问题
答案:B
解析:
35.[单选题](__)度量了同样大小的训练集的变动所导致的学习性能的变化。

A)偏差
B)方差
C)均方差
D)泛化误差
36.[单选题]如右图所示有向图,以下陈述正确的有( )
A)B和G关于{C, F}条件独立
B)B和C关于F条件独立
C)B和G关于F条件独立
D)B和G关于{C,
F, H}条件独立
答案:A
解析:
37.[单选题]这是第25道,也是最后一道。

请估算一下,包括本题在内,这25道题干及选项总共大约有多少个字符?
A)500
B)1000
C)2000
D)4000
答案:C
解析:
38.[单选题]数字图像木刻画效果的出现是由于下列原因所产生的()
A)图像的幅度分辨率过小
B)图像的幅度分辨率过大
C)图像的空间分辨率过小
D)图像的空间分辨率过大
答案:A
解析:
39.[单选题]在这种架构中,对句子中所有词之间的关系进行建模,而与它们的位置无关。

这是哪种架构?
A)OpenAI GPT
B)ELMo
C)BERT
D)ULMFit
答案:C
解析:
40.[单选题]当在卷积神经网络中加入池化层(pooling layer)时,变换的不变性会被保留,是吗?
A)不知道
B)看情况
C)是
D)否
答案:C
解析:
41.[单选题]以下是两种不同的对数模型,分别为β0和β1。

alt="" >
对于两种对数模型(绿色,黑色)的β0和β1值,下列哪一项是正确的?
注: Y =β0+β1* X。

其中β0是截距,β1是系数。

A)绿色的β1大于黑色
B)绿色的β1小于黑色
解析:β0和β1:β0= 0,β1= 1为X1颜色(黑色),β0= 0,β1= -1为X4颜色(绿色)
42.[单选题]回归任务最常使用的性能度量是__。

A)精度
B)ROC
C)MSE
D)AUC
答案:C
解析:
43.[单选题]已知:(1)大脑是有很多个叫做神经元的东西构成,神经网络是对大脑的简单的数学表达。

(2)每一个神经元都有输入、处理函数和输出。

(3)神经元组合起来形成了网络,可以拟合任何函数。

(4)为了得到最佳的神经网络,我们用梯度下降方法不断更新模型。

给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模型?
A)加入更多层,使神经网络的深度增加
B)有维度更高的数据
C)当这是一个图形识别的问题时
D)以上都不正确
答案:A
解析:
44.[单选题](__)试图学得一个线性模型以尽可能准确地预测实值输出标记。

A)决策树
B)线性回归
C)贝叶斯分类器
D)神经网络
45.[单选题]做一个二分类预测问题,先设定阈值为0.5,概率大于等于0.5的样本归入正例类(即1),小于0.5的样本归入反例类(即0)。

然后,用阈值n(n>0.5)重新划分样本到正例类和反例类,下面哪一种说法正确是()1.增加阈值不会提高召回率2..增加阈值会提高召回率3..增加阈值不会降低查准率4.增加阈值会降低查准率
A)1
B)2
C)1、3
D)2、4
答案:C
解析:
46.[单选题]bootstrap数据是什么意思?(提示:考“bootstrap”和“boosting”区别)
A)有放回地从总共M个特征中抽样m个特征
B)无放回地从总共M个特征中抽样m个特征
C)有放回地从总共N个样本中抽样n个样本
D)无放回地从总共N个样本中抽样n个样本
答案:C
解析:
47.[单选题]正则化的回归分析,可以避免( )
A)线性化
B)过拟合
C)欠拟合
D)连续值逼近
答案:B
解析:
48.[单选题]在回归模型中,()在权衡欠拟合(under-fitting)和过拟合(over-fitting)中影响最大。

A)多项式阶数
B)更新权重 w时,使用的是矩阵求逆
C)使用常数项
D)使用梯度下降法
答案:A
解析:选择合适的多项式阶数非常重要。

如果阶数过大,模型就会更加复杂,容易发生过拟合;如果阶数较小,模型就会过于简单,容易发生欠拟合。

49.[单选题]以下对Variety相关描述不正确的是( )。

A)Variety是指类型多
B)结构化数据在各类数据中占比最多
C)类型多是指大数据涉及多种数据
D)大数据种类包括结构化数据、非结构化数据、半结构化数据
答案:B
解析:
50.[单选题]以下方法不可以用于特征降维的有( )
A)Linear Discriminant Analysis
B)Principal Component Analysis
C)Singular Value Decomposition
51.[单选题]图像分割是(__)的过程。

A)改变图像大小
B)将图像分成多个小区域
C)去除干扰信号
D)使图像变得更加丰富
答案:B
解析:
52.[单选题]当闵可夫斯基距离公式中的系数p值为2时,可得到(__)的公式。

A)欧氏距离
B)曼哈顿距离
C)街区距离
D)切比雪夫距离
答案:A
解析:
53.[单选题]所谓不确定性推理就是从( )的初始证据出发,通过运用( )的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的思维过程
A)不确定性, 不确定性
B)确定性, 确定性
C)确定性, 不确定性
D)不确定性 确定性
答案:A
解析:
54.[单选题]变量选择是用来选择最好的判别器子集, 如果要考虑模型效率,我们应该做哪些变量选择的考虑? :
1/多个变量其实有相同的用处
2/变量对于模型的解释有多大作用
3/特征携带的信息
4/交叉验证
A)1 和 4
B)1, 2 和 3
C)1,3 和 4
D)以上所有
答案:C
解析:注意, 这题的题眼是考虑模型效率,所以不要考虑选项2.
55.[单选题]决策树的父节点和子节点的熵的大小关系是()。

A)父节点的熵更小
B)子节点的熵更小
C)两者相等
D)根据具体情况而定
答案:B
解析:决策树分解策略是保证子结点的熵小于父结点的熵。

但子结点的熵是该父结点所有孩子结点的熵的总和,因此,并保证任意一个子节点的熵都小于父结点病。

56.[单选题]梯度下降算法的正确步骤是什么( )
(4)初始化随机权重和偏差
(5)对每一个产生误差的神经元,改变相应的(权重)值以减小误差
A)1, 2, 3, 4, 5
B)4, 3, 1, 5, 2
C)3, 2, 1, 5, 4
D)5, 4, 3, 2, 1
答案:B
解析:
57.[单选题]从左到右和从右到左训练两个独立的LSTM语言模型,并将它们简单地连接起来
A)GPT
B)BERT
C)ULMFit
D)ELMo
答案:D
解析:
58.[单选题]下面不属于数据加工的有(__)。

A)数据脱敏
B)数据脱质
C)数据规约
D)数据标注
答案:B
解析:
第2部分:多项选择题,共17题,每题至少两个正确答案,多选或少选均不得分。

59.[多选题]以下关于Zookeeper的Leader选举说法正确的是?()
A)当实例n为奇数时,假定n=2x+1,则成为leader节点需要x+1票
B)Zookeeper选举leader时,需要半数以上的票数
C)当实例数为8时,则成为leader节点需要5票,容灾能力为4
D)当实例数n为奇数时,假定n=2x+1,则成为leader节点需要x票
答案:AB
解析:
60.[多选题]特征选择方法有()。

A)AIC赤池信息准则
B)LARS嵌入式特征选择方法
C)LVW包裹式特征选择方法
D)Relief过滤式特征选择方法
答案:BCD
解析:AIC 赤池信息准则是常用的模型选择方法。

61.[多选题]知识图谱构建过程中涉及下列哪些内容?( ) * *
A)知识获取
B)知识融合
C)知识验证
D)知识分析
62.[多选题]KNN的主要缺点是()
A)计算量大,尤其是特征数非常多的时候
B)样本不平衡的时候,对稀有类别的预测准确率低
C)预测时速度比起逻辑回归之类的算法慢
D)相比决策树模型,KNN模型可解释性不强
答案:ABCD
解析:
63.[多选题]根据学习形式,数据科学中机器学习可分为(__)。

A)人工神经网络和增强学习
B)基于实例学习
C)遗传算法
D)贝叶斯学习
答案:ABCD
解析:
64.[多选题]下列关于Eureka和ZooKeeper的区别说法对的是()?
A)Eureka保证的是CP
B)Eureka保证的是AP
C)ZooKeeper保证的是CP
D)ZooKeeper有Leader和Follower角色
答案:BCD
解析:
65.[多选题]数据挖掘的挖掘方法包括()。

A)聚类
B)回归分析
C)神经网络
D)决策树算法
答案:ABCD
解析:利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web 页挖掘等。

分类方法有决策树算法、KNN算法(K-Nearest Neighbor))、SVM算法、VSM算法、Bayes算法、神经网络等。

聚类算法有基于密度、基于层次、基于模型、基于网格等。

关联规则算法有 Apriori算法、FP-Growth 算法。

66.[多选题]以下关于大数据描述正确的是( )。

A)“涌现”是大数据的本质特征
B)大数据是对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析
C)促进大数据发展行动纲要是2016年由国务院发布的
D)大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合
答案:ABD
解析:
67.[多选题]Adaboost方法中,需要迭代调整的两个重要参数是( )
A)样本权重
B)分类器权重
C)梯度变化率
68.[多选题]决策树剪枝的基本策略有(___)。

A)预剪枝
B)前剪枝
C)后剪枝
D)下剪枝
答案:AC
解析:
69.[多选题]影响聚类算法效果的主要原因有()。

A)特征选取
B)模式相似性测度
C)分类准则
D)已知类别的样本质量
答案:ABC
解析:聚类算法是无监督的学习算法,训练样本的标记信息是未知的。

70.[多选题](__)是数据科学的主要理论基础之一。

A)机器学习
B)统计学
C)数据
D)黑客精神与技能
答案:AB
解析:
71.[多选题]以下哪些产品属于数据产品
A)数据报表平台
B)DMP
C)搜索与精准化产品
D)风控产品
答案:ABCD
解析:
72.[多选题]特征选择在子集生成与搜索方面引入了人工智能搜索技术和子集评价方法。

其中人工智能搜索技术有()。

A)分支界限法
B)浮动搜索法
C)信息熵
D)AIC
答案:ABCD
解析:特征选择在子集生成与搜索方面引入了很多人工智能搜索技术,如分支界限法、浮动搜索法等;在子集评价方法则采用了很多源于信息论的准则,如信息熵、AIC等。

73.[多选题]一个好的分类模型必须具有(___)。

A)低训练误差
B)低泛化误差
C)过拟合
D)欠拟合
答案:AB
A)Jaccard指数
B)FM指数
C)DB指数
D)Dunn指数
答案:CD
解析:AB为外部指标。

75.[多选题]某服务请求经负载均衡设备分配到集群A、B、C、D进行处理响应的概率分别是10%、20%、30%和40%。

已知测试集群所得的稳定性指标分别是90%、95%、99%和99.9%。

现在该服务器请求处理失败,且已排除稳定性以外的问题,那么最有可能在处理该服务请求的集群是________。

A)A
B)B
C)C
D)D
答案:AB
解析:
第3部分:判断题,共16题,请判断题目是否正确。

76.[判断题]如果希望创建一个数组,则只能用array()函数实现。

A)正确
B)错误
答案:错
解析:
77.[判断题]贝叶斯网学习而言,模型就是一个贝叶斯网,每个贝叶斯网描述了一个在训练数据上的概率分布
A)正确;
B)错误;
答案:对
解析:
78.[判断题]在操作DataFrame对象时,可以通过指定索引名的方式获取数据。

A)正确
B)错误
答案:对
解析:
79.[判断题]线性模型的误差可以理解为真实样本点与预测样本点之间的距离
A)正确
B)错误
答案:对
解析:
80.[判断题]Pandas中利用merge函数合并数据表时默认的是内连接方式。

A)正确
B)错误
答案:对
解析:
B)错误
答案:对
解析:
82.[判断题]通过zeros()函数创建的数组中元素值都是0。

A)正确
B)错误
答案:对
解析:
83.[判断题]朴素贝叶斯做了一个很强的“特征条件独立性假设”把问题简化,即假设的各个特征之间相互独立,一个特征出现的概率不受其他特征的影响。

A)正确
B)错误
答案:对
解析:
84.[判断题]K近邻算法的缺点在于当训练集数据量比较大时,预测过程的效率很低
A)正确
B)错误
答案:对
解析:
85.[判断题]机器学习的学习方式是通过获得经验或历史数据不断改进提高做某项任务的表现 。

A)正确
B)错误
答案:对
解析:
86.[判断题]反应事件或对象在某方面的表现或性质的事项称为属性
A)正确
B)错误
答案:对
解析:
87.[判断题]k均值聚类算法是一种典型的EM算法
A)正确;
B)错误;
答案:对
解析:
第4部分:问答题,共9题,请在空白处填写正确答案。

88.[问答题]一个贝叶斯网由()和()两部分构成
答案:结构
解析:
89.[问答题]()是指正确分类的正样本个数占真正的正样本数的比例
90.[问答题]在数据处理时,为什么通常要进行标准化处理。

答案:在实际问题中, 我们使用的样本通常是多维数据, 每一维对应一个特征, 这些特征的量纲和数量级都是不一样的, 这时需要对数据进行标准化处理, 是所 有的特征具有同样的尺度。

解析:
91.[问答题]Logistic regression(逻辑回归)是一种监督式机器学习算法吗?
A)是
B)否
答案:A
解析:当然,Logistic regression是一种监督式学习算法,因为它使用真假标签进行测试。

测试模型时,监督式学习算法应具有输入变量(x)和目标变量(Y)。

92.[问答题]回归任务最常用的性能度量是()
答案:均方误差
解析:
93.[问答题]在训练逻辑回归之前需要对特征进行标准化。

A)是
B)否
答案:B
解析:逻辑回归不需要标准化。

功能标准化的主要目标是帮助优化技术组合。

94.[问答题]简述什么是留一法?
答案:每次留下一个样本作为验证集,其余所有样本作为测试集,样本总数为n,依次对n个样本进行遍历,进行n次验证,再将评估指标求平均值得到最终的评估指标,在样本总数较多的情况下,留一验证法的时间开销极大
解析:
95.[问答题]Numpy中的random模块中的函数shuffle的功能是对一个序列进行( )。

答案:随机排序
解析:
96.[问答题]什么是神经网络的梯度消失问题,为什么会有梯度消失问题?有什么办法能缓解梯度消失问题?
答案:在反向传播算法计算每一层的误差项的时候,需要乘以本层激活函数的导数值,如果导数值接近于0,则多次乘积之后误差项会趋向于0,而参数的梯度值通过误差项计算,这会导致参数的梯度值接近于0,无法用梯度下降法来有效的更新参数的值。

改进激活函数,选用更不容易饱和的函数,如ReLU函数。

解析:
97.[判断题]CART算法处理回归问题时,要求算法输出的是连续实数值
A)正确
B)错误
答案:对
解析:
98.[判断题]深度学习是基于RNN循环神经网络
A)正确
B)错误
答案:错
解析:
B)错误
答案:错
解析:
100.[判断题]学习率越大,训练速度越快,最优解越精确。

A)正确
B)错误
答案:错
解析:。

相关文档
最新文档