cpda考试真题与答案3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、判断题
1.样本容量是指从总体中抽取的个体。
正确答案:×
2.品质数据既可以用整数值表示,也可以用连续值表示。
正确答案:√
3.需求弹性大的产品价格与销售收入反向变化。
正确答案:√
4.一般而言,定量预测方法在满足下列三个条件时才能使用:一是能够知道待测变量的过去值,二是信息可以量化,三是过去的变动形式将持续到未来是一个合理的假设。
正确答案:√
5.在对不同项目进行风险衡量时,可以用标准差作为标准,标准差越大,方案风险水平越高。正确答案:×
6.在一定时期和一定产销量范围内,固定成本与产品的产销量多少没有关系,只有可变成本才与产品产销量的增减变化发生关系。
正确答案:√
7.如果两个变量不独立,那这两者的相关系数必然不等于0。
正确答案:×
8.数据库类型是按照数据存取的方法来划分的。
正确答案:×
语言中,条件年龄BETWEEN 15 AND 35,表示年龄在15至35之间,且包括15岁但不包括35岁。
正确答案:×
10.资本成本就是资金的时间价值。
正确答案:×
11.一组数据排序后处于25%和75%位置上的值称为四分位数。
正确答案:√
12.企业购并处于竞争地位的同类型企业形成企业集团称为集团多角化。
正确答案:×
13.内部收益率考虑了资金时间价值,受折现率高低的影响。
正确答案:×
14.边际收入是指每增加1单位销量所带来的总收入的增加额度。
正确答案:√
15.分类预测时,准确率和召回率存在矛盾关系,不能同时增大,所以要考虑他们的综合影响,即F1-Score。
正确答案:×
二、单选题
1.当所有观测值都落在回归直线上,则这两个变量之间的相关系数为()
A、1
B、-1
C、+1或-1
D、0
正确答案: C
2.表示职称为副教授、性别为男的表达式为()
A、职称='副教授' OR 性别='男'
B、职称='副教授' AND 性别='男'
C、BETWEEN '副教授' AND '男'
D、IN ('副教授','男')
正确答案: B
3.对于下列实验数据:1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11 ,描述其集中趋势用()最为适宜,其值是()。
A、平均数,
B、中位数,
C、众数,8
D、以上都可以
正确答案: C
4.()是进行项目投资效益评价的最终依据。
A、现金流量
B、盈亏平衡点
C、净现金流量
D、现金流入量
正确答案: C
5.有一组数据其均值是20 ,对其中的每一个数据都加上10 ,那么得到的这组新数据的均值是()。
A、20
B、10
C、15
D、30
正确答案: D
6.分类变量使用以下哪个统计量进行缺失值填补较合适
A、均值
B、最大值
C、众数
D、中位数
正确答案: C
7.假设{BCE}为一频繁项目集(Frequent Itemset),则根据Apriori Principle以下何者不是子频繁项目
A、BC
B、CE
C、C
D、CD
正确答案: D
8.请问以下何者属于时间序列的问题
A、信用卡发卡银行侦测潜在的卡奴
B、基金经理人针对个股做出未来价格预测
C、电信公司将人户区分为数个群体
D、以上均不是
正确答案: B
9.数据正规化(Data Normalization)是在知识发掘处理(Knowledge Discovery Process)中的哪一个阶段进行
A、数据清洗
B、数据选择
C、数据编码
D、数据扩充
正确答案: C
10.已知事件A的概率P(A)=,U为必然事件,则P(A+U)=1,P(AU)=_______
A、
B、
C、0
D、1
正确答案: B
11.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型()
A、直线
B、二次抛物线
C、三次抛物线
D、指数曲线
正确答案: A
12.变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响()
A、方差分析
B、回归分析
C、聚类分析
D、主成分分析
正确答案: C
13.若数据量较大,下面哪种方式比较适合()
A、系统聚类
B、快速聚类(k-means)
C、A和B都可以
D、A和B都不可以
正确答案: B
14.在建立线性回归(Linear Regression)之前我们可以利用何种方法挑选重要属性,以降低模型的复杂度
A、皮尔森相关系数
B、卡方检定
C、T-检定
D、Z-Score
正确答案: A
曲线凸向哪个角,代表模型越理想
A、左上角
B、右上角
C、左下角
D、右下角
正确答案: A
16.决策树中的Information Gain的计算是用来
A、剪枝
B、使树成长
C、处理缺失值和异常值
D、砍树
正确答案: B
17.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离
A、分类
B、聚类
C、关联分析