CPDA题库

合集下载

CPDA数据分析师原题考试题理论题带答案

CPDA数据分析师原题考试题理论题带答案

正确答案: D 正确答案: D
A、1080 B、1250 C、1000 D、1200
51、在SQL中,建立表用的命令是( )
正确答案: B
A、CREATE SCHEMA B、CREATE TABLE C、CREATE VIEW D、CREATE DATABASE
52、东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别 跑!" 以上对话体现了数据分析方法中的( )
45、对快速聚类(K-Means)说法错误的是( )
正确答案: B
A、占内存少、计算量小、处理速度快 B、可以对样本聚类,也可以对变量聚类 C、适合大样本 D、需要事先确定多少个类别
46、Winter指数平滑模型至少需要( )年以上的数据
正确答案: C
A、2 B、3 C、4 D、5
47、时间序列中的发展水平()
29、在所有两位数(10-99)中任取一两位数,则此数能被2或3整除的概率为
正确答案: C 正确答案: D 正确答案: C
正确答案: C 正确答案: C 正确答案: C 正确答案: D 正确答案: D 正确答案: B 正确答案: A 正确答案: A 正确答案: D 正确答案: B 正确答案: D 正确答案: B 正确答案: C 正确答案: D 正确答案: B 正确答案: A 正确答案: B 正确答案: D 正确答案: B 正确答案: C 正确答案: C 正确答案: B
正确答案: D
A、只能是绝对数 B、只能是相对数 C、只能是平均数 D、以上三种指标都可以
48、在时间序列分析中,一般用循环变动指数(C%)来测定循环波动,( )是计算C%的常用方法。

CPDA考试真题与答案51

CPDA考试真题与答案51

一、判断题(题数:15,共15.0 分)1.定量属性可以是整数值或者是连续值。

()正确答案:√2.分类模型的误差大致分为两种:训练误差()和泛化误差()。

()正确答案:√3.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。

()正确答案:×4.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。

()正确答案:×5.聚类分析可以看作是一种非监督的分类。

()正确答案:√6.如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。

()正确答案:√7.允许误差应根据错误记录对整个系统可能带来的破坏来确定,通常正是那些低使用率的产品或不常使用的产品为库存误差带来很大麻烦,因此应结合数量方差百分比和绝对值方差来确定误差。

()正确答案:√8.召回率反映的是预测为正中的样本中正例的概率。

()正确答案:×9.支持度表示前项与后项在一个数据集中同时出现的频率。

()正确答案:√10.最大最小值标准化法也叫极值法,该方法适用于已知数据集的最小值或最大值情况。

()正确答案:√11.波特五力模型中五个压力来源是供应商议价能力、购买者的议价能力、行业新进入者的威胁、替代产品的威胁及企业内部的管理压力。

()(1.0分)1.0 分正确答案:×12.异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值。

()正确答案:×13.数据可视化可以便于人们对数据的理解。

()正确答案:√14.大数据思维,是指一种意识,认为公开的数据一旦处理得当可以为人类急需解决的问题提供答案。

()正确答案:√15.资金本身具有时间价值。

()正确答案:×二、单选题(题数:30,共45.0 分)1.某超市研究销售记录发现,购买牛奶的人很大概率会购买面包,这种属于数据挖掘的哪类问题?()A、聚类分析B、关联规则C、分类分析D、自然语言处理正确答案:B2.以下两种描述分别对应哪两种对分类算法的评价标准?()(a)警察抓杀人犯,描述警察抓的人中有多少个是杀人犯的标准。

CPDA题库.docx

CPDA题库.docx

CPDA题库1 “大数据”是指规模超过1000TB的数据集。

×2 概率为0的事件是不可能事件,概率为1的事件是必然事件。

×3 将总体中的各单位按某一标志排列再依固定间隔抽选调查单位的抽样方式为等距抽样√4 统计图中的散点图主要用来观察变量之间的相关关系。

√5 抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。

×6 Datahoop1.2版中K-means聚类分析要求输入的数据必须是数值型数据。

√7 如果事件A,B互斥,且P(A)>0,P(B)>0,则A,B独立。

×8 SQL中删除表的命令是“DELETE TABLE”。

×9 聚类分析中,各变量的取值在数量级上不能有过大的差异。

√10 如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。

×11 需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。

×12 使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。

√13 线性回归模型的拟合优度可采用可决系数进行评判。

可决系数越高,模型拟合效果越好;可决系数越小,模型拟合效果越差。

×14 一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。

×15 决策树中包含根结点、叶结点、内部结点和外部结点。

×1 检查异常值常用的统计图形是(B)A、柱状图B、箱线图C、帕累托图D、气泡图2 什么是KDD?(A )A、数据挖掘与知识发现B、领域知识发现C、文档知识发现D、动态知识发现3 东北人养了一只鸡和一头猪。

一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。

"鸡听了撒丫子就跑。

猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!"以上对话体现了数据分析方法中的(A )A、关联B、聚类C、分类D、自然语言处理4 假设检验中显著性水平是(B)A、推断时犯取伪错误的概率B、推断时取伪弃真的概率C、正确推断的概率D、是推断的可信度5 矩估计的基本原理是(A)A、用样本矩估计总体矩B、使得似然函数达到最大C、使得似然函数达到最小D、小概率事件在一次试验中是不可能发生的6 SQL查询语句中HAVING子句的作用是(C )A、指出分组查询的范围B、指出分组查询的值C、指出分组查询的条件D、指出分组查询的内容7 以下哪项关于决策树的说法是错误的(C )A、冗余属性不会对决策树的准确率造成不利的影响B、子树可能在决策树中重复多次C、决策树算法对于噪声的干扰非常敏感D、寻找最佳决策树是NP完全问题8 以下哪种方法不属于于监督学习模型(C)A、决策树B、线性回归C、关联分析D、判别分析9 考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,若采用合并策略,则由候选产生过程得到4-项集不包含(C)A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,510 下列不属于原始数据来源的是(C )A、行政记录B、统计调查C、统计年鉴D、实验11 下列不属于分类算法的是(D)A、C4.5算法B、逻辑回归C、KNN算法D、TF-TDF算法12 相关分析与回归分析的一个重要区别是(A)A、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度C、两者都研究变量间的变动关系D、两者都不研究变量间的变动关系13 数据仓库是随着时间变化的,下面的描述不正确的是(C)A、数据仓库随时间的变化不断增加新的数据内容B、捕捉到的新数据会覆盖原来的快照C、数据仓库随时间变化不断删去旧的数据内容D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合14 资金的时间价值是(B)A、同一资金在同一时点上价值量的差额B、同一资金在不同时点上价值量的差额C、不同资金在同一时点上价值量的差额D、不同资金在不同时点上价值量的差额15 描述一组对称(或正态)分布数据的离散程度时,最适宜选择的指标是(B)A、极差B、标准差C、均值D、变异系数16 下列有关Apriori算法的说法中不正确的是(C)A、Apriori算法是关联分析中最常用的算法之一。

CPDA考试真题与答案4

CPDA考试真题与答案4

------------------------------------ (HT ------------------------------------一、判断题1.数据可分为结构化数据和非结构化数据等。

正确答案:v2.大数据与传统数据有着本质上的差别,因此之前处理数据的方法和软件都不再适用,大数据分析有专用的软件和方法。

正确答案:x3.数据分析的核心是数据,因此数据的获取和处理十分关键。

正确答案:x4.Apriori算法可用于分类预算。

正确答案:x5.一组数据的众数和中位数都是唯一的。

正确答案:x6.资金的时间价值体现在资金会随着时间而增值,如银行存款会增加利息。

正确答案:x7.茎叶图不仅能够反映数据的分布情况,还能显示数据的原始信息。

正确答案:v8.在多元回归分析中,检验方程的拟合优度用调整后的R的平方效果更好。

正确答案:v9.在对不同项目进行风险衡量时,可以用标准差作为标准,标准差越大,方案风险水平越高。

正确答案:x10.时间序列若无季节变动,则其各月(季)季节指数为0.正确答案:x11一个硬币掷10次,其中5次正面向上的概率是0.5。

正确答案:X12.DBSCAN算法对异常值敏感,因此要在聚类前进行异常值分析。

正确答案:X13在假设检验中,当我们做出拒绝原假设而接受备择假设的结论时,表示原假设是错误的。

正确答案:X14.召回率(recall)指预测为正的样本中实际为正的样本所占比例。

正确答案:X15.逻辑回归只能用于二分类问题,即输出只有两种,分别代表两个类别。

正确答案:X二、单选题1.Apriori算法用下列哪个做项目集(佗四$0。

的筛选?A、最小信赖度(Minimum Confidence)B、最小支持度(Minimum Support)C、交易编号(TransactionlD)D、购买数量正确答案:B2.为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg ;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着()A、南方和北方女婴出生体重的差别无统计学意义B、南方和北方女婴出生体重差别很大C、由于P值太小,南方和北方女婴出生体重差别无意义D、南方和北方女婴出生体重差别有统计学意义但无实际意义正确答案:D3.预测分析中将原始数据分为训练数据集和测试数据集等,其中训练数据集的作用在于()A、用于对模型的效果进行无偏的评估B、用于比较不同模型的预测准确度C、用于构造预测模型D、用于选择模型正确答案:C4.一个射手连续射靶22次,其中3次射中10环,7次射中9环,9次射中8环,3次射中7 环.则射中环数的中位数和众数分别为()A、8,9B、8,8C、8,5,8D、8.5, 9正确答案:B5.一般来说,当居民收入减少时,居民储蓄存款也会相应减少,二者之间的关系是()A、负相关B、正相关C、零相关D、曲线相关正确答案:B6.下表为一交易数据库,请问A - C的信赖度(Confidence^()A、75%B、50%C、60%D、66.7%正确答案:D7.如何利用「体重」以简单贝式分类(Naive Bayes)预测「性别」?A、选取另一条件属性B、将体重正规化为到0〜1之间C、将体重离散化D、无法预测正确答案:C8.以下哪个属于时间序列的问题?()A、信用卡发卡银行侦测潜在的卡奴B、基金经理人针对个股做出未来价格预测C、电信公司将人户区分为数个群体D、以上皆是正确答案:B9.数据缺失(Null Value)处理方法可分为人工填补法及自动填补法,下列哪种填补法可得到较准确的结果?庆、填入一个通用的常数值,例如填入“未知/UnknownB、把填补遗缺值的问题当作是分类或预测的问题口填入该属性的整体平均值口、填入该属性的整体中位数正确答案:B10.某市有各类书店500家,其中大型50家,中型150家,小型300家。

完整版cpda继续教育题库

完整版cpda继续教育题库

1、无限期支付的年金是()A、永续年金B、普通年金C、预付年金D、递延年金答案:A2、下列选项中属于现金流出的项目是()A、回收固定资产残值B、营业收入C、所得税D、回收流动资金答案:C3、在建设期内发生的现金注入和流出量是()A、终结现金流量B、期初现金流量C、经营现金流量D、净现金流量答案:B4、以企业的平均资本成本为折现率的前提是()A、投资项目与企业发前的投资项目具有相同的计算期B、投资项目与企业以前的投资项目具有相同的投资规模C、投资项目与企业以前的投资项目具有相同的风险D、投资项目与企业以前的投资项目具有相同的净现金流量答案:C5、下列关于净现值和基准收益率的关系的表述中正确的是()A、基准收益率减小,净现值相应增大B、基准收益率的大小与净现值无关C、基准收益率减小,净现值相应减小D、基准收益率增大,净现值相应增大答案:A6、下列不可以表达盈亏平衡点的是()A、产量B、单位可变成本C、单位固定成本D、质量答案:D7、下列项目中不属于固定成本的是( )A、计件工资B、水电费C、办公费D、计时工资答案:A8、等年值法需要将参与比较的方案的收益现值按约定计算期折算为均匀序列的()A、永续年金B、预付年金C、普通年金D、递延年金答案:C9、项目数据分析的目的是()A、确定拟建项目是否符合经济条件的允许B、分析产品方案、生产规模是否符合市场需要C、为项目决策提供科学的可靠依据D、评价投入品的供应和有关配套条件能否满足持续生产的需要答案:C10、普通年金现值系数的倒数称为()A、普通年金终值系数B、资本回收系数C、偿债基金系数D、复利终值系数答案:B11、银行业务的"零存整取"类型的存款是()A、永续年金B、终身年金C、预付年金D、普通年金答案:C12、在投资项目现金流量中作现金费用的是()A、维修费B、无形资产摊销C、开办费用摊销D、折旧费答案:A13、下列选项中属于现金流入的项目是()A、所得税B、建设投资C、经营成本D、营业收入答案:D14、对计算期相同,但投资总额不等的互斥项目的比较,最好应用()A、排列顺序法B、年总费用法C、增量收益分析法D、只需要对投资项目的经济效益指标进行评价即可答案:C15、项目终止时发生的现金流入和流出量是()A、经营现金流量B、终结现金流量C、期初现金流量D、净现金流量答案:B16、我国常用的项目评价标准是()A、企业的平均资本成本B、行业基准收益率C、银行贴现率D、市场平均盈利率答案:B17、关于产销量的盈亏平衡点正确的公式是()A、年总变动成本/(产品销售单价×(1-销售税率)-单位固定成本)B、年总固定成本/(产品销售单价+单位变动成本+单位产品销售税额)C、年总固定成本/(产品销售单价×(1-销售税率)+单位变动成本)D、年总固定成本/(产品销售单价-单位变动成本-单位产品销售税额)答案:D18、某项目预计运行5年后的净现值为4500万元,如折现率为16%,其终值应为()万元A、8045.86B、6996.21C、9451.54D、7000.02答案:C19、现在向银行存入5000元,如按照复利计算,年利率为8%,5年后可以获得本息共()元A、7346.6B、3564.8C、7013D、3402.98答案:A20、预计运行8年后的净现值为7000万元,如行业折现率为12.5%,其终值应为()万元。

CPDA-多选题题库

CPDA-多选题题库

CPDA-多选1、逻辑回归算法的缺点有()[Points:5]Correct Answer:B、容易欠拟合|D、对自变量共线性较为敏感2、系统聚类法的局限性在于()[Points:5]Correct Answer:A、可能没有确定的、一致的正确答案|B、一般无法处理大型数据|D、缺乏伸缩性,一旦一个合并或者分裂被执行,就不能撤销3、对于算术平均数的特点,下列说法正确的是()? [Points:5]Correct Answer:A、容易受到异常值的影响|B、综合反映全部数据的信息|C、适用于连续型数据|D、可用于推算总体中的总量指标4、以下算法中对缺失值敏感的有()[Points:5]Correct Answer:A、Logistic回归|B、SVM算法5、下列关于脏数据的说法中,正确的是() [Points:5]Correct Answer:A、格式不规范|B、编码不统一|C、意义不明确|D、与实际业务关系不大6、关于对决策树进行剪枝的说法中正确的是()[Points:5]Correct Answer:A、先剪枝和后剪枝都可以降低决策树的过拟合风险|B、后剪枝决策树的训练时间会比先剪枝决策树和未剪枝决策树长很多|C、先剪枝和后剪枝都是利用验证集精度来判断是否剪枝的7、如果参与分类的变量是连续变量,则适用的聚类方法有()[Points:5]Correct Answer:A、层次聚类法|B、K-均值聚类法|C、两步聚类法8、对于数据挖掘中的原始数据,可能存在的问题有()[Points:5]Correct Answer:A、不一致|B、重复|C、不完整|D、含噪声9、物流外包的效益体现在()[Points:5]Correct Answer:A、提升服务水平|B、提高质量水平|C、经营成本的降低|D、竞争力的提升10、对于数据离散程度,下列说法正确的是()[Points:5]Correct Answer:A、反映变量的稳定性和平衡性|B、表示离散程度|D、离散程度决定数据的分布集中程度11、当前,大数据发展的特点是()[Points:5]Correct Answer:A、规模较大|C、增速很快12、用户画像有哪些应用()[Points:5]Correct Answer:A、精准营销|B、用户统计|C、数据挖掘|D、效果后评定13、以下哪些变量代表RFM方法中的M()[Points:5]Correct Answer:A、最近3期境外消费金额|B、最近6期网银平均消费金额14、选择K-Means算法进行聚类分析时,数据预处理过程需要考虑()[Points:5]Correct Answer:A、缺失值、异常值|B、共线性|C、数据类型|D、数据标准化15、美国海军军官莫里通过对前人航海日记的分析,绘制了新的航海图线路,标明了大风与洋流可能发生的地点,这没有体现大数据分析理念中的()[Points:5]Correct Answer:A、在数据基础上倾向于全体数据而不是抽样数据|C、在分析效果上更追求效率而不是绝对精确|D、在数据规模上强调相对数据而不是绝对数据16、风险决策矩阵中应当包括的基本要素有()[Points:5]Correct Answer:A、备选方案|B、状态空间|D、各方案的可能结果17、大数据在今天这个时间点上爆发的原因有哪些?()[Points:5]Correct Answer:A、各种传感器无时无刻不在为我们提供大量的数据|B、各种监控设备无时无刻不在为我们提供大量的数据|C、各种智能设备无时无刻不在为我们提供大量的数据|D、互联网的收集和积18、对于神经网络的基本结构,下列说法正确的是()[Points:5]Correct Answer:A、根据样本特征的个数来确定输入层神经元的个数|B、根据样本类别的数量来确定输出层神经元个数|D、隐含层的个数和每一层神经元的个数是可变的19、关于bagging算法的描述,正确的是()[Points:5]Correct Answer:A、在训练单个分类器时,每个样本被抽中的概率相同|B、对新样本进行分类时,整体模型结果为得票数最多的类别20、寻找数据集中的关系是为了寻找精确、方便并且有价值地总结了数据的某一特征的表示,这个过程包括了以下哪些步骤? [Points:5]Correct Answer:A、决定要使用的表示的特征和结构|B、决定如何量化和比较不同表示拟合数据的好坏|C、选择一个算法过程使评分函数最优|D、决定用什么样的数据管理原则以高效地实现算法。

理论测试20CPDA

理论测试20CPDA

填空题:题目:某商品的年需求量为7500(件),一次订货的订货成本为60元,一件商品在仓库中保存一年的储存成本为3正确答案:973您的答案:973题解: 《量化经营》P155 EPQ=(2*年需求量*单次订货成本*年生产量/单位年存储成本/(年生产量-年需求量))题目:4年分期付款购物,每年初付3000元,设银行利率为8%,该项分期付款相当于一次现金支付的购价是( )元正确答案:10731.29您的答案:10731.29题解:《量化投资》P123 题中每年初等额付款符合预付年金的概念,又知它问的是现在的一次购价,是现值。

所题目:普通年金终值系数的倒数称为()正确答案:偿债基金系数您的答案:普通年金现值系数题解:《量化投资》P122题目:净现值的标准差越大,说明项目的风险越( )。

正确答案:大您的答案:大题解:《量化投资》P232 标准差反映了净现值分布的集中度,标准差越大,说明各净现值偏离期望净现值的距离题目:内部收益率又叫( ),是投资项目实际可望获得的报酬率。

正确答案:内含报酬率您的答案:内含报酬率题解:《量化投资》P211 内部收益率即内含报酬率,是投资项目在计算期内,使投资项目现金流入现值之和等于判断题:题目:折现率的选择对于一个投资项目而言十分重要,在选择方法上WACC及CAPM是同一种方法,只是表示的方式不正确答案:错误您的答案:正确题解:《量化投资》P131 WACC(加权平均资本成本)是多个资金来源渠道下资本成本的确定方法,CAPM(资本资题目:市场需求潜量是指潜在需求的总和。

正确答案:错误您的答案:错误题解:暂无讲解题目:推的策略适用于用户多而广,需求总量大的产品促销。

正确答案:错误您的答案:正确题解:暂无讲解题目:项目投资是一种以特定项目为对象的长期投资行为,因此项目投资具有一次性特征。

正确答案:正确您的答案:正确题解:《量化投资》P8 项目投资的特征一次性和目标性。

题目:价值高体积重大的产品宜采用短渠道策略。

CPDA考试题1

CPDA考试题1

总得分:50.5钱维您好!,通过本次测试表明您对等知识点尚未掌握牢固,希望您对这些知识点进一步加强学习和理解。

填空题:题目:价格(X,元)与需求量(Y,吨)之间的回归方程为: Y=356-1.5X,说明价格每上涨一元,需求量减少( )吨。

(说明:答案取1位小数)正确答案:1.5您的答案:1.5题解:X的系数为 -1.5,说明Y与X为负相关,X每增加1,Y减少1.5。

题目:某自行车生产项目在正常年度的销售单价为180元(不含税),每辆自行车的变动成本为141元,年总固定成本110万元。

如销售税率为5%,盈亏平衡点的销售额为( )万元。

(说明:答案请取整数)正确答案:660您的答案:29690题解:《量化投资》P223 盈亏平衡销售收入BEP(S)=[1100000×180]/[180×(1-5%)-141]=6600000题目:某投资项目在建设期内投入全部原始投资,该项目的获利指数为1.25,则该项目的净现值率为()。

(说明:答案保留两位小数)正确答案:0.25您的答案:0.25题解:《量化投资》P215 净现值率=项目的净现值/初始投资额现值=(运营期各期净现金流量的现值之和-初始投资额现值)/初始投资额现值=获利指数-1题目:某公司生产某种销售价格为25元/件的产品,生产此产品时的固定成本为15000元,单位可变成本则分别为17元/件。

当市场需求量为2200件时,该公司利润为()。

正确答案:2600您的答案:2600题解:《量化经营》P53 (25-17)*2200-15000题目:()是将现在时点的一定量现金按比率折算为未来某个时点的价值。

正确答案:终值您的答案:终值题解:《量化投资》P117判断题:题目:由外购材料和零件转为自制的企业采用的是前向一体化发展战略。

正确答案:错误您的答案:错误题解:《战略管理》P145题目:服务的直接性是指其提供过程就是其所有权转移过程。

正确答案:错误您的答案:错误题解:服务营销中服务的特征:1.无形性2.同步性3.异质性4.不可储存性5.不涉及所有权转移题目:某商品销售增长率大于10%时说明其进入成熟期。

CPDA题库

CPDA题库

1、预付年金的特点有( )。

A、其终值计算与普通年金相同B、预付年金比普通年金多付一期利息C、收付款项发生在每期的期初D、其现值计算与普通年金相同答案:B, C2、属于现金流出的项目有( )。

A、营业收入B、所得税C、建设投资D、回收固定资产残值答案:B, C3、下列成本项目中是变动成本的有( )。

A、生产工人计时工资B、生产产品耗费的能源费用C、销售部门的销售提成D、固定资产折旧费答案:B, C4、投资项目的现金流量的现金包括( )。

A、银行存款B、货币现金C、厂房设备D、材料答案:B, C, D5、敏感性分析的计算指标有( )A、盈亏平衡点B、敏感度系数C、临界点D、净现值答案:B, C, D6、运用各种贴现指标来评价投资项目的可行性,下列确定投资方案可行的必要条件之一是( )。

A、内含报酬率大于1B、现值指数大于1C、净现值大于0D、内含报酬率高于必要报酬率答案:B, C, D7、项目数据分析的内容包括( )。

A、风险分析B、经济效益评价C、项目投资方案的审核和决策D、项目的比较选择答案:A, B, D8、普通年金的特点有( )。

A、收付款项发生在每期的期末B、最初若干期没有收付款项C、普通年金现值的逆运算是资本回收D、普通年金终值的逆运算是偿债基金答案:A, C, D9、永续年金的特点有( )。

A、永续年金没有终值B、永续年金最初若干期没有收付款项C、永续年金是无限期支付的年金D、永续年金终值计算与普通年金相同答案:A, C10、对项目进行数据分析的目的在于 ( )A、进行市场风险分析B、计算评价指标C、编制财务报表D、进行盈利能力分析答案:A, B, D11、在项目资本金现金流量表中,包括( )A、折旧B、建设期利息C、管理工人工资D、运营期借款利息答案:B, C, D12、下列属于现金流出的项目是( )。

A、开办费摊销B、增值税C、设备更新支出D、运营费用支出答案:C, D13、属于直接投资的经济行为有( )。

CPDA考试真题及答案

CPDA考试真题及答案

一、判断题1.数据可分为构造化数据和非构造化数据等。

正确答案:√2.大数据与传统数据有着本质上的差异,因此之前处理数据的方法和软件都不再适用,大数据分析有专用的软件和方法。

正确答案:×3.数据分析的核心是数据,因此数据的获取和处理十分关键。

正确答案:×4.Apriori算法可用于分类预算。

正确答案:×5.一组数据的众数和中位数都是唯一的。

正确答案:×6.资金的时间价值表达在资金会随着时间而增值,如银行存款会增加利息。

正确答案:×7.茎叶图不仅能够反映数据的分布情况,还能显示数据的原始信息。

正确答案:√8.在多元回归分析中,检验方程的拟合优度用调整后的R的平方效果更好。

正确答案:√9.在对不同工程进展风险衡量时,可以用标准差作为标准,标准差越大,方案风险水平越高。

正确答案:×10.时间序列假设无季节变动,则其各月〔季〕季节指数为0.正确答案:×11.一个硬币掷10 次,其中5 次正面向上的概率是0.5。

正确答案:×12.DBSCAN算法对异常值敏感,因此要在聚类前进展异常值分析。

正确答案:×13.在假设检验中,当我们做出拒绝原假设而承受备择假设的结论时,表示原假设是错误的。

正确答案:×14.召回率〔recall〕指预测为正的样本中实际为正的样本所占比例。

正确答案:×15.逻辑回归只能用于二分类问题,即输出只有两种,分别代表两个类别。

正确答案:×二、单项选择题1.Apriori算法用以下哪个做工程集(Itemset)的筛选.A、最小信赖度(Minimum Confidence)B、最小支持度(Minimum Support)C、交易编号(TransactionID)D、购置数量正确答案:B2.为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着〔〕A、南方和北方女婴出生体重的差异无统计学意义B、南方和北方女婴出生体重差异很大C、由于P值太小,南方和北方女婴出生体重差异无意义D、南方和北方女婴出生体重差异有统计学意义但无实际意义正确答案:D3.预测分析中将原始数据分为训练数据集和测试数据集等,其中训练数据集的作用在于〔〕A、用于对模型的效果进展无偏的评估B、用于比拟不同模型的预测准确度C、用于构造预测模型D、用于选择模型正确答案:C4.一个射手连续射靶22次,其中3次射中10环,7次射中9环,9次射中8环,3次射中7环.则射中环数的中位数和众数分别为〔〕A、8,9B、8,8C、8.5,8D、8.5,9正确答案:B5.一般来说,当居民收入减少时,居民储蓄存款也会相应减少,二者之间的关系是〔〕A、负相关B、正相关C、零相关D、曲线相关正确答案:B6.下表为一交易数据库,请问A →C 的信赖度(Confidence)为〔〕A、75%B、50%C、60%D、66.7%正确答案:D7.如何利用「体重」以简单贝式分类(Naive Bayes)预测「性别」.A、选取另一条件属性B、将体重正规化为到0~1 之间C、将体重离散化D、无法预测正确答案:C8.以下哪个属于时间序列的问题.〔〕A、信用卡发卡银行侦测潜在的卡奴B、基金经理人针对个股做出未来价格预测C、电信公司将人户区分为数个群体D、以上皆是正确答案:B9.数据缺失(Null Value)处理方法可分为人工填补法及自动填补法,以下哪种填补法可得到较准确的结果.A、填入一个通用的常数值,例如填入"未知/UnknownB、把填补遗缺值的问题当作是分类或预测的问题C、填入该属性的整体平均值D、填入该属性的整体中位数正确答案:B10.*市有各类书店500家,其型50家,中型150家,小型300家。

CPDA考试题库

CPDA考试题库

CPDA考试题库题目()表示了未来可能的收益水平围绕最佳期望值变化的区间大小。

答案正确答案:标准差()分析是研究项目的经济变量或条件发生变化时,项目的经济效益指标的变动情况。

正确答案:敏感性()分析是研究项目的正常生产的情况下各个经济变量之间的关系。

正确答案:盈亏平衡()分析找出的某些因素可以作为概率分析风险因素的确定依据。

正确答案:敏感性()就是从多个投资项目方案中选择一种方案而放弃其它方案所丧失的收益。

正确答案:机会成本()是过去已经发生,无法由现在的决策所能改变的支出,与当前的投资项目决策无关的成本正确答案:。

沉没成本()是将现在时点的一定量现金按比率折算为未来某个时点的价值。

正确答案:终值()是没有实物形态但能长期使用的可辨认非货币性(新增)资产。

正确答案:无形资产()是投资项目可能带来的对投资者的其它利益的影响。

正确答案:附加效应()是投资者所要求的必要收益率。

正确答案:资本成本()是指将未来某个时点一定量的现金按比率折算为现在时点的价值。

正确答案:现值()现金流量是由于接受或放弃某个投资项目所引起的现金流量的改变量,即有该项目投资和正确答案:没有该项目投资所造成的现金流量的差额。

增量()作为一种绝对量指标,表示项目投资在某种折现率时的盈利能力。

正确答案:净现值4年分期付款购物,每年初付3000元,设银行利率为8%,该项分期付款相当于一次现金支付的购正确答案:价是()元。

(说明:答案保留两位小数)10731.29 NPV 的标准差越大,说明项目的风险越()。

正确答案:大标准差越(),正态分布曲线越集中,概率分布密度越低。

正确答案:小标准差越(),正态分布曲线越集中,项目风险越小。

正确答案:小并购的类型有横向兼并、纵向兼并和()。

正确答案:混合兼并当年利率为10%时,如想要在4年后获得本息共3000元,现在应存入()元。

(说明:答案取整正确答案:数)2049 根据国家现行财税制度规定,偿还借款本息的资金来源主要是项目投产后所取得的利润和摊入成正确答案:本费用中()、摊销费以及其它资金来源。

CPDA考试真题含答案

CPDA考试真题含答案

精选文档一、判断题1.样本容量是指从整体中抽取的个体。

正确答案:×2.质量数据既能够用整数值表示,也能够用连续值表示。

正确答案:√3.需求弹性大的产品价钱与销售收入反向变化。

正确答案:√4.一般而言,定量展望方法在知足以下三个条件时才能使用:一是能够知道待测变量的过去值,二是信息能够量化,三是过去的改动形式将连续到将来是一个合理的假定。

正确答案:√5.在对不一样项目进行风险权衡时,能够用标准差作为标准,标准差越大,方案风险水平越高。

正确答案:×6.在一准时期和必定产销量范围内,固定成本与产品的产销量多少没有关系,只有可变为本才与产品产销量的增减变化发生关系。

正确答案:√7.假如两个变量不独立,那这二者的有关系数必定不等于0 。

正确答案:×8.数据库种类是依照数据存取的方法来区分的。

正确答案:×9.SQL 语言中,条件年纪 BETWEEN 15 AND 35,表示年纪在 15 至 35 之间,且包含 15 岁但不包含 35 岁。

正确答案:×10.资本成本就是资本的时间价值。

正确答案:×精选文档11.一组数据排序后处于25%和 75%地点上的值称为四分位数。

正确答案:√12.公司购并处于竞争地位的同种类公司形成公司公司称为公司多角化。

正确答案:×13.内部利润率考虑了资本时间价值,受折现率高低的影响。

正确答案:×14.边沿收入是指每增添 1 单位销量所带来的总收入的增添额度。

正确答案:√15.分类展望时,正确率和召回率存在矛盾关系,不可以同时增大,因此要考虑他们的综合影响,即 F1-Score 。

正确答案:×二、单项选择题1.当全部观察值都落在回归直线上,则这两个变量之间的有关系数为()A、1B、 -1C、+1 或-1D、0正确答案: C2.表示职称为副教授、性别为男的表达式为()A、职称 =' 副教授 ' OR 性别 =' 男 'B、职称 =' 副教授 ' AND性别='男'C、 BETWEEN '副教授 ' AND ' 男'D、IN (' 副教授 ','男 ')正确答案: B3.对于以下实验数据: 1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11,描绘其集中趋向用()最为适宜,其值是()。

项目数据分析师理论考试(cpda)题库

项目数据分析师理论考试(cpda)题库

测试题1填空题:题目:()是没有实物形态但能长期使用的资产。

正确答案:无形资产您的答案:题目:某项永久性奖学金,每年计划颁发50000元奖金。

若年复利率为8%,该奖学金的本金应为()元。

(说明:答案取整数)正确答案:625000您的答案:题目:某公司下属两个分厂,一分厂从事家电生产,年销售收入为3000万元,现在二分厂也准备投资一个家电生产项目,预计该项目投产后给二分厂带来的年销售收入为2000万元,但由于与一分厂形成竞争,每年会使一分厂的销售收入减少400万元,那么,从该公司的角度出发,二分厂投资该项目预计的年现金流入为()万元。

正确答案:1600您的答案:题目:预付年金又称(),是指收付款项发生在每期的期初。

预付年金现值是普通年金现值的()倍。

正确答案:先付年金,1+i您的答案:题目:()分析是研究项目的正常生产的情况下各个经济变量之间的关系正确答案:盈亏平衡您的答案:判断题:题目:投资项目的经济变量一般都假设为连续型的随机变量,是服从正态分布的随机变量。

()正确答案:正确您的答案:题目:复利法是利息只按照本金计算,利息部分不再重复计息的方式。

( )正确答案:错误您的答案:题目:对于独立投资项目只有接受和放弃两种选择,不会影响也不考虑其它项目的结果。

()正确答案:正确您的答案:题目:机会成本作为现金流出量,应在现金流量表中体现出来,而且要注意所得税也要相应减免。

()正确答案:错误您的答案:题目:回收固定资产残值时,如果实际变现收入大于固定资产的法定残值,则超出部分应上缴所得税,形成现金流出量。

()正确答案:正确您的答案:题目:利息支出的估算包括长期借款利息(即建设期投资借款在投产后需要支付的利息),用于流动资金的借款利息和短期借款利息三个部分。

()正确答案:正确您的答案:题目:盈亏平衡分析是静态分析,不考虑资金的时间价值和项目寿命周期内的现金流量的变化。

()正确答案:正确您的答案:题目:某企业生产某种产品,年设计生产能力为7.6万台,每件产品的售价为560元,单位可变成本为270元,年固定成本为1666 万元,年销售税金为388万元,该企业的盈亏平衡产量是7.08万台。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 “大数据”是指规模超过1000TB的数据集。

×2 概率为0的事件是不可能事件,概率为1的事件是必然事件。

×3 将总体中的各单位按某一标志排列再依固定间隔抽选调查单位的抽样方式为等距抽样√4 统计图中的散点图主要用来观察变量之间的相关关系。

√5 抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。

×6 Datahoop1.2版中 K-means聚类分析要求输入的数据必须是数值型数据。

√7 如果事件A,B互斥,且P(A)>0,P(B)>0,则A,B独立。

×8 SQL中删除表的命令是“DELETE TABLE”。

×9 聚类分析中,各变量的取值在数量级上不能有过大的差异。

√10 如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。

×11 需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。

×12 使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。

√13 线性回归模型的拟合优度可采用可决系数进行评判。

可决系数越高,模型拟合效果越好;可决系数越小,模型拟合效果越差。

×14 一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。

×15 决策树中包含根结点、叶结点、内部结点和外部结点。

×1 检查异常值常用的统计图形是(B)A、柱状图B、箱线图C、帕累托图D、气泡图2 什么是KDD?(A )A、数据挖掘与知识发现B、领域知识发现C、文档知识发现D、动态知识发现3 东北人养了一只鸡和一头猪。

一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。

"鸡听了撒丫子就跑。

猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!"以上对话体现了数据分析方法中的(A )A、关联B、聚类C、分类D、自然语言处理4 假设检验中显著性水平是(B)A、推断时犯取伪错误的概率B、推断时取伪弃真的概率C、正确推断的概率D、是推断的可信度5 矩估计的基本原理是(A)A、用样本矩估计总体矩B、使得似然函数达到最大C、使得似然函数达到最小D、小概率事件在一次试验中是不可能发生的6 SQL查询语句中HAVING子句的作用是(C )A、指出分组查询的范围B、指出分组查询的值C、指出分组查询的条件D、指出分组查询的内容7 以下哪项关于决策树的说法是错误的(C )A、冗余属性不会对决策树的准确率造成不利的影响B、子树可能在决策树中重复多次C、决策树算法对于噪声的干扰非常敏感D、寻找最佳决策树是NP完全问题8 以下哪种方法不属于于监督学习模型(C)A、决策树B、线性回归C、关联分析D、判别分析9 考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,若采用合并策略,则由候选产生过程得到4-项集不包含(C)A、 1,2,3,4B、 1,2,3,5C、 1,2,4,5D、 1,3,4,510 下列不属于原始数据来源的是(C )A、行政记录B、统计调查C、统计年鉴D、实验11 下列不属于分类算法的是(D)A、 C4.5算法B、逻辑回归C、 KNN算法D、TF-TDF算法12 相关分析与回归分析的一个重要区别是(A)A、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度C、两者都研究变量间的变动关系D、两者都不研究变量间的变动关系13 数据仓库是随着时间变化的,下面的描述不正确的是(C)A、数据仓库随时间的变化不断增加新的数据内容B、捕捉到的新数据会覆盖原来的快照C、数据仓库随时间变化不断删去旧的数据内容D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合14 资金的时间价值是(B)A、同一资金在同一时点上价值量的差额B、同一资金在不同时点上价值量的差额C、不同资金在同一时点上价值量的差额D、不同资金在不同时点上价值量的差额15 描述一组对称(或正态)分布数据的离散程度时,最适宜选择的指标是(B)A、极差B、标准差C、均值D、变异系数16 下列有关Apriori算法的说法中不正确的是(C)A、 Apriori算法是关联分析中最常用的算法之一。

B、应用Apriori算法时,需要先设定模型的最小支持度、最小置信度等阈值。

C、应用Apriori算法时,输入的数据可以是连续型数据也可以是离散型数据。

D、 Apriori算法扫描数据库的次数依赖于最大频繁项集中项的数量。

17 当置信水平一定时,置信区间的宽度(A)A、随着样本量的增大而减小B、随着样本量的增大而增大C、与样本量的大小无关D、先随着样本量的增大而减小,到一定程度后会随着样本量的增大而增大。

18 一种商品价格变动与由此引起另外一种商品需求量相对变动的比率称为(C)A、需求价格弹性B、供给价格弹性C、需求交叉弹性D、供给交叉弹性19 分类器效果检验中的准确率是指(C)A、预测正确的数据在总数据中的比例B、预测为正的数据在总数据中的比例C、预测为正的数据中实际为正的数据所占比例D、实际为正的数据中被预测为正的数据所占比例20 给出下列结论:(1)在回归分析中,可用指数系数R方的值判断模型的拟合效果,R方越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越宽,说明模型的拟合精度越高.以上结论中,正确的有(A )个.A、 1B、 2C、 3D、 421 维度规约是在以下哪个步骤的任务?(C)A、频繁模式挖掘B、降维C、数据预处理D、数据流挖掘22 假设属性income的最大最小值分别是12000元和98000元。

利用最大-最小规范化的方法将属性的值映射到0至1的范围内。

对属性income的73600元将被转化为(D )A、 0.751B、 0.163C、 0.457D、0.71623 假定用于分析的数据包含属性age。

数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。

第二个箱子值为(B)A、 15.7B、 18.3C、 19.7D、以上都不对24 EXCEL中,求标准差的函数是(D)A、 AVERAGEB、 MEDIANC、 MODED、 STDEV25 人们购买制冷用空调主要是为了在夏天获得凉爽空气,这属于空调产品整体概念中的(C)A、有形产品B、直接产品C、核心产品D、主要产品26 贝叶斯决策是根据(D )进行决策的一种方法。

A、极大似然概率B、先验概率C、边际概率D、后验概率27 某人欲为子女筹措250000元的留学经费,预计在8年内的每年年初在银行存入一笔款项,如银行存款年利率为8%,每年应存入金额为(D )A、 23502.87B、 23505.20C、 12698.6D、 21762.6728 指数平滑法可以用以下哪种指标来反映对时间序列资料的修正程度(A )A、平滑常数B、指数平滑数初始值C、跨越期D、季节指数29 某牙膏厂原来生产两面针药物牙膏,现在又增加牙刷生产,这属于(B)A、同心多元化B、水平多元化C、集团多元化D、相关多元化30 净现值、内部收益率、获利指数指标之间的数量关系是(B)A、当NPV>0时,IRR>i,PI<1B、当NPV>0时,IRR>i,PI>1C、当NPV<0时,IRR>i,PI<1D、当NPV<0时,IRR>i,PI>11 以下关于皮尔森相关分析叙述正确的是(AB)A、两变量独立,两者的皮尔森相关系数必然等于0B、两变量皮尔森相关系数不等于0,两者必然不独立C、皮尔森相关系数是否等于零,不能指明两变量是否独立D、两变量不独立,两者的皮尔森相关系数必然不等于02 在实际数据中,元组在某些属性上缺少值是常有的。

描述处理该问题的各种方法有:(ABCD)A、直接删除B、使用属性的平均值填充空缺值C、使用一个全局常量填充空缺值D、使用与给定元组属同一类的所有样本的平均值3 描述变量离期望值大小的指标是(ABC)A、方差B、变异系数C、标准差D、期望4 以下属于分类器评价或比较尺度的有(ABD)A、预测准确度B、召回率C、模型描述的简洁度D、 F1-Score5 以下关于逻辑回归的说法正确的是(ACD)A、应用逻辑回归时,异常值会对模型造成很大的干扰。

B、逻辑回归的自变量必须是分类变量,因此要对连续型变量进行离散化处理。

C、逻辑回归对模型中自变量的多重共线性较为敏感。

D、逻辑回归属于分类算法。

6 下列项目中,其变动可以改变盈亏平衡点位置的因素有(ABCD)A、单价B、单位变动成本C、销量D、固定成本7 关于基准收益率的表述,正确的是(CD )A、基准收益率越高越好B、基准收益率越低越好,但不能低于银行贷款利率C、可以采用项目加权平均资金成本为基础确定基准收益率D、可以采用国家有关部门或行业统一发布的行业基准收益率8 数据离散化是指为了数据分析的需要,将连续数据转换为离散型数据的过程。

数据离散化的方法有(BD )A、随机取值B、等距离散法C、数值规约D、等频离散法9 根据分析内容和侧重面不同,风险分析的方法有(ABD)A、敏感性分析B、概率分析C、经济效益分析D、盈亏平衡分析10 以下说法正确的有(ABCD )A、评价预测精度是通过测量与分析预测误差进行的B、绝对误差是实际观测值与预测值的离差C、相对误差反映实际观测值与预测值之间差异的相对程度D、平均误差反映实际观测值与预测值之间的平均差异11 下列公式正确的是(ACD)A、流动资金=流动资产-流动负债B、流动资产=应收账款+存货C、流动负债=应付账款+预收账款D、流动资金本年增加额=本年流动资金-上年流动资金12 如下哪些不是基于规则的分类器的特点(AC)A、规则集的表达能力远不如决策树好B、基于规则的分类器都对属性空间进行直线划分,并将类指派到每个划分C、无法被用来产生更易于解释的描述性模型D、非常适合处理类分布不平衡的数据集13 以下有关随机森林算法的说法正确的是(ABD)A、随机森林算法的分类精度不会随着决策树数量的增加而提高。

相关文档
最新文档