CPDA考试真题与答案
CPDA数据分析师原题考试题理论题带答案
正确答案: D 正确答案: D
A、1080 B、1250 C、1000 D、1200
51、在SQL中,建立表用的命令是( )
正确答案: B
A、CREATE SCHEMA B、CREATE TABLE C、CREATE VIEW D、CREATE DATABASE
52、东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别 跑!" 以上对话体现了数据分析方法中的( )
45、对快速聚类(K-Means)说法错误的是( )
正确答案: B
A、占内存少、计算量小、处理速度快 B、可以对样本聚类,也可以对变量聚类 C、适合大样本 D、需要事先确定多少个类别
46、Winter指数平滑模型至少需要( )年以上的数据
正确答案: C
A、2 B、3 C、4 D、5
47、时间序列中的发展水平()
29、在所有两位数(10-99)中任取一两位数,则此数能被2或3整除的概率为
正确答案: C 正确答案: D 正确答案: C
正确答案: C 正确答案: C 正确答案: C 正确答案: D 正确答案: D 正确答案: B 正确答案: A 正确答案: A 正确答案: D 正确答案: B 正确答案: D 正确答案: B 正确答案: C 正确答案: D 正确答案: B 正确答案: A 正确答案: B 正确答案: D 正确答案: B 正确答案: C 正确答案: C 正确答案: B
正确答案: D
A、只能是绝对数 B、只能是相对数 C、只能是平均数 D、以上三种指标都可以
48、在时间序列分析中,一般用循环变动指数(C%)来测定循环波动,( )是计算C%的常用方法。
CPDA考试真题与答案-5
一、判断题(题数:15,共分)1.定量属性可以是整数值或者是连续值。
()正确答案:√2.分类模型的误差大致分为两种:训练误差(training error)和泛化误差(generalization error)。
()正确答案:√>3.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
()正确答案:×4.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
()正确答案:×:5.聚类分析可以看作是一种非监督的分类。
()正确答案:√6.如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。
()正确答案:√(7.允许误差应根据错误记录对整个系统可能带来的破坏来确定,通常正是那些低使用率的产品或不常使用的产品为库存误差带来很大麻烦,因此应结合数量方差百分比和绝对值方差来确定误差。
()正确答案:√8.召回率反映的是预测为正中的样本中正例的概率。
()正确答案:×(9.支持度表示前项与后项在一个数据集中同时出现的频率。
()正确答案:√10.最大最小值标准化法也叫极值法,该方法适用于已知数据集的最小值或最大值情况。
()正确答案:√》11.波特五力模型中五个压力来源是供应商议价能力、购买者的议价能力、行业新进入者的威胁、替代产品的威胁及企业内部的管理压力。
()(分)分正确答案:×12.异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值。
()正确答案:×,13.数据可视化可以便于人们对数据的理解。
()正确答案:√14.大数据思维,是指一种意识,认为公开的数据一旦处理得当可以为人类急需解决的问题提供答案。
()正确答案:√~15.资金本身具有时间价值。
()正确答案:×二、单选题(题数:30,共分)1.某超市研究销售记录发现,购买牛奶的人很大概率会购买面包,这种属于数据挖掘的哪类问题()]A、聚类分析B、关联规则C、分类分析D、自然语言处理正确答案: B2.以下两种描述分别对应哪两种对分类算法的评价标准()(a)警察抓杀人犯,描述警察抓的人中有多少个是杀人犯的标准。
CPDA考试真题与答案 5
一、判断题(题数:15,共分)1.定量属性可以是整数值或者是连续值。
()正确答案:√2.分类模型的误差大致分为两种:训练误差(training error)和泛化误差(generalization error)。
()正确答案:√3.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
()正确答案:×4.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
()正确答案:×5.聚类分析可以看作是一种非监督的分类。
()正确答案:√6.如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。
()正确答案:√7.允许误差应根据错误记录对整个系统可能带来的破坏来确定,通常正是那些低使用率的产品或不常使用的产品为库存误差带来很大麻烦,因此应结合数量方差百分比和绝对值方差来确定误差。
()正确答案:√8.召回率反映的是预测为正中的样本中正例的概率。
()正确答案:×9.支持度表示前项与后项在一个数据集中同时出现的频率。
()正确答案:√10.最大最小值标准化法也叫极值法,该方法适用于已知数据集的最小值或最大值情况。
()正确答案:√11.波特五力模型中五个压力来源是供应商议价能力、购买者的议价能力、行业新进入者的威胁、替代产品的威胁及企业内部的管理压力。
()(分)分正确答案:×12.异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值。
()正确答案:×13.数据可视化可以便于人们对数据的理解。
()正确答案:√14.大数据思维,是指一种意识,认为公开的数据一旦处理得当可以为人类急需解决的问题提供答案。
()正确答案:√15.资金本身具有时间价值。
()正确答案:×二、单选题(题数:30,共分)1.某超市研究销售记录发现,购买牛奶的人很大概率会购买面包,这种属于数据挖掘的哪类问题()A、聚类分析B、关联规则C、分类分析D、自然语言处理正确答案: B2.以下两种描述分别对应哪两种对分类算法的评价标准()(a)警察抓杀人犯,描述警察抓的人中有多少个是杀人犯的标准。
项目数据分析师(PADC)理论考试真题及答案(四)
项目数据分析师(CPDA)理论考试测试题及答案(四)填空题:题目1:某公司拟新建一车间用于生产受市场欢迎的甲产品,据预测甲产品投产后每年可创造100万元的收入;但公司原生产的A产品会因此受到影响,使其年收入由原来的200万元降低到180万元。
则与新建车间相关的现金流量为(80)万元。
(说明:答案取整数)题目2:项目的数据分析是以定量分析为主要分析目的,通过建立(数学模型)的方法进行分析的边缘科学。
题目3:某公司向银行贷款500万元,银行年利率为8%。
如分为5年偿还,每年应支付年金(125.23)万元。
(说明:答案保留两位小数)题解:偿债基金的计算:500/(P/A,8%,5)=500/3.99271=125.23题目4:(增量)现金流量是由于接受或放弃某个投资项目所引起的现金流量的改变量,即有该项目投资和没有该项目投资所造成的现金流量的差额。
题解:根据投资项目现金流量编制的增量原则(又称相关原则、边际原则或有无原则),增量现金流量是由于接受或放弃某个投资项目所引起的现金流量的改变量,即有该项目投资和没有该项目投资所造成的现金流量的差额。
在考虑增量原则时应注意机会成本和沉没成本。
题目5:(独立)项目只有接受和放弃两种选择,(互斥)项目采用其中之一就必须放弃其它项目方案。
题解:独立项目(方案)决策指在资源总量无限的情况下,项目(方案)之间不存在竞争,项目的选择不受同等风险条件下其他可选项目的影响,只取决于自身的经济合理性,方案之间不存在竞争比选关系。
互斥项目(方案)决策指在资源总量受限制的情况下,项目(方案)之间存在互相排斥关系,即选择某项目必须以放弃其他项目为条件。
判断题:题目1:内部收益率考虑了资金时间价值,受折现率高低的影响。
(错误)题目2:项目的数据分析是以定性分析为基础的。
(错误)题目3:投资并不局限于与基础建设相关的经济活动,还包括证券投资、信贷投资和信托投资。
(正确)题目4:投资项目风险的起因是经济活动的不确定性。
CPDA考试真题与答案1
一、单选题1.“大数据”是指规模超过 1000TB 的数据集。
正确答案:×2. 概率为 0 的事件是不可能事件,概率为 1 的事件是必然事件。
正确答案:×3.将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽样。
正确答案:√4.统计图中的散点图主要用来观察变量之间的相关关系。
正确答案:√5.抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。
正确答案:×6.Datahoop1.2 版中 K-means 聚类分析要求输入的数据必须是数值型数据。
正确答案:√7.如果事件 A,B 互斥,且 P(A)>0,P(B)>0, 则 A , B 独立。
正确答案:×8.SQL 中删除表的命令是“ DELETE TABLE”。
正确答案:×9.聚类分析中,各变量的取值在数量级上不能有过大的差异。
正确答案:√10.如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。
正确答案:×11. 需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。
正确答案:×12.使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。
正确答案:√13. 线性回归模型的拟合优度可采用可决系数进行评判。
可决系数越高,模型拟合效果越好;可决系数越小,模型拟合效果越差。
正确答案:×14.一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。
正确答案:×15.决策树中包含根结点、叶结点、内部结点和外部结点。
正确答案:×二、单选题1. 检查异常值常用的统计图形是()A 、柱状图B、箱线图C、帕累托图D、气泡图正确答案:B2.什么是 KDD ?()A、数据挖掘与知识发现B、领域知识发现C、文档知识发现D、动态知识发现正确答案:A3.东北人养了一只鸡和一头猪。
CPDA考试题1
总得分:50.5钱维您好!,通过本次测试表明您对等知识点尚未掌握牢固,希望您对这些知识点进一步加强学习和理解。
填空题:题目:价格(X,元)与需求量(Y,吨)之间的回归方程为: Y=356-1.5X,说明价格每上涨一元,需求量减少( )吨。
(说明:答案取1位小数)正确答案:1.5您的答案:1.5题解:X的系数为 -1.5,说明Y与X为负相关,X每增加1,Y减少1.5。
题目:某自行车生产项目在正常年度的销售单价为180元(不含税),每辆自行车的变动成本为141元,年总固定成本110万元。
如销售税率为5%,盈亏平衡点的销售额为( )万元。
(说明:答案请取整数)正确答案:660您的答案:29690题解:《量化投资》P223 盈亏平衡销售收入BEP(S)=[1100000×180]/[180×(1-5%)-141]=6600000题目:某投资项目在建设期内投入全部原始投资,该项目的获利指数为1.25,则该项目的净现值率为()。
(说明:答案保留两位小数)正确答案:0.25您的答案:0.25题解:《量化投资》P215 净现值率=项目的净现值/初始投资额现值=(运营期各期净现金流量的现值之和-初始投资额现值)/初始投资额现值=获利指数-1题目:某公司生产某种销售价格为25元/件的产品,生产此产品时的固定成本为15000元,单位可变成本则分别为17元/件。
当市场需求量为2200件时,该公司利润为()。
正确答案:2600您的答案:2600题解:《量化经营》P53 (25-17)*2200-15000题目:()是将现在时点的一定量现金按比率折算为未来某个时点的价值。
正确答案:终值您的答案:终值题解:《量化投资》P117判断题:题目:由外购材料和零件转为自制的企业采用的是前向一体化发展战略。
正确答案:错误您的答案:错误题解:《战略管理》P145题目:服务的直接性是指其提供过程就是其所有权转移过程。
正确答案:错误您的答案:错误题解:服务营销中服务的特征:1.无形性2.同步性3.异质性4.不可储存性5.不涉及所有权转移题目:某商品销售增长率大于10%时说明其进入成熟期。
项目数据分析师(PADC)理论考试真题及答案(一)
项目数据分析师(CPDA)理论考试测试题及答案(一)填空题:题目1:(期望值)是各种可能的结果的取值中心,(标准差)表示了未来可能的收益水平围绕最佳期望值变化的区间大小。
题目2:某项永久性奖学金,每年计划颁发50000元奖金。
若年复利率为8%,该奖学金的本金应为(625000)元。
(说明:答案取整数)题目3:NPV的标准差越大,说明项目的风险越(大)题目4:折现率是将未来收益还原或转换为(现值)的比率,通常按项目的(资本成本)确定。
题解:折现率是将未来收益转换为现值的比率,在项目投资的效益评价中,折现率通常以项目的资本成本作为确定依据。
题目5:盈亏平衡分析按照产品销售量和销售收入的关系可以分为(线性)盈亏平衡分析和(非线性)盈亏平衡分析。
题解:根据产销量、成本、利润三者间的关系,可将盈亏平衡分析分为线性盈亏平衡分析与非线性盈亏平衡分析。
线性盈亏平衡分析是建立在假设销售收入与产销量、总成本与产销量成线性函数关系基础上,非线性盈亏平衡分析是在产品成本与产量往往呈非线性变化的实际情况下发展起来的。
判断题:题目1:投资是指与基础建设相关的经济活动,包括基本建设投资和固定资产更新改造投资。
(错误)题目2:会计收益中由于采用的折旧方法不同,各期计提的折旧费用就不同,影响当期收益的计算结果也就不同,会导致折算出来的现值就不一致。
(正确)题目3:风险就是不确定性,不确定性就是风险。
(错误)题目4:项目的数据分析必须通过建立数学模型的方法进行分析。
(正确)题目5:流动资金从本质上来说应归为长期借款。
(错误)题目6:资金时间价值是资金在周转使用中产生的,是资金所有者让渡资金使用权而参与社会财富分配的一种形式。
(正确)题解:资金的时间价值也被称为货币的时间价值。
从资金所有者的角度来看,资金的所有者把资金的使用权转让给使用者时,要求获得一定的报酬;从使用者的角度来看,投资的目的就是获得资本的增值;从消费者的角度来看,未来存在通货膨胀以及其他的风险,牺牲现在的消费总是要求获得补偿的。
CPDA考试真题与答案1
一、单选题1.“大数据”是指规模超过1000TB的数据集。
正确答案:×2.概率为0的事件是不可能事件,概率为1的事件是必然事件。
正确答案:×3.将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽样。
正确答案:√4.统计图中的散点图主要用来观察变量之间的相关关系。
正确答案:√5.抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。
正确答案:×6.Datahoop1.2版中K-means聚类分析要求输入的数据必须是数值型数据。
正确答案:√7.如果事件A,B互斥,且P(A)>0,P(B)>0,则A,B独立。
正确答案:×8. SQL中删除表的命令是“DELETE TABLE”。
正确答案:×9.聚类分析中,各变量的取值在数量级上不能有过大的差异。
正确答案:√10.如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。
正确答案:×11.需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。
正确答案:×12.使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。
正确答案:√13.线性回归模型的拟合优度可采用可决系数进行评判。
可决系数越高,模型拟合效果越好;可决系数越小,模型拟合效果越差。
正确答案:×14.一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。
正确答案:×15.决策树中包含根结点、叶结点、内部结点和外部结点。
正确答案:×二、单选题1. 检查异常值常用的统计图形是()A、柱状图B、箱线图C、帕累托图D、气泡图正确答案: B2. 什么是KDD?()A、数据挖掘与知识发现B、领域知识发现C、文档知识发现D、动态知识发现正确答案: A3. 东北人养了一只鸡和一头猪。
CPDA考试真题含答案
一、判断题1.样本容量是指从总体中抽取的个体。
正确答案:×2.品质数据既可以用整数值表示,也可以用连续值表示。
正确答案:√3.需求弹性大的产品价格与销售收入反向变化。
正确答案:√4.一般而言,定量预测方法在满足下列三个条件时才能使用:一是能够知道待测变量的过去值,二是信息可以量化,三是过去的变动形式将持续到未来是一个合理的假设。
正确答案:√5.在对不同项目进行风险衡量时,可以用标准差作为标准,标准差越大,方案风险水平越高。
正确答案:×6.在一定时期和一定产销量范围内,固定成本与产品的产销量多少没有关系,只有可变成本才与产品产销量的增减变化发生关系。
正确答案:√7.如果两个变量不独立,那这两者的相关系数必然不等于0。
正确答案:×8.数据库类型是按照数据存取的方法来划分的。
正确答案:×9.SQL语言中,条件年龄BETWEEN 15 AND 35,表示年龄在15至35之间,且包括15岁但不包括35岁。
正确答案:×10.资本成本就是资金的时间价值。
正确答案:×11.一组数据排序后处于25%和75%位置上的值称为四分位数。
正确答案:√12.企业购并处于竞争地位的同类型企业形成企业集团称为集团多角化。
正确答案:×13.内部收益率考虑了资金时间价值,受折现率高低的影响。
正确答案:×14.边际收入是指每增加1单位销量所带来的总收入的增加额度。
正确答案:√15.分类预测时,准确率和召回率存在矛盾关系,不能同时增大,所以要考虑他们的综合影响,即F1-Score。
正确答案:×二、单选题1.当所有观测值都落在回归直线上,则这两个变量之间的相关系数为()A、1B、-1C、+1或-1D、0正确答案:C2.表示职称为副教授、性别为男的表达式为()A、职称='副教授' OR 性别='男'B、职称='副教授' AND 性别='男'C、BETWEEN '副教授' AND '男'D、IN ('副教授','男')正确答案:B3.对于下列实验数据:1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11 ,描述其集中趋势用()最为适宜,其值是()。
最新-CPDA考试真题与答案-5
CPDA考试真题与答案--汇总一、判断题(题数:15,共15.0 分)1.定量属性可以是整数值或者是连续值。
()正确答案--:√2.分类模型的误差大致分为两种:训练误差(training error)和泛化误差(generalization error)。
()正确答案--:√3.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
()正确答案--:×4.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
()正确答案--:×5.聚类分析可以看作是一种非监督的分类。
()正确答案--:√6.如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。
()正确答案--:√7.允许误差应根据错误记录对整个系统可能带来的破坏来确定,通常正是那些低使用率的产品或不常使用的产品为库存误差带来很大麻烦,因此应结合数量方差百分比和绝对值方差来确定误差。
()正确答案--:√8.召回率反映的是预测为正中的样本中正例的概率。
()正确答案--:×9.支持度表示前项与后项在一个数据集中同时出现的频率。
()正确答案--:√10.最大最小值标准化法也叫极值法,该方法适用于已知数据集的最小值或最大值情况。
()正确答案--:√11.波特五力模型中五个压力来源是供应商议价能力、购买者的议价能力、行业新进入者的威胁、替代产品的威胁及企业内部的管理压力。
()(1.0分)1.0 分正确答案--:×12.异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值。
()正确答案--:×13.数据可视化可以便于人们对数据的理解。
()正确答案--:√14.大数据思维,是指一种意识,认为公开的数据一旦处理得当可以为人类急需解决的问题提供答案--。
()正确答案--:√15.资金本身具有时间价值。
()正确答案--:×二、单选题(题数:30,共45.0 分)1.某超市研究销售记录发现,购买牛奶的人很大概率会购买面包,这种属于数据挖掘的哪类问题?()A、聚类分析B、关联规则C、分类分析D、自然语言处理正确答案--:B2.以下两种描述分别对应哪两种对分类算法的评价标准?()(a)警察抓杀人犯,描述警察抓的人中有多少个是杀人犯的标准。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、判断题(题数:15,共分)1.定量属性可以是整数值或者是连续值。
()正确答案:√2.分类模型的误差大致分为两种:训练误差(training error)和泛化误差(generalization error)。
()正确答案:√3.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
()正确答案:×4.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
()正确答案:×5.聚类分析可以看作是一种非监督的分类。
()正确答案:√6.如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。
()正确答案:√7.允许误差应根据错误记录对整个系统可能带来的破坏来确定,通常正是那些低使用率的产品或不常使用的产品为库存误差带来很大麻烦,因此应结合数量方差百分比和绝对值方差来确定误差。
()正确答案:√8.召回率反映的是预测为正中的样本中正例的概率。
()正确答案:×9.支持度表示前项与后项在一个数据集中同时出现的频率。
()正确答案:√10.最大最小值标准化法也叫极值法,该方法适用于已知数据集的最小值或最大值情况。
()11.波特五力模型中五个压力来源是供应商议价能力、购买者的议价能力、行业新进入者的威胁、替代产品的威胁及企业内部的管理压力。
()(分)分正确答案:×12.异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值。
()正确答案:×13.数据可视化可以便于人们对数据的理解。
()正确答案:√14.大数据思维,是指一种意识,认为公开的数据一旦处理得当可以为人类急需解决的问题提供答案。
()正确答案:√15.资金本身具有时间价值。
()正确答案:×二、单选题(题数:30,共分)1.某超市研究销售记录发现,购买牛奶的人很大概率会购买面包,这种属于数据挖掘的哪类问题?()A、聚类分析B、关联规则C、分类分析D、自然语言处理正确答案: B2.以下两种描述分别对应哪两种对分类算法的评价标准?()(a)警察抓杀人犯,描述警察抓的人中有多少个是杀人犯的标准。
(b)描述有多少比例的杀人犯给警察抓了的标准。
A、Precision, RecallB、Recall, PrecisionC、Precision, ROCD、Recall, ROC3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A、数据获取B、分类和预测C、数据预处理D、数据可视化正确答案: C4.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?()A、分类B、聚类C、关联分析D、主成分分析正确答案: B5.下面哪种不属于数据预处理的方法?()A、变量代换B、离散化C、聚集D、估计遗漏值正确答案: D6.假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用等宽划分(宽度为50)方法将它们划分成四个箱,求15在哪个箱子里?()A、第一个B、第二个C、第三个D、第四个正确答案: A7.以下哪些算法是分类算法?()A、DBSCAN、B.D、K-medoids正确答案: B8.以下哪些分类方法可以较好地避免样本的不平衡问题?()A、KNNB、SVMC、BayesD、神经网络正确答案: A9.关于K均值和DBSCAN的比较,以下说法不正确的是()。
A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇正确答案: A10.下列不属于关联分析的关键要素的是()A、支持度B、置信度C、满意度D、提升度正确答案: C11.因子分析的主要作用有()A、对变量进行降维B、对变量进行判别C、对变量进行聚类D、以上都不对正确答案: A曲线凸向哪个角,代表模型越理想?()B、左下角C、右上角D、右下角正确答案: A13. SQL语句中删除表的命令是()A、DROP TABLEB、DELETE TABLEC、ERASE TABLED、DELETE DBF正确答案: A14.在多元回归模型的检验中,目的是检验每一个自变量与因变量在指定显著性水平上是否存在线性相关关系的检验是()A、r检验B、t检验C、f检验D、DW检验正确答案: B15.()提供的支撑技术,有效解决了大数据分析、研发的问题,比如虚拟化技术、并行计算、海量存储和海量管理等。
A、点计算B、线计算C、云计算D、面计算正确答案: C16.智能健康手环的应用开发,体现了()的数据采集技术的应用。
A、统计报表B、网络爬虫C、API接口D、传感器D 正确答案:17.下列关于数据重组的说法中,错误的是()A、数据重组是数据的重新生产和重新采集B、数据重组能够使数据焕发新的光芒C、数据重组实现的关键在于多源数据融合和数据集成D、数据重组有利于实现新颖的数据模式创新正确答案: A18.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的()A、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析C、在分析效果上更追究效率而不是绝对精确D、在数据规模上强调相对数据而不是绝对数据正确答案: B19.当前国内社会中,最为突出的大数据环境是()A、互联网B、物联网C、综合国力D、自然资源正确答案: A20.下列关于聚类挖掘技术的说法中,错误的是()A、不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B、要求同类数据的内容相似度尽可能小C、要求不同类数据的内容相似度尽可能小D、与分类挖掘技术相似的是,都是要对数据进行分类处理正确答案: B21.下列关于大数据的分析理念的说法中,错误的是()A、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析C、在分析效果上更追究效率而不是绝对精确、在数据规模上强调相对数据而不是绝对数据D.正确答案: D22.对于企业来说,数据使用的关键是()A、数据收集B、数据存储C、数据分析D、数据再利用正确答案: D23.数据仓库的最终目的是()A、收集业务需求B、建立数据仓库逻辑模型C、开发数据仓库的应用分析D、为用户和业务部门提供决策支持正确答案: D24.大数据背景下,数据支撑业务的目的是()A、建立数据科学B、完成数据应用C、配备数据硬件D、吸纳数据人才正确答案: B25.在SQL中,创建数据库用的命令是()A、CREATE SCHEMAB、CREATE TABLEC、CREATE VIEWD、CREATE DATABASE正确答案: D26.下列四项中,不属于数据库特点的是()A、数据共享B、数据完整性、数据冗余很高C.D、数据独立性高正确答案: C27.资金的时间价值是()A、同一资金在同一时点上价值量的差额B、同一资金在不同时点上价值量的差额C、不同资金在同一时点上价值量的差额D、不同资金在不同时点上价值量的差额正确答案: B28.下列选项中属于现金流入的项目是()A、所得税B、建设投资C、经营成本D、营业收入正确答案: D29.下列关于计算机存储容量单位的说法中,错误的是()1KB<1MB<1GBA、)B、基本单位是字节(Byte C、一个汉字需要一个字节的存储空间D、一个字节能够容纳一个英文字符正确答案: C按数据的结构程度来划分,分为()30.非结构化数据A、结构化数据半结构化数据弱结构化数据B、强结构化数据C、截面数据面板数据二级数据三级数据、一级数据D正确答案: A,共分)20 三、多选题(题数:1.以下属于数据预处理的是()A、缺失值填充B、噪声数据剔除C、异常值识别D、数据可视化正确答案: ABC2.缺失值的处理方法有哪些?()A、用平均值填充B、忽略缺失记录C、以任意数据填充D、用默认值填充正确答案: ABD3.以下属于数据规约方法的是()A、数据离散化B、数据标准化C、噪声数据识别D、数据压缩正确答案: AD4.数据挖掘的预测建模任务主要包括哪几大类问题?()A、分类B、回归C、模式发现、模式匹配DAB 正确答案:?()5.以下说法正确的有哪些A、大数据仅仅是讲数据的体量大B、大数据对传统行业有帮助、大数据会带来机器智能C D、大数据是一种思维方式正确答案: BCD)关于大数据的来源,以下理解正确的是(6.A、大数据是数据量变积累达到质变的结果B、数据的产生需要经历很长时间C、我们每个人都是数据的制造者D、当今的世界,基本上一切都可以用数字表达,所以叫数字化的世界正确答案: ACD7.大数据在今天这个时间点上爆发的原因有哪些?()A、各种传感器无时无刻不在为我们提供大量的数据B、各种监控设备无时无刻不在为我们提供大量的数据C、各种智能设备无时无刻不在为我们提供大量的数据D、互联网的收集和积累正确答案: ABCD8.()这些数据特性都是对聚类分析具有很强影响的。
A、高维性B、规模C、稀疏性D、噪声和离群点正确答案: ABCD9.以下哪个分布是右偏分布?()A、均匀分布B、卡方分布C、F分布D、对数正态分布正确答案: BCD10.以下哪些变量使用RFM方法构造出来的?()A、最近3期境外消费金额B、最近6期网银消费交易笔数C、信用额度D、距最近一次逾期的月数正确答案: ABD11.如下表student中,如何筛选type为包含数学或语文的记录?()A、select * from student where type=“数学” and type=“语文”B、select * from student where type=“数学” or type=“语文”C、select * from student where type in (“数学” , “语文”)D、select * from student where type in (“数学”? “语文”)正确答案: BC12.主成分分析计算选择相关系数计算法时,确定主成分个数的大致原则包括()A、特征根值大于1B、特征根值大于C、累积特征根值加总占总特征根值的80%以上D、累积特征根值加总占总特征根值的90%以上正确答案: AC13.在客户关系管理中,客户的生命周期都包括()阶段。
A、潜在客户B、响应客户C、即得客户D、流失客户正确答案: ABCD14.分箱方法有哪些?()(分)分A、等深分箱B、等宽分箱C、数据标准化D、自定义区间法正确答案: ABD15.利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。