考试模拟样题—数据分析算法与模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.请你对燃气灶的防干烧功能属性设计调查问题
3.针对燃气灶的防干烧功能,受访者有多少种可能的回答组合,请写出每一种回答组合所对应的属性类别符号(符号见最后一行题注)
4.假设基于对240名受访者的调研,得到下表,请算出这5种功能各自的worse系数和better系数,并基于这两个系数判断这5中功能的属性类别
(3)计算判定系数,并解释其意义;
(4)检验回归方程线性关系的显著性(a=0.05);
(5)如果某地区的人均GDP为5000元,预测其人均消费水平;
(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。(所有结果均保留三位小数)
正确答案:
2.
1.根据以下给出的数据进行分析,本次给出鸢尾花数据,其中包含萼片长、萼片宽、花瓣长、花瓣宽、以及花的类型数据,请根据以下问题进行回答。(本题数据提供在excel里面,数据分析为三份,一份训练数据,一份测试数据,一份预测数据)
正确答案:
4.某厨卫公司要开发一款燃气灶产品,列举出5个可作为卖点的功能属性:防风、定时、防干烧、不沾油、快速而准确地打火。
该公司的产品设计人员不知道该主要开发哪项功能,分析师小李向公司提出了使用KANO模型对上述五个功能进行调研分类的想法。
并得到了公司的支持。假设你是小李
1.请你绘制KANO模型图来介绍对功能属性分类的思路
(3)给出一组预测数据,根据训练模型结果预测,写出预测结果。
正确答案:
3.下表为购物篮事物数据:
购物蓝数据集.xlsx
(1)设minsupport=40%,利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。
(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。
考试模拟样题—数据分析算法与模型
一
1.下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:
一元线性回归.xlsx
一元线性回归预测.xlsx
要求:(1)绘制散点图,并计算相关系数,说明二者之间的关系;
(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义;
鸢尾花训练数据.xlsx
鸢尾花测试数据.xlsx
鸢尾花预测数据.xlsx
(1)根据训练数据,用类型_num作为因变量Y,其他变量作为自变量X,做逻辑回归,写出逻辑回归的方程。
(2)根据测试数据得到的结果,写出逻辑回归的混淆矩阵,以及准确率和召回率,Accuracy和AUC的值(可根据测试数据结果计算表格得到测试数据集的相应的结果)。
69
51
29
89
正确答案:
5.请对该燃气灶的这5项功能开发提出建议
注:魅力属性用符号A表示;必备属性用符号M表示;期望属性用符号O表示;可有可无属性用符号I表示;用户讨厌的属性用R表示;有问题的回答用Q表示
人数
功能
O
I
M
A
防风
118
30
29
63
防干烧
47
78
30wenku.baidu.com
85
定时
22
140
8
70
快速而准确地打火
45
20
107
68
不沾油
3.针对燃气灶的防干烧功能,受访者有多少种可能的回答组合,请写出每一种回答组合所对应的属性类别符号(符号见最后一行题注)
4.假设基于对240名受访者的调研,得到下表,请算出这5种功能各自的worse系数和better系数,并基于这两个系数判断这5中功能的属性类别
(3)计算判定系数,并解释其意义;
(4)检验回归方程线性关系的显著性(a=0.05);
(5)如果某地区的人均GDP为5000元,预测其人均消费水平;
(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。(所有结果均保留三位小数)
正确答案:
2.
1.根据以下给出的数据进行分析,本次给出鸢尾花数据,其中包含萼片长、萼片宽、花瓣长、花瓣宽、以及花的类型数据,请根据以下问题进行回答。(本题数据提供在excel里面,数据分析为三份,一份训练数据,一份测试数据,一份预测数据)
正确答案:
4.某厨卫公司要开发一款燃气灶产品,列举出5个可作为卖点的功能属性:防风、定时、防干烧、不沾油、快速而准确地打火。
该公司的产品设计人员不知道该主要开发哪项功能,分析师小李向公司提出了使用KANO模型对上述五个功能进行调研分类的想法。
并得到了公司的支持。假设你是小李
1.请你绘制KANO模型图来介绍对功能属性分类的思路
(3)给出一组预测数据,根据训练模型结果预测,写出预测结果。
正确答案:
3.下表为购物篮事物数据:
购物蓝数据集.xlsx
(1)设minsupport=40%,利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。
(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。
考试模拟样题—数据分析算法与模型
一
1.下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:
一元线性回归.xlsx
一元线性回归预测.xlsx
要求:(1)绘制散点图,并计算相关系数,说明二者之间的关系;
(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义;
鸢尾花训练数据.xlsx
鸢尾花测试数据.xlsx
鸢尾花预测数据.xlsx
(1)根据训练数据,用类型_num作为因变量Y,其他变量作为自变量X,做逻辑回归,写出逻辑回归的方程。
(2)根据测试数据得到的结果,写出逻辑回归的混淆矩阵,以及准确率和召回率,Accuracy和AUC的值(可根据测试数据结果计算表格得到测试数据集的相应的结果)。
69
51
29
89
正确答案:
5.请对该燃气灶的这5项功能开发提出建议
注:魅力属性用符号A表示;必备属性用符号M表示;期望属性用符号O表示;可有可无属性用符号I表示;用户讨厌的属性用R表示;有问题的回答用Q表示
人数
功能
O
I
M
A
防风
118
30
29
63
防干烧
47
78
30wenku.baidu.com
85
定时
22
140
8
70
快速而准确地打火
45
20
107
68
不沾油