应用统计学判别分析练习题

合集下载

应用统计学试题及答案

应用统计学试题及答案

应用统计学试题及答案一. 单项选择题 (10%, 每题1分)1.要了解某企业职工的文化水平情况,则总体单位是()。

A.该企业的全部职工B.该企业每一个职工的文化程度C.该企业的每一个职工D.该企业全部职工的平均文化程度2.对一批食品进行质量检验,最适宜采用的调查方法是()。

A.全面调查B.抽样调查C.典型调查D.重点调查3.将某地区40个工业企业按产值多少分组而编制的变量数列中,变量值是()。

A.产值B.工厂数C.各组的产值数D.各组的工厂数4.某企业某月产品销售额为20万元,月末库存商品为30万元,这两个总量指标是()。

A.时期指标B.时点指标C.前者为时期指标,后者为时点指标D.前者为时点指标,后者为时期指标5.离散程度大小与平均数代表性之间存在()。

A.正比关系B.反比关系C.恒等关系D.依存关系6.下面4个动态数列中,属于时点数列的是()。

A.历年招生人数动态数列B.历年增加在校生人数动态数列C.历年在校生人数动态数列D.历年毕业生人数动态数列7.在材料单耗综合指数中,每种产品的材料单耗指标是()。

A.质量指标B.数量指标C.相对指标D.总量指标A、提高B、下降C、不变D、条件不够,无法判断8.某企业产品为连续性生产,为检查产品质量,在24小时中每隔30分钟取下一分钟的产品进行全部检查,这是()。

A.整群抽样 B.简单随机抽样C.类型抽样 D.纯随机抽样9.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y =10 + 70x,这意味着年劳动生产率每提高1 000元时,工人工资平均()。

A.增加70元B.减少70元C.增加80元 D.减少80元10.对某市全部商业企业职工的生活状况进行调查,调查对象是()。

A.该市全部商业企业B.该市全部商业企业职工C.该市每一个商业企业D.该市商业企业每一名职工二. 多项选择题 (20%, 每题2分)1.下面说法正确的是()。

A.性别、文化程度、企业所属行业类型都是品质标志B.企业的职工人数、企业管理人员数都是数量标志C.某地区职工的工资总额是统计指标D.在校学生的年龄是连续变量2.我国第六次人口普查的标准时间是2010年11月1日零时,下列情况应统计人口数的有()。

《应用统计学》练习试题及答案解析

《应用统计学》练习试题及答案解析

《应用统计学》本科第一章导论一、单项选择题1.统计有三种涵义,其基础是( )。

(1)统计学 (2)统计话动 (3)统计方法 (4)统计资料2.一个统计总体( )。

(1)只能有个标志 (2)只能有一个指标 (3)可以有多个标志 (4)可以有多个指标3.若要了解某市工业生产设备情况,则总体单位是该市( )。

(1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备4.某班学生数学考试成绩分刷为65分、71分、80分和87分,这四个数字是( )。

(1)指标 (2)标志 (3)变量 (4)标志值5.下列属于品质标志的是( )。

(1)工人年龄 (2)工人性别 (3)工人体重 (d)工人工资6.现要了解某机床厂的生产经营情况,该厂的产量和利润是( )。

(1)连续变量 (2)离散变量 ()3前者是连续变量,后者是离散变量 (4)前者是离散变量,后者是连续变量7.劳动生产率是( )。

(1)动态指标 (2)质量指标 (3)流量指标 (4)强度指标8.统计规律性主要是通过运用下述方法经整理、分析后得出的结论( )。

(1)统计分组法 (2)大量观察法 (3)练台指标法 (4)统计推断法9.( )是统计的基础功能。

(1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能10.( )是统计的根本准则,是统计的生命线。

(1)真实性 (2)及时件 (3)总体性 (4)连续性11.构成统计总体的必要条件是( )。

(1)差异性 (2)综合性 (3)社会性 (4)同质性12.数理统计学的奠基人是( )。

(1) 威廉·配第 (2)阿亭瓦尔 (3)凯特勒 (4)恩格尔13.统汁研究的数量必须是( )。

(1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量14.数量指标一般表现为( )。

(1)平均数 (2)相对数 (3)绝对数 (1)众数15.指标是说明总体特征的.标志则是说明总体单位特征的,所以( )。

《应用统计分析》试题及参考答案

《应用统计分析》试题及参考答案

《应用统计分析》在线作业参考资料一、单选题1、划分离散变量的组限时,相邻两组的组限(C)。

A 必须是间断的B 必须是重叠的C 既可以是间断的,也可以是重叠的D 应当是相近的2、某连续变量的分组中,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组的组中值为(C)。

A 120B 215C 230D 1853、以产品等级来反映某种产品的质量,则该产品等级是(C)。

A 数量标志B 数量指标C 品质标志D 质量指标4、某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是(D)。

A 标志B 指标值C 指标D 变量值5、在抽样方法中,最简单和最基本的一种抽样方法是(B)。

A 人口按年龄分组B 产品按质量优劣分组C 企业按固定资产原值分组D 乡镇按工业产值分组6、统计工作的成果是(C)。

A 统计学B 统计工作C 统计资料D 统计分析和预测7、抽样误差是指(D)。

A 计算过程中产生的误差B 调查中产生的登记性误差C 调查中产生的系统性误差D 调查中产生的随机性误差8、随着样本单位数增大,样本统计量也趋于接近总体参数,成为抽样推断优良估计的(B)。

A 无偏性B 一致性C 有效性D 均匀性9、在假设检验中,不能拒绝原假设意味着(C)。

A 原假设肯定是正确的B 原假设肯定是错误的C 没有证据证明原假设是正确的D 没有证据证明原假设是错误的10、(A)表示事物的质的特征,是不能以数值表示的。

A 品质标志B 数量标志C 质量指标D 数量指标11、在抽样推断中,可以计算和控制的误差是(B)。

A 抽样实际误差B 抽样标准误差C 非随机误差D 系统性误差12、离中趋势指标中,最容易受极端值影响的是(A)。

A 极差B 方差C 标准差D 标准差系数13、如果所有变量值的频数都减少为原来的1/5,而变量值仍然不变,那么算术平均数(A)。

A不变 B扩大到5倍 C减少为原来的1/5 D不能预测其变化14、计算平均数的基本要求是所要计算的平均数的总体单位应是(B)。

应用统计学试题和答案分析

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。

试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。

已知:8.2,6.12==S x 0455.0=α 则有: 202275.02==Z Z α 平均误差=4.078.22==n S极限误差8.04.0222=⨯==∆nS Z α据公式x x ±=±∆ 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 2。

附:1080512)(=∑-=i x x i 8.392512)(=∑-=i y yi 58=x 2.144=y3题 解① 计算估计的回归方程:∑∑∑∑∑--=)(221x x n y x xy n β==-⨯⨯-⨯290217900572129042430554003060=0.567 =-=∑∑nxnyββ10144.2 – 0.567×58=111.314估计的回归方程为:y=111.314+0.567x② 计算判定系数:4计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。

4题 解:① 拉氏加权产量指数= 1000001.1445.4 1.13530.0 1.08655.2111.60%45.430.055.2q p q q p q ⨯+⨯+⨯==++∑∑② 帕氏单位成本总指数=11100053.633.858.5100.10%1.1445.4 1.13530.0 1.08655.2q pq q p q ++==⨯+⨯+⨯∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题)1、我国人口普查的调查对象是 ,调查单位是 。

应用统计学试题和答案分析 (2)

应用统计学试题和答案分析 (2)

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。

试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。

已知:8.2,6.12==S x 0455.0=α 则有:202275.02==Z Z α平均误差=4.078.22==n S334计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。

4题解:① 拉氏加权产量指数=1000001.1445.4 1.13530.0 1.08655.2111.60%45.430.055.2q p q q p q ⨯+⨯+⨯==++∑∑②帕氏单位成本总指数=11100053.633.858.5100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==⨯+⨯+⨯∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题)1、我国人口普查的调查对象是,调查单位是。

2、___频数密度=频数÷组距,它能准确反映频数分布的实际状况。

143>σ,x 甲>x 乙,由此可推断()x 的代表性高于乙组 4、通常所说的指数是指()①、个体指数②、动态相对数③、复杂现象总体综合变动的相对数 5、抽样误差大小()①、不可事先计算,但能控制②、能够控制,但不能消灭③、能够控制和消灭6、某人持有一种股票,连续三年皆获益,但三年的收益率皆不同,要计算这三年的平均收益率应采用的方法为()①、算术平均数②、中位数③、几何平均数7、某企业生产属连续性生产,为了检查产品质量,在每天生产过程中每隔一小时抽取一件产品进行检验.这种抽样方式是()①、简单随机抽样②、分层抽样③、等距抽样8、在假设检验中,若500:,500:10<≥μμH H ,则此检验是()①、左侧检验②、右侧检验③、双侧检验9、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。

应用统计学试题和答案分析

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。

试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。

已知:8.2,6.12==S x 0455.0=α 则有: 202275.02==Z Z α 平均误差=4.078.22==n S极限误差8.04.0222=⨯==∆nS Z α据公式x x ±=±∆ 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 2。

附:1080512)(=∑-=i x x i8.392512)(=∑-=i y y i 58=x 2.144=y17900512=∑=i x i104361512=∑=i y i4243051=∑=yx ii i3题 解① 计算估计的回归方程:∑∑∑∑∑--=)(221x x n y x xy n β==-⨯⨯-⨯290217900572129042430554003060=0.567 =-=∑∑nxnyββ10144.2 – 0.567×58=111.314估计的回归方程为:y=111.314+0.567x② 计算判定系数:222122()0.56710800.884392.8()x x R y y β-⨯===-∑∑4计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。

4题 解:① 拉氏加权产量指数= 1000001.1445.4 1.13530.0 1.08655.2111.60%45.430.055.2q p q q p q ⨯+⨯+⨯==++∑∑② 帕氏单位成本总指数=11100053.633.858.5100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==⨯+⨯+⨯∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题)1、我国人口普查的调查对象是 ,调查单位是 。

判别分析练习题

判别分析练习题

判别分析练习题判别分析练习题在统计学中,判别分析是一种用于分类和预测的方法。

它通过对不同类别的样本进行分析,构建一个分类模型,以便将未知样本分配到正确的类别中。

判别分析在各个领域都有广泛的应用,如医学诊断、金融风险评估等。

下面我将给大家提供一些判别分析的练习题,希望能够帮助大家更好地理解和应用这一方法。

1. 假设有两个类别的样本,每个样本都有两个变量。

已知两个类别的样本均值和协方差矩阵如下:类别1:均值为(1, 2),协方差矩阵为[[2, 1], [1, 2]]类别2:均值为(3, 4),协方差矩阵为[[3, 1], [1, 3]]现有一个未知样本(2, 3),请利用判别分析方法判断该样本属于哪个类别。

解答:首先,我们需要计算两个类别的判别函数值。

对于类别1,判别函数为:g1(x) = -0.5 * (x - μ1) * Σ1^-1 * (x - μ1)T - 0.5 * ln(|Σ1|) + ln(P1)其中,x为未知样本,μ1为类别1的均值,Σ1为类别1的协方差矩阵,P1为类别1的先验概率。

类似地,对于类别2,判别函数为:g2(x) = -0.5 * (x - μ2) * Σ2^-1 * (x - μ2)T - 0.5 * ln(|Σ2|) + ln(P2)其中,μ2为类别2的均值,Σ2为类别2的协方差矩阵,P2为类别2的先验概率。

根据给定的均值和协方差矩阵,我们可以计算出:μ1 = (1, 2), Σ1 = [[2, 1], [1, 2]]μ2 = (3, 4), Σ2 = [[3, 1], [1, 3]]假设两个类别的先验概率相等,即P1 = P2 = 0.5。

将未知样本(2, 3)代入判别函数中,可以计算出:g1(2, 3) = -4.5g2(2, 3) = -5.5由于g2(2, 3)的值较小,所以未知样本更有可能属于类别2。

2. 现有一个三类别的样本,每个样本有三个变量。

已知三个类别的样本均值和协方差矩阵如下:类别1:均值为(1, 2, 3),协方差矩阵为[[2, 1, 1], [1, 2, 1], [1, 1, 2]]类别2:均值为(4, 5, 6),协方差矩阵为[[3, 1, 2], [1, 3, 2], [2, 2, 3]]类别3:均值为(7, 8, 9),协方差矩阵为[[4, 1, 2], [1, 4, 2], [2, 2, 4]]现有一个未知样本(3, 4, 5),请利用判别分析方法判断该样本属于哪个类别。

应用统计 试题及答案

应用统计 试题及答案

应用统计试题及答案一、选择题1.统计学是一门研究什么的科学?A. 数字B. 数据C. 模型D. 计算答案:B. 数据2.统计学的基本任务是什么?A. 数据分析B. 模型建立C. 结果预测D. 变量选择答案:A. 数据分析3.以下哪个是统计学的一个分支?A. 物理学B. 化学C. 经济学D. 历史学答案:C. 经济学4.统计学中,样本是指什么?A. 全体实验对象B. 全体研究对象C. 随机选取的一部分对象D. 不具备代表性的对象答案:C. 随机选取的一部分对象5.哪个指标用于衡量数据的离散程度?A. 均值B. 中位数C. 标准差D. 方差答案:D. 方差二、填空题1.描述数据离散程度的指标是__________。

答案:标准差2.样本容量为100,抽样误差为0.05,那么置信度为__________。

答案:0.953.样本的均值称为__________。

答案:样本均值4.样本容量为200,样本均值为25,样本标准差为5,总体标准差为10,那么样本的标准误差为__________。

答案:0.35365.样本的方差称为__________。

答案:样本方差三、计算题1.某城市有60%的居民喜欢看电影,现在随机调查了200名居民,其中有120人表示喜欢看电影。

根据这个调查结果,估计该城市所有居民喜欢看电影的比例,并给出95%的置信区间。

答案:样本比例 = 120/200 = 0.6标准误差 = sqrt(0.6(1-0.6)/200) = 0.0346置信区间 = 样本比例 ± 1.96 ×标准误差= 0.6 ± 1.96 × 0.0346= [0.5322, 0.6678]结论:根据这个调查结果,我们可以估计该城市所有居民喜欢看电影的比例为0.6,并且有95%的置信度认为比例在0.5322到0.6678之间。

2.某农场种植了1000棵苹果树,调查其中200棵树的产量,平均每棵树的产量为150斤,样本标准差为30斤。

应用统计学习题及答案word精品文档8页

应用统计学习题及答案word精品文档8页

应用统计学习题及答案简答题1.简述普查和抽样调查的特点。

答:普查是指为某一特定目的而专门组织的全面调查,它具有以下几个特点:(1)普查通常具有周期性。

(2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。

(3)普查的数据一般比较准确,规划程度也较高。

(4)普查的使用范围比较窄。

抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。

它具有以下几个特点:(1)经济性。

这是抽样调查最显著的一个特点。

(2)时效性强。

抽样调查可以迅速、及时地获得所需要的信息。

(3)适应面广。

它适用于对各个领域、各种问题的调查。

(4)准确性高。

2.为什么要计算离散系数?答:离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。

对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。

为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。

离散系数的作用主要是用于比较不同总体或样本数据的离散程度。

离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。

3、加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。

答:加权算术平均数受各组平均数喝次数结构(权数)两因素的影响。

若报告期与基期相比各组平均数没变,则总平均数的变动受次数结构(权数)变动的影响,可能不变、上升、下降。

如果各组次数结构不变,则总平均数;如果组平均数高的组次数比例上升,组平均数低的组次数比例下降,则总平均数上升;如果组平均数低的组次数比例上升,组平均数高的组次数比例下降,则总平均数下降。

4.解释相关关系的含义,说明相关关系的特点。

答:变量之间存在的不确定的数量关系为相关关系。

相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。

应用统计学课后习题和参考答案解析

应用统计学课后习题和参考答案解析

应用统计学课后习题与参考答案第一章一、选择题1.一个统计总体(D)。

A.只能有一个标志 B.只能有一个指标C.可以有多个标志 D.可以有多个指标2.对100名职工的工资收入情况进行调查,则总体单位是(D)。

A.100名职工 B.100名职工的工资总额C.每一名职工 D.每一名职工的工资 3.某班学生统计学考试成绩分别为65分、72分、81分和87分,这4个数字是(D)。

A.指标 B.标志C.变量 D.标志值4.下列属于品质标志的是(B)。

A.工人年龄 B.工人性别C.工人体重 D.工人工资5.某工业企业的职工数、商品销售额是(C)。

A.连续变量 B.离散变量C.前者是离散变量,后者是连续变量 D.前者是连续变量,后者是离散变量 6.下面指标中,属于质量指标的是(C)。

A.全国人口数 B.国内生产总值C.劳动生产率 D.工人工资7.以下指标中属于质量指标的是(C)。

A.播种面积 B.销售量C.单位成本 D.产量8.下列各项中属于数量指标的是(B)。

A.劳动生产率 B.产量C.人口密度 D.资金利税率二、简答题1.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。

(1)这一研究的总体是什么?总体是“所有的网上购物者”。

(2)“消费者在网上购物的原因”是定类变量、定序变量还是数值型变量?分类变量。

(3)研究者所关心的参数是什么?所有的网上购物者的月平均花费。

(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?统计量。

(5)研究者所使用的主要是描述统计方法还是推断统计方法?推断统计方法。

2.要调查某商场销售的全部冰箱情况,试指出总体、个体是什么?试举若干品质标志、数量标志、数量指标和质量指标。

总体:该商店销售的所有冰箱。

总体单位:该商店销售的每一台冰箱。

品质标志:型号、产地、颜色。

数量标志:容量、外形尺寸;数量指标:销售量、销售额。

质量指标:不合格率、平均每天销售量、每小时电消耗量。

应用统计学习题及答案

应用统计学习题及答案

一、简答题(3*3=9分)1、试举例说明总体和总体单位之间的关系。

2、举例说明标志和指标之间的关系。

3、抽样调查、重点调查和典型调查这3种非全面调查的区别是什么4、季节变动的测定常用什么方法?简述其基本步骤。

5、影响抽样误差的因素有哪些?二、宏发电脑公司在全国各地有36家销售分公司,为了分析各公司的销售情况,宏发公司调查了这36家公司上个月的销售额,所得数据如表3-4所示。

(6分)表3-4 分公司销售额数据表(单位:万元)60 60 62 65 65 66 67 70 7172 73 74 75 76 76 76 76 7778 78 79 79 80 82 83 84 8486 87 88 89 89 90 91 92 92根据上面的资料进行适当分组,并编制频数分布表。

解:“销售额”是连续变量,应编制组距式频数分布表。

具体过程如下:第一步:计算全距:926032R=-=第二步:按经验公式确定组数:1 3.3lg367 K≈+≈第三步:确定组距:32/75d=≈第四步:确定组限:以60为最小组的下限,其他组限利用组距依次确定。

第五步:编制频数分布表。

如表3-8所示。

三、某厂对3个车间1季度生产情况分析如下:第1车间实际产量为190件,完成计划95%;第2车间实际产量为250件,完成计划100%;第3车间实际产量为609件,完成计划105%。

则3个车间产品产量的平均计划完成程度为:95%100%105%100%3++=。

另外,1车间产品单位成本为18元/件,2车间产品单位成本为12元/件,3车间产品单位成本为15元/件,则3个车间平均单位成本为:181215153++=元/件。

以上平均指标的计算是否正确?如不正确请说明理由并改正。

(6分)答:两种计算均不正确。

平均计划完成程度的计算,因各车间计划产值不同,不能对其进行简单平均,这样也不符合计划完成程度指标的特定含义。

正确的计算方法是:平均计划完成程度190250609101.84%1902506090.95 1.0 1.05m x m x ++===++∑∑ 平均单位成本的计算也因各车间的产量不同,不能简单相加,产量的多少对平均单位成本有直接的影响。

应用统计试题及答案

应用统计试题及答案

2021 ~2022学年春季学期应用统计课程考试一、判断题(打√ 或×,每题2分,共20分)1.统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。

(√)2.分类数据有时会被赋予数字,可以直接用来计算。

(×)3.众数和中位数都是平均指标的一种,计算时容易受极端数值的影响。

(×)4.在置信水平一定的条件下,增加样本容量,会缩小置信区间。

(√)5.无论是数量指标还是质量指标,都能用数值表示。

(√)6.在假设检验中,对一个总体方差的检验一般使用F检验。

(×)7.若X、Y之间的相关系数r=0,则表明X、Y两变量之间无相关关系。

(×)8.一般来说,冷饮的销量夏季大于冬季,这体现了冷饮销售的长期趋势。

(×)9.用回归方程预测y时,使用的x值离样本数据区间越远预测越准确。

(×)10.一般来说,计划完成程度相对数小于100%,表明没有完成计划。

(×)二、单项选择题(每题2分,共20分)1.要了解北京市城镇居民生活消费情况,最适合的调查方式是( D )。

A. 普查B. 重点调查C. 典型调查D. 抽样调查2.某研究机构在某城市100万个家庭中抽取1000个家庭进行调查,推断该城市家庭年人均收入。

该研究样本是( C )A. 100万个家庭B. 100万个家庭总收入C. 1000个家庭D. 1000个家庭总收入3.将某单位职工的年收入分组为10万元以下、10-12万元、12-14万元、14-16万元、16万元以上等五组,第一组的组中值为( B )。

A. 8万元B. 9万元C. 10万元D. 11万元4.两组数据的平均数不等,但标准差相等,则( A )。

A. 平均数小的,离散程度大B. 平均数大的,离散程度大C. 平均数小的,离散程度小D. 两组数据离散程度相同5.当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是( A )A. t分布B. 正态分布C. F分布D. 卡方分布6.当一组数据中出现0或负数时,将无法计算下列哪种平均数?( C )A. 算术平均数B. 中位数C. 几何平均数D. 众数7.若抽取不同的样本,可以得到___的置信区间;所有的置信区间___都会包含总体参数的真值,以上两个空选择( A )。

《应用统计学》模拟考试题参考答案

《应用统计学》模拟考试题参考答案

应用统计学模拟考试题答案一、判断题(共10小题,每小题1分,共10分)请在你认为正确的题号前的括号内划“√”,在你认为错误的题号前的括号内划“×”。

(√)1、在统计调查中,抽样调查因为诸多优点而最经常被采用。

(√)2、按照计量尺度的差异,可以将统计数据分为分类数据、顺序数据和数值型数据三类。

(×)3、抽样误差是抽样调查中可以设法消除的误差。

(×)4、在假设检验中,如果所计算的P值越小,说明检验结果越不显著。

(√)5、不存在趋势的时间序列称为平稳时间序列。

(√)6、拉氏物价指数是以基期的商品交易量作为同度量因素加权的。

(√)7、展示时间序列数据的最佳图形是线图。

(√)8、统计表主要由表头、行标题、列标题、数字资料和表外附加五部分组成。

(×)9、多数情况下,t分布是一个右偏分布。

(×)10、平均数、中位数、众数等都是用来衡量数据离散趋势的。

二、单选题(共10小题,每小题1分,共10分)请将唯一的正确答案选项写在题号前的括号内。

( A)11、下列变量中属于数值型变量的是A、汽车轮胎的直径B、汽车的内燃机类型C、产品等级D、学生生源类别(C)12、以下各种抽样方式中一定属于非随机抽样的方式是:A、简单随机抽样B、等距抽样C、重点抽样D、类型抽样(C )13、下列图形中不能展示分类数据的图是:A、条形图B、饼图C、直方图D、环状图(B)14、经验数据表明某电话订票点每小时接到订票电话的数目X是服从常数为120的泊松分布,请问该订票点每10分钟内接到订票电话数目Y的分布类型是:A、正态分布B、泊松分布C、二项分布D、超几何分布(D)15、下列有关统计分组的一些说法中,错误的是:A、统计分组是指按照某些重要标志把总体分成若干部分的科学分类B、数值型数据的分组的组数主要取决于数据的全距和组距的大小C、统计分组的目的是为了展现总体的内部结构或分布规律D、统计分组只能按照一个标志单独进行(C)16、下面有关相关关系的一些说法错误的是:A、相关关系是一种普遍存在的关系B、简单相关系数是用来定量描述变量之间线性相关程度的C、简单相关系数为零时,说明两个变量之间不存在任何关系D、简单相关系数绝对值越大,两个变量之间的相关程度越密切(B)17、已知一组数据为10,8,7,3,5,6,8,请问这组数据的中位数为 A、8 B、7 C、6.5 D、10(B)18、某样本数据的方差是36,均值是10,则该组数据的离散系数是:A、3.60B、0.60C、1.67D、0.28(D)19、下列有关参数估计的说法错误的是A、参数估计就是利用样本统计量的值来对总体的参数进行估计B、参数估计有点估计和区间估计等形式C、区间估计必须有相应的置信度作为保证D、区间估计的宽度越大说明估计的精确度越高(C)20、下列有关时间序列的说法错误的是:A、长期趋势是指指标值随时间变化呈现出持续的上升或下降的变动B、循环波动是一种周期性变动C、季节变动是指周期为一年上的周期性变动D、不规则变动是没有特定规律的随机变动三、填空题(共10空,每空1分,共10分)P值大于给定的显著性水平α,则在做决策时,需要在显著性水平α的情况下,___不能拒绝_原假设。

多元统计分析应用 第四章课后习题

多元统计分析应用 第四章课后习题

第四章判别分析习题4.8(1)根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。

(2)现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味评分为8,信任度评分平均为5,试预测该饮料的销售情况。

将数据导入SPSS,分析得到以下结果:1.典型判别函数的特征函数的特征值表表1-1 特征值表表1-1所示是典型判别函数的特征值表,只有两个判别函数,所以特征值只有2个。

函数1的特征值为17.791,函数2的特征值为0.720,判别函数的特征值越大,说明函数越具有区别判断力。

函数1方差的累积贡献率高达96.1%,且典型相关系数为0.973,而函数2方差的贡献率仅为3.9%,典型相关系数为0.647。

由此,说明函数1的区别判断力比函数2的强,函数1更具有区别判断力。

2.Wilks检验结果表1-2 Wilks 的Lambda上表中判别函数1和判别函数2的Wilks’Lambda值为0.031,判别函数2的Wilks’Lambda值为0.581。

“1到2”表示两个判别函数的平均数在三个类间的差异情况,P值=0.002<0.05表示差异达到显著水平“2”表示在排除了第一个判别函数后,第二个判别函数在三个组别间的差异情况,P值=0.197>0.05表示判别函数2未达到显著水平。

3.建立贝叶斯判别函数表1-3 贝叶斯判别法函数系数上表为贝叶斯判别函数的系数矩阵,用数学表达式表示各类的贝叶斯判别函数为:第一组:F1=-81.843-11.689X1+12.97X2+16.761X3第二组:F2=-94.536-10.707X1+13.361X2+17.086X3第三组:F3=-17.499-2.194X1+4.960X2+6.447X3将新品牌饮料样品的自变量值分别代入上述三个贝叶斯判别函数,得到三个函数值为:F1=65.271,F2=65.661,F3=47.884比较三个值,可以看出F2=65.661最大,据此得出新品牌饮料样品应该属于第二组,即该饮料的销售情况为平销。

应用统计学试题和答案分析

应用统计学试题和答案分析

应用统计学试题和答案分析1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。

试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间。

解题过程:由于样本量n=49是大样本,应用中心极限定理,样本均值的极限分布为正态分布,因此可以用正态分布对总体均值进行区间估计。

已知:x=12.6,S=2.8,α=0.0455(φ(2)=0.9545)则有:Zα/2=Z0.=1.96平均误差=2.8/√49=0.4极限误差Δ=1.96×0.4=0.784置信区间为x±Δ,代入数据得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)。

2、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:产品产量(台)xi:40、50、50、70、80;生产费用(万元)yi:130、140、145、150、156.要求:①利用最小二乘法求出估计的回归方程;②计算判定系数R2.解题过程:首先计算xi、yi、xi^2、yi^2、xiyi的和:xi=40+50+50+70+80=290yi=130+140+145+150+156=721xi^2=40^2+50^2+50^2+70^2+80^2=1080yi^2=130^2+140^2+145^2+150^2+156^2=xiyi=40×130+50×140+50×145+70×150+80×156=代入最小二乘法公式计算斜率β和截距α:n∑xiyi-∑xi∑yiβ=———————————n∑xi^2-(∑xi)^25×-290×7210.5675×1080-(290)^2α=1/n(∑yi-β∑xi)1/5(721-0.567×290)111.314因此,估计的回归方程为y=111.314+0.567x。

判别分析上机练习题

判别分析上机练习题

判别分析上机练习题一、基础题1. 给定一组数据,如何判断其适合进行判别分析?2. 简述费希尔判别法的基本思想。

3. 什么是马氏距离?它在判别分析中的作用是什么?4. 请列举至少三种常用的判别分析方法。

5. 在进行判别分析时,为什么要对数据进行标准化处理?二、选择题1. 判别分析的主要目的是:A. 分类B. 聚类C. 回归D. 相关性分析A. 费希尔判别法B. 贝叶斯判别法C. 线性回归D. 逐步判别法A. S_wB. S_bC. S_tD. S_o4. 贝叶斯判别法的分类原则是:A. 使总体概率最大B. 使后验概率最大C. 使先验概率最大D. 使损失函数最小三、计算题1. 已知某组数据的协方差矩阵如下,请计算马氏距离:S = | 2 1 || 1 3 |μ_1 = (1, 2, 3)μ_2 = (2, 3, 4)3. 设有两个总体G1和G2,它们的先验概率分别为P(G1) = 0.6,P(G2) = 0.4。

现有一观测向量X,其属于G1和G2的概率密度函数分别为f1(x)和f2(x)。

试计算X属于G1的后验概率。

G1: (1, 2), (2, 3), (3, 4)G2: (4, 5), (5, 6), (6, 7)四、应用题客户编号 | 年收入(万元) | 消费金额(万元)1 | 10 | 22 | 15 | 33 | 20 | 54 | 25 | 65 | 30 | 86 | 35 | 107 | 40 | 128 | 45 | 15类别1:(1, 2), (2, 3), (3, 4)类别2:(4, 5), (5, 6), (6, 7)新观测样本:(3, 5)五、案例分析题病人编号 | 肺活量(升) | 心率(次/分钟) | 疾病类型 | | |1 | 3.5 | 75 | A2 | 4.0 | 80 | A3 | 3.8 | 78 | A4 | 4.2 | 85 | B5 | 4.5 | 90 | B6 | 4.3 | 88 | B新病人 | 4.1 | 82 | ?用户编号 | 购买频率(次/月) | 平均消费金额(元) | 用户类别| | |1 | 3 | 500 | 高价值2 | 2 | 300 | 低价值3 |4 | 700 | 高价值4 | 1 | 200 | 低价值5 | 5 | 900 | 高价值新用户 | 4 | 600 | ?六、编程题1. 编写Python代码,实现费希尔线性判别函数。

应用统计学练习题及答案(精简版)

应用统计学练习题及答案(精简版)

应用统计学练习题及答案(精简版)应用统计学练习题第一章绪论一、填空题1. 统计工作与统计学的关系是—统计实践 _______ 和—统计理论—的关系。

2. 总体是由许多具有_共同性质—的个别事物组成的整体;总体单位是—总体_的组成单位。

3. 统计单体具有3个基本特征,即—同质性_、—变异性_、和—大量性_。

4. 要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是—每一件产品5. 样本是从一总体_中抽出来的,作为代表_这一总体—的部分单位组成的集合体。

6. 标志是说明单体单位特征的名称,按表现形式不同分为一数量标志_和_品质标志_两种。

7.性别是_品质标志_标志,标志表现则具体体现为—男—或一女_两种结果。

1. 统计总体的同质性是指( A )。

A. 总体各单位具有某一共同的品质标志或数量标志B. 总体各单位具有某一共同的品质标志属性或数量标志值C. 总体各单位具有若干互不相同的品质标志或数量标志D. 总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是4. 一个统计总体(D )。

单项选择题(D )。

A.全部工业企业 C.每一件产品3. 有200家公司每位职工的工资资料, 总体为(A )。

A.200家公司的全部职工 C.200家公司职工的全部工资B.800家工业企业D.800家工业企业的全部工业产品如果要调查这200家公司的工资水平情况,则统计B.200家公司D.200家公司每个职工的工资三、多项选择题1.统计的含义包括( ACD )。

A. 统计资料 B. 统计指标 D. 统计学E. 统计调查2.统计研究运用各种专门的方法,包括( ABCDE )。

A. 大量观察法 B. 统计分组法 D.统计模型法E.统计推断法 3. 下列各项中,哪些属于统计指标?( ACDE )A. 我国 2005 年国民生产总值B. 某同学该学期平均成绩C. 某地区出生人口总数D. 某企业全部工人生产某种产品的人均产量E. 某市工业劳动生产率 4.统计指标的表现形式有( BCE )。

判别分析练习题

判别分析练习题

1. 为明确诊断出小儿肺炎三种类型, 某研究单位测得30名结核性、12名化脓性和18细菌性肺炎患儿共60名的7项生理、生化指标(见下表), 试进行判别分析。

三种类型小儿肺炎7项生理、生化指标观测结果X1 X2 X3 X4 X5 X6 X7 肺炎类型X1 X2 X3 X4 X5 X6 X7肺炎类型问题:(1)建立判别函数;(2)判别回代后的正确判断率为多少?(3)现有两个未知类别的小儿肺炎患者,他们的7项指标分别为:4.0、1、0、0、0、7.0、4.571和18.0、1、0、0、0、60.0、1.727,分别判断他们的类别。

操作:开始建数据库的时候就把(3)的数据输入直接参与操作analyse--classify——Discriminant 肺炎类型放入grouping 其余为自变量其中define range 填入组别最大最小值分别为1 和3Statistics 里面,fisher’s为bayes判别选择fisher’s Classify——display——summary table显示结果Save —(全选)—predicted group membership新数据的预测分类Probabilities of group membership 回代正确率Discriminant scores 判别得分结果中:classification function coefficients下标为fisher’s linear分为几类就有几个判别函数:y=0.033x1+1.617x2+…..Classification rescult’s 下标的88.3%为正确率2. 下表是10名健康人(group=1)和6名心肌梗塞患者(group=2)的三个心电图指标(X1,X2,X3)。

试进行判别分析。

group X1 X2 X31 436.70 49.59 2.321 290.67 30.02 2.461 352.53 36.23 2.361 340.91 38.28 2.441 332.83 41.92 2.281 319.97 31.42 2.491 361.31 37.99 2.021 366.5 39.87 2.421 292.56 26.07 2.161 276.84 16.60 2.912 510.47 67.64 1.732 510.41 62.71 1.582 470.30 54.40 1.682 364.12 46.26 2.092 416.07 45.37 1.902 515.70 84.59 1.75问题:(1)建立判别函数;(2)判别回代后的正确判断率为多少?(3)现有一人,他的3项指标为:420.50、32.42、1.98,判断他是健康人还是心肌梗塞患者?操作与上相同,要注意的是:F判别对数据分布无要求,适用于两组判别分析;B要求数据为多元正态分布,适用于多组判别分析。

应用统计学试题及答案

应用统计学试题及答案

二、单项选择题(每题1分,共10分)1.重点调查中的重点单位是指( )A.处于较好状态的单位B.体现当前工作重点的单位C.规模较大的单位D.在所要调查的数量特征上占有较大比重的单位2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。

A.各组的权数必须相等 B.各组的组中值必须相等C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙)4500 567891B.抽选出的单位有典型意义 C.抽选出的是重点单位D.使用部分单位的指标数值去推断和估计总体的指标数值E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是()A.单位成本计划完成程度为80%B. 单位成本计划完成程度为101.05%C.没完成单位成本计划D.完成了单位成本计划E.单位成本实际比计划少降低了1个百分点3.数据离散程度的测度值中,不受极端数值影响的是()A.极差B.异众比率C.四分位差D.标准差E.离散系数4.下列指标属于时点指标的是( )A.增加人口数B.在校学生数C.利润额D.商品库存额E.银行储蓄存款余额5. 两个变量x 与y 之间完全线性相关,以下结论中正确的是( ) A.相关系数 ?r ?=1 B.相关系数 ?r ?=0 C.估计标准误差S y =0 D.估计标准误差S y =1 E.判定系数r 2=1 F.判定系数r 2=0单项选择题(每题1分,共10分) 1.D 2.C 3.A 4.A 5.A 6.B 7.A 8.B 9.B 10.B一、多项选择题 (每题2分,共10分)1.ADE 2.BCE 3.BC 4.BDE 5.ACE(每题错1项扣1分,错2项及以上扣2分)五、简答题 (5分)则1); ≈估计22月、结(6分):要求:(1)用最小平方法配合直线趋势方程; (2)预测2005年社会商品零售额。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档