应用统计真题

合集下载

应用统计试题及答案

应用统计试题及答案

应用统计试题及答案一、单项选择题(每题2分,共20分)1. 统计学中,用来描述数据集中趋势的量数是()。

A. 方差B. 标准差C. 平均数D. 中位数答案:C2. 在统计学中,一组数据的离散程度可以通过()来衡量。

A. 平均数B. 方差C. 众数D. 极差答案:B3. 以下哪个不是描述数据分布形状的统计量?()A. 偏度B. 峰度C. 平均数D. 标准差答案:C4. 抽样调查中,样本容量的大小对估计的准确性()。

A. 没有影响B. 有正向影响C. 有负向影响D. 影响不确定答案:B5. 以下哪个统计图最适合展示变量间的关系?()A. 条形图B. 折线图C. 散点图D. 饼图答案:C6. 假设检验中,拒绝原假设意味着()。

A. 原假设一定错误B. 有充分证据表明原假设不成立C. 有充分证据表明原假设成立D. 无法确定原假设是否成立答案:B7. 以下哪个统计量不是度量数据的离散程度?()A. 极差B. 方差C. 标准差D. 众数答案:D8. 相关系数的取值范围是()。

A. (-∞, ∞)B. (-1, 1)C. [0, 1)D. (0, ∞)答案:B9. 回归分析中,用于衡量自变量对因变量解释程度的统计量是()。

A. 相关系数B. 回归系数C. 决定系数D. 残差答案:C10. 在方差分析中,F统计量用于检验()。

A. 总体均值是否相等B. 样本均值是否相等C. 总体方差是否相等D. 样本方差是否相等答案:A二、多项选择题(每题3分,共15分)1. 以下哪些是描述数据分布中心的统计量?()A. 平均数B. 中位数C. 众数D. 极差E. 方差答案:ABC2. 以下哪些是描述数据分布形状的统计量?()A. 偏度B. 峰度C. 平均数D. 标准差E. 极差答案:AB3. 以下哪些是描述数据离散程度的统计量?()A. 平均数B. 方差C. 标准差D. 众数E. 极差答案:BCE4. 以下哪些是假设检验的步骤?()A. 建立假设B. 收集数据C. 计算检验统计量D. 确定显著性水平E. 做出决策答案:ABCDE5. 以下哪些是回归分析中常用的诊断方法?()A. 残差图B. 方差膨胀因子C. 相关系数D. 决定系数E. 多重共线性检验答案:ABE三、简答题(每题5分,共10分)1. 请简述什么是置信区间,并说明它在统计推断中的作用。

应用统计学试题和答案

应用统计学试题和答案

应用统计学试题和答案一. 单项选择题(10%, 每题1分)1、()是指构成总体的每—个单位必须或至少有—个共同的性质,正是这个共同的性质才使得这些个体组合在一起,形成一个整体。

A.大量性B.差异性C.同质性D.社会性2、对全国各铁路交通枢纽的货运量、货物种类等进行调查,以了解全国铁路货运概况。

这种调查属于()。

A.普查B.抽样调查C.重点调查D.典型调查3、在抽样调查中,无法避免的误差是()。

A.登记误差B.系统性误差C.计算误差D.抽样误差4、统计表中的主词是指()。

A、表中全部统计资料的内容B、描述研究对象的指标C、各种指标所描述的研究对象D、分布在各栏中的指标数值5、将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为()。

A、动态相对指标B、结构相对指标C、比例相对指标D、比较相对指标6、某企业计划产品产量比上年提高10%,实际提高了15%,则计划完成程度为()。

A.150%B.5%C.4.56%D.104.55%7、两个总体的平均数不等,但标准差相等,则()。

A、小平均数的代表性大B、大平均数的代表性大C、两个平均数代表性相同D、无法判断代表性大小8、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y = 10 + 70x,这意味着年劳动生产率每提高1千元,工人工资平均()。

A、增加70元B、减少70元C、增加80元D、减少80元9、变量间相关程度越低,则相关系数的数值( )。

A、越小B、越接近于0C、越接近于– 1D、越接近于110、产品产量报告期比基期增长25%,单位产品成本减少20%,则生产总成本()。

A、增长5%B、增长20%C、减少80%D、没有变动二. 多项选择题(20%, 每题2分)1.要了解某地区全部大学生的就业情况,那么()。

A.全部大学毕业生是研究总体B.大学毕业生总数是统计指标C.大学毕业生就业率是统计标志D.反映每位大学毕业生特征的职业是数量指标2.某市要调查全市现有养老机构情况,全市每一个养老机构是()。

应用统计基础试题及答案

应用统计基础试题及答案

应用统计基础试题及答案一、单项选择题(每题2分,共20分)1. 以下哪个选项是描述数据集中趋势的统计量?A. 众数B. 方差C. 标准差D. 极差答案:A2. 在统计学中,标准正态分布的均值是:A. -1B. 0C. 1D. 2答案:B3. 以下哪个选项是描述数据离散程度的统计量?A. 平均数B. 中位数C. 众数D. 极差答案:D4. 假设检验中的“显著性水平”通常用哪个希腊字母表示?A. αB. βC. γD. δ5. 相关系数的取值范围是:A. -1到1B. 0到1C. -1到0D. 0到-1答案:A6. 以下哪个选项是描述数据分布形状的统计量?A. 均值B. 方差C. 偏度D. 众数答案:C7. 以下哪个选项是描述数据分布集中趋势的统计量?A. 极差B. 标准差C. 众数D. 偏度答案:C8. 在统计学中,完全正相关的情况下,相关系数的值是:A. 0B. 1C. -1D. 2答案:B9. 以下哪个选项是描述数据分布离散程度的统计量?B. 众数C. 方差D. 极差答案:C10. 以下哪个选项是描述数据分布偏斜方向的统计量?A. 均值B. 标准差C. 偏度D. 极差答案:C二、多项选择题(每题3分,共15分)1. 下列哪些统计量可以用来描述数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差答案:ABC2. 在统计学中,以下哪些是描述数据分布形状的统计量?A. 偏度B. 峰度C. 极差D. 标准差答案:AB3. 以下哪些统计量可以用来描述数据的离散程度?A. 极差B. 方差D. 平均数答案:ABC4. 在假设检验中,以下哪些是常见的检验类型?A. t检验B. 方差分析C. 卡方检验D. 回归分析答案:ABC5. 以下哪些统计量可以用来描述数据的分布?A. 均值B. 众数C. 偏度D. 峰度答案:ABCD三、判断题(每题1分,共10分)1. 标准差是衡量数据集中趋势的统计量。

(×)2. 相关系数的绝对值越接近1,表示变量之间的相关性越强。

应用统计学试题含答案

应用统计学试题含答案

二、单项选择题(每题 1 分,共10 分)1 .重点调查中的重点单位是指()A. 处于较好状态的单位B. 体现当前工作重点的单位C.规模较大的单位D.在所要调查的数量特征上占有较大比重的单位2 .根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。

A .各组的权数必须相等 B.各组的组中值必须相等C .各组数据在各组中均匀分布D .各组的组中值都能取整数值3. 已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。

由此可知两个班考试成绩的离散程度()A.甲班较大B. 乙班较大C. 两班相同D. 无法作比较4. 某乡播种早稻5000亩,其中20咖用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为()A.520 公斤B.530 公斤C.540 公斤D.550 公斤5. 时间序列若无季节变动,则其各月(季)季节指数应为()A.100%B.400%C.120%D.1200%6. 用最小平方法给时间数列配合直线趋势方程y=a+bt,当b< 0时,说明现象的发展趋势是()A.上升趋势B. 下降趋势C. 水平态势D. 不能确定7. 某地区今年和去年相比商品零售价格提高12%则用同样多的货币今年比去年少购买()的商品。

8. 置信概率表达了区间估计的()A.精确性B. 可靠性C. 显着性D. 规范性9. H0:从= ^0,选用Z统计量进行检验,接受原假设H0的标准是()A.|Z| > 乙B.|Z|<Z «/2C.Z > 乙/2D.Z>-Z «10. 对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归方程可能是正确的?()A.y=125-10xB.y=-50+8xC.y=150-20xD.y=-15-6x三、多项选择题(每题2分,共10分)1. 抽样调查的特点有()。

应用统计学考试试题

应用统计学考试试题

应用统计学考试试题一、选择题(每题 3 分,共 30 分)1、下列数据中,属于分类数据的是()A 年龄B 工资C 性别D 体重2、为了调查某校学生的购书费用支出,从男生中抽取 60 名学生调查,从女生中抽取 40 名学生调查,这种抽样方法是()A 简单随机抽样B 分层抽样C 系统抽样D 整群抽样3、设随机变量 X 的概率密度函数为$f(x)=\begin{cases}2x, &0<x<1 \\ 0, &\text{其他}\end{cases}$,则 P(05 < X < 15) =()A 075B 05C 025D 14、设随机变量 X 服从参数为λ的泊松分布,且 P(X = 1) = P(X = 2),则λ =()A 1B 2C 3D 45、设总体 X 服从正态分布$N(\mu,\sigma^2)$,其中$\sigma^2$已知,$\mu$未知。

从总体中抽取样本容量为 n 的样本,样本均值为$\overline{x}$,则$\mu$的置信水平为 1 $\alpha$的置信区间为()A $(\overline{x} z_{\alpha/2}\frac{\sigma}{\sqrt{n}},\overline{x} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}})$B $(\overline{x} t_{\alpha/2}(n 1)\frac{\sigma}{\sqrt{n}},\overline{x} + t_{\alpha/2}(n 1)\frac{\sigma}{\sqrt{n}})$C $(\overline{x} z_{\alpha}\frac{\sigma}{\sqrt{n}},\overline{x} + z_{\alpha}\frac{\sigma}{\sqrt{n}})$D $(\overline{x} t_{\alpha}(n 1)\frac{\sigma}{\sqrt{n}},\overline{x} + t_{\alpha}(n 1)\frac{\sigma}{\sqrt{n}})$6、在假设检验中,原假设为 H0,备择假设为 H1,如果原假设被拒绝,则()A 可能犯第一类错误B 可能犯第二类错误C 两类错误都可能犯D 两类错误都不可能犯7、对于两个独立样本均值之差的检验,当两个总体方差未知但相等时,检验统计量为()A $Z =\frac{\overline{x_1} \overline{x_2}}{\sqrt{\frac{\sigma_1^2}{n_1} +\frac{\sigma_2^2}{n_2}}}$B $T =\frac{\overline{x_1} \overline{x_2}}{\sqrt{\frac{s_1^2}{n_1} +\frac{s_2^2}{n_2}}}$C $F =\frac{s_1^2}{s_2^2}$D $Z =\frac{\overline{x_1} \overline{x_2}}{\sqrt{\frac{(n_1 1)s_1^2 +(n_2 1)s_2^2}{n_1 + n_2 2}(\frac{1}{n_1} +\frac{1}{n_2})}}$8、方差分析中,用于检验不同水平下总体均值是否相等的统计量是()A F 统计量B T 统计量C Z 统计量D $\chi^2$统计量9、相关系数的取值范围是()A -1, 1B 0, 1C (∞,+∞)D 0, +∞)10、在线性回归模型中,判定系数 R²越接近 1,说明()A 回归方程的拟合程度越好B 回归方程的拟合程度越差C 自变量对因变量的影响越大D 自变量对因变量的影响越小二、填空题(每题 3 分,共 30 分)1、数据的类型包括_____、_____和_____。

自考应用统计试题及答案

自考应用统计试题及答案

自考应用统计试题及答案一、选择题(每题2分,共20分)1. 下列哪项不是描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 标准差答案:D2. 在进行回归分析时,如果自变量与因变量之间的关系不是线性的,应采用哪种方法?A. 线性回归B. 多项式回归C. 非线性回归D. 时间序列分析答案:C3. 以下哪个统计概念用于衡量数据的离散程度?A. 方差B. 均值C. 相关系数D. 回归系数答案:A4. 抽样误差是指什么?A. 抽样中的随机误差B. 抽样中的系统误差C. 调查中的非抽样误差D. 抽样中的选择偏差答案:A5. 在统计学中,置信区间的置信水平通常表示为:A. 0到1之间的一个数值B. 一个百分比C. 一个标准差D. 一个均值答案:B6. 下列哪项是概率分布的期望值?A. 中位数B. 众数C. 平均数D. 标准差答案:C7. 在假设检验中,如果原假设是正确的,但实际上拒绝了它,这种情况称为:A. 第一型错误B. 第二型错误C. 正确拒绝D. 不可判定答案:A8. 下列哪项是衡量变量之间线性关系强度和方向的统计量?A. 方差B. 标准差C. 相关系数D. 回归系数答案:C9. 在统计学中,样本容量是指:A. 样本中的个体数量B. 总体中的个体数量C. 调查的持续时间D. 抽样的地点数量答案:A10. 下列哪项不是统计学中的抽样方法?A. 简单随机抽样B. 分层抽样C. 系统抽样D. 全部调查答案:D二、简答题(每题10分,共30分)1. 请简述统计学中的中心极限定理,并说明其在实际应用中的重要性。

答案:中心极限定理是统计学中的一个基本定理,它指出,如果从具有任意概率分布的总体中抽取足够大的样本,那么这些样本的均值的分布将趋近于正态分布。

即使原始总体分布不是正态的,只要样本容量足够大,样本均值的分布仍然可以近似为正态分布。

这个定理在实际应用中非常重要,因为它允许我们使用正态分布的性质来估计和推断总体参数,即使我们对总体的真实分布知之甚少。

山东财经大学2022应用统计真题

山东财经大学2022应用统计真题

山东财经大学2022应用统计真题一、单选题(每题5分,共25分)1、用1个图形描述原材料使用量与产品产量之间关系,下列选项中最合适的是()。

[单选题] *A.散点图(正确答案)B.茎叶图C.箱线图D.直方图2、9名技术人员每月对机器进行维修的时间(小时)分别为:120,150,90,120,130,120,140,110,100。

则根据数据计算的结果,下列关系正确的是()。

[单选题] *A.众数>中位数>均值B.均值>中位数>众数C.中位数>均值>众数D.均值=中位数=众数(正确答案)3、某包装机某天包装出的产品平均重81克,标准差是6克,中位数77克,则该天包装的产品数据分布是()。

[单选题] *A.对称B.左偏C.右偏(正确答案)D.无法确定4、某天随机从生产线上随机抽取100件产品,称重后得知产品的平均重量(公斤)为2,方差为2.5。

则该天生产线上产品重量95%的置信区间为()。

(注:Z0.025=1.96 ) [单选题] *A.1.69~2.31B.1.51~2.49C.1.84~2.16(正确答案)D.1.75~2.255、对两个配对总体的均值之差进行假设检验,需要假定()。

[单选题] *A.两个总体都服从正态分布(正确答案)B.两个样本需相互独立C.两个样本的数据无需一一对应D.两个总体均服从t分布二、多选题(每题5分,共25分)1、在一次假设检验中,当显著性水平a=0.05时,原假设被拒绝。

假定其他情况不变,现将显著性水平设定为a= 0.01,则原假设()。

*A.可能会被拒绝(正确答案)B.可能不会拒绝(正确答案)C.需要重新计算检验统计量或 P 值D.一定会被拒绝2、某个总体的方差为σ2,现在对总体均值μ进行假设检验,样本容量为 n,下列能使用 Z 统计量的情况有()。

*A.总体服从正态分布,σ2已知,n >= 30(正确答案)B.总体服从正态分布,σ2未知,n >=30(正确答案)C.总体服从正态分布,σ2未知,n < 30D.总体服从正态分布,σ2已知,n < 30(正确答案)E.总体分布未知,σ2已知,n < 303、在假设检验中,当作出拒绝原假设而接受备择假设时,表示()。

应用统计学试题含答案

应用统计学试题含答案

六、计算题:〔要求写出计算公式、过程,结果保存两位小数,共4题,每题10分〕1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。

试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;〔φ〔2〕=0.9545〕49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。

:8.2,6.12==S x 0455.0=α 那么有: 202275.02==Z Z α 平均误差=4.078.22==n S极限误差8.04.0222=⨯==∆nS Z α据公式x x ±=±∆ 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为〔11.8,13.4〕3附:1080512)(=∑-=i x x i8.392512)(=∑-=i y y i 58=x 2.144=y17900512=∑=i x i104361512=∑=i y i4243051=∑=yx ii i3题 解① 计算估计的回归方程:∑∑∑∑∑--=)(221x x n y x xy n β==-⨯⨯-⨯290217900572129042430554003060=0.567 =-=∑∑nxnyββ10144.2 – 0.567×58=111.314估计的回归方程为:y=111.314+0.567x② 计算判定系数:222122()0.56710800.884392.8()x x R y y β-⨯===-∑∑4计算以下指数:①拉氏加权产量指数;②帕氏单位本钱总指数。

4题 解:① 拉氏加权产量指数= 1000001.1445.4 1.13530.0 1.08655.2111.60%45.430.055.2q p q q p q ⨯+⨯+⨯==++∑∑② 帕氏单位本钱总指数=11100053.633.858.5100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==⨯+⨯+⨯∑∑ 模拟试卷(二) 一、填空题〔每题1分,共10题〕1、我国人口普查的调查对象是 ,调查单位是。

应用统计复习题答案

应用统计复习题答案

应用统计复习题答案一、单项选择题1. 在统计学中,用于描述一组数据的集中趋势的度量是()。

A. 方差B. 标准差C. 平均数D. 极差答案:C2. 下列哪项不是描述数据离散程度的统计量?()A. 极差B. 标准差C. 众数D. 四分位数间距答案:C3. 相关系数的取值范围是()。

A. [-1, 1]B. (-∞, +∞)C. [0, 1]D. [0, ∞)答案:A4. 假设检验中,如果原假设为真,但被错误地拒绝,这种情况称为()。

A. 第一类错误B. 第二类错误C. 正确决策D. 错误决策答案:A5. 以下哪种分布是对称分布?()A. 正态分布B. 均匀分布C. 指数分布D. 泊松分布答案:A二、多项选择题1. 下列哪些统计图可以用于展示分类数据?()A. 条形图B. 饼图C. 散点图D. 箱线图答案:A|B2. 在回归分析中,以下哪些因素会影响回归方程的准确性?()A. 样本大小B. 变量间相关性C. 异常值D. 多重共线性答案:A|B|C|D三、判断题1. 中位数是将一组数据从小到大排列后,位于中间位置的数值。

()答案:正确2. 标准差越大,数据的波动性越小。

()答案:错误3. 相关系数为0意味着两个变量之间没有任何关系。

()答案:错误四、简答题1. 请简述中心极限定理的内容。

答案:中心极限定理指出,对于足够大的样本量,样本均值的分布将近似正态分布,无论总体分布的形状如何。

2. 什么是置信区间?它在统计推断中有何作用?答案:置信区间是用于估计总体参数的一个区间估计,它以一定的置信水平给出了总体参数可能落在的值的范围。

在统计推断中,置信区间帮助我们了解样本统计量与总体参数之间的关系,并提供了一种量化不确定性的方法。

五、计算题1. 给定一组数据:10, 12, 15, 18, 20,计算其平均数和标准差。

答案:平均数 = (10+12+15+18+20)/5 = 15;标准差= √[(1/5) * ((10-15)^2 + (12-15)^2 + (15-15)^2 + (18-15)^2 + (20-15)^2)] = √[(1/5) * (25+9+0+9+25)] = √[(1/5) * 68] ≈ 4.042. 如果一个总体服从正态分布,其均值为100,标准差为15,从中抽取一个容量为100的样本,求样本均值的95%置信区间。

应用统计 试题及答案

应用统计 试题及答案

应用统计试题及答案一、选择题1.统计学是一门研究什么的科学?A. 数字B. 数据C. 模型D. 计算答案:B. 数据2.统计学的基本任务是什么?A. 数据分析B. 模型建立C. 结果预测D. 变量选择答案:A. 数据分析3.以下哪个是统计学的一个分支?A. 物理学B. 化学C. 经济学D. 历史学答案:C. 经济学4.统计学中,样本是指什么?A. 全体实验对象B. 全体研究对象C. 随机选取的一部分对象D. 不具备代表性的对象答案:C. 随机选取的一部分对象5.哪个指标用于衡量数据的离散程度?A. 均值B. 中位数C. 标准差D. 方差答案:D. 方差二、填空题1.描述数据离散程度的指标是__________。

答案:标准差2.样本容量为100,抽样误差为0.05,那么置信度为__________。

答案:0.953.样本的均值称为__________。

答案:样本均值4.样本容量为200,样本均值为25,样本标准差为5,总体标准差为10,那么样本的标准误差为__________。

答案:0.35365.样本的方差称为__________。

答案:样本方差三、计算题1.某城市有60%的居民喜欢看电影,现在随机调查了200名居民,其中有120人表示喜欢看电影。

根据这个调查结果,估计该城市所有居民喜欢看电影的比例,并给出95%的置信区间。

答案:样本比例 = 120/200 = 0.6标准误差 = sqrt(0.6(1-0.6)/200) = 0.0346置信区间 = 样本比例 ± 1.96 ×标准误差= 0.6 ± 1.96 × 0.0346= [0.5322, 0.6678]结论:根据这个调查结果,我们可以估计该城市所有居民喜欢看电影的比例为0.6,并且有95%的置信度认为比例在0.5322到0.6678之间。

2.某农场种植了1000棵苹果树,调查其中200棵树的产量,平均每棵树的产量为150斤,样本标准差为30斤。

应用统计学试题和答案

应用统计学试题和答案

应用统计学试题和答案统计学(Statistics)是研究收集、整理、描述、分析和解释数据的一门学科,广泛应用于各个领域。

本文将介绍一些应用统计学的试题以及相应的答案,旨在帮助读者加深对统计学概念和方法的理解。

一、选择题1. 下列哪个量不是描述数据分布的度量指标?A. 平均值B. 方差C. 中位数D. 相关系数答案:D2. 如果一组数据呈正态分布,那么其中约有多少比例的数据会落在1个标准差范围内?A. 34%B. 68%C. 95%D. 99.7%答案:B3. 在某班级的成绩中,小明的成绩排在全班第80%的位置,那么小明的排名在班级中大约是第几名?A. 第16名B. 第20名C. 第24名D. 第32名答案:C二、填空题1. 某产品的年销售量(单位:万件)如下:18、21、25、16、19、23、20。

请计算这组数据的平均值。

答案:平均值= (18 + 21 + 25 + 16 + 19 + 23 + 20) / 7 = 142 / 7 ≈ 20.292. 某网络游戏每天的在线人数(单位:千人)如下:12、10、9、14、15、11、13。

请计算这组数据的中位数。

答案:首先将数据排序:9、10、11、12、13、14、15。

中位数为中间值,即第4个数和第5个数的平均值,所以中位数为 (12 + 13) / 2 = 12.5三、计算题某班级学生的数学考试成绩如下:1. 请计算这组数据的标准差。

答案:首先计算平均值:(85 + 76 + 92 + 88 + 79 + 81 + 90 + 84 + 87 + 93) / 10 ≈ 85.5然后计算每个数据与平均值的差的平方,并求和:(85-85.5)^2 + (76-85.5)^2 + ... + (93-85.5)^2 ≈ 230.5标准差= √(230.5 / 10) ≈ 4.82. 请计算这组数据的相关系数。

答案:首先计算每个数据与平均值的差,并求平方:(85-85.5)^2,(76-85.5)^2,...,(93-85.5)^2然后计算每个数据与平均值的差的乘积,并求和:(85-85.5)(76-85.5),(85-85.5)(92-85.5),...,(93-85.5)(87-85.5)最后计算相关系数:相关系数 = (每个数据与平均值的差的乘积的和) / √[(每个数据与平均值的差的平方的和) × (每个数据与平均值的差的平方的和)]计算结果为相关系数≈ 0.757四、应用题某超市的顾客每天购买的商品件数如下:1. 请计算这组数据的众数。

应用统计考研试题及答案

应用统计考研试题及答案

应用统计考研试题及答案一、单项选择题(每题2分,共10分)1. 在统计学中,总体参数是指()A. 从样本数据中得到的统计量B. 描述总体特征的数值C. 描述样本特征的数值D. 用于推断总体的样本统计量2. 下列哪项不是描述数据集中趋势的度量()A. 平均数B. 中位数C. 众数D. 极差3. 假设检验中,犯第一类错误的概率用α表示,那么犯第二类错误的概率用()表示。

A. βB. γC. δD. ε4. 在回归分析中,如果自变量和因变量之间的关系是线性的,那么这种关系可以表示为()A. y = β0 + β1x + εB. y = β0 + β1x^2 + εC. y = β0 + β1x + β2x^2 + εD. y = β0 + β1x^3 + ε5. 下列哪项是时间序列数据的特点()A. 数据点是随机的B. 数据点按照时间顺序排列C. 数据点之间没有关联D. 数据点可以任意排序二、简答题(每题5分,共10分)1. 请简述样本容量对抽样分布的影响。

2. 请解释什么是“大数定律”及其在实际应用中的意义。

三、计算题(每题15分,共30分)1. 某工厂生产的产品中,次品率估计为2%。

假设从这批产品中随机抽取100个进行检查,记录次品数X。

(1) 确定X的分布类型;(2) 计算在抽取的100个产品中,至少有3个次品的概率;(3) 如果已知有5个次品,计算这批产品中次品率超过2%的置信水平。

2. 某地区对家庭收入进行调查,得到以下数据:月收入在3000元以下的有50户,3000-5000元的有120户,5000元以上的有30户。

根据这些数据,计算该地区家庭收入的平均值和标准差。

四、论述题(共20分)1. 论述相关性与回归分析之间的关系,并说明在实际应用中如何确定自变量和因变量。

应用统计考研试题答案一、单项选择题1. B2. D3. A4. A5. B二、简答题1. 样本容量对抽样分布的影响主要体现在样本容量越大,抽样分布越接近正态分布,即满足大数定律。

自考应用统计试题及答案

自考应用统计试题及答案

自考应用统计试题及答案一、选择题(每题2分,共20分)1. 在统计学中,用来描述一组数据集中趋势的指标是()。

A. 平均数B. 方差C. 标准差D. 众数答案:A2. 下列哪个选项不是描述数据离散程度的统计量?()A. 方差B. 标准差C. 均值D. 极差答案:C3. 回归分析中,用来衡量自变量对因变量影响程度的统计量是()。

A. 相关系数B. 回归系数C. 回归标准误D. 回归方程答案:B4. 假设检验中,用于判断原假设是否成立的统计量是()。

A. t统计量B. F统计量C. Z统计量D. 卡方统计量答案:D5. 下列哪个选项不是统计图?()A. 条形图B. 折线图C. 饼图D. 表格答案:D6. 抽样调查中,样本容量的确定主要取决于()。

A. 总体数量B. 总体的变异程度C. 抽样误差D. 调查目的答案:B7. 以下哪个不是时间序列分析的组成部分?()A. 水平B. 趋势C. 季节性D. 离散性答案:D8. 描述两组数据之间关系的统计方法是()。

A. 描述性统计B. 推断性统计C. 相关性分析D. 回归分析答案:C9. 以下哪个选项是概率分布?()A. 正态分布B. 泊松分布C. 二项分布D. 所有以上答案:D10. 在统计学中,用于衡量两个变量之间线性关系强度的指标是()。

A. 相关系数B. 回归系数C. 回归标准误D. 回归方程答案:A二、填空题(每题3分,共15分)1. 一组数据的中位数是将数据从小到大排列后,位于中间位置的数值,如果数据个数为奇数,则中位数是第____个数。

答案:(数据个数+1)/22. 标准差是方差的______次方根。

答案:平方3. 相关系数的取值范围在-1到1之间,相关系数为0表示两变量之间______相关。

答案:无4. 回归分析中,回归系数的估计值是通过______方法得到的。

答案:最小二乘法5. 卡方检验是一种非参数检验方法,它用于检验两个分类变量之间的______。

应用统计学(含答案)

应用统计学(含答案)

应用统计学一、计算题(请在以下题目中任选2题作答,每题25分,共50分)1、下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y 表示)和他在校学习时的总评分(用x 表示)的回归方程。

2、某一汽车装配操作线完成时间的计划均值为2.2分钟。

由于完成时间既受上一道装配操作线的影响,又影响到下一道装配操作线的生产,所以保持2.2分钟的标准是很重要的。

一个随机样本由45项组成,其完成时间的样本均值为2.39分钟,样本标准差为0.20分钟。

在0.05的显著性水平下检验操作线是否达到了2.2分钟的标准。

96.12=αμ3、设总体X 的概率密度函数为2(ln )2,0(,)0,0x x f x x μμ--⎧>=≤⎩其中μ为未知参数,nX X X ,...,,21是来自X 的样本。

(1)试求13)(+=μμg 的极大似然估计量)(g ˆμ; (2)试验证)(g ˆμ 是)(μg 的无偏估计量。

4、某商店为解决居民对某种商品的需要,调查了100户住户,得出每月每户平均需要量为10千克,样本方差为9。

若这个商店供应10000户,求最少需要准备多少这种商品,才能以95%的概率满足需要?5、根据下表中Y与X 两个变量的样本数据,建立Y与X的一元线性回归方程。

Y ijf X 5 10 15 20yf120 0 0 8 10 18140 3 4 3 0 10fx3 4 11 10 286、假定某化工原料在处理前和处理后取样得到的含脂率如下表:处理前0.140 0.138 0.143 0.142 0.144 0.137处理后0.135 0.140 0.142 0.136 0.138 0.140假定处理前后含脂率都服从正态分布,问处理后与处理前含脂率均值有无显著差异。

7、某茶叶制造商声称其生产的一种包装茶叶平均每包重量不低于150克,已知茶叶包装重量服从正态分布,现从一批包装茶叶中随机抽取100包,检验结果如下:每包重量(克) 包数(包)f x xfx-(x-)2f148—149 10 148.5 1485 -1.8 32.4149—150 20 149.5 2990 -0.8 12.8 150—151 50 150.5 7525 0.2 2.0 151—152 20 151.5 3030 1.2 28.8合计100 -- 15030 -- 76.0要求:(1)计算该样本每包重量的均值和标准差;(2)以99%的概率估计该批茶叶平均每包重量的置信区间(t0.005(99)≈2.626);(3)在ɑ=0.01的显著性水平上检验该制造商的说法是否可信(t0.01(99)≈2.364)(4)以95%的概率对这批包装茶叶达到包重150克的比例作出区间估计(Z0.025=1.96);(写出公式、计算过程,标准差及置信上、下保留3位小数)8、一种新型减肥方法自称其参加者在第一个星期平均能减去至少8磅体重.由40名使用了该种方法的个人组成一个随机样本,其减去的体重的样本均值为7磅,样本标准差为3.2磅.你对该减肥方法的结论是什么?(α=0.05,μα/2=1.96, μα=1.647)9、某地区社会商品零售额资料如下:要求:1)用最小平方法配合直线趋势方程:2)预测2005年社会商品零售额。

应用统计试题及答案

应用统计试题及答案

2021 ~2022学年春季学期应用统计课程考试一、判断题(打√ 或×,每题2分,共20分)1.统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。

(√)2.分类数据有时会被赋予数字,可以直接用来计算。

(×)3.众数和中位数都是平均指标的一种,计算时容易受极端数值的影响。

(×)4.在置信水平一定的条件下,增加样本容量,会缩小置信区间。

(√)5.无论是数量指标还是质量指标,都能用数值表示。

(√)6.在假设检验中,对一个总体方差的检验一般使用F检验。

(×)7.若X、Y之间的相关系数r=0,则表明X、Y两变量之间无相关关系。

(×)8.一般来说,冷饮的销量夏季大于冬季,这体现了冷饮销售的长期趋势。

(×)9.用回归方程预测y时,使用的x值离样本数据区间越远预测越准确。

(×)10.一般来说,计划完成程度相对数小于100%,表明没有完成计划。

(×)二、单项选择题(每题2分,共20分)1.要了解北京市城镇居民生活消费情况,最适合的调查方式是( D )。

A. 普查B. 重点调查C. 典型调查D. 抽样调查2.某研究机构在某城市100万个家庭中抽取1000个家庭进行调查,推断该城市家庭年人均收入。

该研究样本是( C )A. 100万个家庭B. 100万个家庭总收入C. 1000个家庭D. 1000个家庭总收入3.将某单位职工的年收入分组为10万元以下、10-12万元、12-14万元、14-16万元、16万元以上等五组,第一组的组中值为( B )。

A. 8万元B. 9万元C. 10万元D. 11万元4.两组数据的平均数不等,但标准差相等,则( A )。

A. 平均数小的,离散程度大B. 平均数大的,离散程度大C. 平均数小的,离散程度小D. 两组数据离散程度相同5.当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是( A )A. t分布B. 正态分布C. F分布D. 卡方分布6.当一组数据中出现0或负数时,将无法计算下列哪种平均数?( C )A. 算术平均数B. 中位数C. 几何平均数D. 众数7.若抽取不同的样本,可以得到___的置信区间;所有的置信区间___都会包含总体参数的真值,以上两个空选择( A )。

《应用统计学》作业考核试题及答案

《应用统计学》作业考核试题及答案

《应用统计学》作业考核试题及答案一、选择题(每题2分,共20分)1. 下列哪一项不是统计学的基本任务?A. 描述数据的特征B. 探索变量之间的关系C. 预测未来的趋势D. 淘汰错误的数据答案:D2. 以下哪个分布是离散型分布?A. 正态分布B. 二项分布C. 指数分布D. 卡方分布答案:B3. 在样本量为n的情况下,样本均值的期望值是?A. 0B. 1C. nD. μ(总体均值)答案:D4. 当总体方差已知时,对总体均值进行区间估计所使用的分布是?A. t分布B. F分布C. 卡方分布D. 正态分布答案:D5. 以下哪个方法用于检验两个独立样本的均值是否存在显著差异?A. t检验B. 卡方检验C. 方差分析D. 相关分析答案:A二、填空题(每题2分,共20分)1. 统计数据的类型分为______和______。

答案:定量数据,定性数据2. 在进行参数估计时,无偏性和一致性是评价估计量的两个重要标准,其中______是指估计量的期望值等于被估计的参数。

答案:无偏性3. 假设检验的基本思想是______。

答案:小概率原理4. 在进行相关分析时,皮尔逊相关系数的取值范围是______。

答案:[-1, 1]5. 当总体方差未知且样本量较小(n < 30)时,对总体均值进行区间估计所使用的分布是______。

答案:t分布三、计算题(每题10分,共30分)1. 已知某班级学生的身高数据如下(单位:cm):170,165,175,160,180,170,165,175,165,160求该班级学生身高的平均数、中位数和方差。

答案:平均数:(170 + 165 + 175 + 160 + 180 + 170 + 165 + 175 + 165 + 160) / 10 = 168.5中位数:(165 + 165) / 2 = 165方差:((170 - 168.5)^2 + (165 - 168.5)^2 + (175 - 168.5)^2 + (160 - 168.5)^2 + (180 - 168.5)^2 + (170 - 168.5)^2 + (165 - 168.5)^2 + (175 - 168.5)^2 + (165 - 168.5)^2 + (160 - 168.5)^2) / 10 ≈ 11.752. 某企业生产的产品寿命(单位:小时)服从正态分布,已知平均寿命为100小时,标准差为10小时。

应用统计学综合测试题试卷5套及答案

应用统计学综合测试题试卷5套及答案

(4)调查时间与地点 (5)调查组织实施方案二、单项选择题(每题2分,共30分)1~5:ACBCA 6~10: DCDBC 11~15: BACDD三、计算题(每题15分,共60分) 1、(1)第二种排队时间的平均数:(3分)第二种排队时间的标准差: (3分)(2)1112221.970.277.20.6730.0967x x συσυ======(6分)由于12υυ〉,所以,第一种排队方式的离散程度大于第二种排队方式。

选第二种排队方式,因为其排队的平均等待时间短,且排队时间较为稳定。

(3分) 2、118098.33%12001450103.57%1400118014502630101.15%120014002600======+====+实际进货数(1)第一季度进货计划完成程度(5分)计划进货数实际进货数第二季度进货计划完成程度(5分)计划进货数上半年实际进货数(2)上半年计划完成程度(5分)上半年计划进货数3、,8,3.9745 53.94a ytt = =-(2分)4分)(2分)(3分)年开始,A.门店B.物流中心C.配送中心或总部 D.采购部门4.连锁门店进货时物流信息流都不通过配送中心,属于()。

A.直配进货 B.自营进货C.配货进货 D.调入进货5.以下条码为哪种类型条码?A39条码B25条码C库德巴条码D交叉25条码6.对于生鲜等保质期要求比较高的商品,在系统中我们通常使用来()处理。

A.配货进货单B.直配进货单C.调入调出单D.自营进货单7.海润超市配送中心01号仓位和02号仓位之间的商品转移应用()来反映。

A.调入单B.调出单C.内部调拨单D.库存单8.近日,银天购物中心在盘点过程中发现部分物品滞销,于是决定直接向供应商退货,此时,银天购物中心应填制的单据是()A.直配进货退货单B.配货进货退货单C.自营进货退货单D.调入调出单9.商场通常将特价商品、高利润商品、季节性商品以及厂家促销商品陈列在商场的()A.第一磁石点B.第二磁石点C.第三磁石点D.第四磁石点10.在盘点过程中,如果发现某种商品的实际库存数少于帐面库存数,通常在系统中,用()来调整账面库存数。

应用统计基础试题及答案

应用统计基础试题及答案

应用统计基础试题及答案一、选择题1. 以下哪项不是描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 方差答案:D2. 标准差和方差之间的关系是什么?A. 标准差是方差的平方根B. 方差是标准差的平方C. 标准差是方差的倒数D. 方差是标准差的立方根答案:B3. 以下哪个是衡量数据离散程度的统计量?A. 均值B. 众数C. 极差D. 所有选项都是答案:C二、填空题1. 样本均值的计算公式为 _________(用样本数据的和除以样本数量)。

答案:(样本数据的和)/n2. 一个数据集的方差是衡量数据点与 _________ 的平均差异。

答案:均值三、解答题1. 给定一组数据:10, 12, 14, 16, 18, 20。

计算这组数据的中位数。

答案:首先将数据按顺序排列:10, 12, 14, 16, 18, 20。

因为数据点数为偶数,所以中位数是中间两个数的平均值,即(14+16)/2=15。

2. 假设一家公司的员工工资数据如下:3000, 3200, 3500, 4000, 4500。

计算这组数据的平均数和标准差。

答案:平均数 = (3000 + 3200 + 3500 + 4000 + 4500) / 5 = 3750。

标准差= √[(1/5) * ( (3000-3750)^2 + (3200-3750)^2 + (3500-3750)^2 + (4000-3750)^2 + (4500-3750)^2 )] = 500。

四、判断题1. 相关系数为-1表示完全正相关。

(错误)2. 一个数据集的方差越大,其数据点越集中。

(错误)3. 样本容量增加时,样本均值的标准误差会减小。

(正确)答案:1. 错误2. 错误3. 正确五、简答题1. 描述统计学中“总体”和“样本”的区别。

答案:在统计学中,“总体”指的是研究中所关注的所有个体的集合,而“样本”是从总体中抽取的一部分个体。

总体是研究的完整对象,而样本是总体的代表性子集。

应用统计学试题和答案分析

应用统计学试题和答案分析

应用统计学试题和答案分析1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。

试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间。

解题过程:由于样本量n=49是大样本,应用中心极限定理,样本均值的极限分布为正态分布,因此可以用正态分布对总体均值进行区间估计。

已知:x=12.6,S=2.8,α=0.0455(φ(2)=0.9545)则有:Zα/2=Z0.=1.96平均误差=2.8/√49=0.4极限误差Δ=1.96×0.4=0.784置信区间为x±Δ,代入数据得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)。

2、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:产品产量(台)xi:40、50、50、70、80;生产费用(万元)yi:130、140、145、150、156.要求:①利用最小二乘法求出估计的回归方程;②计算判定系数R2.解题过程:首先计算xi、yi、xi^2、yi^2、xiyi的和:xi=40+50+50+70+80=290yi=130+140+145+150+156=721xi^2=40^2+50^2+50^2+70^2+80^2=1080yi^2=130^2+140^2+145^2+150^2+156^2=xiyi=40×130+50×140+50×145+70×150+80×156=代入最小二乘法公式计算斜率β和截距α:n∑xiyi-∑xi∑yiβ=———————————n∑xi^2-(∑xi)^25×-290×7210.5675×1080-(290)^2α=1/n(∑yi-β∑xi)1/5(721-0.567×290)111.314因此,估计的回归方程为y=111.314+0.567x。

应用统计真题

应用统计真题

论述题:1. 解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。

2. 试述均匀试验设计的特点,对均匀试验设计和正交试验设计两种方法进行比较,指出各自的优缺点。

3. 试述费歇判别的基本思想方法及主要步骤。

4. 试述多元线性回归解决实际问题的基本思想方法及主要步骤。

6.解释正交试验设计的特点及理论依据。

7.试论述一元线性回归的基本思想及主要方法步骤。

一、(任选两题,每题10 分,共20分)1.解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。

2.解释正交试验设计的特点及理论依据。

3.试述一元线性回归的基本思想及主要方法步骤。

答案: 1.假设原理运用了小概率原理,在原假设H0 正确的前提下,根据样本观察值和运用统计方法检验由此将导致什么结果,如果导致小概率事件在依次试验中发生了,则认为原假设可能不正确,从而拒绝原假设;反之,如果未导致小概率事件发生,则没有理由拒绝原假设。

第一类错误:弃真错误即H 0为真时,作出拒绝H0 的判断;第二类错误:纳伪错误即H 0 不真时,作出接受H 0 的判断。

通常限制犯第一类错误的概率,增大样本容量使犯第二类错误的概率尽可能地小。

为了简化检验过程,更多的应用是只控制犯第一类错误的概率,而不考虑犯第二类错误的概率。

2. 正交试验设计是研究多因素多水平的又一种设计方法,它有多、快、好、省的特点。

“多”是指可以考虑多因素、多指标;“快”是指试验次数少、周期短、见效快;“好”是指可以很快找到优秀方案和可能最优方案;“省”是指省时间、省耗费、省资金、省劳力等。

正交性原理是正交实验设计的理论依据,它主要表现在均衡分散性和整齐可比性两个方面。

均衡分散性是指正交表安排的实验方案均衡地分散在配合完全的水平组合的方案之中。

整齐可比性是指对于每列因素,在各个水平导致的结果之和中,其它因素的各个水平出现的次数是相同的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

论述题:1. 解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。

2.试述均匀试验设计的特点,对均匀试验设计和正交试验设计两种方法进行比较,指出各自的优缺点。

3.试述费歇判别的基本思想方法及主要步骤。

4.试述多元线性回归解决实际问题的基本思想方法及主要步骤。

6.解释正交试验设计的特点及理论依据。

7.试论述一元线性回归的基本思想及主要方法步骤。

一、(任选两题,每题10分,共20分)1.解释假设检验的基本思想方法及可能会犯的两类错误及在实际应用中如何控制可能犯两类错误的概率。

2.解释正交试验设计的特点及理论依据。

3.试述一元线性回归的基本思想及主要方法步骤。

答案:1.假设原理运用了小概率原理,在原假设0H 正确的前提下,根据样本观察值和运用统计方法检验由此将导致什么结果,如果导致小概率事件在依次试验中发生了,则认为原假设可能不正确,从而拒绝原假设;反之,如果未导致小概率事件发生,则没有理由拒绝原假设。

第一类错误:弃真错误即0H 为真时,作出拒绝0H 的判断;第二类错误:纳伪错误即0H 不真时,作出接受0H 的判断。

通常限制犯第一类错误的概率α,增大样本容量使犯第二类错误的概率β尽可能地小。

为了简化检验过程,更多的应用是只控制犯第一类错误的概率α,而不考虑犯第二类错误的概率。

2. 正交试验设计是研究多因素多水平的又一种设计方法,它有多、快、好、省的特点。

“多”是指可以考虑多因素、多指标;“快”是指试验次数少、周期短、见效快;“好”是指可以很快找到优秀方案和可能最优方案;“省”是指省时间、省耗费、省资金、省劳力等。

正交性原理是正交实验设计的理论依据,它主要表现在均衡分散性和整齐可比性两个方面。

均衡分散性是指正交表安排的实验方案均衡地分散在配合完全的水平组合的方案之中。

整齐可比性是指对于每列因素,在各个水平导致的结果之和中,其它因素的各个水平出现的次数是相同的。

3.一元线性回归是研究两个变量之间的相关关系,且两个变量有着密切的关系,它们的这种相关关系不能用完全确切的函数形式表示,但在平均意义下有一定的定量关系表达式。

1)先进行相关性分析,看两个变量间是否有线性关系,确定回归方程中的因变量与自变量,对线性模型进行假设;2)从样本数据出发对线性回归方程进行参数估计,确定回归方程;3)对回归方程进行各种统计检验:回归方程的拟合优度检验、回归方程的显著性检验、回归系数的显著性检验、残差正态检验。

4)利用回归方程进行解释或预测现象。

1.在某新产品开发试验中需要考虑四个因素A 、B 、C 、D 对产品质量的影响。

根据专业知识和实践经验知道,A 与C 之间存在着交互作用,D 与A 、B 及C 之间的交互作用可以忽略不计。

(1)假设每个因子只取两个水平,试选择适当的正交表安排该实验; (2)指出第2号及第5号试验的实验条件。

解: (1)根据题意,A 与B 、B 与C 之间的交互作用还不能肯定,需要通过试验考察。

这样,需要考察的因子及交互作用为A ,B ,C ,D ,A ×B ,A ×C ,B ×C 。

因此可以选用78(2)L 正交表。

表头设计列入表1-1。

(2)第2号试验的试验条件为1122A B C D ,第5号试验的试验条件为2112A B C D 。

2.设'1(0,1,1)X =,'2(2,0,1)X =,'3(1,2,4)X =,为来自总体X 的一个样本,求X 的协方差矩阵∑、相关矩阵R 的矩估计。

解:333'''123111111111(,,)((021),(102),(114))(1,1,2)333333i i i i i i X x x x =====++++++=∑∑∑µ'311 1011()()( 0(1,0,1)1(1,1,1)1(0,1,2))312112i i i X X X X =-⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪∑=--=--+---+ ⎪ ⎪ ⎪- ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭∑1 102101 111000113(0001 1 1012) 12221011 1 10243 0 32⎛⎫-⎪--⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪⎪=+-+=-⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎪⎝⎭⎝⎭⎝⎭ ⎪ ⎪⎝⎭µ1 1-021- 1201R ⎛⎫ ⎪ = ⎪ ⎪ ⎪⎝⎭(1)操作工之间的差异是否显著; (2)机器之间的差异是否显著; (3)交互影响是否显著(0.05α=)。

解:由题意知3,4,2k r n ===,又由题目给出数据可得:123134,129,150T T T ===g g g g g g ,1234103,104,102,104T T T T ====g g g g g g g g ,413T =g g g ,ij T g 见上表中两数之和。

2222111413718981.9583342krnijli j l T S y krn ====-=-=⨯⨯∑∑∑g g g总22221114135709730.083342342k A i i T S T rn krn ==-=⨯-=⨯⨯⨯∑g g g g g2222111413426450.458332342r B j j T S T kn krn ==-=⨯-=⨯⨯⨯∑g g g g g22222211114131434530.08330.458334.91672342k r ABij A B i j T S T S S n krn ===---=⨯---=⨯⨯∑∑g g g g22222=-81.958330.08330.458334.916716.5A B AB S S S S S --=---=误总将计算的有关结果列入方差分析表(表3-1)中。

对于给定水平0.05α=,由{}0.05P F λ>=分别查(附表5)得123.89, 3.49λλ==,3 3.00λ=,由表3-1可知:(1)操作工之间的差异显著。

(2)机器之间的差异不显著。

(3)操作工与机器交互影响显著。

4.下面是来自两个正态总体11(,1)N πμ:、222(,2)N πμ:的样本值12::3ππ⎧⎪⎨⎪-++⎩ 试分别用贝叶斯判别法(取1221,,(1|2)(2|1)33q q C C ===)和距离(采用马氏距离)判别法判别样品12x =及21.1x =所属的类i π。

若出现不一致结果,请提出你的判别建议。

解: 依题意,对于1π,10EX μ==,对于2π,23EX μ==。

(1)贝叶斯判别法:21(20)221(2)0.054p ---=== 211(23)222(2)p ---===0.242 21211(1.10)20021(1.1)p ---===0.218 23611(1.13)20022(1.1)p ---===0.066 112221(2)0.0540.036(2)0.2420.08133p q p q =⨯=<=⨯=112221(1.1)0.2180.145(1.1)0.0660.02233p q p q =⨯=>=⨯=所以,12x =属于2π,2 1.1x =属于1π。

(2)距离判别法:11(2)(2,)2d d π===221(2)(2,)2d d π===显然12(2,)(2,)d d ππ>,故12x =属于2π。

11(1.1)(1.1,) 1.1d d π===22(1.1)(1.1,)0.95d d π===显然12(1.1,)(1.1,)d d ππ>,故2 1.1x =属于2π。

(3)结果不一致分析。

5.已知四个样品分别为''''(2,5),(2,3),(4,3),(6,2),试用重心法和离差平方和法进行聚类分析。

若分成两类,请您提出您的分类建议。

解: (1)重心法:首先将四个样品分别看做一类,计算距离矩阵2(0)D 。

由2(0)D 可以看出,2G 和3G 之间距离最短,因此可以合并为一个新类{}523,G G G =,然后计算1G 、4G 、5G 之间的距离,得相应的2(1)D 如下由2(1)D 可以看出,1G 和5G 之间距离最短,因此可以合并为一个新类{}615,G G G =,然后计算4G 、6G 之间的距离,得相应的2(2)D 如下最后将4G 与6G 合为一类{}71234,,,G G G G G =。

上述聚类过程用聚类图表示为图5-1。

(2)离差平方和法:由(1)中已计算的重心法的距离平方及22()p q pq pq p qn n D D C n n =+计算距离矩阵2(0)D 。

由2(0)D 可以看出,2G 和3G 之间距离最短,因此可以合并为一个新类{}523,G G G =,然后计算1G 、4G 、5G 之间的距离,得相应的2(1)D 如下由2(1)D 可以看出,1G 和5G 之间距离最短,因此可以合并为一个新类{}615,G G G =,然后计算4G 、6G 之间的距离,得相应的2(2)D 如下最后将4G 与6G 合为一类{}71234,,,G G G G G =。

上述聚类过程用聚类图表示为图5-2。

(2)检验所见方程是否有意义(0.05α=);(3)预测当拉伸倍数x=6时,强度y 的置信度为95%的置信区间。

解:(1)由于n =12,64.8 5.412x ==,57.54.791712y ==2121222211()12428.1812(5.4)78.26xx i i i i l x x x x ===-=-=-⨯=∑∑121211()()1237812 5.4 4.791767.4978xy i i i i i i l x x y y x y x y ===--=-=-⨯⨯=∑∑于是得67.49780.862578.26xy xx l b l ===$ 4.79170.8625 5.40.1342a y bx =-=-⨯=$$故所求回归方程为0.13420.8625y x =+$(2)22121222211()12335.6312(4.7917)60.1053yy i ii i S l y y y y ====-=-=-⨯=∑∑总20.862567.497858.2169xy S bl ==⨯=回$222 1.8884S S S =-=总回残由{}0.05P F λ>=,查(1,10)F 分布表(附表5)得 4.96λ=,而22308.2869 4.96/(122)S F S ==>-回残所以回归方程有意义。

(3)6x =时,y 的估计值为0.13420.86256 5.3092y =+⨯=$又0.4346S ==,由{}0.05/20.025P T λ>==,查(10)t 分布表(附表3)得 2.2281λ=,故得y 的置信度为95%的预测区间为00(y y λλ-+$$00(0.13420.8625 2.22810.13420.8625 2.2281x x =+-⨯++⨯从而得6x =时,y 的置信度为95%的预测区间为(4.2992,6.3192)1.某厂有三条生产线,从三条生产线生产的纤维中分别抽取了一些样品,纤维强度数据三条生产线可以看做三个水平,即3k =,以(1,2,3)i r i =表分别示各水平所做的重复试验次数,即1235,4,6r r r ===,由上表计算得123103.5,34.5,25.2,43.8T T T T ====g g g g g222211113103.5721.217.06546ir kiji j T S y r r r ===-=-=++++∑∑g g总22222221113T 34.525.243.8103.5 2.4546546ki i iT Sr r r r ==-=++-=++++∑g gg 组间222=7.06 2.4=4.66S S S =--误总组间22123 2.4/(1)2 3.09014.66/()12S k F S r r r k -===++-组间误对于给定α,由{}P F λα>=查(2,12)F 表可得λ=,则F λ,所以三条生产线上的纤维强度差异。

相关文档
最新文档