统计学第七章、第八章课后题答案
统计学人教版第五版7,8,10,11,13,14章课后题答案
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
统计学7-10章课后作业答案
第7章 相关与回归分析1、设销售收入x 为自变量,销售成本y 为因变量。
现已根据某百货公司某年12个月的有关资料计算出以下数据(单位:万元):2()425053.73ix x -=∑ 647.88x =2()262855.25iy y -=∑549.8y =()()334229.09iix x y y --=∑(1)拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。
(2)计算可决系数和回归估计的标准误差。
(3)对回归系数进行显著性水平为5%的显著性检验。
(4)假定下年一月销售收入为800万元,利用拟合的回归方程预测销售成本,并给出置信度为95%的预测区间。
解:(1)定性分析可知,销售收入影响销售成本,以销售收入为自变量,销售成本为因变量拟合线性回归方程i i i y x u αβ=++,采用最小二乘法估计回归参数得:22()()(,)334229.09ˆ0.7863()425053.73ii xix x y y Cov x y x x βσ--===≈-∑∑ˆˆ549.80.7863647.8840.372y x αβ=-=-⨯= 因此,拟合的回归方程为:ˆˆˆ40.3720.7863i i iy x x αβ=+=+ 其中,回归系数β表示自变量每变动一个单位,因变量的平均变量幅度。
在此,表示销售收入每增加1万元,销售成本平均增加0.7863万元。
(2)可决系数22222[()()]334229.090.9998()()425053.73262855.25i i i i x x y y SSR R SST x x y y --===≈-⋅-⨯∑∑∑ (本问接下来的计算不做要求:为计算回归系数的标准误差,根据离差平方和分解,可知:2222222[()()]ˆˆˆˆˆˆ()[()()]()()334229.09262811.68425053.73i i i iiix x y y SSR y y x x x x x x αβαββ--=-=+-+=-=-==∑∑∑∑∑22ˆ()()262855.25262811.6843.57i i SSE SST SSR y y yy =-=---=-=∑∑因此有ˆ()0.0032S β===≈) (3)陈述假设:01:0 :0H H ββ=≠在原假设成立的前提下,构造t 检验统计量245.598t ===在5%的双侧检验显著性水平下,查自由度为10的t 分布表,得临界值0.025(10) 2.228t t =<,因此拒绝原假设。
《统计学概论》第八章课后练习题答案
《统计学概论》第八章课后练习答案一、思考题1.什么是相关系数?它与函数关系有什么不同?P237- P2382.什么是正相关、负相关、无线性相关?试举例说明。
P238- P2393.相关系数r的意义是什么?如何根据相关系数来判定变量之间的相关系数?P245 4.简述等级相关系数的含义及其作用?P2505.配合回归直线方程有什么要求?回归方程中参数a、b的经济含义是什么?P2566.回归系数b与相关系数r之间有何关系?P2587.回归分析与相关分析有什么联系与区别?P2548.什么是估计标准误差?这个指标有什么作用?P2619.估计标准误差与相关系数的关系如何?P258-P26410.解释判定系数的意义和作用。
P261二、单项选择题1.从变量之间相互关系的方向来看,相关关系可以分为()。
A.正相关和负相关B.直线关系与曲线关系C.单相关和复相关D.完全相关和不完全相关2.相关分析和回归分析相比较,对变量的要求是不同的。
回归分析中要求()。
A.因变量是随机的,自变量是给定的B.两个变量都是随机的C.两个变量都不是随机的D.以上三个答案都不对3.如果变量x与变量y之间的相关系数为-1,这说明两个变量之间是()。
A.低度相关关系B.完全相关关系C.高度相关关系D.完全不相关4.初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”之间的相关关系为()。
A.正相关B.高相关C.负相关D.低相关5.假设两变量呈线性关系,且两变量均为顺序变量,那么表现两变量相关关系时应选用()。
A.简单相关系数r B.等级相关系数r sC.回归系数b D.估计标准误差S yx6.变量之间的相关程度越低,则相关系数的数值()。
A.越大B.越接近0C.越接近-1 D.越接近17.下列各组中,两个变量之间的相关程度最高的是()。
A.商品销售额和商品销售量的相关系数是0.9B.商品销售额和商品利润率的相关系数是0.84C.产量与单位成本之间的相关系数为-0.94D.商品销售价格与销售量的相关系数为-0.918.相关系数r的取值范围是()。
统计学原理 第七章课后习题及答案
第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。
(1)1.2 (3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
统计学原理 第七章课后习题及答案
第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。
(1)1.2 (3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
统计学课后练答案
第七章 参数估计(1)x σ==(2)2x z α∆==1.96=某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x σ=== (2)在95%的置信水平下,求估计误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=z α 因此,x x t σ∆=⋅x z ασ=⋅0.025x z σ=⋅=×=(3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:2x z x z αα⎛-+ ⎝=()120 4.2,120 4.2-+=(,)2x z x z αα⎛-+ ⎝=104560±(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求:大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭:或2,s x N n μ⎛⎫⎪⎝⎭:置信区间为:22x z x z αα⎛-+ ⎝, (1)构建μ的90%的置信区间。
2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(,) (2)构建μ的95%的置信区间。
2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(,) (3)构建μ的99%的置信区间。
2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(,)(1)2x z α±=25 1.96±(,) (2)2x z α±=119.6 2.326±=(,) (3)2x z α±=3.419 1.645±(,) (1)2x z α±=8900 1.96±=(,)(2)2x z α±=8900 1.96±=(,) (3)2x z α±=8900 1.645±=(,)(4)2x z α±=8900 2.58±=(,) 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查解:(1)样本均值x =,样本标准差s=1α-=,t=z α=0.05z =,xz α±=3.32 1.645±(,) 1α-=,t=z α=0.025z =,x z α±=3.32 1.96±(,)1α-=,t=z α=0.005z =,x zα±=3.32 2.76±(,)2x t α±=10 2.365±=,某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
统计学第四版第七章课后题最全答案
配对号
来自总体A得样本
来自总体B得样本
1
2
3
4
2
5
10
8
0
7
6
5
(1)计算A与B各对观察值之差,再利用得出得差值计算与。
=1、75,=2、62996
(2)设分别为总体A与总体B得均值,构造得95%得置信区间。
解:小样本,配对样本,总体方差未知,用t统计量
均值=1、75,样本标准差s=2、62996
(2)已知:E=0、1,=0、8,=0、05,=1、96
应抽取得样本量为:=≈62
7.20
(1)构建第一种排队方式等待时间标准差得95%得置信区间。
解:估计统计量
经计算得样本标准差=3、318
置信区间:
=0、95,n=10,==19、02,==2、7
==(0、1075,0、7574)
因此,标准差得置信区间为(0、3279,0、8703)
(3)已知=0、01,=2、58
由于n=100为大样本,所以总体均值得99%得置信区间为:
=812、58*813、096,即(77、94,84、096)
7、5(1)已知=3、5,n=60,=25,=0、05,=1、96
由于总体标准差已知,所以总体均值得95%得置信区间为:
=251、96*250、89,即(24、11,25、89)
7、4(1)已知n=100,=81,s=12, =0、1,=1、645
由于n=100为大样本,所以总体均值得90%得置信区间为:
=811、645*811、974,即(79、026,82、974)
(2)已知=0、05,=1、96
由于n=100为大样本,所以总体均值得95%得置信区间为:
统计学课后答案第七八章汇总
6.1 调理一个装瓶机使其对每个瓶子的灌装量均值为盎司,经过察看这台装瓶机对每个瓶子的灌装量听从标准差 1.0 盎司的正态散布。
随机抽取由这台机器灌装的9 个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确立样本均值偏离整体均值不超出0.3 盎司的概率。
解:整体方差知道的状况下,均值的抽样散布听从N , 2的正态散布,由正态散布,n标准化获得标准正态散布:z= x~ N 0,1 ,所以,样本均值不超出整体均值的概率P n为:P x 0.3 =P x 0.3= P0.3 x 0.3n n 1 9 n 1 9= P 0.9 z 0.9 =2 0.9 -1,查标准正态散布表得0.9 =0.8159所以, P x 0.3 =0.63186.2 在练习题 6.1 中,我们希望样本均值与整体均值的偏差在 0.3 盎司以内的概率达到0.95,应该抽取多大的样本?解: P xx 0.3= P0.3 x 0.30.3 =Pn n 1 n n 1 n= 2 (0.3 n) 1 0.95 (0.3 n) 0.9750.3 n 1.96 n 42.68288 n 436.3 Z1,Z2 ,,Z6表示从标准正态整体中随机抽取的容量,n=6 的一个样本,试确立常数b,使得6P Z i2b0.95i 1解:因为卡方散布是由标准正态散布的平方和构成的:设 Z1, Z2,,Z n是来自整体N(0,1)的样本,则统计量2 Z12 Z 22 Z n2听从自由度为2 2~ 2n 的χ散布,记为χχ( n)6 6 62所以,令2Z i2,则 2 Z i2 2 6 ,那么由概率 P Z i b0.95 ,可知:i 1 i 1 i 120.95 6 ,查概率表得: b=12.59b= 1121 6.4 在习题 6.1 中,假定装瓶机对瓶子的灌装量听从方差 的标准正态散布。
假定我们计划随机抽取 10 个瓶子构成样本,观察每个瓶子的灌装量,获得 10 个观察值,用这1n10 个观察值我们能够求出样本方差S 2 (S 2(Y i Y )2 ) ,确立一个适合的范围使得有n 1 i 1较大的概率保证 S 2落入此中是实用的,试求 b 1, b 2 ,使得p(b 1 S 2 b 2 ) 0.90解:更为样本方差的抽样散布知识可知,样本统计量:(n 1s)22(n 1 ) 2~此处, n=10,21 ,所以统计量(n 1)s 2(10 1)s 22~ 2(n 1)21 9s依据卡方散布的可知:P b 1 S 2 b 2P 9b 1 9S 29b 20.90又因为:2n122 n11P 1 29S2所以:P 9b 129b 2P2n 19S 22n1 10.909S122P 9b 12P222n 19S 9b 2 12 n 1 9S2P2922 9 0.900.959S0.05则:222 9299b 19b 10.95, b 20.050.959 ,9b 2 0.0599查概率表: 2 9 =3.325 ,2 9 =19.919 ,则0.950.052 92 90.95=0.369, b 20.05=1.88b 19927.1 从一个标准差为 5 的整体中采纳重复抽样方法抽出一个样本容量为40 的样本,样本均值为 25。
统计学第八章课后作业答案
第八章练习题
一、单项选择
(1)当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( )。
A.相关关系
B.函数关系
C.回归关系
D.随机关系
(2)相关系数的取值范围是( )。
A. 0≤r ≤1
B. -1<r <1
C. -1≤r ≤1
D. -1≤r ≤0
(3)一元线性回归方程y=12+3.6x,如x每增加1个单位,则y平均增加( )。
A. 12个单位
B. 15.6个单位
C. 3.6个单位
D. 8.4个单位
(4)一元线性回归方程中的两个变量( )。
A.都是随机变量
B.地位是对等的
C.都是给定的量
D.一个是自变量,另一个是因变量
二、多项选择题
(5)相关系数表明两变量之间的关系( )。
A.线性关系
B.因果关系
C.变异关系
D.相关方向
E.相关的密切程度
(6)如果两个变量之间的相关系数是1,则这两个变量是( )。
A.负相关关系
B.正相关关系
C.完全相关关系
D.不完全相关关系
E.零相关
(7)在一元线性回归分析中( )。
A.自变量是可控变量,因变量是随机变量
B.两个变量不是对等的关系
C.利用回归方程,两个变量可以相互推算
D.根据回归系数可判定相关的方向
E.自变量是随机变量,因变量是可控变量
(8)利用一元线性回归方程,可以( )。
A.进行两个变量的互相推算
B.用自变量推算因变量
C.用因变量推算自变量
D.确定两个变量的变动关系
E.研究两个变量之间的密切程度。
统计学课后习题答案(全章节)(精品).docx
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
统计学课后习题答案第七章相关分析与回归分析
统计学课后习题答案第七章相关分析与回归分析第七章相关分析与回归分析⼀、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.⾃变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪⼀个属于相关关系?A.播种量与粮⾷收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆⾯积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化⽅向相反B.两个变量⼀增⼀减C.两个变量之间的变化⽅向⼀致D.两个变量⼀减⼀增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当⾃变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要⽅法是A.对现象进⾏定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.⾃变量不是随机的,因变量是随机的B.两个变量均不是随机的C.⾃变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适⽤于直线相关,⼜适⽤于曲线相关B.只适⽤于直线相关C.既不适⽤于直线相关,⼜不适⽤于曲线相关D.只适⽤于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是A.-1≤r≤1B.-1≤r≤0C.0≤r≤114.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全⽆关B.相关程度较⼩B.现象之间完全相关 D.⽆直线相关关系18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说明这两个变量之间存在A.⾼度相关B.中度相关C.低度相关D.显著相关19.从变量之间相关的⽅向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关21.物价上涨,销售量下降,则物价与销售量之间属于A.⽆相关B.负相关C.正相关D.⽆法判断22.配合回归直线最合理的⽅法是A.随⼿画线法B.半数平均法C.最⼩平⽅法D.指数平滑法23.在回归直线⽅程y=a+bx中b表⽰A.当x增加⼀个单位时,y增加a的数量B.当y增加⼀个单位时,x增加b的数量C.当x增加⼀个单位时,y的平均增加量D.当y增加⼀个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动⽣产率(千元)和⼯⼈⼯资(元)之间存在回归⽅程y=10+70x,这意味着年劳动⽣产率每提⾼⼀千元时,⼯⼈⼯资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其⽣产成本为30000元,其中固定成本6000元,则总⽣产成本对产量的⼀元线性回归⽅程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.⽤来反映因变量估计值代表性⾼低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差⼆、多项选择题1.下列现象之间属于相关关系的有A.家庭收⼊与消费⽀出之间的关系B.农作物收获量与施肥量之间的关系C.圆的⾯积与圆的半径之间的关系D.⾝⾼与体重之间的关系E.年龄与⾎压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有⼀个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的⼀元线性回归⽅程为y=85-5.6x,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加5.6元D.产量为1千件时,单位成本为79.4元E.产量每增加1千件,单位成本平均减少5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.⾮线性相关7.判断现象之间有⽆相关关系的⽅法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差 8.当现象之间完全相关的,相关系数为A.0B.-1C.1D.0.5E.-0.5 9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.⾼度曲线相关10.下列现象属于正相关的有A.家庭收⼊愈多,其消费⽀出也愈多B.流通费⽤率随商品销售额的增加⽽减少C.产量随⽣产⽤固定资产价值减少⽽减少D.⽣产单位产品耗⽤⼯时,随劳动⽣产率的提⾼⽽减少E.⼯⼈劳动⽣产率越⾼,则创造的产值就越多 11.直线回归分析的特点有A.存在两个回归⽅程B.回归系数有正负值C.两个变量不对等关系D.⾃变量是给定的,因变量是随机的E.利⽤⼀个回归⽅程,两个变量可以相互计算 12.直线回归⽅程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是⾃变量,哪个是因变量D.⼀个是随机变量,另⼀个是给定变量E.⼀个是⾃变量,另⼀个是因变量13.从现象间相互关系的⽅向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关 14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈⼩,表明估计值愈可靠E.指标值愈⼤,表明估计值愈可靠 15.下列公式哪些是计算相关系数的公式16.⽤最⼩平⽅法配合的回归直线,必须满⾜以下条件A.∑(y-y c )=最⼩值B.∑(y-y c )=0C.∑(y-y c )2=最⼩值D.∑(y-y c )2=0E.∑(y-y c )2=最⼤值 17.⽅程y c =a+bx222222)()(.)()())((...))((.y y n x x n yx xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xyyy xx xy y x ∑-∑?∑-∑∑?∑-∑=-∑?-∑--∑===--∑=σσA.这是⼀个直线回归⽅程B.这是⼀个以X为⾃变量的回归⽅程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18.直线回归⽅程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动⽅向D.其数值⼤⼩不受计量单位的影响E. 其数值⼤⼩受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数⼤于零则相关系数⼤于零B.回归系数⼩于零则相关系数⼩于零C.回归系数等于零则相关系数等于零D.回归系数⼤于零则相关系数⼩于零E.回归系数⼩于零则相关系数⼤于零20.配合直线回归⽅程的⽬的是为了A.确定两个变量之间的变动关系B.⽤因变量推算⾃变量C.⽤⾃变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值⼀致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;⽽回归分析中⾃变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;⽽相关分析中⾃变量是给定的数值,因变量是随机的C.相关系数有正负号;⽽回归系数只能取正值D.相关分析中的两个变量是对等关系;⽽回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出⼀个相关系数;⽽回归分析中根据两个变量只能计算出⼀个回归系数三、填空题1.研究现象之间相关关系称作相关分析。
统计学课后答案第七八章
6.1调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从N , 的正态分布,由正态分布,x标准化得到标准正态分布:z= 〜N 0,1,因此,样本均值不超过总体均值的概率P/v n为:P |x | 0.3 =P = P 半畀/x/n /J n 的9 /J n 1 V9=P 0.9 z 0.9 =2 0.9 -1,查标准正态分布表得0.9 =0.8159因此,P X 0.3 =0.63186.2在练习题 6.1中,我们希望样本均值与总体均值的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?X0.30.3X0.3解:P X0.3 =P 1 Vn/V n 1 Vn=2 (0.3希) 1 0.95(0.3诉)0.97503」1.96 n 42.68288 n 436.3乙,乙,……,Z6表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得62P Z i b 0.95i 1解:由于卡方分布是由标准正态分布的平方和构成的:设Z1,Z2,……,Z n是来自总体N(0,1)的样本,则统计量2 Z12 Z;L Z;服从自由度为n的X分布,记为X〜X( n)6 6 6因此,令2Z2,贝y 2Z i2: 26,那么由概率P Z: b 0.95,可知:i 1 i 1 i 1b= ;0.956,查概率表得:b=12.59929 9996.4在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21的标准正态分布。
假定我们计划随机抽取 10个瓶子组成样本,观测每个瓶子的灌装量,得到 10个观测值,用这1 n—(Y i Y)2),确定一个合适的范围使得有n 1 i 1 b 1,b 2,使得2p(bi Sb 2) 0.90解:更加样本方差的抽样分布知识可知,样本统计量:(n 1)s22(n 1)根据卡方分布的可知:又因为:P J 2 2 n 1 9S 2因此:P 9b 9S 2 9b 2 P 9S 2 0.90则:P 9b 1 9S 2 9b 21 9S 22.959 9S 220.050.909b 12 0.959 ,9b 2;05 920.95920.059查概率表:2 0.959 =3.325,2 0.059 =19.919,则 bi2 0.95=0.369, b 20.05 =1.8810个观测值我们可以求出样本方差 S 2 (S 2 较大的概率保证 S 2落入其中是有用的,试求此处,n=10,21,所以统计量(n 1)s 22(10 1)s 2 19 s 22(n 1)P b s 2 b 2p 9b 9S 20.90。
统计学人教版第五版7,8,10,11,13,14章课后题答案
统计学人教版第五版7,8,10,11,13,14章课后题答案第七章 参数估计7.1 (1)79.0405===nx σσ (2)由于1-α=95% α=5% 96.12=αZ所以 估计误差55.140596.12≈⨯=nZ σα7.2 (1)14.24915===nx σσ (2)因为96.12=αZ 所以20.4491596.12≈⨯=nZ σα(3)μ的置信区间为20.41202±=±nZ x σα7.3 由于96.12=αZ 104560=x 85414=σ n=100所以μ的95%置信区间为14.167411045601008541496.11045602±=⨯±=±nZ x σα7.4(1)μ的90%置信区间为97.18110012645.1812±=⨯±=±n s Z x α(2)μ的95%置信区间为35.2811001296.1812±=⨯±=±n s Z x α(3)μ的99%置信区间为096.3811001258.2812±=⨯±=±n s Z x α7.5 (1)89.025605.396.1252±=⨯±=±nZ x σα(2)416.66.1197589.23326.26.1192±=⨯±=±n s Z x α(3)283.0419.332974.0645.1419.32±=⨯±=±n s Z x α7.6 (1)035.25389001550096.189002±=⨯±=±nZ x σα(2)650.16589003550096.189002±=⨯±=±nZ x σα(3)028.139890035500645.189002±=⨯±=±n s Z x α(4)583.196890035500326.289002±=⨯±=±n s Z x α7.7 317.31==∑i x nx ()609.1113612=--=∑=i ix x n s 90%置信区间为441.0317.336609.1645.1317.32±=⨯±=±n s Z x α95%置信区间为526.0317.336609.196.1317.32±=⨯±=±n s Z x α99%置信区间为6908.0317.336609.1576.2317.32±=⨯±=±n s Z x α7.8 101==∑i x nx ()464.311812=--=∑=i ix x n s 所以95%置信区间为()896.2108464.33646.21012±=⨯±=±-n s t x n α7.9 375.91==∑i x n x 由于()131.2)15(025.012==-t t n α ()113.4112=--=∑x x n s i 所以95%置信区间为()191.2375.916113.4131.2375.912±=⨯±=±-n s t x n α7.10 (1)63.05.1493693.196.15.1492±=⨯±=±n s Z x α(2)中心极限定理 7.11 (1)132.10150665011=⨯==∑i x nx ()641.188.131491112=⨯=--=∑x x n s i 455.032.10150641.196.132.1012±=⨯±=±n s Z x α(2)由于9.05045==p 所以 合格率的95%置信区间为()083.09.0501.09.096.19.012±=⨯⨯±=-±n p p Z p α7.12 由于128.161==∑i x n x ()745.3)24(005.012==-t t n α ()8706.0112=--=∑x x n s i所以99%置信区间为653.028.161258706.0745.328.161)1(2±=⨯±=-±n s n t x α 7.13 7396.1)17()1(05.02==-t n t α 556.131==∑i x nx ()800.7112=--=∑x x n s i所以90%置信区间为198.3556.13188.77396.1556.13)1(2±=⨯±=-±n s n t x α 7.14(1)()194.051.04449.051.0576.251.012±=⨯⨯±=-±n p p Z p α(2)()0435.082.030018.082.096.182.012±=⨯⨯±=-±n p p Z p α(3)()024.048.0115052.048.0645.148.012±=⨯⨯±=-±n p p Z p α7.15(1)90%置信区间为()049.023.020077.023.0645.123.012±=⨯⨯±=-±n p p Z p α(2)95%置信区间为()058.023.020077.023.096.123.012±=⨯⨯±=-±n p p Z p α7.16 89.1652001000576.222222222=⨯=⎪⎪⎭⎫ ⎝⎛=⇒=E Z n nZ E σδαα所以n 为166 7.17(1)()13.25302.06.04.0054.2122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为254 (2)()0625.15004.05.05.096.1122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为151(3)()89.26705.045.055.0645.1122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为268 7.18(1)64.05032==p (2)()46.611.02.08.096.1122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为62 7.19(1)()()339.661501205.022=-=-χχαn()()930.331501295.0221=-=--χχαn ()()2212222211ααχσχ--≤≤-s n s n所以()()40.272.1293.33492339.66491122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n(2)()()6848.231151205.022=-=-χχαn()()5706.61151295.0221=-=--χχαn()()043.0015.002.05.61470602.06848.23141122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n (3)()()6706.321221205.022=-=-χχαn()()5913.111221295.0221=-=--χχαn ()()725.4185.24315913.112131706.36211122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n 7.20(1)15.71==∑i x n x ()4767.0112=--=∑x x n s i ()()0228.1911012025.022=-=-χχαn ()()7004.211012975.0221=-=--χχαn ()()87.0328.04767.07004.294767.00228.1991122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n(2)()()326.3253.1822.17004.29822.10228.1991122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n7.21 2)1()1(212222112-+-+-=n n s n s n s p=442.981910268.9613≈⨯+⨯ (1)21μμ-的90%置信区间为: 212122111)2()(n n s n n t x x p+-+±-α=⨯⨯±442.98729.18.971141+ =9411.78.9± (2)21μμ-的95%置信区间为: 212122111)2()(n n s n n t x x p+-+±-α=⨯⨯±442.9893.028.971141+ =13.698.9± (3)21μμ-的99%置信区间为: ⨯⨯±442.98609.828.971141+=40.1138.9± 7.22(1)2122121221)(n s n s z x x +±-α=36.096.12⨯±=176.12±(2)2)1()1(212222112-+-+-=n n s n s n s p=18209169⨯+⨯=18212122111)2()(n n s n n t x x p+-+±-α=5118.122⨯⨯±=8.932± (3)1)(1)()(222221212122122121-+-+=n n s n n s n s n s ν=17.78 2122121221)(t )(n s n s x x +±-να=6.31.22⨯±=98.32±(4)048.2)28(t 025.0=2)1()1(212222112-+-+-=n n s n s n s p=18.714 212122111)2()(n n s n n t x x p+-+±-α=20110114.71848.022+⨯⨯± =3.432±(5)1)(1)()(222221212122122121-+-+=n n s n n s n s n s ν1919.61)20201016(222++==20.05 086.2)(t =να2122121221)(t )(n s n s x x +±-να=1.61086.22+⨯±=64.332± 7.23(1)47d = 1)(2--=∑n d ds id =48332=917.6(2)n s n t d )1(d -±α=185.447± 7.24 6216.2)1(2=-n t α 11=d ,53197.6=d s d μ的置信区间为:ns n t d )1(d 2-±α=1053197.66216.211⨯±=4152.511±7.25(1)222111221)1()1()(p n p p n p p z p -+-±-α=25076.03.02506.04.0645.11.0⨯+⨯⨯±=0698.01.0± (2)222111221)1()1()(p n p p n p p z p -+-±-α=25076.03.02506.04.096.11.0⨯+⨯⨯±=0831.01.0± 7.26 241609.01=s 076457.02=s)1,1(21--n n F α=)20,20(025.0F =2.464 )20,20(975.0F =0.40576212221222122221αασσ-≤≤F s s F s s 40576.0986.9446.2986.92221≤≤σσ 611.240528.42221≤≤σσ7.27 222)1()(Ez n ππα-==2204.098.002.096.1⨯⨯=47.06 所以 n =487.282222)(E z n σα==2222012096.1⨯=138.30所以 n =139第8章 假设检验二、练习题(说明:为了便于查找书后正态分布表,本答案中,正态分布的分位点均采用了下侧分位点。
《统计学概论》第八章课后练习题答案
《统计学概论》第八章课后练习答案一、思考题1.什么是相关系数?它与函数关系有什么不同?P237- P2382.什么是正相关、负相关、无线性相关?试举例说明。
P238- P2393.相关系数r的意义是什么?如何根据相关系数来判定变量之间的相关系数?P245 4.简述等级相关系数的含义及其作用?P2505.配合回归直线方程有什么要求?回归方程中参数a、b的经济含义是什么?P2566.回归系数b与相关系数r之间有何关系?P2587.回归分析与相关分析有什么联系与区别?P2548.什么是估计标准误差?这个指标有什么作用?P2619.估计标准误差与相关系数的关系如何?P258-P26410.解释判定系数的意义和作用。
P261二、单项选择题1.从变量之间相互关系的方向来看,相关关系可以分为()。
A.正相关和负相关B.直线关系与曲线关系C.单相关和复相关D.完全相关和不完全相关2.相关分析和回归分析相比较,对变量的要求是不同的。
回归分析中要求()。
A.因变量是随机的,自变量是给定的B.两个变量都是随机的C.两个变量都不是随机的D.以上三个答案都不对3.如果变量x与变量y之间的相关系数为-1,这说明两个变量之间是()。
A.低度相关关系B.完全相关关系C.高度相关关系D.完全不相关4.初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”之间的相关关系为()。
A.正相关B.高相关C.负相关D.低相关5.假设两变量呈线性关系,且两变量均为顺序变量,那么表现两变量相关关系时应选用()。
A.简单相关系数r B.等级相关系数r sC.回归系数b D.估计标准误差S yx6.变量之间的相关程度越低,则相关系数的数值()。
A.越大B.越接近0C.越接近-1 D.越接近17.下列各组中,两个变量之间的相关程度最高的是()。
A.商品销售额和商品销售量的相关系数是0.9B.商品销售额和商品利润率的相关系数是0.84C.产量与单位成本之间的相关系数为-0.94D.商品销售价格与销售量的相关系数为-0.918.相关系数r的取值范围是()。
统计学原理 第七章课后习题及答案
第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。
(1)21.2 2(3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
《统计学》-第7章-习题答案
第七章思考与练习参考答案1 •答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在定的范围内变化。
2•答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3•答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数二样本相关系数,「一】。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数R2的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y与自变量X之间存在着近似的线性函数关系,可表示为Y^ 11X t u t,这就是总体回归函数,其中u t是随机误差项,可以反映未考虑的其他各种因素对Y的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:Y?=耳+弭x t。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的-0和-1是未知的参数,表现为常数;而样本回归直线中的'?Q和?i是随机变量,其具体数值随所抽取的样本观测值不同而变动。
统计学原理 第七章课后习题及答案(2020年7月整理).pdf
第七章 相关和回归 一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x −∑是2()y y −∑的2倍,()()x x y y −−∑是2()y y −∑的1.2倍,则相关系数r=( )。
(1)21.2 2(3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学复习笔记第七章参数估计一、思考题1.解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2.简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4.解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。
5.简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为(z 2 )2 2其中: E znn E22 其中: E z 2 n2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平成正比,在其他条件不变的情况下,置信水平越大,所x 需要的样本量越大; 与总体方差成正比,总体的差异越大,所要求的样本量也越大; 与与总体方差成正比, 样本量与估计误差的平方成反比,即可以接 受的估计误差的平方越大,所需的样本量越小。
二、 练习题1. 从一个标准差为 5 的总体中采用重复抽样方法抽出一个样本量 为 40 的样本,样本均值为 25。
1) 样本均值的抽样标准差等于多少?2) 在 95%的置信水平下,估计误差是多少?解: 1 ) 已知 σ = 5 , n = 40 x , = 25/√ 40 ≈2 ) 已知估计误差 E = ×5÷√ 40 ≈2. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期 3 周 的时间里选取 49 名顾客组成了一个简单随机样本。
1) 假定总体标准差为 15 元,求样本均值的抽样标准误差。
2) 在 95%的置信水平下,求估计误差。
3) 如果样本均值为 120 元,求总体均值 μ的 95%的置信区间 。
解: 1)已知 σ = 15 ,n = 49xx= 15 ÷√49 =估计误差 E = ×15÷√ 49 ≈3) 已知x = 120∵ 置信区间为x ± E其置信区间= 120 ±3.从一个总体中随机抽取n =100 的随机样本,得到x=104560 ,假定总体标准差σ = 85414 ,试构建总体均值μ的95%的置信区间。
解:已知n =100,x =104560,σ = 85414 ,1- =95% ,由于是正态总体,且总体标准差已知。
总体均值在1- 置信水平下的置信区间为10x1z04256n0105.36 1.9±6×2585414÷√ 100105.36 3.92= 104560 101.44,109.±284.从总体中抽取一个n =100 的简单随机样本,得到x =81 ,s=12。
要求:1) 构建μ的90%的置信区间。
2) 构建μ的95%的置信区间。
3) 构建μ的99%的置信区间。
2 )已知解:由于是正态总体,但总体标准差未知。
总体均值在1- 置信水平下的置信区间公式为81 ±× 12÷√ 100 = 81 ±×1) 1- =90%,其置信区间为81 ±2) 1- =95% ,其置信区间为81 ±3) 1- =99%,其置信区间为81 ±5.利用下面的信息,构建总体均值的置信区间。
1) x = 25,σ = ,n =60 ,置信水平为95%2) x =119,s = ,n =75 ,置信水平为98%3) x =,s = ,n =32 ,置信水平为90%1 ) 1- =95% ,其置信区间为:25±×÷√ 60= 25 ±2 ) 1- =98% ,则=, /2=, 1- /2=, 查标准正态分布表, 可知:其置信区间为: 119 ±×÷√ 75= 1193) 1- =90%,其置信区间为 : ±×÷√ 326. 利用下面的信息,构建总体均值 μ的置信区间:1) 总体服从正态分布,且已知 σ = 500 ,n = 15x , =8900 ,置 信水平为 95%。
置信水平为 95%。
解:为大样本总体非正态分布,但 σ 已知。
则 1- = 95%,。
其置信 区间公式为 x z 22105.36 1.96 10 n 25∴置信区间为: 8900±× 500÷√ 35=( )105.36 3.92101.44,109.28 3) 总体不服从正态分布,σ 未知, n = 35 x , =8900 ,s =500 ,置信水平为 90%。
解:为大样本总体非正态分布,且 σ 未知, 1- =90%,其置信区间为: 8900 ±× 500÷√ 35=( 8761 9039)4) 总体不服从正态分布,σ 未知, n = 35 x , =8900 ,s =500 , 置信水平为 99%。
解:为大样本总体非正态分布,且 σ 未知, 1- =99%,。
其置信区间为: 8900±× 500÷√ 35=( )解: N=15,为小样本正态分布,但 已知。
则 1- 信区间公式为 x z 22 n∴置信区间为: 8900±× 500÷√ 15=( , ) 105.36 =95%,。
其置10 1.96 252) 总体不服从正态分布,且已知 σ = 500 , 105.36 101.44,109.28 n =35x , =8900 ,7.某大学为了解学生每天上网的时间,在全校7500 名学生中采取重复抽样方法随机抽取36 人,调查他们每天上网的时间,得到下面的数据(单位:小时)(略)。
求该校大学生平均上网时间的置信区间,置信水平分别为90% 解:先求样本均值:=再求样本标准差:置信区间公式:8.从一个正态总体中随机抽取样本量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。
求总体均值μ的95%置信区间。
解:本题为一个小样本正态分布,σ 未知。
先求样本均值:= 80 ÷8=10再求样本标准差:= √84/7 =于是, 的置信水平为的置信区间是已知,n = 8,则, α /2= ,查自由度为n-1 = 7 的分布表得临界值所以,置信区间为:10±×÷√ 7 9.某居民小区为研究职工上班从家里到单位的距离,抽取了由16 个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。
假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
解:小样本正态分布,σ 未知。
已知,n = 16 ,,则, α/2= ,查自由度为n-1 = 15 的分布表得临界值样本均值=150/16=再求样本标准差:= √15 ≈于是, 的置信水平为的置信区间是±×÷√ 1610.从一批零件是随机抽取36 个,测得其平均长度是,标准差是。
1) 求确定该种零件平均长度的95%的置信区间。
2) 在上面估计中,你使用了统计中的哪一个重要定理?请解释。
解:1) 这是一个大样本分布。
已知N=36,=x,S =,1-α=,。
其置信区间为:±×÷√ 362) 中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。
在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。
样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。
11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100 克,现从某天生产的一批产品中按重复抽样随机抽取50 包进行检查,测得每包重量如下:(略)已知食品包重服从正态分布,要求:1)确定该种食品平均重量的95%的置信区间。
2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。
解: 1 )本题为一个大样本正态分布,σ 未知。
已知N=50,μ= 100,1- α=,。
①每组组中值分别为97、99、101、103、105,即此50 包样本平均值= (97+99+101+103+105)/5 = 101②样本标准差为:= √{(97-101 )2×2+(99-101 )2×3+(101-101 )2×34+(103-101 )2 ×7+(105-101 )2×4}÷(50-1)≈③其置信区间为:101±×÷√ 502 )∵不合格包数(<100 克)为2+3=5 包,5/50 = 10% (不合格率),即P = 90%。
∴ 该批食品合格率的95%置信区间为:= ±×√×÷ 50= ±×12.假设总体服从正态分布,利用下面的数据构建总体均值μ的99%的置信区间。
(略)解:样本均值样本标准差:尽管总体服从正态分布,但是样本n=25 是小样本,且总体标准差未知,应该用T 统计量估计。
1- α=,则α=, α/2= ,查自由度为n-1 = 24 的分布表得临界值的置信水平为的置信区间是,13.一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18 个员工,得到他们每周加班的时间数据如下(单位:小时):(略)假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。