《统计学》(袁卫第四版)课后答案.pptx

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

.解释置信水平为95%的置信区间的含义
答：总体参数是固定的，未知的，置信区间是一个随机区间。置信水平为95%的置信区间的含义是指，在相同条件下多次抽样下，在所有构造的置信区间里大约有95%包含总体参数的真值。
.简述样本容量与置信水平、总体方差、允许误差的关系
答：以估计总体均值时样本容量的确定公式为例：〃=卜“『
(3)个人对股票的选择，与其风险偏好等因素有关。
第四章
1.总体分布指某个变量在总体中各个个体上的取值所形成的分布，它是未知的,是统计推断的对象。从总体中随机抽取容量为n的样本。,λ2,∙,王)，它的分布称为样本分布。由样本的某个函数所形成的统计量/(3,λ2,,天)，它的分布称为抽样分布(如样本均值、样本方差的分布)
5对比率数据的平均，为什么采用几何平均？
答：比率数据往往表现出连乘积为总比率的特征，不同于一般数据的和为总量的性质，由此需采用几何平均。
6.简述众数、中位数和均值的特点和应用场合。
答：众数、中位数和均值是分布集中趋势的三个主要测度，众数和中位数是从数据分布形状及位置角度来考虑的，而均值是对所有数据计算后得到的。众数容易计算，但不是总是存在，应用场合较少；中位数直观，不受极端数据的影响，但数据信息利用不够充分；均值数据提取的信息最充分，但受极端数据的影响。
.简要说明统计数据的来源
答：统计数据来源于两个方面：直接的数据：源于直接组织的调查、观察和科学实验，在社会经济管理领域，主要通过统计调查方式来获得，如普查和抽样调查。间接的数据：从报纸、图书杂志、统计年鉴、网络等渠道获得。
.简要说明抽样误差和非抽样误差
答：统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的，从理论上看，这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差，它是不可避免的，但可以控制的。
.第一类错误和第二类错误分别是指什么？它们发生的概率大小之间存在怎样的关系？
答：第I类错误指，当原假设为真时，作出拒绝原假设所犯的错误，其概率为ao
第口类错误指当原假设为假时，作出接受原假设所犯的错误，其概率为在
其他条件不变时，α增大，夕减小；夕增大，α减小。
.什么是显著性水平？它对于假设检验决策的意义是什么？
,什么是统计上的显著性？
答：一项检验在统计上是显著的（拒绝原假设），是指这样的（样本）结果不是偶然得到的，或者说，不是靠机遇
能够得到的。显著性的意义在于“非偶然的练习题 .解（1）第一类错误是，供应商提供的炸土豆片的平均重量不低于60克，但店方拒收并投诉。（2）第二类错误是，供应商提供的炸土豆片的平均重量低于60克，但店方没有拒收。（3）顾客会认为第二类错误很严重，而供应商会将第一类错误看得较严重。 .解：提出假设H0:∕√≤6,H2:^>6 已知σ∙=1.19,h=100,a=0.05 （1）检验统计量为Z=-^/N（。J） (2)拒绝规则是：若Z>z0,拒绝"°；否则，不拒绝 (3)由亍=6.35得：Z=6-^~6=2.94>Z005=1.64,拒绝认为改进工 √ioδ 艺能提高其平均强度。 5解：设〃为如今每个家庭每天收看电视的平均时间(小时) 需检验的假设为：”o∕≤6.7。,K∕a6.7。
<=1
∑α-对工
S=+ =116.48（万元）
V∑z-ι
1ι=ι
13（1）离散系数，因为它消除了不同组数据水平高低的影响。
vv= =0.024
(2)成年组身高的离散系数： 172.1 ；
23
匕=—=0.032
幼儿组身高的离散系数：
71.3 ；
由于幼儿组身高的离散系数大于成年组身高的离散系数，说明幼儿组身高的离散程度相对较大。
极差、方差、标准差、离散系数、偏态系数和峰度系数。
4怎样理解均值在统计中的地位？
答:均值是对所有数据平均后计算的一般水平的代表值，数据信息提取得最充分,具有良好的数学性质，是数据误差相互抵消后的客观事物必然性数量特征的一种反映，在统计推断中显示出优良特性，由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。
大样本的情况出S+丁
9ቤተ መጻሕፍቲ ባይዱ%置信度下
95%置信度下
12.解:由题可计算：Sj=0.2422,5j=0.0762
两个总体方差比σ12/犬在95%的置信区间为：
--Γ-^——V
ri=（4.06,14.35）14.解：由题意：σ=120,za/2=1.96,E=20
则必须抽取的顾客数为：〃=匕2^1=坐N型=139
答：假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值，用于检验结果的可靠性度量，但确定了显著性水平等于控制了犯第一错误的概率，但犯第二类错误的概率却是不确定的，因此作出“拒绝原假设”的结论，其可靠性是确定的，但作出“不拒绝原假设”的结论，其可靠性是难以控制的。
.什么是P值？P值检验和统计量检验有什么不同？
.表给出了一些主要描述统计量
先考虑平均指标，在平均指标相近时考虑离散程度指标。
应选择方法A,其均值远高于其他两种方法，同时离散程度与其他两组相近。
.(1)风险的度量是一个不断发展的问题，在古典金融理论中，主要采用标准差这个统计测度来反映，现代金融中，采用在险值(valueatrisk)0
(2)无论采用何种风险度量，商业类股票较小
.重复抽样和不重复抽样下，样本均值的标准差分别为:
因此不重复抽样下的标准差小于重复抽样下的标准差，两者相差一个调整系数
.解释中心极限定理的含义
答：在抽样推断中，中心极限定理指出，不论总体服从何种分布，只要其数学期望和方差存在，对总体进行重复抽样时，当样本容量充分大，样本均值趋近于正态分布。中心极限定理为均值的抽样推断奠定了理论基础。
(1)总体中赞成比率的显著性水平为α的置信区间为当α=0.05时，E=za,2=1.96*F蜉6%=133% 置信区间为(50.7%,77.3%) (2)如果要求允许误差不超过10%,置信水平为95%,则应抽取的户数: n= 8.此题需先检验两总体的方差是否相等:Hf):σ12=b；,H]:σ12≠σ1 在5%的显著性水平下，F=s^Is[=96.8/102.0=0.949 外025(i3,6)=5.37,耳975(13,6)=1∕∕‰5(6,13)=1/3.6=0.28,不拒绝原假设认为两总体方差是相同的。 (1) l-α=90%,(x1-x2)±r005(19)∕5^f^-+∣j=9.8±1.729√98.44*0.21=9.8±1.729*4.55 =9.8±2.093√98.44*0.21=9.8±2.093*4.55 即(0.27,19.32)
E2
样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。
练习题：
.解：由题意：样本容量为〃=49
(1)
=(115.7997,124.20028) .解：由题可得：〃=36,5=3.317,S=I.609 尽管采用不重复抽样，但因为样本比例很小（不到0.5%）,其抽样误差与重复抽样下近似相同，采用重复抽样的抽样误差公式来计算。〃=36为大样本，则在α的显著性水平下的置信区间为: Ef京，T+Z,G) 当a=0.1,Z。∕2=1.64,置信区间为(2.88,3.76) 当α=。.。5,Z/2=1.96,置信区间为⑵80,3.84) 当。=0.01,Za∕2=2.56,置信区间为⑵63,4.01)5解：假设距离服从正态分布，〃=16,元=9.375,s=4.113 平均距离的95%的置信区间为ET。o2505)j=,"h025(i5)亍J=(7.18,11.57) 3? 7解：由题意：w=5。,p=-=64%0 50 因为〃p,"(l-p)均超过5,大样本
7为什么要计算离散系数？
答：在比较二组数据的差异程度时，由于方差和标准差受变量值水平和计量单位的影响不能直接比较，由此需计算离散系数作为比较的指标。
练习题：
1.频数分布表如下：
服务质量等级评价的频数分布
条形图（略）
2（1）采用等距分组：
n=40全距=152-88=64取组距为10
组数为64/10=6.4取6组
69001 70001 1223456667 9 5566677888899 78889 7100223 35677889 720122567899 73356 74147 5等距分组 n=65全距=9-(-25)=34取组距为5,组数=34/5=6.8,取7组频数分布表：
7(1)茎叶图如下: （3）A班考试成绩的分布比较集中，且平均分数较高；B班考试成绩的分布比A班分散, 且平均成绩较A班低 .箱线图如下：（特征请读者自己分析） .(1)^=274.1(Tjte)；Me=272.5；。1.=260.25；。U=291.25。 (2)"21.17(万元)。 Σw21 乙企业平均成本月=与——=18.29（元）；（SVYl 华 »=lx2i 原因：尽管两个企业的单位成本相同，但单位成本较低的产品在乙企业的产量中所占比重较大，因此拉低了总平均成本。 11.X=j⅛——426.67(万元)； ∑z
频数分布表如下：
40个企业按产品销售收入分组表
（2）
某管理局下属40个企分组表
3采用等距分组
全距=49-25=24
n=40取组距为5,则组数为24/5=4.8取5组
频数分布表:
g
25
30
40 45 50 35sales 4..（1）排序略。（2）频数分布表如下: 100只灯泡使用寿命非频数分布直方图（略）。（3）茎叶图如下: 6518 6614568 67134679 6811233 34555889
.答：（1）有两个总体：A品牌所有产品、B品牌所有产品
（2）变量：口味（如可用10分制表示）
（3）匹配样本：从两品牌产品中各抽取100。瓶，由100o名消费者分别打分，形成匹配样本。
（4）从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题 1描述次数分配表的编制过程答：分二个步骤：（1）按照统计研究的目的，将数据按分组标志进行分组。按品质标志进行分组时，可将其每个具体的表现作为一个组，或者几个表现合并成一个组，这取决于分组的粗细。按数量标志进行分组，可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组；组距式分组将变量的取值范围（区间）作为一个组。统计分组应遵循“不重不漏”原则（2）将数据分配到各个组，统计各组的次数，编制次数分配表。 .解释洛伦兹曲线及其用途答：洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。 .一组数据的分布特征可以从哪几个方面进行测度？答：数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、
《统计学》（袁卫第四版）课后答案
《统计学》（袁卫第四版）课后答案
第一章
1.什么是统计学？怎样理解统计学与统计数据的关系？
答：统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系，统计学阐述的统计方法来源于对统计数据的研究，目的也在于对统计数据的研究，离开了统计数据，统计方法以致于统计学就失去了其存在意义。
E2202
第五章、假设检验
思考题
.1.理解原假设与备择假设的含义，并归纳常见的几种建立原假设与备择假设的原则.
答：原假设通常是研究者想收集证据予以反对的假设；而备择假设通常是研究者想收集证据予以支持的假设。建立两个假设的原则有：
（1）原假设和备择假设是一个完备事件组。（2）一般先确定备择假设。再确定原假设。（3）等号“=”总是放在原假设上。（4）假设的确定带有一定的主观色彩。（5）假设检验的目的主要是收集证据来拒绝原假设。
第四章、参数估计
.简述评价估计量好坏的标准
答：评价估计量好坏的标准主要有：无偏性、有效性和相合性。设总体参数。的估计量有«和a,如果。，称A是无偏估计量；如果。和θ2是无偏估计量，且。⑻小于。阎，则@比a更有效；如果当样本容量"→8,θx→θ,则。是相合估计量。
.说明区间估计的基本原理
答：总体参数的区间估计是在一定的置信水平下，根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间，使该区间包含总体参数的概率为置信水平。置信水平反映估计的可信度，而区间的长度反映估计的精确度。
答：P值是当原假设为真时，检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P 值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平来控制犯第一类错误的上限，p
值可以有效地补充α提供地关于检验可靠性的有限信息。〃值检验的优点在于，
它提供了更多的信息，让人们可以选择一定的水平来评估结果是否具有统计上的显著性。

《统计学》(袁卫 第四版)课后答案.pptx

《统计学》(袁卫第四版)课后答案.pptx