北京师范大学统计学课后习题答案
统计学课后习题和答案
第一章1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A.9252157g B. 9282157g C.528292g D. 655292g E. 925282g 1*. Answer :BAnalysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为:92829282(,)()()157157157157P Earned Employed Total P Earned P Employed Total ===g g g g g g2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组的试验结果。
如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱绿色的人数的期望值? A.(99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35)3142*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为:1089999108(3050,)(3050)()314314314314P green Total P P green Total -=-==g g g g g g 第二章1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。
下面哪个图代表了有最大标准差的数据集?A. B.C. D.E.2*..这张图是一次统计学考试中40个成绩的累积相对频率直方图,下列哪一个选项可以从这张A.较低的20个分数的差异大于较高的20个分数的差异B.中位数小于50C.60%的学生的分数高于80分D.如果设定及格线是70,那么大多数人没通过这次考试E.这张图的平均水平组是60分,低于这个组的分数出现的频率更高F.1*. Answer:DG.Analysis:本题考查如何判断直方图的spread,显然,图D的标准差是最大的。
北师大统计学基础习题答案5
Exercise 51. P201: 4.59.Let 54321Y Y Y Y Y <<<<be the order statistics of a random sample of size n from a distribution with p.d.f. ∞<<=-x e x f x 0,)(,zero elsewhere..Show that 21Y Z =and 242Y Y Z -=are independent. Solution: Since ∞<<=-x e x f x 0,)(, so ∞<<-=-x e x F x 0,1)()()()]()][()()][([!1!1!1!5),(424242424,2y f y f y F y F y F y F y y g -=424422))()(1(120y y y y y y e e e e e e --------= Since 12Z Y =,214Z Z Y +=,11101==J . 22111211212112421)1)(1(120))(1(120),(z z z z z z z z z z z z z e e e e ee eee e z z g ---------------=--=)1(20)()]'([)](1)][([!3!1!5)()(11424322211z z e e y f y F y F y F y g z g ---=-== ⎰⎰∞----∞--==01240121222211)1)(1(120),()(dz e e e e dz z z g z g z z z z222211222205042)1(6)1(201120)|5|4()1(120z z z z z z z z e e e e e e ee----∞-∞----=-⋅=----= Thus, =),(21z z g )()(2211z g z g .So 1Z and 2Z are independent.P274: 6.15. Let X be the mean of a random sample of size n from adistribution that is )9,(μN . Find n such that 90.0)11Pr(=+<<-X X μ, approximately.Solution: Since ~X )9,(n N μ,)1,0(~3)(N X n μ-.90.01)3(2)3|3)(Pr(|)1|Pr(|)11Pr(=-Φ=<-=<-=+<<-nn X n X X X μμμ Thus )3(n Φ=0.95, 645.13=nand 35.24≈n . Because n must be an integer, so n=24 or 25.P275: 6.18. Let 121,,,+n n X X X X be a random sample of size 9 from adistribution that is ),(2σμN .(a) If σis known, find the length of a 95 percent confidence interval for if this interval is based on the random variable.(b) If σis unknown, find the expected value of the length of a 95 percent confidence interval for if this interval is based on the random variable S X /)(8μ-. (c) Compare these two answers. Solution:(a) Since ~991∑==i iXX )9,(2σμN ,thus)1,0(~)(9N X σμ-.Pr(|σμ)(9-X |<1.96)=0.9595.0)96.1)(396.1Pr(=<-<-⇔σμX95.0)396.1396.1Pr(=+<<-⇔σμσX X . The 95 percent confidence interval for μis )396.1,396.1(σσ+-X X and the length of it isσσ31.17598≈ (b) Since σ is unknown, then )8(~)(81/t SX n S X T μμ-=--=975.0)P r (95.01)Pr(295.0))(8Pr(=≤⇒=-≤⇒=<-<-b T b T b S X b μFrom TABLE IV of Appendix B, we know b=2.306, thus95.0)8306.28306.2Pr(=+<<-σμσX X . The 95 percent confidence interval for μ is )8306.2,8306.2(σσ+-X X with the length S L 8612.4=⎰∞-Γ===02342121222)4(183612.4))/9((38612.4)(8612.4)(dx e x x S E S E L E xσσσ)29(22)4(183612.422)4(183612.42)4(183612.429402729402274ΓΓ=Γ=Γ=⎰⎰∞-∞-σσσdy e y dx e x y xThen σ49.1)(≈L E(c) From (a) we know the answer is σ31.1, from (b) we know the answer isσ49.1. The two methods yield results that are in substantial agreement, which shows the length of the confidence interval for μ is almost the same with the parameter σ known or unknown.P279: 6.30.Let two independent random samples, each of size 10, from two normal distributions ),(21σμN and ),(22σμN yield 8.4=x ,64.821=s ,6.5=y ,88.722=s . Find a 95 percent confidence interval for.Solution: Let 1021,,X X X and 1021,,Y Y Y denote, respectively, independent random samples from the two distributions ),(21σμN and),(22σμN , then ~10101∑==i iXX )10,(21σμN and ~10101∑==i iYY )10,(22σμN .)5,(~221σμμ--N Y X .)18(~/)1010(222221χσS S +)18(~9)()()()101101(18)(10)()(222121222121t S S Y X S S Y X T +---=++---=μμμμ.101.295.0)Pr(=⇒=<<-b b T b and95.0))(3)()(3)Pr((2221212221=++-<-<+--S S b Y X S S b Y X μμ So the random intervalis )3101.2)(,3101.2)((22212221S S Y X S S Y X ++-+--. Let 8.4=x ,64.821=s ,6.5=y ,88.722=s , we get a 95 percent confidenceinterval (-3.6,2.0).2. Use Splus or R software to compute the mean, standard deviation, skewness and kurtosis of the following dataset.-0.4292, 0.0064, 0.1181, -0.6282, 2.2010, -1.7623, 0.0921,1.8742, 1.4538, 0.3575, -1.5848, 0.4993, 0.7762, -0.2638, -1.1003, -2.2480, 0.5419, -0.4018, -0.3562, -0.5872. Solution: > x<-c(-0.4292,0.0064,0.1181,-0.6282,2.2010,-1.7623,0.0921,1.8742,1.4538,0.3575,-1.5848,0.4993,0.7762,-0.2638,-1.1003,-2.2480,0.5419,-0.4018,-0.3562,-0.5872) > a=mean(x) > a[1] -0.072065 > b=sd(x) > b[1] 1.143067> c=mean(((x-a)/b)^3) > c[1] 0.1234913> d=mean(((x-a)/b)^4)-3 > d[1] -0.5280221So the mean of the dataset is -0.072065, the standard deviation is 1.143067, the skewness is 0.1234913 and the kurtosis is -0.5280221.3*. P203: 4.73. Let n Y Y Y <<< 21be the order statistics of a random sample of size n from the exponential distribution with p.d.f.∞<<=-x e x f x 0,)(,zero elsewhere..(a) Show that 11nY Z =,))(1(122Y Y n Z --=,))(2(233Y Y n Z --=,…1--=n n n Y Y Z , are independent and that each i Z has the exponential distribution.Solution: Since n y y y n e e e n y y y g ---= 21!),,(21, andn n n Z Z n Zn Z Y n Z n Z Y n Z Y ++-+=-+==-21,,1,12121211 and the Jacobian is!1121111021111011101n n n n n n n n J =---=nn z z z z n z n z n z n z nz n n e e e eee y y y g J z z z g ---++-+--+--=== 2121211)1()1(2121),,(||),,(k z n k k n k k e dz dz dz dz z z z g z g -+-∞∞∞∞==⎰⎰⎰⎰ 11012100),,()(So )()()(),,(221121n n n z g z g z g z z z g = and ∞<<=-k z k k z e z g k 0,)( Which shows that n z z z ,,21are independent and that each i z has the exponential distribution.(b) Demonstrate that all linear functions of n Y Y Y ,,,21 , such as ∑ni i Y a 1, canbe expressed as linear functions of independent random variables. Solution:)())(1())(1(11122112211---++---++--+=+++n n n k k k n n Y Y b Y Y k n b Y Y n b nY b Y a Y a Y a n n Z b Z b Z b +++= 2211. Then ,)2()1(,)1(232121a n b n n b a n b n b =---=-- n n n n n k k k a b a b b a k n b k n b ==-=--+---+)1(,)1()2(,,)()1(,111 . Then n n nk k n n a b k n a a b n a a a b n a a a b =+-++=-++=++=,1,,1,322211So1,11+-+==∑∑==i n a a b Z b Y a ni i ni i i ni i i .Since n Z Z Z ,,,21 are independent, thenn n Z b Z b Z b ,,,2211 are independent. So∑=ni i i Y a 1can be expressed as linearfunctions of independent random variables.P275: 6.19.Let 121,,,+n n X X X X be a random sample of size n+1, n>1, from a distribution that is ),(2σμN . Let n X X ni /1∑= andn X X S ni /)(212-=∑. Find the constant c so that the statisticσ1+-n X X chas a t-distribution. If n=8, determine k suchthat 80.0)Pr(=+<<-kS X kS X μ. The observed interval is ),(ks x ks x +- often called an 80 percent prediction interval for 9X . Solution: )/,(~2n N X σμ,),(~21σμN X n +,),1,0(~21σnn N X X n +-+ ).1(~11)1(1),1(~).1,0(~112212221--⋅+⋅-=-+--+-+++n t SX X n nn n n nS n n X X n nS N nn X X n n n σσχσσTherefore 11+-=n n c . 80.0)9797Pr()Pr()Pr(999=<-=<-=+<<-k S X X k S X X kS X x kS X 60.1,415.197==k k . So k=1.60.。
1 现代心理与教育统计学 课后答案(张厚粲 徐建平著 著) 北京师范大学出版社
第一章1名词概念(1)随机变量答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本答:样本是从总体中抽取的一部分个体。
(4)个体答:构成总体的每个基本单元。
(5)次数是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。
(8)统计量答:样本的特征值叫做统计量,又称作特征值。
(9)参数答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值答:随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工具。
②心理与教育统计学是心理与教育科研定量分析的重要工具。
统计学课后习题答案_(第四版)4.5.7.8章
《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
北京师范大学统计学导论答案整理版
40
练习2.2.11
P
(A1)
N N
1
n
P
( A1 A 2 )
N
N
2
n
P (A1A2
A N 1 )
1 N
n
P ( A 1 A 2 A N 1 A N ) 0
41
练习2.2.11
P(B)
1C1NNN1n
CN2NN2n
(1)N1 1n N
N k01(1)kCNk NNkn
42
练习1.4.1 比如,北京某交通路口某个方向共有4条 汽车道,要研究应设几个直行道、几个 左转弯道、几个右转弯道才能有利于交 通畅通?应调查的变量是每天开往各个 方向的车流量,根据各个时段的车流量 情况设计车道。
1
练习1.4.2 解:不可取。因为这里检查的苹果是方 便样本,不是随机样本,方便样本的代 表性差。 第二页:例1.1.3 注:收集有代表性的数据,是得到正确 结论的基础。
AA 12A 13A23
且A12,A13,A23两两互不相 . 容
37
练习2.2.10 A12 A13={边长为l1的边与某直线相交} A12 A23={边长为l2的边与某直线相交} A23 A13 ={边长为l3的边与某直线相交}
P ( A 1 2 U A 1 3 ) 2 l a 1 ,P ( A 1 2 U A 2 3 ) 2 l a 2 ,P ( A 1 3 U A 2 3 ) 2 l a 3
证明: A B A (B A ) A (B A )B
且 A (B A) B ,A B B
PABP(A)P(BA)B
P(A)P(B)(A)B
25
练习2.2.4 解:A={1,2,3至少出现一个},
统计学课后习题及答案
统计学课后习题及答案统计学课后习题及答案统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有广泛的应用。
作为学习统计学的学生,课后习题是巩固知识、提高技能的重要途径。
本文将提供一些统计学课后习题及其答案,希望对学习者有所帮助。
1. 描述性统计习题:给定以下一组数据:10, 15, 12, 18, 20, 22, 16, 10, 14, 19。
请计算该组数据的均值、中位数和众数,并解释它们的含义。
答案:均值:计算方法是将所有数据相加,然后除以数据的个数。
对于给定的数据,均值为(10+15+12+18+20+22+16+10+14+19)/10 = 16.6。
中位数:将数据按照从小到大的顺序排列,找出中间的数。
对于给定的数据,中位数为16。
众数:出现频率最高的数。
对于给定的数据,众数为10。
这些统计量可以帮助我们了解数据的集中趋势。
均值是所有数据的平均值,中位数是数据的中间值,众数是出现频率最高的值。
在这个例子中,均值告诉我们这组数据的平均水平是16.6,中位数告诉我们大约一半的数据小于16,一半的数据大于16,众数告诉我们10是这组数据中出现次数最多的数。
2. 概率习题:一个骰子有6个面,每个面上的数字分别是1、2、3、4、5、6。
如果投掷一次骰子,求得到奇数的概率。
答案:奇数的个数为3个,即1、3、5。
骰子的总个数为6个。
所以得到奇数的概率为3/6 = 1/2。
概率是事件发生的可能性。
在这个例子中,奇数的个数是3个,总个数是6个,所以得到奇数的概率是3/6,即1/2。
3. 抽样与估计习题:某市有1000名居民,你希望了解他们对某项政策的态度。
你打算进行一次调查,抽取100名居民进行问卷调查。
这个调查结果能否代表整个市民的态度?为什么?答案:这个调查结果不能代表整个市民的态度。
原因是抽样的方式可能引入抽样误差。
如果抽取的100名居民在某些特征上不具有代表性,比如年龄、性别、职业等,那么调查结果可能会偏离整个市民的态度。
统计学课后习题答案
第四章 统计描述某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%.试分别计算产量、成本、劳动生产率的计划完成程度. 解产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成%.成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成%.劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成%.某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%,在五年中,该矿实际开采原煤情况如下(单位:万吨)试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间. 解本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成%.(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划. 我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中;(2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几 解(1)(2)是比例相对数;1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长%.某乡三个村2000年小麦播种面积与亩产量资料如下表:要求:(1)填上表中所缺数字;(2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量.解(1)(2))(75.72840013065015082012070011斤=⨯+⨯+⨯==∑∑==k i iki iiff xx(3)两种不同品种的玉米分别在五块地上试种,产量资料如下:已知生产条件相同,对这两种玉米品种进行分析比较,试计算并说明哪一种品种的亩产量更稳定一些解田块总面积总产量平均亩产量=即: 由于是总体数据,所以计算总体均值: 计算表格乙品种下面分别求两块田地亩产量的标准差:要比较两种不同玉米的亩产量的代表性,需要计算离散系数:<甲σv 乙σv ,∴甲品种的亩产量更稳定一些.两家企业生产相同的产品,每批产品的单位成本及产量比重资料如下: 甲企业乙企业试比较两个企业哪个企业的产品平均单位成本低,为什么解∴乙企业的产品平均单位成本更低.某粮食储备库收购稻米的价格、数量及收购额资料如下:要求:(1)按加权算术平均数公式计算稻米的平均收购价格;(2)按加权调和平均数公式计算稻米的平均收购价格.解(1))(02.19000915011元≈==∑∑==k i iki iiff xx (2))(02.190009150400030002000360031502400m H 元≈=++++==∑∑xm x已知我国1995年—1999年末总人口及人口增长率资料:试计算该期间我国人口平均增长率. 解计算过程如下:按照平均增长率的公式可知:1-平均发展速度平均增长率=所以,1995年—1999年期间我国人口平均增长率=96.91-1204861253604≈‰某单位职工按月工资额分组资料如下: 根据资料回答问题并计算: (1)它是一个什么数列(2)计算工资额的众数和中位数;(3)分别用职工人数和人数所占比重计算平均工资.结果一样吗(4)分别计算工资的平均差和标准差. 解(1)是等距分组数列 (2)d f f f f f f L M m m m m m m ⨯-+--+≈+--)()(1110下限公式:即:59.54821000)30134()37134(371345000)()(1110≈⨯-+--+=⨯-+--+≈+--df f f f f f L M m m m m m m(注:用上限公式算出的结果与上述结果相同) (注:用上限公式算出的结果与上述结果相同) (3))(22.5343236107500306500134550037450025350011元≈⨯+⨯+⨯+⨯+⨯==∑∑==k i iki iiff xx (元)2.53434.24%7500 71%.12650078%.56550068%.15450059%.103500x 1111≈⨯+⨯+⨯+⨯+⨯=⋅==∑∑∑∑====ki ki iii k i iki iiff x ff x两者结果一样.(忽略小数点位数的保留对结果造成的影响)(4)平均差 92.65411≈-=∑∑==ki iki iidff x xM标准差 33.923)(12≈-=∑=Nf X XKi i iσ某市甲、乙两商店把售货员按其人均年销售额分组,具体资料如下:要求:(1)分别计算这两个商场售货员的人均销售额; (2)通过计算说明哪个商场人均销售额的代表性大解(1) 423001260011===∑∑==k i iki iiff xX 甲(2)05.1030030300)(12≈=-=∑=Nf X XKi i i甲甲σ >甲σv 乙σv ,∴乙商场销售额的代表性大.第五章 统计抽样袋中装有5只同样大小的球,编号为1,2,3,4,5,从中同时取出3只球,求取出的最大号X 的分布律及其分布函数并画出其图形.解先求X 的分布律:由题知,X 的可能取值为3,4,5,且2345{5}/6/10P X C C ===,∴X 的分布律为:⎪⎪⎭⎫ ⎝⎛10/610/310/1543, 由(){}i i ix xF x P X x p ≤=≤=∑得:设X 的密度函数为求: (1)常数c ;(2)X 的分布函数()F x ; (3){13}P X <≤. 解(1)24241()0(32)018f x dx dx c x dx dx c +∞+∞-∞-∞==+++=⎰⎰⎰⎰(2)当2x ≤时,()00xF x dt -∞==⎰;当24x <<时,22211()()0(32)(310)1818xxF x f t dt dt t dt x x -∞-∞==++=+-⎰⎰⎰当4x ≥时,24241()()0(32)0118xx F x f t dt dt t dt dt -∞-∞==+++=⎰⎰⎰⎰.故分布函数 (3)21{13}=(3)(1)(33310)04/918P X F F <≤-=+⨯--= 随机变量,X Y 相互独立,又(2)XP ,1(8,)4YB ,试求(2)E X Y -和(2)D X Y -.解(2)()2()2222E X Y E X E Y -=-=-⨯=-一本书排版后一校时出现错误处数X 服从正态分布(200,400)N , 求: (1)出现错误处数不超过230的概率;(2)出现错误处数在190~210的概率. 解(200,400)X N(1)200230200(230)()2020X P X P --∴≤=≤ (2) 190200200210200(190210)()202020X P X P ---∴≤≤=≤≤某地区职工家庭的人均年收入平均为12000元,标准差为2000元.若知该地区家庭的人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,问出现样本均值等于或超过12500元的可能性有多大 解对总体而言,2(12000,2000)XN∴样本均值22000(12000,)25xN某商场推销一种洗发水.据统计,本年度购买此种洗发水的有10万人,其中3万6千人是女性.如果按重复抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%的可能性有多大解总体比例 3.6=36%10π=万万(1)(,)p N nπππ-∴即2(0.36,0.048)pN第八章 相关分析和回归分析某店主分析其店面的经营情况时,收集了连续10天的访问量数据(单位:天)和当天营业额数据(单位:元)如下.对以上访问量和营业额数据作相关分析.解相关分析(1)画访问量和营业额数据的散点图,如下所示从图上可以看出,访问量和营业额数据是简单线性正的不完全相关. (2)计算相关系数计算访问量和营业额的简单线性相关系数为,大于,说明访问量和营业额之间存在较高的线性关系.某饮料广告费投入为x,产品销售数量为y,根据收集2年的月度数据 资料,计算得到以下结果:∑=-6546)(2x x i,∑=-5641)(2y y i375=x ,498=y ,6054))((=--∑y y x x i i(1)计算相关系数,并初步判断x 与y 之间的关系; (2)用最小二乘法估计模型回归系数,并写出模型结果; (3)说明所计算的回归系数的经济意义;(4)计算模型可决系数,并用其说明模型的拟合效果. 解最小二乘法的计算(一元)(1)计算相关系数,并初步判断x 与y 之间的关系;计算x 与y 相关系数为r=,说明两者的简单线性相关程度非常高,因此可以初步判断x 与y 呈现线性关系.(2)用最小二乘法估计模型回归系数,并写出模型结果;记模型为:i i x y 10ˆˆˆββ+=,将以上结果代入最小二乘法的计算公式,得到=1ˆβ,=0ˆβ. 因此,产品销售数量为y 对广告费投入为x 的模型为i i x y92484.01852.151ˆ+= (3)说明所计算的回归系数的经济意义;=1ˆβ表示当广告费投入每增加1个单位,产品销售数量会增加个单位. (4)计算模型可决系数,并用其说明模型的拟合效果.由于模型为一元线性回归模型,根据一元线性回归模型中可决系数为模型因变量和自变量简单线性相关系数的平方的关系,可得模型的可决系数R 2=(r)2=2=.可决系数接近1,说明模型拟合的非常好.第九章 统计指数某市场上四种蔬菜的销售资料如下:(1) 根据综合指数编制规则,将上表所缺空格填齐; (2) 用拉氏公式编制四种蔬菜的销量总指数和价格总指数; (3) 用帕氏公式编制四种蔬菜的销量总指数和价格总指数; (4) 建立适当的指数体系,对蔬菜销售额的变动进行因素分析.解 %p q p q L %pq pq L p q 11.1092282431227.1072282390220010001======∑∑∑∑)拉氏:(即 ()⎩⎨⎧+=⨯=元175********.10727.10712.115%%计算表明: 四种蔬菜的销量增长了 %,使销售额增加了 162元;四种蔬菜的价格上长了 %,使销售额增加了175元;两因素共同影响,使销售额增长了%, 销售额增加了337元. 结论:某厂三种产品的产量情况如下表:试分析出厂价格和产量的变动对总产值的影响. 解第一步:计算三个总产值:24200064000101100081350000=⨯+⨯+⨯=∑p q(万元);25080064800101020081500001=⨯+⨯+⨯=∑pq (万元);2637005480011102005.81500011=⨯+⨯+⨯=∑pq (万元);第二步:建立指标体系即⎪⎩⎪⎨⎧-+-=-⨯=)250800263700()242000250800(242000263700250800263700242000250800242000263700 第三步:分析结论.计算结果表明:由于出厂价上涨了%,使总产值增加了8800元;由于产量提高了%,使总产值增加了12900元;两因素共同作用,使总产值上升了%,增加了21700元.若给出题中四种蔬菜的资料如下:(1) 编制四种蔬菜的算术平均指数; (2) 编制四种蔬菜的调和平均指数;(3) 把它们与上题计算的拉氏指数和帕氏指数进行比较,看看有何种关系什么条件下才会有这种关系的呢 (4)解(1)(2) (3)算术平均指数的结果与拉氏指数相等——以基期的总值指标为权数. 调和平均指数的结果与帕氏指数相等——以报告期的总值指标为权数.某地区2005年农副产品收购总额为1 360亿元,2006年比上年的收购总额增长了12%,农副产品价格指数为105%;试考虑:2006年与2005年相比较(1) 农副产品收购总额增长了百分之几农民共增加多少收入 (2)(3) 农副产品收购量增加了百分之几农民增加了多少收入 (4)(5) 由于农副产品收购价格提高了5%,农民又增加了多少收入 (6) 验证以上三者之间有何等关系解已知:农民交售农副产品增加收入亿元, 与去年相比增长幅度为12%; 农副产品收购数量增长 %, 农民增加收入 亿元; 农副产品收购价格上涨 %, 农民增加收入 亿元.显然,有:⎩⎨⎧+=⨯=(亿元)5.727.902.16300.10567.10600.112%%%可见,分析结论是协调一致的.某企业生产的三种产品的有关资料如下:(1) 根据上表资料计算相关指标填入上表(见绿色区域数字); (2) 计算产品产量总指数及由于产量增长而增加的总成本;(3)计算单位成本总指数及由于单位成本变动而增减的总成本.解建立指数体系:结论:计算结果表明:由于产量总指数增加了37%(=%-1),而使总成本增加了37元,由于单位成本总指数下降了%(=%-1),使总成本减少了元.两个因素共同影响使总成本上升了%,增加了元.9.8某商场的销售资料如下:(1)根据上表资料计算相关指标填入上表(见绿色区域数字);(2)计算商品销售量总指数及由于销量变化而增减的销售额;(3)计算商品价格总指数及由于价格变动而增减的销售额.解建立指数体系:计算结果表明:由于商品销量总指数下降了%(=%),而使销售额减少了万元,由于商品价格总指数下降了%(=%),使销售额减少了万元.两个因素共同影响使销售总额下降了%(=%),减少了54万元.某乡力图通过推广良种和改善田间耕作管理来提高粮食生产水平,有关生产情况如下表所示:(1) 该乡粮食平均亩产提高了百分之几由此增产粮食多少吨 (2)(3) 改善田间耕作管理使平均亩产提高多少增产粮食多少吨 (4)(5) 推广良种使平均亩产提高多少增产粮食多少吨 (6)解计算的相关数据(∑∑∑110100110100x f x f x f x f x f x f )见上表中绿色区域数字;从而有:建立指数体系: ⎪⎩⎪⎨⎧-+=-⨯=)()-(10011001假假假假x x x x x x x x x x x x 即 ()()⎪⎩⎪⎨⎧-+-=-⨯=000 657 48000 737 49000 478 46000 657 48000 478 46000 737 4948.40548.417 32.38748.40532.38748.417 即 ()⎩⎨⎧+=⨯=公斤 000 080 1000 179 2000 259 3 %22.102 %69.104%01.107分析结论: 计算结果表明(1)该乡粮食平均亩产提高了%(=%-1),由此增产粮食3 259吨; (2)由于改善田间管理,使平均亩产提高了%,粮食增产2 179吨; (3)由于推广优良品种,使平均亩产提高了%,粮食增产1 080吨.第十章 时间序列分析某公司2009年末有职工250人,10月上旬的人数变动情况是:10月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年职工应征入伍,同日又有3名职工辞职离岗,9日招聘7名销售人员上岗.试计算该公司10月上旬的平均在岗人数. 解)(25610256010518252516524750212232)7334262(1)334262(2)4262(2)12250(3250人==++++=++++⨯+---+⨯---+⨯-+⨯++⨯==∑∑iii fxf x 答:该公司10月上旬的平均在岗人数为256人. 某银行2009年部分月份的现金库存额资料如下:要求:(1)该时间序列属于哪一种时间序列.(2)分别计算该银行该年第一、二季度和上半年的平均现金库存额. 解(1) 该时间序列属于动态时点时间序列; (2) 第一季度平均现金库存额:)(4803144032520450480250014224321万元==+++=-+++=x x x x x ; 第二季度平均现金库存额:)(5673170032580600550252014227324万元==+++=-+++=x x x x x ; 上半年平均现金库存额:)(52363140625806005505204504802500172 (2)721万元==++++++=-+++=x x x x 某企业08年上半年的产量和单位成本资料如下:试计算该企业08年上半年的产品平均单位成本.解答:该企业08年上半年的产品平均单位成本为元. 某企业有关资料如下,计算该企业一季度人均月销售额.解 该企业一季度月平均销售额:)(33.12331201501003321万元=++=++=a a a a ;该企业一季度月平均职工人数:)(1133211611012021003224321人=+++=+++=b b b b b ; 该企业一季度人均月销售额:)/(091.111333.123人万元===ba c .某市2001~2005年的地区生产总值如下表:(1) 按平均发展速度估计2002~2004年的地区生产总值. (2) 按此5年的平均发展速度预测2008年和2010年的GDP.解(1)2002~2006年泉州市地区生产总值的平均发展速度为:%12.11399316264==v ; 按平均发展速度估计2002~2004年的地区生产总值分别为:11437%)12.113(9931270%)12.113(9931123%12.11399332=⨯=⨯=⨯(将计算结果填入上表绿色区域内);(2)按此5年的平均发展速度预测2008年和2010年的GDP 分别为:2008年地区GDP 预测值)(23541312.116263亿元=⨯=; 2010年地区GDP 预测值)(7.30111312.116265亿元=⨯=.我国某地区2001年~ 2006年税收总额如下:试计算:(1)环比发展速度和定基发展速度; (2)环比增长速度和定基增长速度; (3)增长1%绝对值;(4)用水平法计算平均增长速度;(5)分析表中所列资料反映的趋势特征,拟配合适的趋势模型,并预测2007年该地区的税收收入.解(1)~(3)相关计算结果填入下表(见绿色区域数字):(4) 用水平法计算平均发展速度和平均增长速度:平均发展速度%44.1161644.11404.22821603855====v ; 则平均增长速度%44.161%44.1161=-=-=v ;。
北京师范大学《统计学》课后习题答案
第八章
二、 选择题
1.B;2.A;3.C;4.B;5.D
三、 计算题
1.r =0.9540
2.
2
⑵R=0.8980,表明自变量能解释因变量89.81%左右的变动。
(3)t(l?) =7.2705,t(b?)At0.025(6)=2.4469,斜率系数通过参数显著性检验。
4.(1)630人;(2)647人
第六章
二、 选择题
1. B;2.D
三、 计算题
1.比例相同2.重量为10盎司3.合规定4.无差别5.有影响
第七章
二、计算题
1.(1)设不同年级学生赞成此项教学计划改革的态度比例分别为Pi,原假设和备择假设分
别为:
H0:P1=P2=P3=P4=0.66
H1:P1,P2,P3,P4不全相等
第四章
二、单选题
1.C;2.B;3.B;4.B;5.D;6.C;7.D;8.B;9.A;10.D;11.C;12.D;13.D;14.A;15.B;
16.A;17.C;18.C;19.B;20.C;21.D;22.B;23.C;24.B;25.B;26.B;27.A;28.B;
29.A;30.C;31.B;32.A;33.C
(2)计算得:2=3.0319
(3)查表得(3)=6.2511。由于<^20.1(3),故不能拒绝原假设H。。最后得出结论:
造成的。
2 2
2•计算得贸=1.91"0.05(1),即新推销员的推销业绩与公司期望的平均业绩无明显差别。
3•计算得 护=0.1624£尸0.05(4),即工人的生产水平与其年龄无关。
30.23
260
统计学课后习题答案(全章节)(精品).docx
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
统计学课后答案
第一章1.举出你所知道的统计应用的例子。
答:期末考试后统计班里同学的成绩,从而进行排名等;人口普查统计,从而得知男女人口比例,年龄分布等;统计一个生态系统里某种物种的密度;统计股票市场上某一天的各种数据;统计某个城市的人均收入水平,人民幸福指数,对某一电视节目的看法等。
2. 解释定性数据和定量数据的区别,分别给出一个定性数据和一个定量数据的例子。
答:定性数据和定量数据的区别:定性数据是由于我们考虑的是取值为类别的变量,对这些类别用数字来分别代表就得到定性数据;定量数据是我们所考虑的变量的取值为数值,它将在某个区间上连续取值,或在某个区间上取离散的值。
定性数据的例子:例如考察某幼儿园10个人的性别,定义1=男,2=女,则所得到定性数据为:1,1,2,2,2,1,2,1,1,1. ;定量数据的例子:考察某幼儿园10个人的身高,则此变量取值区间为(0,200)(单位:cm)3. 解释样本和总体的区别。
答:总体是根据一定目的和要求所确定的研究事物的全体。
为了了解总体的分布,我们从总体中随机地抽取一些个体,称这些个体的全体为样本。
样本和总体的区别在于总体是要考虑对象的全体,而样本是从总体中抽取出的一部分具有代表性的个体,从而通过对样本的研究得出关于总体的一些结论。
4. 解释离散型变量和连续型变量的区别,并各举一例。
离散型变量是指其数值只能用自然数或整数单位计算。
例如:某企业里职工的人数连续型变量是如果所考虑变量可以在某个区间内取任一实数,即变量的取值可以是连续的。
例如:生产零件的规格尺寸。
5.阐述四种主要的收集数据方法的区别。
答:观测,访问,问卷,实验区别:观测数据的研究者尽量不干涉研究对象的行为模式;访问在一定程度上对被访问者心理造成干扰,则收集到的数据会有误差;问卷常会产生未响应误差;实验时需要其控制它变量的影响。
6.举出一些观测数据和实验数据的例子。
·答:(1)观测数据:证券分析人员可能会记录某即将收购的公司在被收购的前一天的股市收盘价,并与宣布被收购的当天的收盘价比较。
统计学课后习题参考答案(可编辑修改word版)
思考题与练习题参考答案【友情提示】请各位同学完成思考题和练习题后再对照参考答案。
回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。
学而不思则罔,如果直接抄答案,对学习无益,危害甚大。
想抄答案者,请三思而后行!第一章绪论思考题参考答案1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。
即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。
2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。
3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。
练习题参考答案一、填空题1.调查。
2.探索、调查、发现。
3.目的。
二、简答题1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。
2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题;② 建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。
不解决问题时,重复第②-⑥步。
3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。
三、案例分析题1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:姓名;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。
统计学答案
统计学课本课后作业题(全)题目:第1章:P11 6,7第2章:P52 练习题3、9、10、11第3章: P116思考题12、14 练习题16、25第4章:P114 思考题6,练习题2、4、6、13第5章:P179 思考题4、练习题3、4、6、11第6章: P209 思考题4、练习题1、3、6第7章: P246思考题1、练习题1、7第8章: P287 思考题4、10 练习题2、3第一章6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;最近的一个集装箱内的全部油漆;(2)描述研究变量;装满的油漆罐的质量;(3)描述样本;最近的一个集装箱内的50罐油漆;(4)描述推断。
50罐油漆的质量应为×50=226.8 kg。
7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第二章3.某百货公司连续40天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
统计学课后习题答案
第一章统计学及基本概念 1第二章数据的收集与整理 4第三章统计表与统计图7第四章数据的描述性分析 9第五章参数估计 12第六章假设检验 17第七章方差分析 21第八章非参数检验24第九章相关与回归分析27第十章多元统计分析 31第十一章时间序列分析35第十二章指数38第十二章指数38第十三章统计决策42第十四章统计质量管理45第一章统计学及基本概念1.1 统计的涵义(统计工作、统计资料和统计学)1.2 统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学)1.3 统计学的发展史(学派与主要代表人物)1.4 数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数)1.5 变量:连续与离散;确定与随机1.6 总体、样本与个体1.7 标志、指标及指标体系1.8 统计计算工具习题一、单项选择题1. 推断统计学研究()。
(知识点:1.2 答案:D)A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。
(知识点:1.3 答案:D) A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派3. 下列数据中哪个是定比尺度衡量的数据()。
(知识点:1.4 答案:B)A.性别B.年龄C.籍贯D.民族4. 统计对现象总体数量特征的认识是()。
(知识点:1.6 答案:C)A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体5. 调查10个企业职工的工资水平情况,则统计总体是()。
(知识点:1.6 答案:C)A.10个企业B.10个企业职工的全部工资C.10个企业的全部职工D.10个企业每个职工的工资6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().(知识点:1.6 答案:A)A. 样本B. 总体单位C. 个体D. 全及总体7. 三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。
统计学课后答案2
低于1000小时,批发商不应购买这批灯泡。
解: H0: μ≥1000小时 应购买灯泡 H1: μ<1000小时 拒绝购买灯泡
已知μ0 = 1000(小时),σ=200(小时),x 960(小时) n = 100,因为是大样本,故选择Z统计量
α=0.05,本题为左侧检验,因此zα= 1.645 检验统计量: z x 0 960 1000 2 1.645
x t0.025(161)
s 32 2.131 n
8 32 4.262 27.738 16
x t0.025(161)
s 32 2.131 n
8 32 4.262 36.262 16
因此,有95%的把握估计全部顾客平均年龄在 27.738至36.262之间。
【例5】解:已知n=100,zα/2 =1.96, p=42/100=0.42
检验统计量:
t x 0 5.3 5 3.16 2.262
s n 0.3 10
统计决策: 因为 t t /2 ,样本统计量落入拒绝域,
所以拒绝H0,可以认为该机器的性能不好
解: H0: ≤ 5% H1: > 5%
本题为右侧检验,α=0.05,Zα =1.645 已知n=50, 0= 5% ,p=6/50 =0.12
检验统计量:
Z x 0 12 15 9 1.96 n 2 36
统计决策: 因为 Z Z /2 ,Z值位于拒绝域,
所 以 拒 绝 H0 , 新 员 工 的 月 平 均 销 售 额 与老员工相比有显著差异。
解: H0: μ≥1000小时 应购买灯泡 H1: μ<1000小时 拒绝购买灯泡
202
138.2976 139
《统计学》第9章课后习题参考答案
第9章习题参考答案
9.1
解:(1)长度Y(厘米)与重量X(克)之间的散点图如下所示:
由Y与X的散点图可以大致推测长度Y关于重量X是线性相关,且二者呈正相关关系。
(2)首先,先分别求出平均重量和平均长度:
;;
其次,计算回归参数,其计算表如下:
表1:回归方程参数的计算表
(X-(Y-
最后,根据公式(9.6)计算相应的回归参数:
;
所以,Y关于X的一元线性回归方程为:
9.5
解:总变差,回归平方和,残差平方和的计算如下:
表2:总变差,回归平方和,残差平方和的计算表
∴残差平方和:;
回归平方和:
9.6
解:由表2得:
判定系数
又∵习题9.1的散点图显示Y与X是呈正相关关系
∴相关系数
显著性检验:
(1)回归方程的显著性检验:
原假设H0:该回归方程不显著;备择假设H1:该回归方程显著
计算F统计量:
∵在α=0.05的显著性水平下,有4454.79>F0.05(1,4)=7.71
∴拒绝原假设,认为该回归方程式显著的。
(2)回归参数的假设检验:
原假设H0:备择假设H1:
计算t统计量:;
[其中] ∵在α=0.05的显著性水平下,有15.98>t0.05(4)=2.776
∴拒绝原假设,即认为自变量X对因变量Y有显著性影响。
(3)相关关系的显著性检验:
原假设H0:ρ=0;备择假设H1:ρ
计算t统计量:;
∵在α=0.05的显著性水平下,有66.64> t0.05(4)=2.776
∴拒绝原假设,认为总体相关系数不为0。