《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版
贾俊平统计学第7版课后习题答案
1.针对性强,解决难点。精选人大、中央财大等名校统计学院的初试和复试的考研真 题,既注重基础知识的掌握,又对一些难题、易错题目给出了详细的解析。本书特别适用于 参加研究生入学考试和复试指定考研参考书目为贾俊平主编的《统计学》的考生。
贾俊平《统计学》课后习题答案在线阅读:https:///cUb7v8DC
编著的。该书基本遵循贾俊平的《统计学》(第 7 版)的章目编排,共分 14 章,精选了 40 余所高校近年的考研真题,并提供了详细的参考答案。 目录 第 1 章 导 论 第 2 章 数据的搜集 第 3 章 数据的图表展示 第 4 章 数据的概括性度量 第 5 章 概率与概率分布 第 6 章 统计量及其抽样分布 第 7 章 参数估计 第 8 章 假设检验 第 9 章 分类数据分析 第 10 章 方差分析 第 11 章 一元线性回归 第 12 章 多元线性回归 第 13 章 时间序列分析和预测 第 14 章 指 数
贾俊平《统计学》课后习题答案在线阅读:https:///cUb7v8DC
【解析】数据的测量尺度有四种:①分类尺度,即名义尺度。按照事物的某种属性对其进行 平行的分类,数据表现为类别,如“性别”。②顺序尺度。对事物类别顺序的测度,数据表 现为有序的类别,如“产品登记”“受教育程度”。③差距尺度。对事物类别或次序之间间 距的测度,没有绝对零点,数据表现为数字。④比例尺度。对事物类别或次序之间间距的测 度,有绝对零点,数据表现为数字。 8 以下关于参数和统计量的说法正确的是( )。[中央财经大学 2011 研] A.总体参数是随机变量 B.样本统计量都是总体参数的无偏估计量 C.对一个总体参数进行估计时,统计量的表达式是唯一的 D.样本统计量是随机变量 【答案】D 【解析】参数是用来描述总体特征的概括性数字度量,研究者所关心的参数通常有总体平均 数、总体标准差、总体比例等,由于总体数据通常是不知道的,所以参数是一个未知的常数。 无偏性是指估计量抽样分布的数学期望等于被估计的总体参数,并非所有的估计量都具有无 偏性。对总体参数进行估计时,用不同估计方法得到的估计量可能不同。统计量是根据样本 数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,是随机变量。 9 以下哪一种情形涉及定性数据的收集?( )[中山大学 2012 研] A.质量控制工程师测量电灯泡的寿命 B.社会学家通过抽样调查来估计广州市市民的平均年收入 C.运动器材厂家在区分各大俱乐部棒球选手是左撇子还是右撇子时做的调查 D.婚礼策划公司通过抽样调查来估计上海市市民举办婚礼的平均开销 【答案】C
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第7章 参数估计)【圣才出品】
第7章参数估计7.1 考点归纳【知识框架】【考点提示】(1)置信区间的含义理解(选择题、简答题考点);(2)估计量的三个评价标准(判断题、填空题、简答题考点);(3)区间估计的步骤(简答题考点)、总体参数的区间估计选择恰当的统计量(计算题考点);(4)必要样本容量的影响因素、计算(简答题、计算题考点)。
【核心考点】考点一:参数估计的基本原理1.置信区间(1)置信水平为95%的置信区间的含义:用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
(2)置信度愈高(即估计的可靠性愈高),则置信区间相应也愈宽(即估计准确性愈低)。
(3)置信区间的特点:置信区间受样本影响,具有随机性,总体参数的真值是固定的。
一个特定的置信区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。
2.评价估计量的标准(1)无偏性:估计量抽样分布的期望值等于被估计的总体参数,即E(θ∧)=θ。
(2)有效性:估计量的方差尽可能小。
(3)一致性:随着样本量的增大,估计量的值越来越接近被估计总体的参数。
【提示】本考点常见考查方式:①直接考查置信水平为95%的置信区间的含义;②置信度、估计可靠性、置信区间的关系及应用;③置信区间的特点;④给出估计量的具体含义,判断体现了什么标准;⑤直接回答估计量的三个评价标准及具体含义(简答题)。
考点二:一个总体参数的区间估计表7-1 一个总体参数的区间估计【总结】一个总体参数的估计及所使用的分布见图7-1:图7-1 一个总体参数的估计及所使用的分布【真题精选】设总体X~N(μ,σ2),σ2已知,样本容量和置信水平固定,对不同的样本观测值,μ的置信区间的长度()。
[对外经济贸易大学2018研]A.变长B .变短C .保持不变D .不能确定 【答案】C【解析】在正态总体方差已知的条件下,μ的置信区间为/2x z ±ασ所以置信区间长度为/22Z α,当样本容量和置信水平固定时,置信区间长度保持不变。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第13章 时间序列分析和预测)【圣才
第13章时间序列分析和预测13.1 考点归纳【知识框架】【考点提示】(1)时间序列构成要素及平稳序列、非平稳序列的含义(简答题考点);(2)时间序列的描述性分析(简答题、计算题考点);(3)平稳序列的预测,重点是移动平均法、一次平滑指数法(选择题、简答题、计算题考点)。
【核心考点】考点一:时间序列1.成分分解表13-1 时间序列的成分2.分解模型表13-2 时间序列构成因素的组合模型【注意】四种因素不一定同时存在于每个时间序列中。
一般情况下,经常存在的是长期趋势,季节变动因素和周期变动因素则不一定存在。
3.平稳序列与非平稳序列(1)平稳序列平稳序列是基本上不存在趋势的序列。
这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。
(2)非平稳序列非平稳序列是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。
其又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
考点二:时间序列的描述性分析1.速度分析指标(1)增长率环比增长率:G i =(Y i -Y i -1)/Y i -1=Y i /Y i -1-1(i =1,…,n )定基增长率:G i =(Y i -Y 0)/Y 0=Y i /Y 0-1(i =1,…,n )式中,Y 0表示用于对比的固定基期的观察值。
(2)平均增长率(平均增长速度)111n n Y G Y -=⨯⨯-=- 式中,G _表示平均增长率;n 为环比值的个数。
(3)增长率分析中应注意的问题①当时间序列中的观察值出现0或负数时,不宜计算增长率,此时直接用绝对数进行分析;②增长1%的绝对值表示增长率每增长一个百分点而增加的绝对数量,其计算公式为:增长1%的绝对值=前期水平/100。
2.水平分析指标【考点拓展】表13-3考点三:平稳序列的预测1.简单平均法112111()t t t i i F Y Y Y Y t t +==+++=∑ 12121111()11t t t t i i F Y Y Y Y Y t t +++==++++=++∑2.移动平均法对于t+1期的简单移动平均预测值为:F t+1=Y_t=(Y t-k+1+Y t-k+2+…+Y t-1+Y t)/k【注意】移动平均后的序列项数较原序列减少,当k为奇数时,新序列首尾各减少(k -1)/2项;当k为偶数时,首尾各减少k/2项。
贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。
3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。
贾俊平统计学 第七版 课后思考题
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第11章 一元线性回归)【圣才出品】
第11章一元线性回归11.1 考点归纳【知识框架】【考点提示】(1)变量间关系的度量,包括相关系数的计算公式、性质,相关关系的显著性检验(简答题、计算题考点);(2)一元线性回归,包括回归模型的假定(简答题考点),回归方程、估计的回归方程的建立(选择题、计算题考点);(3)最小二乘法的含义、性质,回归系数的计算(选择题、简答题、计算题考点);(4)回归直线的拟合优度及显著性检验(计算题考点);(5)点估计和区间估计,包括置信区间和预测区间(判断题、计算题考点)。
【核心考点】考点一:变量间关系的度量1.相关系数(线性相关系数,或Pearson 相关系数)总体相关系数ρ,样本相关系数r 。
(1)计算公式n xy x y r ∑-∑∑=(2)性质 ①r 的取值范围为-1≤r≤1。
|r|→1说明两个变量之间的线性关系越强。
②r 具有对称性,即r xy =r yx 。
③r 取值大小与x 和y 的原点及尺度无关。
④r 仅用于度量线性关系,不能用于描述非线性关系⑤r 只是度量数量关系,但不意味着因果关系。
⑥r 取值可以解释两个变量之间的相关程度。
但需要先对相关系数的显著性进行检验。
【真题精选】如果变量X 与变量Y 之间的相关系数为0,说明这两个变量之间是( )。
[浙江财经大学2019研]A .完全相关关系B .完全不相关C .没有线性关系D .低度相关关系【答案】C 【解析】相关系数r 仅仅是变量X 与Y 之间线性关系的一个度量,r =0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。
因此当r =0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图作出合理的解释。
2.相关关系的显著性检验——t 检验(小样本或大样本) 检验的统计量(2)t r t n =-若|t|>t α/2,则拒绝原假设H 0,表明总体的两个变量之间存在显著的线性关系。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第四章至第六章【圣才出品】
第4章数据的概括性度量4.1考点归纳【知识框架】【考点提示】(1)集中趋势、离散趋势的度量指标,包括每个指标的含义、计算公式、特点、意义、适用范围(选择题、简答题、计算题考点);(2)众数、中位数和平均数三个指标的特点和应用场合,偏态分布下三个指标的关系(选择题、简答题、计算题考点);(3)分布形状的测度指标:偏态系数和峰态系数的数值含义(选择题、简答题考点)。
(4)标准分数的计算公式及应用(选择题、简答题、计算题考点);(5)经验法则、切比雪夫不等式的具体应用(选择题考点)。
【核心考点】考点一:集中趋势的度量表4-1集中趋势度量指标【注意】不同偏态程度的分布中集中趋势度量指标的关系:①对称分布中,众数、中位数和平均数相等;②左偏分布中,数据存在极小值,拉动平均数向极小值一方靠,而众数和中位数不受极值的影响,有_x<M e<M o;③右偏分布中,数据存在极大值,必然拉动平均数向极大值一方靠,因此M o<M e<_x。
【知识拓展】不同的教材分位数的计算公式不同,除了表中的计算公式,一种比较精确的计算公式:下四分位数Q L的位置=(n+1)/4,上四分位数Q U的位置=(3n+1)/4。
【真题精选】假定标志值所对应的权数都缩小1/10,则算术平均数()。
[浙江财经大学2019研]A.不变B.无法判断C.缩小百分之一D.扩大十倍【答案】A【解析】假设标志值为x,其对应的权数为f,则算术平均数为_x=∑xf/∑f;若各权数都缩小1/10,则新的算术平均数为110110xf xf x x f f '===∑∑∑∑考点二:离散程度的度量数据的离散程度反映了各变量值远离其中心值的程度,离散程度越小,代表性就越好。
表4-2离散程度的度量指标【注意】①表中方差和标准差的计算公式均为样本数据的方差和标准差。
若为总体数据,则分母应为n。
②标准差系数,也称变异系数或离散系数。
③表中平均差、样本方差、样本标准差仅给出了未分组数据的计算公式,分组数据的计算公式实质是等于未分组数据的计算公式,会运用即可。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第8章 假设检验)【圣才出品】
3.单侧检验和双侧检验 表 8-2 常用假设检验形式
【总结】假设检验:①依据的是小概率原理; ②小概率标准在抽样前依照需要确定; ③假设检验的结果只能是拒绝或不拒绝原假设,而不能证明原假设成立; ④统计假设检验的结果不是绝对正确。
考点二:一个总体参数的检验
1.检验统计量的确定 一个总体参数的检验中,检验统计量主要有三个:z 统计量,t 统计量,χ2 统计量。 选择检验统计量需要考虑的因素:样本量、总体方差 σ2 是否已知。
2 / 48
圣才电子书 十万种考研考证电子书、题库视频学习平台
α 的最大允许值,一般是人们事先指定的。 显著性水平 α 越小,犯第Ⅰ类错误的可能性越小,但犯第Ⅱ类错误的可能性则随之增
大。
【真题精选】 下列哪种情况下属于犯第二类错误?( )[浙江财经大学 2019 研] A.H0 为真,接受 H1 B.H0 不真,接受 H0 C.H0 为真,拒绝 H1 D.H0 不真,拒绝 H0 【答案】B 【解析】在假设检验中,第一类错误指原假设 H0 为真却被拒绝了,犯这种错误的概率 用 α 表示,所以也称其为 α 错误或弃真错误;第二类错误是当原假设 H0 为伪却没有被拒绝, 犯这种错误的概率用 β 表示,所以也称其为 β 错误或取伪错误。
考点三:两个总体参数的检验
1.检验统计量的确定(如图 8-1 所示)
6 / 48
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 8-1 检验统计量的确定 2.两个总体均值之差的检验
7 / 48
圣才电子书 十万种考研考证电子书、题库视频学习平台
大样本时,若 np>5,n(1-p)>5,样本比例近似服从正态分布。
检验统计量: z
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第九章至第十一章【圣才出品】
第9章分类数据分析9.1考点归纳【知识框架】【考点提示】(1)χ2统计量的计算公式及应用(计算题考点);(2)拟合优度检验(一个分类变量)和独立性检验(两个分类变量)(简答题、计算题考点);(3)列联表中的相关测量:三个系数的计算公式、特点及应用(选择题、简答题、计算题考点)。
【核心考点】考点一:χ2统计量(1)χ2统计量计算公式22()o e ef f f χ-=∑f o 表示观察值频数,用f e 表示期望值频数。
(2)χ2统计量的特征①χ2≥0;②χ2统计量的分布与自由度有关;③χ2统计量描述了观察值与期望值的接近程度。
(3)χ2分布与自由度的关系χ2分布随着自由度的增加而向右倾斜,且逐渐趋近于对称的正态分布。
考点二:列联表中的相关测量表9-1列联表的测量指标【真题精选】当列联表中的两个变量相互独立时,计算的相关系数c()。
[中国海洋大学2018研]A.等于1B.大于1C.等于0D.小于0【答案】C【解析】两个随机变量独立,则这两个随机变量不相关,反之不成立。
9.2课后习题详解一、思考题1.简述列联表的构造与列联表的分布。
答:(1)列联表的构造:列联表是将两个以上的变量进行交叉分类的频数分布表。
(2)列联表的分布:列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。
2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。
答:(1)构造列联表:对三个生产厂甲、乙、丙提供的学习机的A、B、C三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。
抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。
表9-2(2)提出检验问题根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。
(3)进行检验建立假设:H0:次品类型与厂家生产是独立的;H1:次品类型与厂家生产不是独立的。
贾俊平统计学第7版第八章例题课后习题
第8章假设检验例题由统计资料得知,1989 年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显着差异★解:从调查结果看,1990 年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。
_种情况是,1990 年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。
上述问题的关键点是,20克的差异说明了什么这个差异能不能用抽样的随机性来解释为了回答这个问题,我们可以采取假设的方法。
假设1989年和1990年新生儿的体重没有显着差异,如果用μo表示1989年新生儿的平均体重,μ表示1990年新生儿的平均体重,我们的假设可以表示为μ=μ或μ心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。
如果成立,说明这两年新生儿的体重没有显着差异;如果不成立,说明1990年新生儿的体重有了明显增加。
在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。
所以假设检验的实质是检验我们关心的参数一1990 年的新生儿总体平均体重是否等于某个我们感兴趣的数值。
例某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。
在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡★解:这是一个单侧检验问题。
显然,如果灯泡的燃烧寿命超过了1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。
因此,如果样本均值超过1000小时,他会购进这批灯泡。
2023统计学第七版贾俊平课后习题答案
2023统计学第七版贾俊平课后习题答案第一章1.1 习题答案1.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市,而纽约市占比是 5%,所以答案应为 $60 \\times 0.05 = 3$2.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市并且是女性,而纽约市总体中女性的占比是 53%,所以答案应为 $60 \\times 0.05 \\times 0.53 = 1.59$1.2 习题答案1.答案:根据题意,我们需要求得这家电视公司进入市场的概率。
已知电视公司市场占有率为 10%,而市场占有率的补集为失败率,所以电视公司进入市场的概率为1−0.10=0.902.答案:根据题意,我们需要求得这两家公司都进入市场的概率。
已知电视公司进入市场的概率为 0.90,而两家公司都进入市场的概率为两者概率相乘,所以两家公司都进入市场的概率为 $0.90 \\times 0.90 = 0.81$第二章2.1 习题答案1.答案:根据题意,我们需要求得两次抛掷硬币都为正面向上的概率。
已知硬币正面朝上的概率为 0.5,而两次抛掷硬币都为正面向上的概率为两者概率相乘,所以两次抛掷硬币都为正面向上的概率为 $0.5 \\times 0.5 = 0.25$2.答案:根据题意,我们需要求得至少一次抛掷硬币为正面向上的概率。
已知硬币正面朝上的概率为 0.5,而至少一次抛掷硬币为正面向上的概率为 1 减去两次都为背面向上的概率,所以至少一次抛掷硬币为正面向上的概率为 $1 - (0.5 \\times 0.5) = 0.75$2.2 习题答案1.答案:根据题意,我们需要求得至少一辆汽车需要检测两次才能检查到故障的概率。
已知单次检测不到故障的概率为 0.1,而至少一辆汽车需要检测两次才能检查到故障的概率为 1 减去两次都未检测到故障的概率,所以至少一辆汽车需要检测两次才能检查到故障的概率为 $1 - (0.1 \\times 0.1) = 0.99$2.答案:根据题意,我们需要求得两辆车都不需要检测两次才能检查到故障的概率。
贾俊平统计学第7版第八章例题课后习题
贾俊平统计学第7版第⼋章例题课后习题第8章假设检验例题8.1由统计资料得知,1989 年某地新⽣⼉的平均体重为3190克,现从1990年的新⽣⼉中国机抽取100个,测得其平均体重为3210克,问1990年的新⽣⼉与1989年相⽐,体重有⽆显著差异?★解:从调查结果看,1990 年新⽣⼉的平均体重为3210克,⽐1989年新⽣⼉的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。
_种情况是,1990 年新⽣⼉的体重与1989年相⽐没有什么差别,20克的差异是由于抽样的随机性造成的;另⼀种情况是,抽样的随机性不可能造成20克这样⼤的差异,1990年新⽣⼉的体重与1989年新⽣⼉的体重相⽐确实有所增加。
上述问题的关键点是,20克的差异说明了什么?这个差异能不能⽤抽样的随机性来解释?为了回答这个问题,我们可以采取假设的⽅法。
假设1989年和1990年新⽣⼉的体重没有显著差异,如果⽤µo表⽰1989年新⽣⼉的平均体重,µ表⽰1990年新⽣⼉的平均体重,我们的假设可以表⽰为µ=µ或µ⼼=0,现要利⽤1990年新⽣⼉体重的样本信息检验上述假设是否成⽴。
如果成⽴,说明这两年新⽣⼉的体重没有显著差异;如果不成⽴,说明1990年新⽣⼉的体重有了明显增加。
在这⾥,问题是以假设的形式提出的,问题的解决⽅案是检验提出的假设是否成⽴。
所以假设检验的实质是检验我们关⼼的参数⼀1990 年的新⽣⼉总体平均体重是否等于某个我们感兴趣的数值。
例8.2某批发商欲从⼚家购进⼀批灯泡,根据合同规定灯泡的使⽤寿命平均不能低于1 000⼩时,已知灯泡燃烧寿命服从正态分布,标准差为200⼩时。
在总体中随机抽取了100个灯泡,得知样本均值为960⼩时,批发商是否应该购买这批灯泡?★解:这是⼀个单侧检验问题。
显然,如果灯泡的燃烧寿命超过了1 000⼩时,批发商是欢迎的,因为他⽤已定的价格(灯泡寿命为1 000⼩时的价格)购进了更⾼质量的产品。
统计学贾俊平课后习题答案完整版
统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下(4)帕累托图(略)。
2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。
(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。
2.72.8(1)属于数值型数据。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =(万元);M e= 。
统计学贾俊平课后习题答案1
第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。
本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。
本章各节的主要内容和学习要点如下表所示。
章节主要内容学习要点1.1 统计及其应用领域什么是统计学④概念:统计学,描述统计,推断统计。
统计的应用领域④统计在工商管理中的应用。
④统计的其他应用领域。
1.2 数据的类型分类数据、顺序数据、数值型数据④概念:分类数据,顺序数据,数值型数据。
④不同数据的特点。
观测数据和实验数据④概念:观测数据,实验数据。
截面数据和时间序列数据④概念:截面数据,时间序列数据。
1.3 数据来源数据的间接来源④统计数据的间接来源。
④二手数据的特点。
数据的直接来源④概念:抽样调查,普查。
④数据的间接来源。
④数据的收集方法。
调查方案设计④调查方案的内容。
数据质量④概念。
抽样误差,非抽样误差。
④统计数据的质量。
1.4 统计中的几个基本概念总体和样本④概念:总体,样本。
参数和统计量④概念:参数,统计量。
变量④概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。
二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第14章 指 数)【圣才出品】
5 / 31
圣才电子书
十万种考研考证电子书、题库视频学习平台
Ixf
x1 x0
x1 f1 x0 f0
f1 f0
(2)组水平变动指数
Ix
x1 xn
x1 f1 x0 f1
f1 f1
(3)结构变动指数
I f
xn x0
x0 f1 x0 f0
f1 f0
总平均水平指数=组水平变动指数×结构变动指数,即
圣才电子书 十万种考研考证电子书、题库视频学习平台
1.加权综合指数
(1)拉氏指数(将同度量因素固定在基期)
拉氏物价指数 I p
q0 p1 100 q0 p0
拉氏物量指数 Iq
q1 p0 100 q0 p0
(2)帕氏指数(将同度量因素固定在报告期)
帕氏物价指数 I p
H p
q1 p1
p0 p1
q1 p1
q1 p1 (与帕氏质量指标指数相同) q1 p0
Hq
q1 p1
q0 q1
q1 p1
q1 p1 (与帕氏数量指标指数相同) q0 p1
【注意】如果计算时依据的是全面资料,可采用加权综合指数;而计算价格指数时,通
常采取选样方法。
【真题精选】
1.数量指标指数 q1 p0 变形为加权算术平均数指数时的权数是( q0 p0
说明 个体指数和总指数的区 别:考查范围不同,计算
方法也不同
数量指标和质量指标的 划分具有相对性
加权指数可以分为综合 形式和平均形式
加权综合指数:采用综合 形式编制的加权指数
加权平均指数:采用平均 形式编制的加权指数
【注意】本考点常考数量指标指数和质量指标指数的区分和计算。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】第12章多元线性回归12.1 考点归纳【知识框架】【考点提⽰】(1)多元线性回归模型,包括回归模型的基本假定(简答题考点),最⼩⼆乘估计(选择题、计算题考点);(2)回归模型的拟合优度评价(简答题、计算题考点);(3)显著性检验(计算题考点);(4)多重共线性的含义、产⽣的问题、判别及处理⽅式(简答题考点)。
【核⼼考点】考点⼀:多元线性回归模型1.回归模型假定(1)E (ε)=0;(2)D (ε)=σ2;(3)()2cov ,0i j i j i j σεε?==?≠?2.参数的最⼩⼆乘估计使残差平⽅和Q =∑(y i -y ∧i )2=∑(y ∧i =β∧0-β∧1x 1-β∧2x 2-…-β∧k x k )2达到最⼩的β∧0,β∧1,β∧2,…,β∧k 。
由此可以得到求解β∧0,β∧1,β∧2,…,β∧k 的标准⽅程组为:00?0?00,1,2,,i i ββi ββQ βQ i k β==??===???多元线性回归的最⼩⼆乘估计是最优线性⽆偏估计。
考点⼆:回归⽅程的拟合优度表12-1 多元线性回归⽅程的评价【提⽰】实际应⽤中,采⽤调整的判定系数来评价多元回归⽅程的拟合优度。
【真题精选】多元线性回归模型的调整的多重判定系数取值范围在0⾄1之间。
[对外经济贸易⼤学2018研]【答案】√【解析】多重判定系数R2=SSR/SST是多元回归中的回归平⽅和占总平⽅和的⽐例,它是度量多元回归⽅程拟合程度的⼀个统计量,反映了在因变量y的变差中被估计的回归⽅程所解释的⽐例,取值为0~1。
调整的多重判定系数R a2与多重判定系数R2不同之处在于:R a2同时考虑了样本量n和模型中⾃变量的个数k的影响,这就使得R a2的值永远⼩于R2,⽽且R a2的值不会由于模型中⾃变量个数的增加⽽越来越接近1,因此R a2的取值也为0~1。
《统计学》(贾俊平第七版)课后题及答案-统计学 贾俊平第七版
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第一章至第三章【圣才出品】
第1章导论1.1考点归纳【知识框架】【考点提示】(1)统计学的目的(选择题考点);(2)描述统计和推断统计的区分、参数估计和假设检验的区分(选择题考点);(3)统计数据类型、分类、各自特点及其具体应用(选择题、简答题考点)(非常重要);(4)统计学中的基本概念(选择题、简答题考点)。
【核心考点】考点一:统计数据的类型(见表1-1)表1-1统计数据的类型【注意】①分类数据和顺序数据说明的是事物的品质特征,其结果均表现为类别,因而也统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,因此也称为定量数据或数量数据。
②对不同类型的数据采用不同的统计方法来处理和分析。
对分类数据可以计算出各类别的频率,而数值型数据则可以进行数学运算。
【真题精选】1.在对数据进行汇总时,往往将男性用“1”来表示,女性用“0”来表示,所以将性别视为数值型变量。
[对外经济贸易大学2018研]【答案】×【解析】数值型变量是说明事物数字特征的一个名称,其取值是数值型数据,数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值;分类变量是说明事物类别的一个名称,其取值是分类数据,分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
性别是分类变量,为便于统计处理,对于分类变量可以用数字代码来表示各个类别。
2.下列数据不属于时间序列数据的是()。
[四川大学2016研]A.1990~2014年我国每年进出口总额B.2014年某品牌手机在中国各个省市的销售量C.成都市2014年每个月的PM2.5月平均浓度D.某股票在2015年1月的日收盘价【答案】B【解析】时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
本题中B项是在相同的时间点、不同的空间上获得的数据,属于截面数据。
考点二:统计中的基本概念1.总体和样本(1)总体、个体(2)样本、样本量2.参数和统计量(1)参数:用于描述总体特征,是未知的常数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样:指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本。
当用样本对总体进行估计时,要考虑每个单位样本被抽中的概率。
技术含量和成本都比较高。
如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样:指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽取部分单位对其进行实施调查。
操作简单、时效快、成本低。
而且对于抽样中的统计学专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
3.调查中搜集数据的方法主要有自填式、面访式、电话式。
除此之外,还有哪些搜集数据的方法?试验式和观察式。
4.自填式、面访式、电话式调查各有什么利弊?自填式优点:调查组织者管理容易;成本低,可进行大规模调查;减少被调查者回答敏感问题的压力。
缺点:返回率低;调查内容有限;调查周期长;在数据搜集过程中遇见问题不能及时调整。
面访式优点:回答率高;数据质量高;在调查过程中遇见问题可以及时调整。
缺点:成本比较高;搜集数据的方式对调查过程的质量控制有一定难度;对于敏感问题,被访者会有压力。
电话式优点:对调查员比较安全;对访问过程的控制比较容易。
缺点:实施地区有限;调查时间不能过长;使用的问卷要简单;被访者不愿回答时,不易劝服。
5.你认为应当如何控制调查中的回答误差?对于理解误差,我会学习一些心理学知识;对于记忆误差,我会尽量去缩短所涉及的时间范围;对于有意识误差,要做好被调查者的心理工作,要遵守职业道德,为被调查者保密,尽量在问卷中不涉及敏感问题。
6.怎样减少无回答?请通过一个例子说明你所考虑到的减少无回答的具体措施。
对于随机误差,要提高样本容量;对于系统误差,只有做好准备工作并做好补救措施。
第三章数据的图表展示1.数据的预处理包括哪些内容?数据审核(对于原始数据:完整性和准确性;对于二手数据:实用性和实效性)、数据筛选和数据排序。
2.分类数据和顺序数据的整理和图示方法各有哪些?分类数据:制作频数分布表,用比例、百分比和比率等进行描述性分析,可用条形图、帕累托图、饼图和环形图进行图示分析。
顺序数据:制作频数分布表,用比例、百分比、比率、累计频数和累计频率等进行描述性分析,可用条形图、帕累托图、饼图、累计评书分布图和环形图进行分析。
3.数值型数据的分组方法有哪些?简述组距分组的步骤。
分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。
分组步骤:①确定组数②确定组距③根据分组整理成频数分布表。
4.直方图与条形图有何区别?条形图使用的长度表示各类别频数的多少,其宽度固定;直方图用面积表示各组频数,矩形的高度表示魅族的频数或频率,宽度表示组距。
直方图各矩形连续排列,条形图分开排列。
直方图主要展示数值型数据。
5.绘制线图应注意哪些问题?时间在横轴,观测值在纵轴。
一般是长宽比例 10:7 的长方形,纵轴下端一般从 0 开始,数据与 0 距离过大的话用折断符号折断。
6.饼图和环形图有什么不同?饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列。
7.茎叶图与直方图相比有什么优点?他们的应用场合是什么?茎叶图既能给出数据的分布情况,又能给出每个原始数据,即保留了原始数据的信息。
茎叶图通常适用于小批量数据,直方图适用于大批量数据。
8.鉴别图表优劣的准则有哪些?显示数据;有助于洞察问题的本质;使复杂的观点得到简明、确切、高效的阐述;快速高效地给读者提供大量的信息;多维的;表述数据的真实情况。
9.制作统计表时应注意哪几个问题?合理安排统计表结构;表头一般包括表号、总标题和表中数据的单位等内容;在使用统计表时,必要时可在下方加注释注明数据来源。
第四章数据的概括性度量1.一组数据的分布特征可以从哪几个方面进行测度?可以从数据分布的集中趋势、离散程度和分布的偏态与峰态三个方面进行测量。
集中其实反映了各数据向其中心支靠拢或聚集的程度;离散程度反映了各数据原理其中心值的趋势;偏态与峰态反映了数据分布的图像形状。
2.简述众数、中位数和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。
众数只有在数据量较多时才有意义。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受极端值影响,当数据分布的偏斜较大时,可以使用中位数。
主要适合作为顺序数据的集中趋势测度值。
平均是是针对数值型数据计算的,而且利用了全部数据信息。
当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选平均数作为集中趋势的代表值。
但平均数的主要缺点是易受极端值的影响;对于偏态分布的数据,平均数的代表性较差。
3.简述异众比率、四分位差、方差或标准差的应用场合。
异众比率主要用于测量分类数据的离散程度;四分位差主要用于测量顺序数据的离散程度;方差或标准差主要用于测量数值型数据的离散程度。
4.标准分数有哪些用途?标准分数给出了一组数据中各数值的相对位置。
在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。
它还可以用来判断一组数据是否有离群数据。
5.为什么要计算离散系数?方差和标准差是反映数据离散程度的绝对值,一方面其数值大小受原变量值本身水平高低的影响;另一方面,他们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的测度值也就不同。
6.测度数据分布形状的统计量有哪些?对于分布形状的测度有偏态和峰态。
测度偏态的统计量是偏态系数;测度峰态的统计量是峰态系数。
i =1i 第五章 概率与概率分布1. 频率与概率有什么关系?在相同条件下随机试验n 次,某事件出现m 次,则比值m称为该事件发生的频率。
随 n 着n 的增大,该频率围绕某一常数p 波动,且波动幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率。
第六章 统计量及其抽样分布1. 什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数?统计量:设X 1, X 2,···, X n 是从总体X 总抽取的容量为n 的一个样本,如果由此样本构造一个函数T (X 1, X 2,···, X n ),不依赖于任何未知参数,则称函数T (X 1, X 2,···, X n )是一个统计量。
由样本构造具体的统计量,实际上是对样本信息进行加工并集中到统计量的取值上, 便于通过统计量推断总体参数。
由于样本已经抽出,故统计量总是知道的,因此统计量不含有任何未知参数。
2. 简述χ2分布、t 分布、F 分布及正态分布之间的关系。
正态分布:Z = X−μ~N (0,1),则X ~N (μ, σ2)σ χ2分布:设随机变量X 1, X 2,···, X n 相互独立,且X i (i = 1,2,···, n )服从标准正态分布N (0,1),则他们的平方和∑n X 2服从自由度为n 的χ2分布。
t 分布:设随机变量X ~N (0,1),Y ~χ2(n ),且X 与Y 独立,则t = X √Y /n其分布称为t 分 布。
F 分布:设随机变量Y 与Z 相互独立,且Y 与Z 分别服从自由度为m 和n 的χ2分布,则 X = Y /m= nY ~F (m , n )Z /n mZ 3. 什么是抽样分布?在总体X 的分布类型已知时,若对任一自然数n ,都能导出统计量T = T (X 1, X 2,···, X n ) 的分布的数学表达式,这种分布称为精确的抽样分布。
4. 简述中心极限定理的意义。
中心极限定理:设从均值为μ,方差为σ2的一个文艺总体中抽取容量为n 的样本,当 n 充分大时,样本均值的抽样分布近似服从均值为μ,方差为σ2/n 的正态分布。
意义:是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。
第七章 参数估计1. 解释估计量和估计值。
估计量:用于估计总体参数的随机变量。
估计值:估计参数时计算出来的统计量的具体值。
2.简述评价估计量好坏的标准。
无偏性:估计量抽验分布的数学期望等于被估计的总体参数。
有效性:对同一总体参数的连个无偏点估计量,有更小标准差的估计量更有效。
一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。
3.怎样理解置信区间?由样本统计量所构造的总体参数的估计区间。
4.解释95的置信区间。
用某种方法构造的所有区间中有 95%的区间包含总体参数的真值。
5.zσαnzα/2是标准正态分布上侧面积为α/2的z值,公式是统计总体均值时的边际误差。