甘怡群《心理与行为科学统计》笔记和习题详解(第5~10章)【圣才出品】
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
来公式中的σ。公式如下:
(二)取样分布 1.含义 取样分布是指从同一总体中可以抽取出很多个样本,总体中可抽取的所有可能的特定容 量分布的统计量(包括平均数,两平均数之差,方差,标准差,相关系数,回归系数,百分 比率等等)所形成的统计分布。 2.取样分布与总体分布的区别 取样分布是参数或统计量的集合,而总体分布和样本分布则是原始分数的集合。 (三)样本均值分布 1.含义 样本均值的分布是取样分布的一个特例。它是指总体中可抽取的所有可能的特定容量 (n)的随机样本的均值的集合。样本均值的分布包含所有可能的样本;由于属于取样分布, 在样本均值的分布中,值不是分数,而是统计量(样本均值)。 2.建构一个样本均值分布的步骤 首先,从总体中随机抽取得到一个包含 n 个分数的样本,计算出它的均值并把它记下 来;然后选择另一个随机样本,也计算出均值;重复前两个步骤,便得到所有可能的随机样 本,它们的均值就形成了样本均值的分布。 3.样本均值分布的特点 (1)样本均值的分布形状上接近正态分布,尤其当总体是正态分布,或者样本量较大
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
第 5 章 概率和样本:样本均值的分布
5.1 复习笔记
一、样本均值的分布 (一)取样方法 1.简单随机取样 简单随机抽样是最基本的一种随机取样方法,具体操作是可以将总体中的每一个个体都 编上号码并抽签,或者利用随机数字表。这种抽样只适用于总体数目较少且总体的个体之间 差异程度较小的情况。 2.等距抽样 当总体的数目非常大时,可以使用等距抽样,也是将每个个体编号,并且将已编好号码 的个体排成顺序,然后每隔若干个抽取一个。一旦定下取样间隔和起点之后,每一个个体就 没有相等的机会被抽取到,而是只有每隔一定的间隔的个体才能被抽取。但是这个方法使得 被抽取的个体均匀地分配在总体当中,而不会发生聚堆的现象。但是,不适合总体排列具有 周期性的情况。 3.分层随机抽样 当总体内的个体差异比较大时,必须考虑到总体的这种信息再进行随机抽取。在抽样时 先根据差异分成不同的层次,然后再在每个层次中随机抽取。在进行分层随机抽样时,每一 层中抽取的样本数目可以不同,更恰当的方法是应当考虑总体的比例。 4.阶段抽样 当总体容量很大时,直接以总体中的所有个体为对象进行抽样,在实际调查或研究中存在很
当得到所有可能的样本时,它们的均值就完全与总体均值相等。因此所有样本均值的平均称
为 X 的期望值,应该等于总体均值。
(4)与正态分布的标准差类似,样本均值分布中用标准误(SE)来描述。它是指样本
均值分布的标准差。它反映了样本均值和总体均值之间平均差异的大小。
X 的标准误= X = X 与μ的标准距离
2 / 60
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
(30 以上)时,样本均值的分布几乎可以看做是完全的正态分布。
(2)取样是为了对总体进行最好的估计。因此当从总体中抽取出一个样本,它的均值
应该是趋近于总体均值,它可以代表这个总体。
(3)无偏估计时,样本均值等于总体均值,这也是正态情况下样本均值分布的均值。
一个样本均值可能大于或小于总体均值。
(2)标准误则提供了一个衡量取样误差的方法。它衡量了样本均值与总体均值之间平
Hale Waihona Puke Baidu
均起来的差异,这样就可以知道样本能在多大程度上代表总体。
(3)可以把标准差看成是标准误的特例。标准误的公式:
,如果是一个单个
分数,即 n=1,那么
,即标准误等于标准差。
二、样本均值分布与概率
n
(五)标准差、标准误和取样误差
1.标准差
标准差是总体中的概念,指的是总体中一个分数与总体均值的标准距离,即 X-μ。衡量
的是次数分布的变异性。
2.标准误
标准误是样本均值分布中的概念,是指一个样本均值和其相应的总体均值之间的标准距
离,即 X -μ。衡量的是样本均值分布的变异性。
3.取样误差
(1)取样误差描述了样本和总体所得到的统计量与参数之间的偏差(或误差)。任何
4 / 60
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
(一)样本均值分布中概率的计算 1.由样本平均数计算 z 分数 除了能用 z 分数来描述单个的分数,还可以描述选取的一个样本在样本均值分布中的位
置。由于要考查的是样本而不是单个的分数,因此 X 代替了原来公式中的 X; X 代替了原
σ是指与均值的一个标准差或标准距离,而下标 X 是指测量的是样本均值的分布的标准
差。因此,标准误就测量了 X 与μ之间平均起来能预期到的误差。
(四)中心极限定律
1.标准误的定义公式
X的标准误
X
n
2.影响样本均值标准误的两个因素
(1)样本容量对样本均值标准误的影响
样本越大,就能越准确地代表总体。当样本完全等于总体时,对总体的估计就完全没有
1 / 60
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
大困难。此时,对于这种大范围的调查研究一般采取阶段抽样方法,如两阶段随机抽样。首 先将总体分成 M 个部分,每一部分是一“集团”(“群”),第一步从 M 个集团中随机抽取 m 个作为第一阶段的样本,第二步是分别从所选取的 m 个“集团”中抽取 n 个个体构成第二 阶段样本。
偏差。
(2)总体的方差对标准误的影响
当总体方差较大时,总体本身包含的分数比较分散,离总体均值较远的极端值比较多,
因此从中抽取样本,也会包含较多极端值,难以较好地对总体均值进行估计;当总体方差较
小时,抽取的样本分数都比较靠近总体均值,能更好地估计总体均值。因此总体方差越大,
3 / 60
圣才电子书
www.100xuexi.com
标准误就越大。
十万种考研考证电子书、题库视频学习平台
3.中心极限定律
对于任何均值为μ,标准差为σ的总体,样本容量为 n 的样本均值的分布,随着 n 趋近
无穷大时,会趋近均值为μ,标准差为 的正态分布。因此,当 n 足够大时(30 或以上),
n
近似地有 X ~ N( , )。中心极限定律综合了样本均值的形状、均值和方差这三个特征。
(二)取样分布 1.含义 取样分布是指从同一总体中可以抽取出很多个样本,总体中可抽取的所有可能的特定容 量分布的统计量(包括平均数,两平均数之差,方差,标准差,相关系数,回归系数,百分 比率等等)所形成的统计分布。 2.取样分布与总体分布的区别 取样分布是参数或统计量的集合,而总体分布和样本分布则是原始分数的集合。 (三)样本均值分布 1.含义 样本均值的分布是取样分布的一个特例。它是指总体中可抽取的所有可能的特定容量 (n)的随机样本的均值的集合。样本均值的分布包含所有可能的样本;由于属于取样分布, 在样本均值的分布中,值不是分数,而是统计量(样本均值)。 2.建构一个样本均值分布的步骤 首先,从总体中随机抽取得到一个包含 n 个分数的样本,计算出它的均值并把它记下 来;然后选择另一个随机样本,也计算出均值;重复前两个步骤,便得到所有可能的随机样 本,它们的均值就形成了样本均值的分布。 3.样本均值分布的特点 (1)样本均值的分布形状上接近正态分布,尤其当总体是正态分布,或者样本量较大
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
第 5 章 概率和样本:样本均值的分布
5.1 复习笔记
一、样本均值的分布 (一)取样方法 1.简单随机取样 简单随机抽样是最基本的一种随机取样方法,具体操作是可以将总体中的每一个个体都 编上号码并抽签,或者利用随机数字表。这种抽样只适用于总体数目较少且总体的个体之间 差异程度较小的情况。 2.等距抽样 当总体的数目非常大时,可以使用等距抽样,也是将每个个体编号,并且将已编好号码 的个体排成顺序,然后每隔若干个抽取一个。一旦定下取样间隔和起点之后,每一个个体就 没有相等的机会被抽取到,而是只有每隔一定的间隔的个体才能被抽取。但是这个方法使得 被抽取的个体均匀地分配在总体当中,而不会发生聚堆的现象。但是,不适合总体排列具有 周期性的情况。 3.分层随机抽样 当总体内的个体差异比较大时,必须考虑到总体的这种信息再进行随机抽取。在抽样时 先根据差异分成不同的层次,然后再在每个层次中随机抽取。在进行分层随机抽样时,每一 层中抽取的样本数目可以不同,更恰当的方法是应当考虑总体的比例。 4.阶段抽样 当总体容量很大时,直接以总体中的所有个体为对象进行抽样,在实际调查或研究中存在很
当得到所有可能的样本时,它们的均值就完全与总体均值相等。因此所有样本均值的平均称
为 X 的期望值,应该等于总体均值。
(4)与正态分布的标准差类似,样本均值分布中用标准误(SE)来描述。它是指样本
均值分布的标准差。它反映了样本均值和总体均值之间平均差异的大小。
X 的标准误= X = X 与μ的标准距离
2 / 60
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
(30 以上)时,样本均值的分布几乎可以看做是完全的正态分布。
(2)取样是为了对总体进行最好的估计。因此当从总体中抽取出一个样本,它的均值
应该是趋近于总体均值,它可以代表这个总体。
(3)无偏估计时,样本均值等于总体均值,这也是正态情况下样本均值分布的均值。
一个样本均值可能大于或小于总体均值。
(2)标准误则提供了一个衡量取样误差的方法。它衡量了样本均值与总体均值之间平
Hale Waihona Puke Baidu
均起来的差异,这样就可以知道样本能在多大程度上代表总体。
(3)可以把标准差看成是标准误的特例。标准误的公式:
,如果是一个单个
分数,即 n=1,那么
,即标准误等于标准差。
二、样本均值分布与概率
n
(五)标准差、标准误和取样误差
1.标准差
标准差是总体中的概念,指的是总体中一个分数与总体均值的标准距离,即 X-μ。衡量
的是次数分布的变异性。
2.标准误
标准误是样本均值分布中的概念,是指一个样本均值和其相应的总体均值之间的标准距
离,即 X -μ。衡量的是样本均值分布的变异性。
3.取样误差
(1)取样误差描述了样本和总体所得到的统计量与参数之间的偏差(或误差)。任何
4 / 60
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
(一)样本均值分布中概率的计算 1.由样本平均数计算 z 分数 除了能用 z 分数来描述单个的分数,还可以描述选取的一个样本在样本均值分布中的位
置。由于要考查的是样本而不是单个的分数,因此 X 代替了原来公式中的 X; X 代替了原
σ是指与均值的一个标准差或标准距离,而下标 X 是指测量的是样本均值的分布的标准
差。因此,标准误就测量了 X 与μ之间平均起来能预期到的误差。
(四)中心极限定律
1.标准误的定义公式
X的标准误
X
n
2.影响样本均值标准误的两个因素
(1)样本容量对样本均值标准误的影响
样本越大,就能越准确地代表总体。当样本完全等于总体时,对总体的估计就完全没有
1 / 60
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.100xuexi.com
大困难。此时,对于这种大范围的调查研究一般采取阶段抽样方法,如两阶段随机抽样。首 先将总体分成 M 个部分,每一部分是一“集团”(“群”),第一步从 M 个集团中随机抽取 m 个作为第一阶段的样本,第二步是分别从所选取的 m 个“集团”中抽取 n 个个体构成第二 阶段样本。
偏差。
(2)总体的方差对标准误的影响
当总体方差较大时,总体本身包含的分数比较分散,离总体均值较远的极端值比较多,
因此从中抽取样本,也会包含较多极端值,难以较好地对总体均值进行估计;当总体方差较
小时,抽取的样本分数都比较靠近总体均值,能更好地估计总体均值。因此总体方差越大,
3 / 60
圣才电子书
www.100xuexi.com
标准误就越大。
十万种考研考证电子书、题库视频学习平台
3.中心极限定律
对于任何均值为μ,标准差为σ的总体,样本容量为 n 的样本均值的分布,随着 n 趋近
无穷大时,会趋近均值为μ,标准差为 的正态分布。因此,当 n 足够大时(30 或以上),
n
近似地有 X ~ N( , )。中心极限定律综合了样本均值的形状、均值和方差这三个特征。