第四节抽样分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
志存高远,顽强拼搏
(四)t分布表的使用
▪ 左列表示自由度。 ▪ 最上一行表示不同自由度下t分布两端的概率之和,
即在某t值时, t分布两端的概率之和,又称显著 性水平。 ▪ 中间数字:某一自由度和某一显著性水平t的临界 值。
志存高远,顽强拼搏
不管是正态分布,还是 在t分布,都存在标准误问题. 标准误的含义:某种统计量在抽样分布上的标准差,符号
自由度的变化而变化。 ▪ 联系:当自由度趋于无穷大时, t分布接近标准正态分布。
志存高远,顽强拼搏
(三)自由度
▪ 指总体参数估计量中变量值自由变化的个数,用符号df表 示。
▪ 任何变量中可以自由变化的数目 。 ▪ 自由度(degree of freedom, df)在数学中能够自由取值的变
量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由 度等于2。在统计学中,自由度指的是计算某一统计量时, 取值不受限制的变量个数。通常df=n-k。其中n为样本含量, k为被限制的条件数或变量个数,或计算某一统计量时用 到其它独立统计量的个数。自由度通常用于抽样分布中。
在以笔名"Student"发表的一篇论文中推导的一种分布。
志存高远,Hale Waihona Puke 强拼搏(二) t分布的特征
▪ 1. t分布的平均值为0。 ▪ 2. t分布是以过平均值0的垂线为轴的对称分布,分布左侧t
为负值,分布右侧t为正值。 ▪ 3. t变量取值在--∞—+∞之间。 ▪ 4. 当样本容量趋于+∞时,t分布为正态分布。 ▪ 5.t分布的形态随自由度的变化而变化,呈一簇分布形态
▪ (三)无限多个n个随机变量平方和或标准分数 的平方和的分布,称为χ2分布。χ2分布是正偏态分 布;卡方值都是正值;卡方分布的和也是卡方分 布;χ2分布是连续型分布。
▪ (四)自一个正态总体中随机抽取容量为n1及n2 两个样本,它们的总体方差估计值的比值F的分布 称为F分布。
汇报结束
谢谢大家! 请各位批评指正
(即自由度不同的t分布形态也不同);t分布的峰狭窄尖 峭,尾长而翘得高。
志存高远,顽强拼搏
t分布与标准正态分布的比较
▪ 相同点: ▪ 1. 以过平均数的直线为轴,两侧对称; ▪ 2. 曲线在平均数这一点上有最高点; ▪ 3. 曲线从中央点向两侧逐渐下降,但永远不与基线相交; ▪ 4. 曲线下的面积为1,以平均数为界,左右各占0.5 。 ▪ 不同点: ▪ t分布随自由度的变化,是一簇分布;标准正态分布不随
▪ χ2分布是统计分析中应用较多的一种抽样分布。
志存高远,顽强拼搏
(二)χ2分布的特点
▪ 1、是一个正偏态分布。随每次所抽取的随机变量X个数 (n的大小)不同,其分布曲线的形状不同,n或n-1越小分布 越偏斜,df很大时,接近正态分布。当df→∞时,χ2分布为正态 分布。可见χ2分布是一族分布,正态分布是其中一特例。
志存高远,顽强拼搏
二、t分布
▪ 当总体为正态分布,但总体方差未知,而且N<30时,样本
平均数的分布为t分布。 ▪ (一)什么是t分布
若干个来自已知平均数为U,而方差未知的正态分布总体的样
本统计量
t
X S
的分布。t分布是统计分析中应用较多的
n 1
一种随机变量函数的分布,是统计学者高赛特(Goeset)1908年
志存高远,顽强拼搏
▪ 统计学上的自由度是指当以样本的统计量来估计总体的参数 时, 样本中独立或能自由变化的自变量的个数,称为该统 计量的自由度。 统计学上的自由度包括两方面的内容:
▪ 首先,在估计总体的平均数时,由于样本中的 n 个数都是相 互独立的,从其中抽出任何一个数都不影响其他数据,所以 其自由度为n。
自由度相同概率的t值(双侧概率)的平方相等。
志存高远,顽强拼搏
(三)F分布表的使用
▪ 该表左一列为分母的自由度从1-30比较详细,30以 后只列出间隔较大的一部分自由度。表的左二列 为α概率:0.05与0.01即F曲线下某F值之右侧的概率, 表的最上行为分子的自由度,其值与分母自由度的 值相似。表中其他各行各列的数值为0.05与0.01概 率时,不同分子、分母自由度时F分布的值。
志存高远,顽强拼搏
(二)F分布的特点
▪ 1.F分布形态是一个正偏态的分布,它的分布曲线的形式随分 子、分母的自由度不同而不同,它是一族分布,随df1与df2的增 加而渐趋正态分布。
▪ 2.因F为两个方差之比率,故F总为正值。 ▪ 3.F分布表是根据F分布函数计算得来。 ▪ 4.当分子的自由度为1,分母的自由度为任意值时,F值与分母
志存高远,顽强拼搏
三、χ2 (卡方)分布
▪ (一) χ2 (卡方)分布的含义
▪ 从一个服从正态分布的总体中,每次随机抽取随机变量 X1,X2,X3…XN,并分别将其平方,即可得到X12,X22,X32…, XN2,这样可抽取无限多个数量为n的随机变量X,并可求得 无限多个n个随机变量X的平方的和,也可计算其标准分数Z =X-μ/δ,及其平方Z2=(X-μ/δ)2。这无限多个n个随机变量平 方和或标准分数的平方和的分布,即为χ2分布。
上述两种情况,都可以将样本平均数转化成标准分数:
Z
X X
X
n
志存高远,顽强拼搏
(三)如果总体呈正态分布,总体方差未知,样本 是大样本,那么,样本平均数的抽样分布为渐进 正态分布。
(四)依随机取样的原则,自正态分布的总体中抽取 容量为n的样本,当n足够大时(n≥30),样本方差及 标准差的分布,渐趋于正态分布。
SE表示。包括: 样本平均数的标准误; 样本标准差的标准误; 样本相关系数的标准误; 标准差与标准误的异同: 都是描述数据的离中趋势,即都是离中趋势的指标 标准差是一般变量值离中趋势的指标 标准误是样本统计量离中趋势的指标 抽样误差:从总体中抽取容量为的个样本时,样本统 计量与总体参数之间总会存在一定的差距,而这种差 距是由于抽样的随机性所引起的样本统计量与总体参 数之间的不同,称为抽样误差。
一、正态分布与渐进正态分布
▪ (一)如果总体呈正态分布,且总体方差已知,
那么,样本平均数的抽样分布为正态分布。
▪ 此时,样本平均数的平均数等于总体平均数,样
本平均数在抽样分布上的标准差,等于总体标准
差除以N的平方根。
EX
X
n
志存高远,顽强拼搏
(二)如果总体不呈正态分布,但2已知,且样本容量较 大,此时,样本平均数的抽样分布接近正态分布。
▪ 在估计总体的方差时,使用的是离差平方和。只要n-1个数 的离差平方和确定了,方差也就确定了;因为在均值确定后, 如果知道了其中n-1个数的值,第n个数的值也就确定了。这 里,均值就相当于一个限制条件,由于加了这个限制条件, 估计总体方差的自由度为n-1。
▪ 例如,有一个有4个数据(n=4)的样本,其平均值m等于5,即 受到m=5的条件限制,在自由确定4、2、5三个数据后, 第 四个数据只能是9,否则m≠5。因而这里的自由度υ=n-1=41=3。推而广之,任何统计量的自由度υ=n-限制条件的个数
▪ 抽样分布是对样本统计量概率分布的一种描述方式。这个和上 面两个是截然不同的概念。虽然统计量也是随机变量,但是本 身来说,是经过处理的变量。在使用时需要计算任意n个样本 的统计量,然后将数据进行分布查看。由样本n个观察值计算 的统计量的概率分布就是抽样分布。
▪ 抽样分布有什么特征,抽样分布是什么样的分布,这要根据总 体是否正态、总体方差是否已知、样本统计量是什么等因素确 定。
▪ 2.卡方值都是正值。 ▪ 3.卡方分布的和也是卡方分布。 ▪ 4.χ2分布是连续型分布,但有些离散型的分布也近似χ2分布。
志存高远,顽强拼搏
(三)χ2分布表的编制与使用
▪ χ2分布表是根据χ2分布函数计算出来的, χ2分布曲 线下的面积都是1。但随自由度不同,同一χ2值以 下或以上所含面积与总面积之比率不同。故一般 χ2表,要列出自由度、及某一χ2值以上χ2分布曲线 下的概率。
志存高远,顽强拼搏
四、F分布
▪ (一)F分布的含义
▪ 自一个正态总体中随机抽取容量为n1及n2两个样本, 它们的总体方差估计值的比值F的分布称为F分布 (分子的自由度为n1-1,分母的自由度为n2-1)。
▪ 知道了同一总体不同样本的总体方差估计值F的分 布,即可分析任意两样本方差是否取自同一总体了。 可见,F分布在统计分析中是很有用的一种样本分布。
▪ 总体分布:所有元素出现概率的分布。是简单意义上的随机变 量对应的频次分布。总体分布往往是未知的,很多场合不可能 获取得对所有个体元素的观察值。当然有些时候可以通过理论 计算进行假定。
▪ 样本分布:选择的样本在随机变量上的对应的频次分布,样本 分布实际上也在趋向总体分布。样本分布和总体分布的本质是 一样,区别就在于选取的数据不一样,一个是总体(N个), 一个是样本(n个)
志存高远,顽强拼搏
▪ 抽样分布:某一种统计量的频数分布。 ▪ (一)当总体为正态分布,总体方差已知时,样本平均数的
分布为正态分布。此时,样本平均数的平均数等于总体的平 均数;样本平均数的标准差,等于总体标准差除以N的平方 根。 ▪ 当总体为正态分布,总体方差未知,且样本为大样本时,样 本平均数的分布为渐近正态分布。 ▪ 当总体为正态分布,样本为大样本时,样本方差及标准差的分布 为渐近正态分布。 ▪ (二)当总体为正态分布,但总体方差未知,且N<30时, 样本平均数的分布为t分布。此时,样本平均数的平均数等于 总体平均数;样本平均数的标准差,等于样本标准差除以N1的平方根。
相关文档
最新文档