t检验的资料与习题.pdf

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布(normal distribution)是数理统计中的一种重要的理论分布, 是许多统计方法的理论基础。正态分布有两个参数,μ 和 σ,决定了正态分布 的位置和形态。为了应用方便,常将一般的正态变量 X 通过 u 变换[(X-μ)/σ] 转化成标准正态变量 u,以使原来各种形态的正态分布都转换为 μ=0,σ=1 的 标准正态分布(standard normal distribution),亦称 u 分布。
1
学海无涯 假设 X 服从标准正态分布 N(0,1),Y 服从 χ2(n)分布,那么 Z=X/sqrt(Y/n)的分布称为自由度为 n 的 t 分布,记为 Z~t(n)。
特征: 1.以 0 为中心,左右对称的单峰分布; 2.t 分布是一簇曲线,其形态变化与 n(确切地说与自由度 ν)大小有关。 自由度 ν 越小,t 分布曲线越低平;自由度 ν 越大,t 分布曲线越接近标准正 态分布(u 分布)曲线,如图.
t(n)分布与标准正态 N(0,1)的密度函数 对应于每一个自由度 ν,就有一条 t 分布曲线,每条曲线都有其曲线下统 计量 t 的分布规律,计算较复杂。 学生的 t 分布(或也 t 分布) ,在概率统计中,在置信区间估计、显著性 检验等问题的计算中发挥重要作用。 t 分布情况出现时(如在几乎所有实际的统计工作)的总体标准偏差是未 知的,并要从数据估算。教科书问题的处理标准偏差,因为如果它被称为是两 类:( 1 )那些在该样本规模是如此之大的一个可处理的数据为基础估计的差 异,就好像它是一定的( 2 )这些说明数学推理,在其中的问题,估计标准偏 差是暂时忽略的,因为这不是一点,这是作者或导师当时的解释。
σ x=σ/ S x=S/
2 t 分布 t 分布曲线形态与 n(确切地说与自由度 v)大小有关。与标准正态分布曲线相比,自
由度 v 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度 v 愈大, t 分布曲线愈接近正态分布曲线,当自由度 v=∞时,t 分布曲线为标准正态分布曲线。
t = X-u/Sx=X-u/(S/),V=N-1
3
基本步骤
学海无涯
1、提出检验假设又称无效假设,符号是 H0;备择假设的符号是 H1。
H0:样本与总体或样本与样本间的差异是由抽样误差引起的;
H1:样本与总体或样本与样本间存在本质差异;
预先设定的检验水准为 0.05;当检验假设为真,但被错误地拒绝的概率, 记作 α,通常取 α=0.05 或 α=0.01。
t 检验 若总体服从正态分布 N(μ,σ),但 σ 未知,记,,则 t=遵从 自由度为 n-1 的 t 分布,可对 μ 有以下的水平为 α 的检验,其中 tα 为自由 度为 n-1 的 t 分布的上 α 分位数。这些检验称为 t 检验。
3.均数的参数估计
2
学海无涯
可信区间
按一定的概率或可信度 (1-α)用一个区间来估计总体参数所在的范围,该范围通常称 为参数的可信区间或者置信区间,预先给定的概率(1-α)称为可信度或者置信度,常取 95% 或 99%。 1. 点估计 用样本统计量直接作为总体参数的估计值。其方法简单,易于理解,但为考虑
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如 X2 值、t 值等。根据资料的类型和特点,可分别选用 Z 检验,T 检验,
3、根据统计量的大小及其分布确定检验假设成立的可能性 P 的大小并判断 结果。若 P>α,结论为按 α 所取水准不显著,不拒绝 H0,即认为差别很可能 是由于抽样误差造成的,在统计上不成立;如果 P≤α,结论为按所取 α 水准 显著,拒绝 H0,接受 H1,则认为此差别不大可能仅由抽样误差所致,很可能是 实验因素不同造成的,故在统计上成立。P 值的大小一般可通过查阅相应的界 值表得到。
假设检验 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方 法,构成假设检验的内容。设 A 是关于总体分布的一项命题,所有使命题 A 成 立的总体分布构成一个集合 h0,称为原假设(常简称假设)。使命题 A 不成立的 所有总体分布构成另一个集合 h1,称为备择假设。如果 h0 可以通过有限个实 参数来描述,则称为参数假设,否则称为非参数假设(见非参数结果)。如果 h0(或 h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合 假设。对一个假设 h0 进行检验,就是要制定一个规则,使得有了样本以后,根 据这规则可以决定是接受它(承认命题 A 正确),还是拒绝它(否认命题 A 正 确)。这样,所有可能的样本所组成的空间(称样本空间)被划分为两部分 HA 和 HR(HA 的补集),当样本 x∈HA 时,接受假设 h0;当 x∈HR 时,拒绝 h0。集 合 HR 常称为检验的拒绝域,HA 称为接受域。因此选定一个检验法,也就是选 定一个拒绝域,故常把检验法本身与拒绝域 HR
抽样误差的大小。 2. 区间估计 既按照预先给定的概率(1-a),确定的包含总体参数的可能范围。该范围
被称为总体参数的可信区间或置信区间Hale Waihona Puke Baidu 假设检验基础
假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件 (P<0.01 或 P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设 (检验假设 H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小, 则认为假设不成立,若可能性大,则还不能认为不假设成立。[2]
学海无涯
第四章:定量资料的参数估计与假设检验基础
1 抽样与抽样误差 抽样方法本身所引起的误差。当由总体中随机地抽取样本时,哪个样本被抽到是随机
的,由所抽到的样本得到的样本指标 x 与总体指标 μ 之间偏差,称为实际抽样误差。当总 体相当大时,可能被抽取的样本非常多,不可能列出所有的实际抽样误差,而用平均抽样 误差来表征各样本实际抽样误差的平均水平。
根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以 固定 n,抽取若干个样本时,样本均数的分布仍服从正态分布,即 N(μ,σ)。 所以,对样本均数的分布进行 u 变换,也可变换为标准正态分布 N (0,1)
由于在实际工作中,往往 σ 是未知的,常用 s 作为 σ 的估计值,为了与 u 变换区别,称为 t 变换,统计量 t 值的分布称为 t 分布。
相关文档
最新文档