《统计学—基于SPSS》((06)第6章 假设检验(S3)
【SPSS初级教程】6-1(假设检验概念和方法)
假设检验中的两类错误 (决策结果)
H0: 无罪 假设检验就好像一场审判过程
统计检验过程
陪审团审判
裁决
实际情况
之所以用零来修饰原假设,其原因是原假设 的内容总是没有差异或没有改变,或变量间 没有关系等等 零假设总是一个与总体参数有关的问题,所 以总是用希腊字母表示。关于样本统计量如 样本均值或样本均值之差的零假设是没有意 义的,因为样本统计量是已知的,当然能说 出它们等于几或是否相等
提出原假设和备择假设
什么是备择假设?(alternative hypothesis) 与原假设对立的假设,也称“研究假设” 研究者想收集证据予以支持的假设总是有不等号:
5. 建立的原假设与备择假设应为
6.
H0: = 10 H1:
10
双侧检验 (显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平 拒绝域
a/2
1-
a/2
临界值
H0值
样本统计量 临界值
双侧检验 (显著性水平与拒绝域)
抽样分布
置信水平
拒绝域
拒绝域
a/2
1-
a/2
临界值
H0值 临界值 样本统计量
双侧检验 (显著性水平与拒绝域)
1. 总体参数的真值 随着假设的总体参数的减少而增大 2. 显著性水平 当 减少时增大 3. 总体标准差 当 增大时增大 4. 样本容量 n 当 n 减少时增大
什么是P 值? (P-value)
1. 是一个概率值 2. 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的
spss假设检验
SPSS假设检验1. 简介SPSS(Statistical Package for the Social Sciences)是一种非常常用的统计软件,被广泛应用于社会科学研究中。
其中,假设检验是SPSS中常用的统计方法之一,用于验证研究者对总体或样本的某种假设。
2. 假设检验的概念假设检验是统计学中的一种重要方法,用于判断一个统计推断是否与样本数据一致。
在假设检验中,通常会提出一个原假设(H0)和一个备择假设(H1),然后根据样本数据对两个假设进行检验,以确定是否拒绝原假设,从而对总体进行推断。
3. SPSS中的假设检验SPSS中提供了丰富的假设检验方法,涵盖了多种统计推断的情况。
下面将介绍几种常见的假设检验方法。
3.1 单样本 t 检验单样本 t 检验用于判断一个样本的均值是否与一个已知的常数有显著性差异。
在SPSS中,进行单样本 t 检验的步骤如下:1.导入数据:在SPSS中打开或导入数据文件。
2.选择变量:选择要进行 t 检验的变量。
3.进行检验:选择菜单栏上的“分析”-“比较均值”-“单样本 t 检验”。
4.设置参数:选择相关的变量和检验参数,点击“确定”进行分析。
5.查看结果:SPSS将显示 t 检验的结果,包括均值、标准差、t 值、自由度和显著性等。
3.2 独立样本 t 检验独立样本 t 检验用于判断两个独立样本的均值是否存在显著性差异。
在SPSS中,进行独立样本 t 检验的步骤如下:1.导入数据:在SPSS中打开或导入数据文件。
2.选择变量:选择需要进行对比的两个变量。
3.进行检验:选择菜单栏上的“分析”-“比较均值”-“独立样本 t 检验”。
4.设置参数:选择相关的变量和检验参数,点击“确定”进行分析。
5.查看结果:SPSS将显示独立样本 t 检验的结果,包括均值、标准差、t 值、自由度和显著性等。
3.3 配对样本 t 检验配对样本 t 检验用于判断同一组个体在两个不同时间点或条件下的均值是否存在显著性差异。
SPSS-假设检验
Ⅰ类错误又称为 错误,就是把真实的
差异错判为是非真实的差异,即实际上H0正 确,检验结果为否定H0。犯Ⅰ类型错误的可
能性一般不会超过所选用的显著水平 ;
Ⅱ类错误又称为 错误 ,就是把非真实
的差异错判为是真实的差异 ,即实际上HA 正确,检验结果却未能否定H0 。 犯Ⅱ类型
错误的可能性记为 ,一般是随着 0 的 减小或试验误差的增大而增大,所以 0
越小或试验误差越大,就越容易将试验的真
实差异错判为试验误差。
显著性检验的两类错误归纳如下:
表3-1 显著性检验的两类错误
客观实际
H0 成立 H0 不成立 即 H1 成立
假设检验的结果
拒绝 H0
I 型错误( ) 推 断 正 确 (1 )
把这一检验结果表述为:“总体平均数
与0
u
差异显著 ”,在计算所得的 值的右上
方标记“*”;
u 若| |≥2.58,则说明试验的表面差异属
于试验误差的概率 p 不超过 0.01 ,即 p
≤0.01 ,表面差异属于试验误差的可能性更小,
应否定H0: ,接0受HA: 。统0 计学
上把这一检验结果表述为: “总体平均数
▪ 而在这一章中,我们所要做的工作是,先对要
研究的参数作一个假设,然后去检验这个假设 是否正确。因此假设检验对于所研究的参数总 是先有一个假设的值。
▪ 这也是这两种方法最基本的区别。
假设检验又叫显著性检验是统计学中的一 个重要内容 。
显著性检验的方法很多 ,常用的有u检
验、t检验、F检验和2检验等。尽管这些
反过来,如果要证明这个人说过 谎很容易,只要有一次被抓住就 足够了。
SPSS假设检验
SPSS假设检验实验⽬的::实验⽬的1、学会使⽤SPSS的简单操作。
2、掌握假设检验。
:实验内容:实验内容1.⼀个总体均值的检验(⼩样本);2.两个总体均值之差的检验;3.绘制正态概率图;4.S—W检验。
实验步骤: 1.⼀个总体均值的检验(⼩样本):单总体的Z检验和t检验。
设是取⾃正态总体的⼀个样本,要检验。
其中为已知的常数。
为了说明如何构造检验统计量和拒绝域,先看⼀个简单的情形。
设总体⽅差是已知的,记为,设为样本均值,则。
设为真,即,对作标准化,得到上述的Z就是要构造的检验统计量。
设定显著性⽔平为0.05,因为,的概率为0.05,所以检验的拒绝域是。
如果由样本计算得到,与⼩概率原理⽭盾,从⽽拒绝原假设。
在实际应⽤中,总体的⽅差是未知的。
因⽽需要样本⽅差代替总体⽅差,相应地,检验统计量编程了t统计量。
设与分别为样本的均值和样本⽅差,当为真时,可知统计量对于给定的显著性⽔平,检验的拒绝域是。
其中临界值满⾜条件。
它就是⾃由度为(N-1)的t分布的双侧分为点。
如果由样本观测值代⼊,计算得到的t值满⾜,则拒绝原假设。
SPSS检验结果不给出临界值,⽽是在给出t值的同时给出它的显著性概率(也成为p值或相伴概率,记为p或Sig)。
计算⼀个双侧检验问题,SPSS操作如下:“分析”→“⽐较均值”→“单样本T检验”,在打开的对话框中填好“检验变量”列表框和“检验值”⽂本框。
单击“确定”。
输出结果中的Sig.(双侧)就是p值。
⽐较p值与检验⽔准。
1 T-TEST2 /TESTVAL=803 /MISSING=ANALYSIS4 /VARIABLES=score5 /CRITERIA=CI(.95).⼀个总体的均值检验 差齐性检验:Sig=0.397>0.05,⽅差不显著,可以认为两个独⽴样本的⽅差⼀致。
均值之差t检验:在⽅差相等的条件下,Sig=0.004<0.05,均值之差显著,可以认为两个独⽴样本均值有显著差异。
SPSS假设检验
SPSS数据统计分析与实践主讲:周涛副教授北京师范大学资源学院2007 -10 -16教学网站:/Courses/SPSS第六章假设检验(Hypothesis Testing)本章内容:一、单样本假设检验z基本统计原理z SPSS应用实例二、独立双样本假设检验z基本原理z SPSS应用实例三、配对双样本假设检验z基本原理z SPSS应用实例几个基本常识z统计分析常常采取抽样的研究方法。
即从总体中抽取一定数量的样本进行研究来推论总体的特征。
z由于总体中的每个个体间存在差异,即使严格遵守随机抽样原则也会有样本统计量与总体参数之间有所不同。
z实验者测量技术的差别或测量仪器精确程度的差别等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。
几个基本常识Cont. z均值不相等的两个样本不一定来自均值不同的总体?(从均值相等的总体等抽样的均值可能不相等,这是抽样造成的)z两个样本的均值不同,其差异是否具有统计意义,能否说明总体差异?(只有样本均值的差异具有统计意义时,才能推断总体均值有差异)z校验假设的基本思想是统计学的“小概率反证法”一、单样本假设检验z基本统计原理z SPSS应用实例单样本假设检验的用途z The goal in a one-sample t test is to test if the mean ofa single sample differs from a hypothesized populationvalue.z e.g. You read that in the U.S., the average IQ is 100and you know that the average IQ for your coworkers is127.5. Are you coworkers smarter than the averageperson in the U.S.?z To answer this type of question in SPSS, request a one-sample t test to compare the mean of the sample IQvalue with the constant 100.单样本假设检验的基本统计原理主要内容:•Hypothesis Testing Methodology (假设检验的方法论)•Z Test for the Mean (σ Known) (Z检验方法,σ已知)•p-Value Approach to Hypothesis Testing(P-值检验方法)•t Test of Hypothesis for the Mean (t检验方法)z A hypothesis is an assumption about the population parameter.z A parameter is a Populationmean or proportionz The parameter must beidentified before analysis.I assume the mean GPA(总平均成绩) of this class is 3.5!What is a Hypothesis?The Null Hypothesis (零假设),H0z States the Assumption (numerical) to be testede.g. The average # TV sets in US homes is atleast 3(H: µ ≥3)z Begin with the assumption that the nullhypothesis is TRUE.(Similar to the notion of innocent until proven guilty)•Refers to the Status Quo (现状)•Always contains the‘= ‘sign•The Null Hypothesis may or may not be rejected.z Is the opposite of the null hypothesise.g. The average # TV sets in US homes isless than 3(H 1: µ< 3)z Challenges the Status Quo (现状)z Never contains the ‘=‘signz The Alternative Hypothesis may or may not be accepted The Alternative Hypothesis (备择假设),H 1Identify the ProblemSteps:z State the Null Hypothesis (H0: µ≥3)z State its opposite, the Alternative: µ< 3)Hypothesis (H1z Hypotheses are mutually exclusive (互斥的)&exhaustive(无遗漏的)z Sometimes it is easier to form thealternative hypothesis first.PopulationAssume the populationmean age is 50.(Null Hypothesis)REJECT The Sample Mean Is 20SampleNull Hypothesis50?20=≅=µX Is Hypothesis Testing ProcessNo, not likely!Sample Meanµ= 50Sampling DistributionIt is unlikely that we would get a sample mean of this value ...... if in fact this were the population mean.... Therefore, we reject the null hypothesis thatµ= 50.20H 0Reason for Rejecting H 0zDefines Unlikely Values of Sample Statistic if Null Hypothesis Is TruezCalled Rejection Region of Sampling DistributionzDesignated α(alpha)zTypical values are 0.01, 0.05, 0.10z Selected by the Researcher at the Start zProvides the Critical Value(s)of the TestLevel of Significance,α(临界值)Level of Significance,α and the Rejection RegionH 0:µ≥3 H 1: µ< 30H 0: µ≤3 H 1: µ> 3H 0: µ= 3 H 1: µ≠3ααα/2Critical Value(s)Rejection RegionsErrors in Making Decisionsz Type I Errorz Reject True Null Hypothesisz Has Serious Consequencesz Probability of Type I Error Isαz Called Level of Significance(显著性水平)z Type II Errorz Do Not Reject False Null Hypothesis(没有拒绝错误的零假设)z Probability of Type II Error Is β(Beta)α &β Have anInverse RelationshipReduce probability of one errorand the other one goes up.βαzConvert Sample Statistic (e.g., ) to Standardized Z VariablezCompare to Critical Z Value(s)zIf Z test Statistic falls in Critical Region , Reject H 0; Otherwise Do Not Reject H 0Z-Test Statistics (σ Known)Test StatisticX nX X Z XXσµσµ−=−=p Value Testz Probability of Obtaining a Test Statistic More Extreme than Actual Sample Value Given H0 Is Truez Called Observed Level of Significancez Smallest Value of a H0Can Be Rejectedz Used to Make Rejection Decisionz If p value ≥α,Do Not Reject H0z If p value <α, Reject H01.State H 0H 0:µ ≥32.State H 1H 1: µ < 33.Choose αα= .054.Choose n n = 1005.Choose Test:Z Test (or p Value)Hypothesis Testing: StepsTest the Assumption that the true mean # ofTV sets in US homes is at least 3.6. Set Up Critical Value(s)Z = -1.6457. Collect Data100 households surveyed 8. Compute Test Statistic Computed Test Stat.= -29. Make Statistical Decision Reject Null Hypothesis10. Express DecisionThe true mean # of TV set is less than 3 in the US households.Hypothesis Testing: StepsTest the Assumption that the average # ofTV sets in US homes is at least 3.(continued)zAssumptionsz Population is normally distributedz If not normal , only slightly skewed & a large sample taken zParametric test procedurezt test statistict-Test: σ UnknownnSX t µ−=Example: One Tail t-TestA random sample of 36boxes showed X = 372.5, and S =15. Test at the α=0.01level.368 gm.H 0: µ ≤368 H 1: µ >368σ is not given,Does an average box of cereal contain more than 368grams of cereal?z α = 0.01z n = 36, df= 35z Critical Value: 2.4377Test Statistic:Decision:Conclusion:Do Not Reject at α = .01No Evidence that True Mean Is More than 368Z02.4377.01Reject Example Solution: One TailH 0: µ ≤368 H 1: µ >36880.136153685.372=−=−=nSX t µSPSS单样本T检验实例SPSS单样本T检验实例A manufacturer of high-performance automobiles produces discbrakes (盘式制动器)that must measure 322 millimeters(毫米)in diameter. Quality control randomly draws 16 discs made by each of eight production machines(总计128个观测量)and measures their diameters.Use One Sample T Test to determine whether or not the mean diameters of the brakes in each sample significantly differ from 322 millimeters.A nominal variable, Machine Number, identifies the productionmachine used to make the disc brake. Because the data from each machine must be tested as a separate sample, the file must first be split into groups by Machine Number.数据文件:brakes.sav操作步骤1. 以变量“Machine Number”分割文件操作步骤2. 调用“One-Sample T Test”过程操作步骤3. 在One-Sample T Test的主对话框中输入要检验的变量,并输入要检验的值(322),并在“Options”中设置置信区间(90%)操作步骤4. 对输出结果进行解释One-Sample Test-.53315.602-.0014858-.006375.0034045.33615.000.0142629.009577.018948-.65515.522-.0017174-.006311.002876-2.61315.020-.0045649-.007628-.0015021.84715.085.0042486.000216.0082821.13415.274.0024516-.001337.0062402.65015.018.0061813.002092.010270-1.71315.107-.0033014-.006680.000077Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Disc Brake Diameter (mm)Machine Number 12345678tdfSig. (2-tailed)Mean Difference Lower Upper 90% Confidence Interval of the Difference Test Value = 3221. The columnlabeled Sig. (2-tailed)displays a probability from the t distribution with 15 degrees of freedom.2.The 90%Confidence Interval of the Differenceprovides an estimate of the boundaries between which the true mean difference lies in 90% of all possible random samples of 16 disc brakes produced by this machine.3. Since their confidence intervals lie entirely above 0.0, you can safely say that machines 2, 5and 7are producing discs that are significantly wider than 322mm on the average.4. Similarly, because its confidenceinterval lies entirely below 0.0, machine 4is producing discs that are not wide enough .二、独立双样本假设检验z基本原理z SPSS应用实例独立双样本假设检验—基本原理主要内容:Comparing Two Independent Samples (两个独立样本的比较): Z Test for the Difference in Two Means (Z检验方法)t Test for Difference in Two Means (t检验方法)•F Test for Difference in two Variances (方差相等检验,F检验)Independent Samples•Different Data Sources:Unrelated (不相关)Independent (独立)Sample selected from one population has no effector bearing on the sample selected from the otherpopulation.•Use Difference Between the 2 Sample Means •Use Pooled Variance(合并方差)t TestzAssumptions (前提假设):zSamples are Randomly and Independentlydrawnz Data Collected are Numerical z Population Variances Are Known zSamples drawn are LargezTest Statistic:Z Test for Differences in Two Means (Variances Known)2221122121n n )()X X (Z σσµµ+−−−=zAssumptions (前提假设):z Both Populations Are Normally Distributed zOr, If Not Normal, Can Be Approximated byNormal DistributionzSamples are Randomly and IndependentlydrawnzPopulation Variances Are Unknown ButAssumed Equalt Test for Differences in Two Means (Variances Unknown)Pooled-Variance t Test (Part 1) 1. Setting Up the Hypothesis:H0: µ 1≤µ 2 H1: µ 1> µ 2H0: µ 1-µ 2= 0 H1: µ 1-µ 2 ≠0H0: µ 1= µ 2 H1: µ 1≠µ 2H0: µ 1≥µ 2H0: µ 1-µ 2≤0H1: µ 1-µ 2> 0H0: µ 1-µ 2≥0H1: µ 1-µ 2 < 0OROROR LeftTailRightTailTwoTailH1: µ 1< µ 2Pooled-Variance t Test (Part 2)2. Calculate the Pooled Sample Variances as an Estimate of the Common Populations Variance:)n ()n (S )n (S )n (Sp1111212222112−+−−+−=2pS 21S 22S 1n 2n = Pooled-Variance = Variance of Sample 1= Variance of sample 2= Size of Sample 1= Size of Sample 2t X X S n S n S n n df n n P=−−−=−×+−×−+−=+−12122112222121211112µµHypothesizedDifference Pooled-Variance t Test (Part 3)3. Compute the Test Statistic:())(()()()()⎟⎟⎠⎞⎜⎜⎝⎛+•112p S n 1n 2__Pooled-Variance t Test: Examplez You’re a financial analyst for Charles Schwab. Isthere a difference in dividend (股息)yield between stocks listed on the NYSE(纽约证券交易所)& NASDAQ? You collect the following data:NYSE NASDAQNumber2125Mean 3.27 2.53Std Dev 1.30 1.16z Assuming equal variances, isthere a difference in averageyield (α = 0.05)?t X X S n n S n S n S n n PP=−−−=−−==−×+−×−+−=−×+−×−+−=1212212211222212223272530151********11112111302511162112511510µµ.......Calculating the Test Statistic:((((((((((()))))))))))⎟⎟⎠⎞⎜⎜⎝⎛+•11⎟⎟⎠⎞⎜⎜⎝⎛+•11z H 0: µ1 -µ2= 0 (µ1 = µ2)z H 1: µ1 -µ2≠0 (µ1≠µ2)z α = 0.05z df = 21 + 25 -2 = 44z Critical Value(s):Test Statistic:Decision:Conclusion:Reject at a = 0.05There is evidence of a difference in means.t0 2.0154-2.0154.025Reject H 0Reject H 0.025t =−=327253151********....Solution⎟⎟⎠⎞⎜⎜⎝⎛+•11F Test for Differences in Two Variances•The F test Statistic:F == Variance of Sample 1n 1 -1 = degrees of freedomn 2 -1 = degrees of freedomF0 21S 21S 22S 22S = Variance of Sample 2zTests for Differences in 2 Independent Population Variances z Parametric Test Procedure zAssumptionszBoth Populations Are Normally DistributedzTest Is Not Robust to ViolationsF Test for the Difference in Two Population VarianceszHypotheses z H 0:σ12= σ22z H 1: σ12≠σ22zTest Statistic z F = S 12/S 22zTwo Sets of Degrees of Freedom z df 1= n 1-1;df 2= n 2-1zCritical Values:F L ( )and F U ()F L = 1/F U *(* degrees of freedom switched)F Test for the Difference in Two Population VariancesReject H 0Reject H 0α/2α/2Do Not Reject F0F LF Un 1-1, n 2-1n 1 -1 , n 2 -1F Test: An Examplez Assume you are a financial analyst for Charles Schwab. You want to compare dividend yields between stocks listed on the NYSE & NASDAQ. You collect the following data:NYSE NASDAQNumber2125Mean 3.27 2.53Std Dev 1.30 1.16z Is there a difference in thevariances between the NYSE& NASDAQ at the 0.05level?z H 0:σ12= σ22z H 1: σ12≠σ22z α=.05z df 1=20 df 2=24z Critical Value(s):Test Statistic:Decision:Conclusion:Do not reject at a = 0.05There is no evidence of a difference in variances.0F2.330.415.025Reject Reject .025F ===22130116125...F Test: Example Solution21S 22SH 0: σ12≥σ22H 1: σ12< σ22F Test: One TailH 0: σ12≤σ22H 1: σ12> σ22Reject α =.05F0FReject α =.05α= .05F LF UF L =F U 1or (n 2 -1, n 1-1)Degrees of freedom switchedSPSS双独立样本T检验实例SPSS双独立样本T检验z An analyst at a department store(百货公司) wants to evaluate a recent credit card promotion. To this end, 500 cardholders wererandomly selected. Half received an ad promoting a reduced interest rate on purchases made over the next three months, and halfreceived a standard seasonal ad.z Use Independent-Samples T Test to compare the spending of the two groups.操作步骤:1.打开数据文件(creditpromo.sav)2.调用Independent-Samples T Test。
应用统计学 第六章 假设检验
v (s12
s12 n1
s22 n2
2
n1)2 (s22 n2 )2
n1 1
n2 1
(6-13)
31
第三节 两个总体参数的检验
第 六 章
假
设
检 验
这时,检验统计量t的计算公式为:
t (x1 x2 ) (1 2 )
s12 s22 n1 n2
10
第一节 假设检验的基本问题
第 六 章
假 设
(五) 根据样本数据计算检验统计量的值
检
验
在提出原假设和备择假设,选取适当显著性水平 和检验统计量以后,接下来就要根据样
本观测值计算检验统计量的值,具体计算方法将在本章第二节进行详细介绍。例如,例6-1中检
验统计量的值为:
z x 0 2.21 2 2.67
t x 0 (6-3)
s/ n
18
第二节 一个总体参数的检验
第 六 章
假
综上所述,不同情况下总体均值的检验统计量如表6-3所示。
设
检
验
19
第二节 一个总体参数的检验
第 六 章
二、总体比例的检验
假
设 检
在实际应用中,常常需要检验总体比例是否为某个假设值 0 。例如,检验某课程的
验 考试通过率、产品的合格率、种子的发芽率等,民意调查中也经常用到总体比例检验。
样本条件下,要求总体服从正态分布,且总体标准差 已知时,可以使用z统计量。当
总体标准差 已知时,z统计量的计算公式为:
z x 0 / n
(6-1)
15
第二节 一个总体参数的检验
第 六 章 假 设 检 验
16
第6章 假设检验
×
样本均数 分布未知
样本均数服从 t分布
( X-t / 2 ( ) .S X, X+t / 2 ( ) .S X )
样本均数服从 正态分布
N ( , 2 / n)
N ( , S 2 / n)
( X-u / 2 . X, X+u / 2 . X )
( X-u / 2 .S X, X+u / 2 .S X )
时,当P值在检验水准α 附近时,应慎重做结论。
α 是犯Ⅰ型错误的最大概率,P是犯Ⅰ型错误的实际概率。
3.假设检验的统计意义
假设检验的实际意义
不管是接受还是拒绝零假设都未必有实际意义; 拒绝零假设时,即使P值很小,总体之间差异可能很小,不具有
实际意义;
接受零假设时,不代表总体之间没有差异,可能由于样本量过 小,“证据不足”,“补充证据”后,仍可能拒绝零假设;
样本均数 分布未知
×
样本均数服从 正态分布
Ⅳ N
σ 已知? Y
u
X
X
X X / n S/ n
样本均数服从 t分布
样本均数服从 正态分布
N ( , / n)
2
N ( , S 2 / n)
样本均数与总体 均数比较 (大样本:u检验) (小样本:?检验)
两样本均数比较
若小概率事件发生了,则我们犯了经验主义错误;
因为小概率事件发生可能性为α ,则我们犯经验主义错 误的概率为α ,这种错误称为Ⅰ型ห้องสมุดไป่ตู้误。
若小概率事件没有发生,接受零假设时,还是有可能犯错
误,这时候错误是教条主义,称为Ⅱ型错误。
统计学基础厦门大学06假设检验
• 对原始数据中包含的信息利用不够充分,检验的功 效相对较弱
• 符号检验——只考虑样本间差数的符号
– 单样本场合的符号检验,其步骤如下:
• 作出假设; • 计数; • 确定拒绝域; • 选择n+,n-较大者,再与临界值比较 • 判断
• 例6-11(P172):假设随机抽取20名工人,他们 一天生产的产品件数如下:
– 所谓p-值检验就是拒绝原假设所需的最低显著 性水平
– p-值的判断原则是:如果p值小于给定的显著 性水平,则拒绝原假设;否则,接受原假设。 或:如果p值很小,拒绝H0,否则接受H0。
– p-值实际上是检验统计量超过(大于或小于) 由样本数据所得数值的概率。
• z检验的p-值;
– 步骤:
• 作出假设; • 构造检验统计量; • 计算样本统计的数值; • 计算p-值; • 判断
z 双侧检验
两个正态总体参数的均值检验
2. 方差未知,但两个总体的方差相等,检验均值相等
问题:X ~ NXຫໍສະໝຸດ ,2 XY~N
Y
,
2 Y
未知
2 X
,
Y2,但知
2 X
Y2,检验H0:X
Y
设 X1, X 2 ,......X n1 是X的一个样本, Y1,Y2 ,......Yn2 是Y的一个样本,
• 符号检验
– 配对样本场合的符号检验,其步骤如下:
• 作出假设 • 计数 • 确定拒绝域 • 比较正号个数与临界值的大小 • 判断
• 例6-12(P173):假定在体操比赛中,甲乙两位 裁判分别对该项赛事中的11位运动员打分,并且 记分制为10分,分值如下表:
1 2 3 4 5 6 7 8 9 10 11 裁判甲 8.1 9.0 8.8 9.3 7.9 9.1 8.6 8.8 8.4 9.2 9.1 裁判乙 7.3 8.8 8.6 9.4 8.4 9.0 8.9 8.7 8.0 9.2 9.5 差值符号 + + + - - + - + + 0 -
统计学基础与实务-ppt-第6章假设检验
总体均值的检验
(大样本)
STAT
1. 假定条件
– 正态总体或非正态总体大样本(n30)
2. 使用z检验统计量 2 已知:z x0 ~N(0,1) n
2 未知:z x0 ~N(0,1)
sn
6-50
总体均值的检验(大样本)
(决策规则)
STAT
1. 在双侧检验中,如果|z| z/2 ,则拒绝原 假设H0;反之,则不能
STAT
1. 研究者想收集证据予以反对的假设 2. 又称“0假设” 3. 总是有符号 , 或 4. 表示为 H0
– H0 : = 某一数值
– 指定为符号 =, 或
– 例如, H0 : 10cm
6-12
备择假设
(alternative hypothesis)
STAT
1. 研究者想收集证据予以支持的假设 2. 也称“研究假设” 3. 总是有符号 , 或 4. 表示为 H1
– 总体参数包括总体均值、 比率、方差等
– 分析之前必须陈述
6-6
什么是假设检验?
(hypothesis test)
STAT
1. 先对总体的参数(或分布形式)提出某种假 设,然后利用样本信息判断假设是否成 立的过程
2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率
原理
6-7
假设检验中的小概率原理
z 检验
z x 0 sn
z 检验
z x 0 n
t 检验
t x 0 sn
6-47
STAT
总体均值的检验
(大样本)
6-48
总体均值的检验
(提出假设)
管理统计学第六章假设检验
拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
*均值的单尾 Z 检验
(2 已知)
1. 假定条件
– 总体服从正态分布 – 若不服从正态分布,可以用正态分布来
近似 (n30)
2. 备择假设有<或>符号 3. 使用z-统计量
z x 0 ~ N (0,1) n
均值的单尾 Z 检验
的某个假设
总体分布未知时的 假设检验问题
本章讨论参数假设检验 . 一个质量检验例子:
罐装可乐的容量按标准应在 350毫升和360毫升之间.
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢?
把每一罐都打开倒入量杯, 看看容量是否合于标准.
这样做显然 不行!
• 二、方法 • 方法1:总体方差已知时双侧检验、单尾(左尾、右尾)检验 • 方法2:总体方差未知时双侧检验、单尾(左尾、右尾)检验
方法1:总体方差已知时 的检验
*单样本均值的双尾 Z 检验
(2 已知)
• 1、假定条件
– 总体服从正态分布
– 若不服从正态分布, 可用正态分布来近似(n30)
• 2、原假设为:H0: =0;
= 0 ≠0
0 < 0
0 > 0
(二)双侧检验
1、定义:只强调差异而不强调方向性的检验称为双侧检验。
例:某种零件的尺寸,要求其平均长度为10厘米,大于或 小于10厘米均属于不合格。
建立的原假设与备择假设应为
H0: 1 10
H1: 1 10
2、双侧检验的显著性水平与拒绝域 如果统计量的值界于左、右临界值间,则H0成立;
贾俊平统计学第6章假设检验
正态分布
01
正态分布是一种常见的概率分布 ,其概率密度函数呈钟形曲线, 具有对称性、连续性和可加性等 性质。
02
正态分布广泛存在于自然界和人 类社会中,许多随机变量都服从 或近似服从正态分布。
t分布
t分布是正态分布在自由度不同时的 另一种表现形式,其形状与正态分布 相似,但尾部概率不同。
在假设检验中,t分布在样本量较小或 总体标准差未知时常常被用来代替正 态分布进行统计分析。
界值,判断是否拒绝原假设。
双侧Z检验
总结词
双侧Z检验是用于检验一个总体均数是否与已知值存在显著差异的统计方法。
详细描述
双侧Z检验的步骤与单侧Z检验类似,但需要计算双尾Z值,并根据临界值判断是否拒绝原假设。例如,要检验某 产品的质量是否合格,可以提出原假设为产品质量合格,备择假设为产品质量不合格,然后通过计算Z值和临界 值,判断是否拒绝原假设。
03
样本统计量与抽样分布
样本均值和样本方差
样本均值
表示样本数据的平均水平,计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 为样本容量, $x_i$ 为第 $i$ 个样本数据。
样本方差
表示样本数据的离散程度,计算公式为 $S^2 = frac{1}{n-1}sum_{i=1}^{n} (x_i - bar{x})^2$,其中 $S^2$ 为样本方差,$bar{x}$ 为样本均值。
假设检验的逻辑
小概率事件原理
如果一个事件在多次试验中发生的概 率很小,那么在一次试验中该事件就 不太可能发生。
反证法
先假设原假设成立,然后根据样本数 据和统计原理,推导出与已知事实或 概率相矛盾的结论,从而拒绝原假设 。
《统计学—基于SPSS》((06)第6章--假设检验(S3)
6-4
2022-7-23
第 6 章 假设检验
6.1 假设检验的基本原理
6.1.1 怎样提出假设 6.1.2 怎样做出决策 6.1.3 怎样表述决策结果
ቤተ መጻሕፍቲ ባይዱ
6.1 假设检验的基本原理 6.1.1 怎样提出假设
统计学
基于SPSS (第 3 版)
什么是假设?
(hypothesis)
☺在参数检验中,对总体参数的具体数值 所作的陈述
2. 对样本估计量的标准化结果
原假设H0为真 点估计量的抽样分布
3. 标准化的检验统计量
标准化检验统计量
点估计量 — 假设值 点估计量的抽样标准差
6 - 21
2022-7-23
统计学
基于SPSS (第 3 版)
用统计量决策
(双侧检验 )
6 - 22
2022-7-23
统计学
基于SPSS (第 3 版)
3. 值越小,你拒绝原假设的理由就越充分
6 - 30
2022-7-23
统计学
基于SPSS (第 3 版)
多大的P 值合适?
☺ 要证明原假设不正确,P值要多小,才能令人信 服呢?
原假设的可信度又多高?如果H0所代表的假设 是人们多年来一直相信的,就需要很强的证据( 小的P值)才能说服他们
拒绝的结论是什么?如果拒绝H0而肯定H1 ,你 就需要有很强的证据显示要支持H1。比如,H1 代表要花很多钱把产品包装改换成另一种包装
就一个总体而言,总体参数包括总体均值、 比例、方差等
分析之前必需陈述
6-7
2022-7-23
统计学
基于SPSS (第 3 版)
什么是假设检验?
(hypothesis test)
第6章 假设检验(教学)
(三)显著性水平
/ 2
1. 原假设为真时,拒绝原假设的概率
2. 表示为 (alpha)
/ 2
–常用的 值有0.01, 0.05, 0.10
被称为抽样分布的拒绝域
拒绝 域
拒绝域
3. 由研究者事先确定
临界值-z a/2
H 0值
Z
临界值z a/2
4. 根据给定的显著性水平,查表得出相应的 临界值z或z/2, t或t/2
比较: z z
2
1.96
拒绝 H0
1.96
决策:在 = 0.05的水平上拒绝H0
结论:每晚长途电话通话平均
-1.96 -4
0
1.96
Z
时间发生了变化。
统计学 假设检验的应用 (例题分析p值方法)
H0: = 16
H1: 16
= 0.05 n = 100
检验统计量: x 14 16 z 4 n 5 100
(1)使用其他服务的客户如果超过30%,证明该银行
的研究结论是正确的。
(2)而研究者往往倾向于支持自己的研究结论。
H0 : 30%
H1 : 30%
右侧检验
回上级目录
回本节目录
统计学 (二)识别检验统计量及其分布
1.用于假设检验决策的统计量 2.检验统计量的基本形式为
点估计量 假设值 检验统计量 点估计量的抽样标准差
临界值
H0值
临界值
样本统计量
统计学 双侧检验 (显著性水平与拒绝域)
抽样分布
拒绝域 /2 1-
置信水平 拒绝域 /2
临界值 样本统计量
(06)第6章 假设检验(T6)PPT课件
6 - 14
7/16/2020
统计学
STATISTICS (第六版)
双侧检验与单侧检验
(假设的形式)
以总体均值的检验为例
假设
双侧检验
单侧检验 左侧检验 右侧检验
原假设 H0 : =0 H0 : 0 H0 : 0
备择假设 H1 : ≠0 H1 : <0 H1 : >0
已经成了一种 37.1 36.2 36.3 37.5 36.9
共识。下面是 一个研究人员
37.0
36.7
36.9
37.0
37.1
测量的50个健 36.6 37.2 36.4 36.6 37.3
康成年人的体 36.1 37.1 37.0 36.6 36.9
温数据
36.7 37.2 36.3 37.1 36.7
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系或总体分布于某种理论分布有差异
3. 备择假设通常用于表达研究者自己倾向于支持的 看法,然后就是想办法收集证据拒绝原假设,以 支持备择假设
alternative 4. 总是有符号 , 或 H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
36.8 37.0 37.0 36.1 37.0
6-6
7/16/2020
统计学
STATISTICS (第六版)
正常人的平均体温是37oC吗?
➢ 根据样本数据计算的平均值是36.8oC ,标准差 为0.36oC
➢ 根据参数估计方法得到的健康成年人平均体温的 95%的置信区间为(36.7,36.9)。研究人员发现 这个区间内并没有包括37oC
如何在SPSS数据分析报告中进行假设检验?
如何在SPSS数据分析报告中进行假设检验?关键信息项:1、假设检验的类型独立样本 t 检验配对样本 t 检验单因素方差分析多因素方差分析卡方检验2、数据准备要求数据的完整性数据的准确性数据的正态性异常值处理3、假设的设定原假设和备择假设的明确表述假设的合理性和基于的理论或经验基础4、检验步骤选择合适的检验方法在 SPSS 中输入数据和执行检验操作解读检验结果5、结果报告内容检验统计量的值自由度p 值效应量(如适用)6、结果的解释和结论根据 p 值做出决策对效应大小的解释结果在研究背景下的意义11 假设检验的类型在 SPSS 数据分析报告中,常见的假设检验类型包括但不限于以下几种:111 独立样本 t 检验用于比较两个独立样本的均值是否存在显著差异。
例如,比较两组不同治疗方法下患者的康复时间。
112 配对样本 t 检验适用于配对数据,即同一组对象在不同条件下或不同时间点的测量值。
比如,比较同一批患者治疗前后的体重变化。
113 单因素方差分析用于检验一个因素的不同水平对因变量的均值是否有显著影响。
例如,研究不同教育程度对收入的影响。
114 多因素方差分析当存在多个因素同时影响因变量时,使用多因素方差分析。
比如,研究教育程度和工作经验对收入的共同影响。
115 卡方检验主要用于检验两个分类变量之间是否存在关联。
例如,分析性别与某种疾病的患病率是否有关。
12 数据准备要求在进行假设检验之前,确保数据满足以下要求:121 数据的完整性数据应包含所需的所有变量和观测值,不允许有缺失值。
若存在缺失值,需要采取适当的方法进行处理,如删除含缺失值的观测、均值插补或多重插补等。
122 数据的准确性对数据进行仔细检查,确保其没有录入错误或异常值。
异常值可能会对假设检验的结果产生较大影响,需要谨慎处理。
123 数据的正态性对于一些基于正态分布假设的检验方法(如 t 检验和方差分析),需要检查数据是否近似服从正态分布。
可以通过绘制直方图、正态概率图或进行正态性检验(如 ShapiroWilk 检验)来判断。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6 - 10
2020-5-25
统计学
基于SPSS (第 3 版)
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test)
2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
6 -
基于SPSS (第 3 版)
提出假设
(例题分析)
【例6-1】一种零件的生产标准是直径应为15cm,为 对生产过程进行控制,质量监测人员定期对一台加 工机床检查,确定这台机床生产的零件是否符合标 准要求。如果零件的平均直径大于或小于15cm, 则表明生产过程不正常,必须进行调整。试陈述用 来检验生产过程是否正常的原假设和被择假设
可能犯错误
2. 原假设和备择假设不能同时成立,决策的结果要么拒绝 H0,要么不拒绝H0。决策时总是希望当原假设正确时没 有拒绝它,当原假设不正确时拒绝它,但实际上很难保 证不犯错误
3. 第Ⅰ类错误(错误)
原假设为正确时拒绝原假设
第Ⅰ类错误的概率记为,被称为显著性水平
2. 第Ⅱ类错误(错误)
原假设为错误时未拒绝原假设
4. 因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
6 - 15
2020-5-25
6.1 假设检验的基本原理 6.1.2 怎样做出决策
统计学
基于SPSS (第 3 版)
两类错误与显著性水平
1. 研究者总是希望能做出正确的决策,但由于决策是建立 在样本信息的基础之上,而样本又是随机的,因而就有
就一个总体而言,总体参数包括总体均值、 比例、方差等
分析之前必需陈述
6-7
2020-5-25
统计学
基于SPSS (第 3 版)
什么是假设检验?
(hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假设, 然后利用样本信息判断假设是否成立的统计方 法
2. 有参数检验和非参数检验
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
6 - 11
2020-5-25
统计学
基于SPSS (第 3 版)
双侧检验与单侧检验
(假设的形式)
以总体均值的检验为例
假设
双侧检验
单侧检验 左侧检验 右侧检验
原假设 H0 : =0 H0 : 0 H0 : 0
备择假设 H1 : ≠0 H1 : <0 H1 : >0
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设,用H1或Ha表示
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系
3. 备择假设通常用于表达研究者自己倾向于支持的 看法,然后就是想办法收集证据拒绝原假设,以 支持备择假设
4. 总是有符号 , 或
第Ⅱ类错误的概率记为 (Beta)
6 - 17
2020-5-25
统计学
基于SPSS (第 3 版)
两类错误的控制
1. 一般来说,对于一个给定的样本,如果犯第Ι类错误 的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ 类错误的概率定得低些较为合理;反之,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较低,则将 犯第Ⅰ类错误的概率定得高些
统计学
统计学 基于SPSS
(第二版)
—基于SPSS
课程内容 描述统计、推断统计、其他常 用方法
使用软件 SPSS
学分与课时 3学分,1~17周,每周3课时
1-1
第 6 章 假设检验
6.1 假设检验的基本原理 6.2 总体均值的检验 6.3 总体比例的检验 6.4 总体方差的检验
统计学
基于SPSS (第 3 版)
6-4
2020-5-25
第 6 章 假设检验
6.1 假设检验的基本原理
6.1.1 怎样提出假设 6.1.2 怎样做出决策 6.1.3 怎样表述决策结果
6.1 假设检验的基本原理 6.1.1 怎样提出假设
统计学
基于SPSS (第 3 版)
什么是假设?
(hypothesis)
☺在参数检验中,对总体参数的具体数值 所作的陈述
2. 所表达的含义总是指参数没有变化或变量之间没 有关系
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
6-9
2020-5-25
统计学
基于SPSS (第 3 版)
3. 逻辑上运用反证法,统计上依据小概率原理
小概率是在一次试验中,一个几乎不可能发生的 事件发生的概率
在一次试验中小概率事件一旦发生,我们就有理 由拒绝原假设
6-8
2020-5-25
统计学
基于SPSS (第 3 版)
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示
H0 : 400 H1 : < 400
6 - 14
2020-5-25
统计学
基于SPSS (第 3 版)
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 相互对立
在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设
3. 等号“=”总是放在原假设上
解:研究者想收集证据予以证明的假设应该是 “生产过程不正常”。建立的原假设和备择假 设为
H0 : 15cm H1 : 15cm
6 - 13
2020-5-25
统计学
基于SPSS (第 3 版)
提出假设
(例题分析)
【例6-2】饮用水瓶子上的标签
解:研究者抽检的意图是倾向于证实瓶子上标 签的说法并不属实 。建立的原假设和备择假设 为
学习目标
假设检验的基本思想和原理 假设检验的步骤 总体均值的检验 总体比例的检验 总体方差的检验 P值的计算与应用 用SPSS进行检验
6-3
2020-5-25
统计学
基于SPSS (第 3 版)
问题与思考 你相信饮用水瓶子标签上的说法吗
➢ 产品的外包装 上都贴有标签, 标签上通常标 有该产品的性 能说明、成分 指标等信息。 下面是农夫山 泉500ml瓶装饮 用天然水外包 装标签上给出 的“特征性指 标”信息