第9讲 均值比较
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
取值 不及格 及格 中等 良好 优秀 合计
取值区间
频数 百分比 累计百分比
0-59
1 1.30% 1.30%
60-69
9 11.69% 12.99%
70-79
19 24.68% 37.66%
80-89
32 41.56% 79.22%
90-100
16 20.78% 100.00%
0-100
77 100.00% 100.00%
五种功能各有不同,可根据数据的特征选用其中的一个过程。
单样本T检 验
三、单样本T检验
1. 概念 是检验样本均值与已知总体均值(检验值)之间是否存在差异。 统计的前提条件是:样本总体服从正态分布。 2. 计算公式 式中, 为样本均值和检验值的差。因为总体方差未知,所以用样 本方差S代替总体方差,n为样本数。 3. H0(单样本T检验的零假设):样本均值和总体均值之间不存在显著 差异。(即两者差异不大,或没有差异) (Null Hypothesis,H0——零假设或虚无假设或虚假设)
结论:Sig>0.05,接受原假设,认为两总体方差不存在显著性差异,方差 齐性
上节回顾
交叉列联表分析
1. 概念 通过频数分析,能够掌握单个变量的数据分布情况。 实际情况,还要了解和分析多个变量不同取值下的分布,掌握多变 量的联合分布特征,进而分析变量之间的相互影响和关系。 例如:户口状态和是否买房之间的关系 它包括如下两大基本任务: 1.绘制交叉列联表 2.在交叉列联表基础上,对两两变量间是否存在一定的相关性进行 分析
2.
一、假设检验的概念
1. 2.
小概率事件的含义
设事件A的概率P(A)=ε,ε是一个充分小的数,则称A为小概率事件。 小概率事件原理认为,“小概率事件在一次试验中几乎是不可能发生的。 ”例如,飞机失事是小概率事件,所以人们深信在一次外出旅行途中几乎 不会遇到问题,因而人们总是安然地飞来飞去。 再比如,假定某种商品的次品率很低,则你买到其中的一件应不会是次 品。反之,倘若你买到的商品是一件次品,那么,你一定会认为这种商品 的次品率很高。 对于小概率事件,概率要小到什么程度没有绝对标准。在通常情况下,将 概率不超过0.05的事件当作“小概率事件”;有些场合,把概率不超过0.01 或0.001看作“小概率事件”。
返回
上节回顾
频数分析
2. SPSS中的频数分布表 频数分析的基本功能:是编制频数分布表、绘制统计图,以下是几 个频数分析时常用的概念: 操作步骤:Analyze → Descriptive Statistics→Frequencies
频数(Frenquency):变量值落在某个区间或者某个取值点的个数。 百分比(Percent):各频数占总样本数的百分比。 有效百分比(Valid Percent):各频数占有效样本数的百分比。 累计百分比(Cumulative Percent):各百分比逐级累加起来的结果,最终取值是100。
• •
•
一、假设检验的概念
1.
假设检验的基本思想
假设检验所采用的逻辑推理方法是反证法。为了检验某个假设是否成立, 先假定它是正确的,然后根据抽样理论和样本信息,观察由此假设而导致 的结果是否合理,从而判断是否接受原假设。 这里的合理与否,所依据的是“小概率事件实际不可能发生的原理”。即 在一次观察中小概率事件发生了,则认为原假设是不合理的;反之,小概 率事件没有出现,则认为原假设是合理的。所以,假设检验的反证法是带 有概率性质的反证法,并非严格的逻辑证明。因为假设检验是基于样本资 料来推断总体特征的,而这种推断是在一定的置信概率下进行的。
箱图:哪些个案是奇异值?哪些个案是极端值?
K-S检验或S-W检验 原假设H0是数据服从指定的分布(如正态分布) 操作步骤: Analyze →Descriptive Statistics→Explore →plots → Normality Plots with test
如果相伴概率值(P值或Sig.值)小于或等于显著性水平0.05,则拒绝H0。 相伴概率值(P值或Sig.值)大于显著性水平0.05,则接受H0。
3.
一、假设检验的概念
假设检验的步骤
1.提出原假设和备择假设 对每个假设检验问题,一般可同时提出两个相反的假设: ●原假设 原假设又称零假设,是正待检验的假设,记为H0 ●备择假设 备择假设是拒绝原假设后可供选择的假设,记为H1 。 原假设和备择假设是相互对立的,检验结果二者必取其一。接受H0则必 须拒绝H1;反之,拒绝H1,则必须接受H0 。 原假设和备择假设不是随意提出的,应根据所检验问题的具体背景而定。 2.选择适当的统计量,并确定其分布形式 不同的假设检验问题需要选择不同的统计量作为检验统计量。
(2)考察数据的分布特征 考察数据的正态分布特征可以为以后进行统计分析时采用正确的统计 方法提供正确的依据。QQ图、直方图 (3)考察变量之间数据的相互关系 变量与变量之间相关性的考察、方差齐性的考察,是一些统计分析 过程必须事先了解的。
返回
读懂茎叶图
• • • • 茎宽是多少? 70分~79分的有多少人? 79分的有几个? 语文成绩的上下极端值 分别是多少?
均值比较的概念
二、两总体均值比较的概念
目的
研究总体之间的差异。 因为在所有数值特征中,均值是反映总体一般水平的最重要特征,因此可 以通过比较样本均值与总体均值之间的差异来判断统计分析的质量。
方法
应用统计学方法解决上述问题称为“差异的显著性检验”。 参数检验:若已知总体为正态分布,所进行差异的显著性检验。 非参数检验:若未知总体分布,所进行差异的显著性检验。
返回
小练习
• 曲线II和III的偏度,哪个为正,哪个为负?
小练习
• 曲线II和III哪个的峰度为正?哪个的峰度为 负?
频数分析
• 条形图,直方图,饼图
上节回顾
探索性分析
操作步骤:Analyze → Descriptive Statistics→Explore
1. 概念
数据探索是统计分析中非常重要的一步,可以帮助我们决定选择哪种 统计方法进行数据分析,有如下三方面的考察: (1)考察数据的正确性 考察数据中的一些异常值,分析这些值产生的原因,判断其正确性, 再决定修改、删除或保留它们。茎叶图、箱图
看 备 注 页
一、假设检验的概念
假设检验的涵义 假设检验就是事先对总体参数或总体分布形式做出一个假设, 然后利用样本的实际资料来判断原假设是否合理的一种统计分析方 法。 这里所说的判断原假设是否合理,就是指判断样本信息原假设 是否有显著差异,从而决定应接受或否定原假设。所以,假设检验 也称为显著性检验。
SPSS软件中相关的五种功能
频数分析(Frenquencies): 描述统计量(Descriptives): 探索性分析(Explore): 交叉列联表(Crosstabs): 比率分析(Ratio): P-P图 Q-Q图
上节回顾
基本描述统计量
1. 概念
通过频数分析对数据的总体分布状况有了基本了解之后,通常 还需要对定距变量的分布特征有更为精确的认识,这就需要通过计 算基本描述统计量等途径来实现。
(alternative hypothesis ,H1——择一假设或备择假设或另一假设)
三、单样本T检验
4. 解释方法 是检验样本均值与已知总体均值之间是否存在差异。 5. 统计的前提条件是:样本总体服从正态分布。 由于该统计量服从n-1个自由度的T分布,SPSS将根据T分布表给出t 值对应的相伴概率值P。 6. 检验结果的判断 (1)如果相伴概率值(P值或Sig.值)小于或等于用户假设的 显著性水平α=0.05,则拒绝H0,认为样本均值和总体均值之间存 在显著性差异。 (2)相反,相伴概率值(P值或Sig.值)大于显著性水平α= 0.05,则接受H0,认为样本均值和总体均值之间不存在显著性差异。
结论:Sig>0.05,接受原假设,认为观测值符合正态分布
方差齐性检验 方差齐性原假设H0:认为两总体方差之间不存在显著性差异,方差齐性。 操作步骤: Analyze →Descriptive Statistics→Explore →plot → untansformed
如果相伴概率值(P值或Sig.值)小于或等于显著性水平0.05,则拒 绝H0。 相伴概率值(P值或Sig.值)大于显著性水平0.05,则接受H0。
一、假设检验的概念
•
假设检验的举例
某工厂用自动包装机装箱,每箱标准重量为100千克,每天每隔2小时需要 检查包装工作是否正常。根据以往的经验,用包装机装箱,每箱的重量标 准差σ为1.15千克。某日开机2小时以后,随机抽取了9箱,重量(单位:千 克)分别为:99.3, 98.7, 100.5, 101.2, 98.3, 99.7, 99.5, 102.1 ,100.5 问包装机工作是否正常? 在本例中,要检验包装机是否正常工作,即检验装箱的重量是否符合 标准100千克。假设其装箱的重量符合100千克(原假设H0),然后根据抽 取的9箱样品平均重量,运用假设检验的分析方法,能够很容易地判断原假 设是否正确,并由此得出包装机是否正常的结论。 上述例子是一个关于用样本平均数来判断总体平均数是否符合标准的 假设检验问题。可以判断,如果样本平均数与总体平均数之间的差异不大 ,未超出抽样误差范围,则认为总体平均数符合规定的标准;反之,如果 样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平 均数不符合规定的标准。
ຫໍສະໝຸດ Baidu 第9讲
均值比较
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
假设检 验
一、假设检验的概念
样本与总体 从样本中计算出来的数值,通常称为统计量(Statistics),在 总体中的数值,即为参数(Parameters)。 由样本统计量来估计总体参数有两种方法:点估计和区间估计。
SPSS软件中Compare Means相关的五种功能
两个总体均值的比较(Mean): 单样本T检验(One-Samples T Test): 独立样本T检验(Independent-Samples T Test): 配对样本T检验(Paired-Samples T Test): 单因素方差分析(One-Way ANOVA):
常见的描述统计量大致可以分为三类: 操作步骤:Analyze→Descriptive Statistics→Descriptives 第一类:描述集中趋势的统计量 例如:平均值、中位数、众数、求和 第二类:描述离散趋势的统计量 例如:方差、标准差、极差、最大值、最小值、均值标准误差 第三类:描述分布形态的统计量 例如:偏度、峰度
上节回顾
描述性统计
目的
通过变量的描述性统计分析,能够掌握和了解样本数据的统计特征和总体分布形 态,进而更深入地揭示变量变化的统计规律。
方法
数据计算:计算常见的描述性统计量的值,准确反映样本数据的统计特征。 图形绘制:绘制常见的统计图形,通过图形来直观展现数据的分布特征,比较 数据分布的异同。 通常,两种方法混合使用。
一、假设检验的概念
假设检验的步骤
3.选择显著性水平α 显著性水平表示当H0为真时拒绝H0的概率,即拒绝原假设所冒的风险,用 α表示。通常取α = 0.1、0.05或0.01等。 4.做出结论 根据样本资料计算出检验统计量的具体数值(及伴随概率P),并用它与临 界值相比较,做出接受或拒绝原假设Ho的结论。 ●如果检验统计量的数值落在拒绝区域内(P<= α ),说明样本所描述的情 况与原假设有显著性差异,应拒绝原假设; ●相反,如果检验统计量的数值落在接受区域内(P>α ),说明样本所描述 的情况与原假设没有显著性差异,应当接受原假设。
返回
用卡方检验判断两变量的关系
卡方检验是以2分布为基础的一种假设检验方法,主要用于分类变量,根据样本 数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否 相关或相互独立。其原假设H0为:观察频数与期望频数没有差别 具体问题:H0假设:户口状态在是否买房看法上无显著差异
操作步骤: Analyze →Descriptive Statistics→Crosstabs →statistic → chi-square
取值区间
频数 百分比 累计百分比
0-59
1 1.30% 1.30%
60-69
9 11.69% 12.99%
70-79
19 24.68% 37.66%
80-89
32 41.56% 79.22%
90-100
16 20.78% 100.00%
0-100
77 100.00% 100.00%
五种功能各有不同,可根据数据的特征选用其中的一个过程。
单样本T检 验
三、单样本T检验
1. 概念 是检验样本均值与已知总体均值(检验值)之间是否存在差异。 统计的前提条件是:样本总体服从正态分布。 2. 计算公式 式中, 为样本均值和检验值的差。因为总体方差未知,所以用样 本方差S代替总体方差,n为样本数。 3. H0(单样本T检验的零假设):样本均值和总体均值之间不存在显著 差异。(即两者差异不大,或没有差异) (Null Hypothesis,H0——零假设或虚无假设或虚假设)
结论:Sig>0.05,接受原假设,认为两总体方差不存在显著性差异,方差 齐性
上节回顾
交叉列联表分析
1. 概念 通过频数分析,能够掌握单个变量的数据分布情况。 实际情况,还要了解和分析多个变量不同取值下的分布,掌握多变 量的联合分布特征,进而分析变量之间的相互影响和关系。 例如:户口状态和是否买房之间的关系 它包括如下两大基本任务: 1.绘制交叉列联表 2.在交叉列联表基础上,对两两变量间是否存在一定的相关性进行 分析
2.
一、假设检验的概念
1. 2.
小概率事件的含义
设事件A的概率P(A)=ε,ε是一个充分小的数,则称A为小概率事件。 小概率事件原理认为,“小概率事件在一次试验中几乎是不可能发生的。 ”例如,飞机失事是小概率事件,所以人们深信在一次外出旅行途中几乎 不会遇到问题,因而人们总是安然地飞来飞去。 再比如,假定某种商品的次品率很低,则你买到其中的一件应不会是次 品。反之,倘若你买到的商品是一件次品,那么,你一定会认为这种商品 的次品率很高。 对于小概率事件,概率要小到什么程度没有绝对标准。在通常情况下,将 概率不超过0.05的事件当作“小概率事件”;有些场合,把概率不超过0.01 或0.001看作“小概率事件”。
返回
上节回顾
频数分析
2. SPSS中的频数分布表 频数分析的基本功能:是编制频数分布表、绘制统计图,以下是几 个频数分析时常用的概念: 操作步骤:Analyze → Descriptive Statistics→Frequencies
频数(Frenquency):变量值落在某个区间或者某个取值点的个数。 百分比(Percent):各频数占总样本数的百分比。 有效百分比(Valid Percent):各频数占有效样本数的百分比。 累计百分比(Cumulative Percent):各百分比逐级累加起来的结果,最终取值是100。
• •
•
一、假设检验的概念
1.
假设检验的基本思想
假设检验所采用的逻辑推理方法是反证法。为了检验某个假设是否成立, 先假定它是正确的,然后根据抽样理论和样本信息,观察由此假设而导致 的结果是否合理,从而判断是否接受原假设。 这里的合理与否,所依据的是“小概率事件实际不可能发生的原理”。即 在一次观察中小概率事件发生了,则认为原假设是不合理的;反之,小概 率事件没有出现,则认为原假设是合理的。所以,假设检验的反证法是带 有概率性质的反证法,并非严格的逻辑证明。因为假设检验是基于样本资 料来推断总体特征的,而这种推断是在一定的置信概率下进行的。
箱图:哪些个案是奇异值?哪些个案是极端值?
K-S检验或S-W检验 原假设H0是数据服从指定的分布(如正态分布) 操作步骤: Analyze →Descriptive Statistics→Explore →plots → Normality Plots with test
如果相伴概率值(P值或Sig.值)小于或等于显著性水平0.05,则拒绝H0。 相伴概率值(P值或Sig.值)大于显著性水平0.05,则接受H0。
3.
一、假设检验的概念
假设检验的步骤
1.提出原假设和备择假设 对每个假设检验问题,一般可同时提出两个相反的假设: ●原假设 原假设又称零假设,是正待检验的假设,记为H0 ●备择假设 备择假设是拒绝原假设后可供选择的假设,记为H1 。 原假设和备择假设是相互对立的,检验结果二者必取其一。接受H0则必 须拒绝H1;反之,拒绝H1,则必须接受H0 。 原假设和备择假设不是随意提出的,应根据所检验问题的具体背景而定。 2.选择适当的统计量,并确定其分布形式 不同的假设检验问题需要选择不同的统计量作为检验统计量。
(2)考察数据的分布特征 考察数据的正态分布特征可以为以后进行统计分析时采用正确的统计 方法提供正确的依据。QQ图、直方图 (3)考察变量之间数据的相互关系 变量与变量之间相关性的考察、方差齐性的考察,是一些统计分析 过程必须事先了解的。
返回
读懂茎叶图
• • • • 茎宽是多少? 70分~79分的有多少人? 79分的有几个? 语文成绩的上下极端值 分别是多少?
均值比较的概念
二、两总体均值比较的概念
目的
研究总体之间的差异。 因为在所有数值特征中,均值是反映总体一般水平的最重要特征,因此可 以通过比较样本均值与总体均值之间的差异来判断统计分析的质量。
方法
应用统计学方法解决上述问题称为“差异的显著性检验”。 参数检验:若已知总体为正态分布,所进行差异的显著性检验。 非参数检验:若未知总体分布,所进行差异的显著性检验。
返回
小练习
• 曲线II和III的偏度,哪个为正,哪个为负?
小练习
• 曲线II和III哪个的峰度为正?哪个的峰度为 负?
频数分析
• 条形图,直方图,饼图
上节回顾
探索性分析
操作步骤:Analyze → Descriptive Statistics→Explore
1. 概念
数据探索是统计分析中非常重要的一步,可以帮助我们决定选择哪种 统计方法进行数据分析,有如下三方面的考察: (1)考察数据的正确性 考察数据中的一些异常值,分析这些值产生的原因,判断其正确性, 再决定修改、删除或保留它们。茎叶图、箱图
看 备 注 页
一、假设检验的概念
假设检验的涵义 假设检验就是事先对总体参数或总体分布形式做出一个假设, 然后利用样本的实际资料来判断原假设是否合理的一种统计分析方 法。 这里所说的判断原假设是否合理,就是指判断样本信息原假设 是否有显著差异,从而决定应接受或否定原假设。所以,假设检验 也称为显著性检验。
SPSS软件中相关的五种功能
频数分析(Frenquencies): 描述统计量(Descriptives): 探索性分析(Explore): 交叉列联表(Crosstabs): 比率分析(Ratio): P-P图 Q-Q图
上节回顾
基本描述统计量
1. 概念
通过频数分析对数据的总体分布状况有了基本了解之后,通常 还需要对定距变量的分布特征有更为精确的认识,这就需要通过计 算基本描述统计量等途径来实现。
(alternative hypothesis ,H1——择一假设或备择假设或另一假设)
三、单样本T检验
4. 解释方法 是检验样本均值与已知总体均值之间是否存在差异。 5. 统计的前提条件是:样本总体服从正态分布。 由于该统计量服从n-1个自由度的T分布,SPSS将根据T分布表给出t 值对应的相伴概率值P。 6. 检验结果的判断 (1)如果相伴概率值(P值或Sig.值)小于或等于用户假设的 显著性水平α=0.05,则拒绝H0,认为样本均值和总体均值之间存 在显著性差异。 (2)相反,相伴概率值(P值或Sig.值)大于显著性水平α= 0.05,则接受H0,认为样本均值和总体均值之间不存在显著性差异。
结论:Sig>0.05,接受原假设,认为观测值符合正态分布
方差齐性检验 方差齐性原假设H0:认为两总体方差之间不存在显著性差异,方差齐性。 操作步骤: Analyze →Descriptive Statistics→Explore →plot → untansformed
如果相伴概率值(P值或Sig.值)小于或等于显著性水平0.05,则拒 绝H0。 相伴概率值(P值或Sig.值)大于显著性水平0.05,则接受H0。
一、假设检验的概念
•
假设检验的举例
某工厂用自动包装机装箱,每箱标准重量为100千克,每天每隔2小时需要 检查包装工作是否正常。根据以往的经验,用包装机装箱,每箱的重量标 准差σ为1.15千克。某日开机2小时以后,随机抽取了9箱,重量(单位:千 克)分别为:99.3, 98.7, 100.5, 101.2, 98.3, 99.7, 99.5, 102.1 ,100.5 问包装机工作是否正常? 在本例中,要检验包装机是否正常工作,即检验装箱的重量是否符合 标准100千克。假设其装箱的重量符合100千克(原假设H0),然后根据抽 取的9箱样品平均重量,运用假设检验的分析方法,能够很容易地判断原假 设是否正确,并由此得出包装机是否正常的结论。 上述例子是一个关于用样本平均数来判断总体平均数是否符合标准的 假设检验问题。可以判断,如果样本平均数与总体平均数之间的差异不大 ,未超出抽样误差范围,则认为总体平均数符合规定的标准;反之,如果 样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平 均数不符合规定的标准。
ຫໍສະໝຸດ Baidu 第9讲
均值比较
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
假设检 验
一、假设检验的概念
样本与总体 从样本中计算出来的数值,通常称为统计量(Statistics),在 总体中的数值,即为参数(Parameters)。 由样本统计量来估计总体参数有两种方法:点估计和区间估计。
SPSS软件中Compare Means相关的五种功能
两个总体均值的比较(Mean): 单样本T检验(One-Samples T Test): 独立样本T检验(Independent-Samples T Test): 配对样本T检验(Paired-Samples T Test): 单因素方差分析(One-Way ANOVA):
常见的描述统计量大致可以分为三类: 操作步骤:Analyze→Descriptive Statistics→Descriptives 第一类:描述集中趋势的统计量 例如:平均值、中位数、众数、求和 第二类:描述离散趋势的统计量 例如:方差、标准差、极差、最大值、最小值、均值标准误差 第三类:描述分布形态的统计量 例如:偏度、峰度
上节回顾
描述性统计
目的
通过变量的描述性统计分析,能够掌握和了解样本数据的统计特征和总体分布形 态,进而更深入地揭示变量变化的统计规律。
方法
数据计算:计算常见的描述性统计量的值,准确反映样本数据的统计特征。 图形绘制:绘制常见的统计图形,通过图形来直观展现数据的分布特征,比较 数据分布的异同。 通常,两种方法混合使用。
一、假设检验的概念
假设检验的步骤
3.选择显著性水平α 显著性水平表示当H0为真时拒绝H0的概率,即拒绝原假设所冒的风险,用 α表示。通常取α = 0.1、0.05或0.01等。 4.做出结论 根据样本资料计算出检验统计量的具体数值(及伴随概率P),并用它与临 界值相比较,做出接受或拒绝原假设Ho的结论。 ●如果检验统计量的数值落在拒绝区域内(P<= α ),说明样本所描述的情 况与原假设有显著性差异,应拒绝原假设; ●相反,如果检验统计量的数值落在接受区域内(P>α ),说明样本所描述 的情况与原假设没有显著性差异,应当接受原假设。
返回
用卡方检验判断两变量的关系
卡方检验是以2分布为基础的一种假设检验方法,主要用于分类变量,根据样本 数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否 相关或相互独立。其原假设H0为:观察频数与期望频数没有差别 具体问题:H0假设:户口状态在是否买房看法上无显著差异
操作步骤: Analyze →Descriptive Statistics→Crosstabs →statistic → chi-square