第四讲 连续变量的参数检验:均值比较检验
第6章 SPSS参数检验——均值比较
总体2
抽取简单随机样均值之差的检验 (s12、 s22 已知)
• 1.假定条件
两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和
n230) 2.检验统计量为
Z ( X1 - X 2 ) - (m1 - m2 ) ~ N (0,1)
6.2 MEANS 过程
• 功能:分组计算、比较指定变量的描述统计量。包括均值、 标准差、总和、观测数、方差等等,还可以给出方差分析表 和线性检验结果。
• Analyze-> Compare Means->Means
n Dependent List:用于选入需要分析的变量,如果选入两 个以上变量,系统会在同一张输出表中依次给出分析结果 。
)
1. 检验具有不等方差的两个总体 的均值
2. 假定条件
两个样本是独立的随机样本
两个总体都是正态分布
两个总体方差未知且不相等 s12 s22
3. 检验统计量
( S12 S22 )2
t
(
X1
-
X2) S12 n1
- (m1 S22
n2
-
m2
)
~
t(
(
S12 n1
)2
/(
n1
n1 -1)
s
2 1
s
2 2
n1 n2
两个总体均值之差的检验 (s12、 s22 未知,大样本)
• 检验统计量为
Z (X1 - X 2 ) - (m1 - m2 ) ~ N (0,1)
s12 s22 n1 n2
两个总体均值之差的检验 (s12、 s22 未知但相等,小样本)
第四章-连续变量的描述统计
条图 饼图 直方图
正曲线
结果输出-直方图
Format子对话框
Format 子对话框主要是定义输出频数表的格式。
选择两个以上变量 作频数表
定义频数表 排列顺序
限制分组数
Descriptive过程
它可对变量进行描述性统计分析,计算并列出一系列相应的统计指标, 这和其他过程相比并无不同。
该过程可将原始数据转换成标准正态分值,并以变量的形式存入数据 库供以后分析。
4.1 连续变量的统计描述概述
统计描述的工具
统计描述指标
统计图
统计表
数据分布的特征
集中趋势 (位置)
离中趋势 (分散程度)
偏态和峰度 (形状)
连续变量统计描述的常用指标
统计描述指标
集中趋势
离散趋势
均值
众数
中位数
极差
四分位差
方差
4.2 集中趋势的描述指标
一组数据向其中心值靠拢的倾向和程度; 测度集中趋势就是寻找数据一般水平的代表值或中心值;
集中趋势测度-均值
集中趋势的测度值之一; 最常用的测度值; 一组数据的均衡点所在; 设一组数据为:x1 ,x2 ,… ,xn ,简单算术平均数的计算公式为:
n
x x1 x2 xn i1 xi
n
n
集中趋势测度-中位数
集中趋势的测度值之一;
排序后处于中间位置上的值:
50%
50% Me
117 122 124 129 107 117 130 122 110 118 123 126 127 123 118 112 100 125 117 122 126 122 118 108 112 127 123 119 113 120
spss课件-均值比较与检验
差、總和、觀測數、方差等等,還可以給出方差分析表和線性檢驗 結果。描述統計量公式P126。
Analyze-> Compare Means->Means
• Dependent List:因變數(分析變數,一般為定距或定序變數) • Independent List:引數(分組變數,為分類變數,注意可分
要求:a. 被比較的兩組樣本彼此獨立, 沒有
配對關係 b. 兩組樣本均來自正態總體 c. 均值是對於檢驗有意義的描述統計量
兩組樣本方差相等和不等時使用的計算t值的公式不 同。因此應該先對方差進行齊次性檢驗。SPSS的輸出, 在給出方差齊和不齊兩種計算結果的t值,和t檢驗的 顯著性概率的同時,還給出對方差齊次性檢驗的F值 和F檢驗的顯著性概率。用戶需要根據F檢驗的結果自 己判斷選擇t檢驗輸出中的哪個結果,得出最後結論。
能否用樣本均值估計總體均值?兩個變數均值接近的 樣本是否來自均值相同的總體?換句話說,兩組樣本 某變數均值不同,其差異是否具有統計意義?能否說 明總體差異?這是各種研究工作中經常提出的問題。 這就要進行均值比較。
8.1.2 進行均值比較及檢驗的過程
MEANS過程:不同水準下(不同組)的描述統計量,如男女
的平均工資,各工種的平均工資。目的在於比較。術語:水準數 (指分類變數的值數,如sex變數有2個值,稱為有兩個水準)、 單元Cell(指因變數按分類變數值所分的組)、水準組合
T test 過程:對樣本進行T檢驗的過程
• 單一樣本的T檢驗:檢驗單個變數的均值是否與給定的常數之 間存在差異。
• 獨立樣本的T檢驗:檢驗兩組不相關的樣本是否來自具有相同 均值的總體(均值是否相同,如男女的平均收入是否相同,是 否有顯著性差異)
【高质量】均值比较与检验PPT文档
1、检验统计量未落入拒绝域内,仅仅是不拒绝它,并不能代表就一定要接受它。
慢性支气管炎病人血液中胆碱单酯酶样活性本常t常检偏高验。是检验样本均值和总体均值是否相等。而独立 21、 、样比本较来内自容的不总同体要服从正两态分样布。本t检验是检验两个独立样本的均值是否相等。
4、选取不同分层变量对结果的影响 (1)分组变量设置为一层,则输出两个独立的表格。
如上图, 将两个分组变量“sex”和“area”定义在同一层内, 即二者是平等的关系,所以会分别按照性别和地区分组输出 两张基本信息表。
• (2)分组变量设置为两层,则输出一个交叉表格。 如上图,将“sex”作为第一层分组变量,“area”作为第二层分 组变量,二者之间是有层次关系的,所以最后输出的是先按 性别分组,在同一性别内再按地区分组的一张基本信息表。
析过程
• 男女身高比较
已知从甲、乙两地各抽取60名12岁的学生,其中男女各占 一半,利用【Means】过程比较身高是否受地区和性别的影 响。执行【Analyze】/【Compare Means】/【Means】命令 ,弹出如图所示对话框
• 结果解读 1、数据摘要与基本分组信息 2、方差分析结果
3、相关性度量表
• 结果解读 1、分组统计量 2、独立两样本t检验
方差齐次性检验
t检验结果
3.5 配对样本t检验
• 原理概述 1、配对样本t检验是配对设计的样本差数的均值同总体均值0
比较的t检验。
2、配对样本t检验是针对配对数据的t检验。其检验方法是首 先求出每对样本的差值,然后比较样本差值的均值和总体均 值0之间的关系。
均值比较与检验
(优选)均值比较与检验
SPSS统计分析第四章均值比较与T检验
N 258 216
Mean $41441.8 $26031.9
Std. Dev iation $19,499.214 $7,558.021
Std. Error Mean $1213.97
$514.258
左第一栏为分析变量标签和分类变量标签 N观测量数目 Mean均值 Std. Deviation标准差 Std. Error Mean标准误
三、配对样本T检验
配对样本T检验(Paired Sample T test)用 于检验两个相关的样本是否来自具有相同均 值的总体。这种相关的或配对的样本常常来 自这样的实验结果,在实验中被观测对象在 实验前后均被观测。两个变量可以是before after,配对分析的测度也不是必须来自同一 个观测对象。一对可以两者组合而成。
练习题
已知某水样中含CaCO3的真值为20.7mg/L, 现用某方法重复测定该水样11次CaCO3的含 量(mg/L)为:20.99,20.41,20.10, 20.00,20.91,22.60,20.99,20.41, 20.00,23.00,22.00。问该方法测得的均值 是否偏高?
2、Independent Sample T test(独立样本T检验)
例题一
现有银行雇员工资为例,检验男女雇员现工 资是否有显著差异。一个是要比较salary变量 的均值,另一个是gender变量作为分水平变 量。 (data09--03) 。
分析变量的简单描述性统计量
Gender Current Salary Male
F emale
Group Statistics
如果你试图比较的变量明显不是正态分布的,则应该 考虑使用一种非参数检验过程(Nonparametric test)。 如果想比较的变量是分类变量,应该使用Crosstabs 功能。
连续变量的两样本课件平均水平比较
•
我们这个世界,从不会给一个伤心的 落伍者 颁发奖 牌。。2 0.8.112 0.8.110 7:51:08 07:51:0 8Augus t 11, 2020
•
没有承受困难的能力,就没有希望了 。
•
在漫长的人生旅途中,有时要苦苦撑 持暗无 天日的 境遇; 有时却 风光绝 项,无 人能比 。。202 0年8月 11日上 午7时5 1分20. 8.1120. 8.11
•
一个成功的决策,等于90%的信息加 上10%的 直觉。 。2020 年8月1 1日星 期二7时 51分8 秒Tuesday, August 11, 2020
•
幸运之神会光顾世界上的每一个人, 但如果 她发现 这个人 并没有 准备好 要迎接 她时, 她就会 从大门 里走进 来,然 后从窗 子里飞 出去。 。20.8.1 12020 年8月11 日星期 二7时5 1分8秒 20.8.11
n1 n2 2
n1 n1
两样本进行t检验举例
❖ 两样本标准误
s X1 X2
与H0是否为真无关
❖ X1 X2 是两个总体均数之差的点估计,因此当
H0: µ1=µ2成立时,X1 X2 在大多数情况下非常小 或较小,故t检验统计量较小或比较小。
反之,当H1:µ1µ2,在大多数情况下 X1 X2 较大或很大,所以t检验统计量比较大或很大。
❖两样本 t 检验,其假设一般为:
H0:µ1=µ2,即两样本来自的总体均数相等, H1:µ1µ2,即两样本来自的总体均数不相等,
检验水准为0.05。
两样本进行t检验举例
❖ 两样本t检验统计量
均值比较(T检验,方差检验,非参数检验汇总)
均值⽐较(T检验,⽅差检验,⾮参数检验汇总)⼀、T检验⽤途:⽐较两组数据之间的差异前提:正态性,⽅差齐次性,独⽴性假设:H0: µ0=µ1H1: µ0≠µ1SPSS中对应⽅法:1、单样本T检验(One-sample Test)(1)⽬的:检验单个变量的均值与给定的某个常数是否⼀致。
(2)判断标准:p<0.05;t>1.98即认为是有显著差异的。
2、独⽴样本T检验(Indpendent-Samples T Test)(1)⽬的:检验两个独⽴样本均值是否相等。
(2)判断标准:p<0.05;t>1.98即认为是有显著差异的。
3、配对样本T检验(Paired-Samples T Test)(1)⽬的:检验两个配对样本均值是否相等。
(2)判断标准:p<0.05;t>1.98即认为是有显著差异的。
⼆、⽅差分析⽤途:⽐较多组数据之间的差异前提:正态性,⽅差齐次性,独⽴性假设:H0: µ0=µ1=……H1: µ0,µ1,……不全相等SPSS中对应⽅法:1、单因素⽅差分析(One-way ANOVA)(1)⽬的:检验由单⼀因素影响的多组样本均值差异。
(2)判断标准:p<0.05;t>1.98即认为是有显著差异的。
(3)特别说明:可以进⼀步使⽤LSD,Tukey⽅法检验两两之间的差异。
2、多因素⽅差分析(Univariate)(1)⽬的:检验由多个因素影响的多组样本均值差异。
(2)判断标准:p<0.05;t>1.98即认为是有显著差异的。
(3)特别说明:可以进⼀步使⽤LSD,Tukey⽅法检验两两之间的差异。
三、⾮参数检验⽤途:⽐较多组数据之间的差异,独⽴性等前提:没有严格限制,适⽤于母体不服从正态分布或分布情况不明时,亦可以适⽤于离散和连续数据。
SPSS中对应⽅法:1、卡⽅检验(Chi-Square)(1)⽬的:检验某个连续变量是否与理论的某种分布相⼀致;检验某个分类变量出现的概率是否等于给定的概率;检验两个分类变量是否相互独⽴;检验两种⽅法的结果是否⼀致;检验控制某种或某⼏种分类因素的作⽤后,另两个分类变量是否相互独⽴。
第四讲连续变量的参数检验:均值比较检验ppt课件
Option选项用来指定缺失值的处理方法。 其中: (1)Exclude cases analysis by analysis表示 计算时涉及的变量上有缺失值,则剔除在该 变量上为缺失值的个案; (2)Exclude cases listwise表示剔除所有在任 意变量上含有缺失值的个案后再进行分析。
【比较均值】子菜单
均值:分组计算样本的描述性统计量。
单样本t检验:单样本t检验,即比较样本均值和总 体均值的t检验。
独立样本 t检验:独立两样本t检验,即比较两独立 样本均值的t检验。
配对样本t检验:配对样本t检验,即比较配对设计 的差数均值与0的t检验。
单因素 ANOVA:单因素方差分析。
方法二:运用“探索分析”,
练习:1. 分析2007年4 月总指数是否服从正态 分布。
2.比较三个城市总指数 的箱线图。
2007年4月总指数的正态性检验和Q-Q图
2007年4月三个城市总指数的箱线图
2007年4月三个城市总指数的比较:
第二节 单样本的t检验
一、检验目和条件 检验单个变量的均值是否与给定的常数(总 体均值)之间是否存在显著差异。如:分析 学生的IQ平均分是否为100分;大学生考研 率是否为5%。
2 1
22
n1 n2
两个总体均值之差的检验 (12、 22 未知,大样本) 检验统计量为
Z(X1X2)(12)~N(0,1)
s12 s22 n1 n2
两个总体均值之差的检验 (12、 22 未知但相等,小样本)
1. 检验具有等方差的两个总体的均值 2. 假定条件
两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等 3. 检验统计量
什么是P 值?
连续性变量的统计描述与参数估计PPT课件
目录
• 连续性变量的统计描述 • 参数估计基础 • 参数估计方法 • 实例分析
01 连续性变量的统计描述
均值
总结词
描述数据集的中心趋势
详细描述
均值是一组数据之和除以数据的数量,表示数据的平均水平。在连续性变量中, 均值用于描述数据集的中心趋势,反映数据的平均值。
最小二乘法估计的缺点是对于非 线性模型和异方差性,估计结果
可能不够准确。
04 实例分析
实例一:正态分布的统计描述与参数估计
均值
表示数据的“平均水平”或“中心趋 势”。
方差
表示数据离散程度,即数据分布的宽 度或广度。
实例一:正态分布的统计描述与参数估计
标准差
方差的平方根,也是衡量数据离 散程度的重要指标。
03 参数估计方法
矩法估计
矩法估计是一种基于样本矩的 参数估计方法,通过样本矩来 估计总体矩,进而得到参数的 估计值。
矩法估计的优点是简单易行, 不需要复杂的数学推导和计算, 适用于多种分布类型。
矩法估计的缺点是对于非线性 模型和复杂分布类型,估计结 果可能不够准确。
极大似然估计
极大似然估计是一种基于概率模型的参数估计方法,通过最大化似然函数来估计参 数。
方差
总结词
描述数据离散程度
详细描述
方差是一组数据与其均值的离差平方和的平均值,用于衡量数据离散程度。方差越大,表示数据点与均值的离散 程度越高;方差越小,表示数据点越接近均值。
标准差
总结词
方差的平方根,衡量数据离散程度
详细描述
标准差是方差的平方根,与方差一样,用于衡量连续性变量的离散程度。标准差是实际应用中常用的 一种离散程度指标。
第四讲 连续变量的参数检验:均值比较检验
方法二:运用“探索分析”,
练习:1. 分析2007年4 月总指数是否服从正态 分布。 2.比较三个城市总指数 的箱线图。
2007年4月总指数的正态性检验和Q-Q图
2007年4月三个城市总指数的箱线图
2007年4月三个城市总指数的比较:
第二节 单样本的t检验
一、检验目和条件 检验单个变量的均值是否与给定的常数(总 体均值)之间是否存在显著差异。如:分析 学生的IQ平均分是否为100分;大学生考研 率是否为5%。
( X 1 X 2 ) ( 1 2 ) t ~ t (n1 n2 2) 1 1 Sp n1 n2
(n1 1) S12 (n2 1) S 22 2 Sp 其中: n1 n2 2
两个总体均值之差的检验 (12、 22 未知且不相等,小样本)
1. 2. 检验具有不等方差的两个总体的均值 假定条件
计算检验统计量和概率P值
X 0 t S n
给定显著性水平与p值做比较:如果p值小于显著性水 平,小概率事件在一次实验中发生,则我们应该拒绝 原假设,反之就不能拒绝原假设。
三、单样本t检验的SPSS实现
案列:检验2007年4月3个一线城市的消费者信 心指数值是否和基准值100存在显著差异。
第四讲 连续变量的统计推断(一):均值比较的t检验
第一节、假设检验概述 第二节、单样本的T检验 第三节、两独立样本的T检验 第四节、两配对样本的T检验
第一节 假设检验概述
一、推断统计与假设检验 推断统计是根据样本数据推断总体数量特征的统 计分析方法。 根据样本来推断总体的原因:
均值比较与检验培训资料(ppt 43页)
偏度:
Ske wnN es s
(N 1 )N (2 )
(xix)3 S3
N≥2,S>0
返回 7
【例5.1】
数据文件data06-01.sav为27名学生的身高数据。按 两个分类变量性别和年龄分组,求身高的算术均 值、中位数、几何均值、调和均值等统计量,并 检验不同性别和不同年龄的学生身高是否有显著 差异?给定显著性水平α=0.05(教材P165)
Within Groups
.020
Hale Waihona Puke 23 .001Total
.125
26
Sig. .000 .000 .020
身高按年龄分组的方差分析表中的统计量 F=39.587,p= 0.000<α=0.05,拒绝H0,即不同 年龄段学生的身高有显著差异。
13
结果与分析:
Measures of Association R Square E Ed tta a Squared
身高.8 * 7 年 9 龄 .772 .915 .838
η=0.149,η2=0.022,表明身高与年龄之间的关系 密切。 R=0.879,R2=0.772,表明回归方程的预测性能较 好,即身高与年龄之间的线性关系较好。
14
5.3单一样本t检验(One-Sample T test)
功能:检验单个变量的均值与指定常数之间的差异是否显著。 检验样本均值与总体均值之间的差异显著性属于单一样本t检 验。
Sum of
SquaresM dfean SquarF e Sig.
*B性 etw 别 een (CG orm ou b.p i0ns0e3d)
1 .003 .569 .458
连续型随机变量的参数估计与检验
第四章 连续型随机变量的参数估计与检验第一节 参数估计一、主要内容点估计、估计量的评选标准(无偏性、有效性、一致性)以及区间估计的基本概念,正态总体均数与方差的区间估计计算。
二、教学要求理解无偏性、有效性、一致性的思想,熟悉正态总体均数与方差的区间估计计算。
三、例题分析例1 设()123,,ξξξ为取自总体ξ的样本,且 E ξμ=,2D ξσ=均存在,试证明统计量 ()11123123111,,333μμξξξξξξ∧∧==++,()22123123124,,777μμξξξξξξ∧∧==++都是μ的无偏估计量,并判断哪一个统计量更有效。
解 由无偏估计量的定义知,只要证明1E μμ∧=,2E μμ∧=,就能证明1μ∧与2μ∧均为μ的无偏估计量。
因为 ()123,,ξξξ为取自总体ξ的样本,所以123,,ξξξ 相互独立,且与ξ同分布,于是有 123E E E E ξξξξμ==== ,2123D D D D ξξξξσ====从而 1123123111111333333E E E E E μξξξξξξμ∧⎛⎫=++=++= ⎪⎝⎭2123123124124777777E E E E E μξξξξξξμ∧⎛⎫=++=++= ⎪⎝⎭故1μ∧与2μ∧均为μ的无偏估计量。
由有效性的定义知要比较两个估计量的有效性只要比较它们的方差大小。
因为 2112312311112413339993D D D D D μξξξξξξσ∧⎛⎫=++=++= ⎪⎝⎭22123123124141637774949497D D D D D μξξξξξξσ∧⎛⎫=++=++= ⎪⎝⎭显然,12D D μμ∧∧<,说明1μ∧更有效。
例2 设正态总体(),0.1N μ容量为4的样本均数为5.58,试求总体均数μ的99%置信区间。
解 因10.99α-=,001α=,查表得0.005 2.58u =,又已知 5.58x =,0.1σ=,n=4, 于是25.58 2.58 5.580.129x u α±=±=± 故总体均数μ的99%置信区间为(5.451,5.709)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
输出默认95%的置信区间。
在检验值框中输入检验值100
Option选项用来指定缺失值的处理方法。 其中: (1)Exclude cases analysis by analysis表示 计算时涉及的变量上有缺失值,则剔除在该 变量上为缺失值的个案; (2)Exclude cases listwise表示剔除所有在任 意变量上含有缺失值的个案后再进行分析。 可见,较第二种方式,第一种处理方式较充 分地利用了样本数据。在后面的分析方法中, SPSS对缺失值的处理方法与此相同,不再 赘述。
1/2 P 值
临界值
计算出的样本统计量
H0值
临界值
Z
计算出的样本统计量
左侧检验的P 值
抽样分布
拒绝域 置信水平
1-
P值
临界值 计算出的样本统计量
H0值
样本统计量
右侧检验的P 值
抽样分布
置信水平 拒绝域 1-
P值
H0值
临界值 计算出的样本统计量
利用 P 值进行检验
(决策准则)
若p-值 > ,不拒绝 H0 若p-值 < , 拒绝 H0
参数检验方法和非参数检验方法比较
非参数检验总是比传统检验安全。 在总体分布形式已知时,非参数检验就不如传统方法 效率高。这是因为非参数方法利用的信息要少些。往 往在传统方法可以拒绝零假设的情况,非参数检验无 法拒绝。 非参数统计在总体未知时效率要比传统方法要高,有 时要高很多。是否用非参数统计方法,要根据对总体 分布的了解程度来确定。
( X 1 X 2 ) ( 1 2 ) t ~ t (n1 n2 2) 1 1 Sp n1 n2
(n1 1) S12 (n2 1) S 22 2 Sp 其中: n1 n2 2
两个总体均值之差的检验 (12、 22 未知且不相等,小样本)
1. 2. 检验具有不等方差的两个总体的均值 假定条件
总体1
2 2
总体2
抽取简单随机样 样本容量 n2 计算X2
所有可能样本 的X1-X2
抽样分布
1 2
两个总体均值之差的检验 (12、 22 已知)
1.假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 2.检验统计量为
如上图, 将两个分组变量“城市”和“学历”定义 在同一层内,即二者是平等的关系,所以会分别按 照性别和地区分组输出两张基本信息表。
(2)分组变量设置为两层,则输出一个交叉表格。
如前图,将“城市” 作为第一层分组变量, “学历”作为第二层 分组变量,二者之间 是有层次关系的,所 以最后输出的是先按 城市分组,在同一城 市内再按学历分组的 一张基本信息表。
二、假设检验的基本思想
1、假设检验采用的逻辑推理方法是反证法 为了检某假设是否成立,先假定它正确,然后根据样本信息,观察 由此假设而导致的结果是否合理,从而判断是否接受原假设; 2、判断结果合理与否,是基于“小概率事件不易发生”这一原理的 即在一次抽样中,小概率事件不可能发生。如果在原假设下发生了小 概率事件,则认为原假设是不合理的;反之,小概率事件没有发生, 则认为原假设是合理的。
第四讲 连续变量的统计推断(一):均值比较的t检验
第一节、假设检验概述 第二节、单样本的T检验 第三节、两独立样本的T检验 第四节、两配对样本的T检验
第一节 假设检验概述
一、推断统计与假设检验 推断统计是根据样本数据推断总体数量特征的统 计分析方法。 根据样本来推断总体的原因:
四、假设检验的两类错误
假设检验中的两类错误是指在假设检验中,由 于样本信息的局限性,势必会产生错误,错误 无非只有两种情况,在统计学中,我们一般称 为Ⅰ类错误,Ⅱ类错误。
第一类错误(Ⅰ类错误)也称为 α错误:拒真, 是指当虚无假设(H0)正确时,而拒绝H0所犯的 错误。这意味着研究者的结论并不正确,即观 察到了实际上并不存在的处理效应。 第二类错误(Ⅱ类错误)也称为β错误:纳伪, 是指虚无假设错误时,反而接受虚无假设的情 况,即没有观察到存在的处理效应。
对2007年4月3个城市消费者信心指数均值进行分 组描述的分析步骤: 第一步:选择待分析的个案
第二步:均值描述过程
点击选项(Options)…
结果解读:
1、数据摘要与基本分组信息
2、方差分析结果
3、相关性度量表
4、选取不同分层变量对结果的影响
(1)分组变量设置为一层,则输出两个独立的表格。
第二节 均值(Means)—分组计算样本的描述 性统计量
【均值】过程的特点:
和描述性统计分析的过程相比,【均值】过程可直 接给出分组的统计结果 同时,可直接输出方差分析的结果而无需调用专门 的方差分析过程
案例:在CCSS项目中,以项目启动时的2007 年4月的数据为指数基线,基线期指数值为100, 随后各期所计算出的指数则代表当期数值相对 于“基线”调查数值的变动比例。 CCSS_Sample.sav中提供了北京、上海、广 州3个一线城市的调查数据,现有如下目的: 对2007年4月北京、上海、广州3个一线城市 的消费者信心指数值的均值进行描述。
条件:要求样本来自的总体服从或近似 服从正态分布。
总体均值的检验
是
总体 是否已知 ?
否
小 样本容量 n
用样本标 验
t 检验
Z
X 0
Z
X 0 S n
t
X 0 S n
n
总体均值的检验(2 已知或2未知、
大样本)
1.假定条件
总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 2 已知: Z X 0 ~ N (0,1)
计算检验统计量和概率P值
X 0 t S n
给定显著性水平与p值做比较:如果p值小于显著性水 平,小概率事件在一次实验中发生,则我们应该拒绝 原假设,反之就不能拒绝原假设。
三、单样本t检验的SPSS实现
案列:检验2007年4月3个一线城市的消费者信 心指数值是否和基准值100存在显著差异。
如果相伴概率小于用户给定的显著性水平a,则拒绝H0.否则, 不能拒绝H0.
什么是P 值?
1. 是一个概率值; 2. 如果原假设为真,P-值是抽样分布中大于或 小于样本统计量的概率;
3. 被称为观察到的(或实测的)显著性水平。
双侧检验的P 值
/ 2 / 2 拒绝
1/2 P 值
拒绝
单样本t检验的应用条件: 由中心极限定理可知,即使原数据不服从正态 分布,只要样本容量足够大,其样本均值的抽 样分布仍然是正态的,因此,当样本量较大时, 研究者很少去考虑单样本t检验的适用条件。 也就是说,只要数据分布不是强烈的偏态,一 般而言,单样本和检验都是适用的。
练习
根据各保险公司人员构成情况数据,对我 国目前保险公司从业人员的受高等教育的程度 和年轻化的程度进行推断: 保险公司具有高等教育水平的员工比例的平均 值不低于0.8; 年轻人比例的平均值与0.5无显著差异。
两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且不相等12 22
3.
检验统计量
S12 S 22 ( )2 ( X 1 X 2 ) (1 2 ) n1 n2 t ~ t( 2 ) 2 S1 S2 S12 S 22 ( )2 /( n1 1) ( )2 /( n2 1) n1 n2 n1 n2
小概率事件在一次试验中几乎不会发生。
拒绝域
接受域
拒绝域
Z
x n
__
Z统计量
1
2 2
显著性水平
2
2
2
Z 2
临界值
0
Z
临界值
假设检验是对我们所关心的却又是未知的总体参数先作出假设,然后抽取样本,利用样本提供的信 息,根据小概率原理对假设的正确性进行判断的一种统计推断方法。
第三节 两独立样本的T检验
一、 两独立样本T检验的目的 利用来自两个总体的独立样本,推断两个总体的均值 是否存在显著性差异; 注:
两独立样本的样本容量可以相等,也可以不相等; 样本来自的总体服从或近似服从正态分布。
两个独立样本之差的抽样分布
1
1
抽取简单随机样 样本容量 n1 计算X1 计算每一对样本 的X1-X2
四、均值比较检验的SPSS实现
【比较均值】子菜单
均值:分组计算样本的描述性统计量。
单样本t检验:单样本t检验,即比较样本均值和总 体均值的t检验。 独立样本 t检验:独立两样本t检验,即比较两独立 样本均值的t检验。 配对样本t检验:配对样本t检验,即比较配对设计 的差数均值与0的t检验。 单因素 ANOVA:单因素方差分析。
2.使用Z-统计量
n
2 未知:
Z
X 0 S n
~ N (0,1)
总体均值的检验 (2未知小样本)
1. 假定条件
总体为正态分布 2未知,且小样本
2. 使用t 统计量
t
X 0 S n
~ t (n 1)
单样本T检验的实现思路 提出原假设: H : 0 0
方法二:运用“探索分析”,
练习:1. 分析2007年4 月总指数是否服从正态 分布。 2.比较三个城市总指数 的箱线图。