心理统计学精髓知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 正态分布
1 正态分布的特点 首先,钟形对称分布
其次, 1.96X μσ-≤的概率是95%; 2.58X μσ-≤的概率是99%;将
1.96X μσ-≥称为决策水平0.05上的小概率事件,将
2.58X μσ-≥称为决策水平0.01上的小概率事件。其中,X 是总体中的随机抽取的一个数值;μ为总体平均值,
第三,曲线两端无限靠近横轴。 2 应用
(1)某学校三年级学生的平均智商是100,其标准差为15.那么,从中随机抽取一个学生,其智商大于等于130的概率是多少?其智商小于等于85的概率是多少?
(2)某企业生产的产品重量均值为100,标准差为15。质检人员从市场上随机抽取一件,发现其重量为115,仅从质量上看,如何用统计学视角来判断此产品是否属于这一企业(决策水平为0.05)。
(3)在上题中,如果质检人员从市场上发现一个产品的重量为140,那么,仅从质量上判断,此产品是否属于这一企业(决策水平为0.01)。
3 数据处理一
让学生报告自己的身高、体重以及自己的肥胖感知(我认为自己很肥胖)、以及自己的性别。数据处理任务包括:报告三个变量的茎叶图,并大致判断其分布形态;报告三个变量的平均值、中数以及中位数、标准差。
第二节 标准正态分布
将总体的平均值记为μ,标准差记为σ,将其中的数据或个案记为X 。那么,使
用公式X z μ
σ
-=,就可以将正态分布转化为标准正态分布。
标准正态分布是正态分布的一个特例,因此,第一节的内容皆可以标准正态分布进行直译。
思考题:标准正态分布的标准差是多少?其平均值又是多少?
对于标准正态分布而言, 1.96Z ≥为决策水平0.05上的小概率事件,将 2.58Z ≥为决策水平0.01上的小概率事件
思考题:某地三年级学生的身高是一个总体,并且是正态分布,均值为160厘米,标准差为5厘米。研究者随机抽取一个学生,其身高为170厘米。那么,此生在标准正态分布中的身高数值应该为多少?这次抽到他是一个小概率事件吗?为什么?
练习:将“数据处理一”中三个变量转化为标准正态分布,并报告其茎叶图。
第三节 样本均值的分布
1 存在一个非常数总体,无论其为何种分布。并且此总体平均值μ与标准差σ已知。用(放回式)随机抽样,获得无数个容量相等的样本,当每一个样本容量大于30时,样本均值的分布就是正态分布。
2将样本平均值记为X ,标准差记为S ,容量记为n ,则此分布的标准误X n
σ
σ=。
3 样本均值分布的特点: 首先,是正态分布,
第二,此分布的理论均值等于总体均值μ。 第三,其标准误X n
σ
σ=
第四, 1.96X X μσ-≤ 的概率是95%;将 1.96X X μσ-≥称为决策水平为0.05上的小概率事件; 2.58X X μσ-≤的概率是99%。将 2.58X X μσ-≥的事件称为决策水平为0.01上的小概率事件;
第五,用公式X X
X z μ
σ-= 将其标准化,则得到标准正态分布。那么,, 1.96
X z ≥为决策水平0.05上的小概率事件,将 2.58X z ≥为决策水平0.01上的小概率事件。
第四节 统计检验的逻辑
如果一个样本是从某一总体中随机抽样得来的,那么,这一个样本必定能够代表这一总体的特征,其含义有三。其一,两者的分布形态是一致的;其二,两者的方差是一致的;其三,两者的平均值是一致的。“一致”的统计含义是,在0.05或者0.01的决策水平上,是没有差异的。 当然,随机样本不能百分百地代表总体的特征,当这样的样本不能代表总体特征时,就说是小概率事件发生了。
在科学研究中,总体往往是一个理论上的或者特定的描述,包括其分布形态、平均值以及其标准差。而样本往往来自于现实的抽取中,通过比较三个方面,就可以决断这个样本是不是属于这个理论或者特定的总体。
比如,某地区90年代的14岁儿童的平均身高为μ厘米,标准差为σ厘米,并且为正态分布。现在来考察这一地区14儿童的身高是否与90年代同龄儿童的身高是否一致。
在统计学上,只能这样做:从现在的14岁儿童中,随机进行抽样,比如,抽取n 个儿童构成一个样本,其平均值为 ,X 标准差为S 。
由于是真正的随机抽样,那么,决策者会检验三个方面。第一,看此样本的分布是否与(90年代的那个)特定总体的分布形态有一致性,如果两者分布形态一致,即样本也是正态分布,那么第二,看此样本的方差是否与特定总体的方差具有一致性,如果两者方差一致,那么第三,看此样本的平均值是否与特定总体的均值具有一致性,如果一致,则可以认为此样本依然属于那个特定的总体,或者说,如今此地区14岁儿童的身高依然与90年代一样。 在上述中,“一致”是指在0.05或者0.01的水平上进行判断,即没有发生小概率事件。如果小概率事件
发生,则说明“不一致”,或者说“具有显著性差异”。
关于分布形态一致性检验与方差一致性检验在后面再学习。这里,我们先认为此样本分布形态和方差皆与那个特定总体的一致,那么,就只剩下检验样本均值是否与那个特定总体的一致。 统计学上的检验过程表述如下。
H 0:此样本是从90年代的总体中随机抽取的,那么,就有 1.96X X X μσ-≤ 计算过程:因为,,X X n
σ
μμσ==
所以只需要证明 1.96
X n
σ
μ-≤是否成立,即
/ 1.96X n
σ
μ-≤是否成立。如果成立,则认为H 0是正确的;反之,如果/
1.96X n
σ
μ-≥,则说明小概率事件发生了;一次随机抽样,就发生了小概率
事件,那么我宁愿在0.05的水平上相信H 0是不正确的,也就是说,此样本不是从90年代的那个样本中随机抽取的,或者说,这个样本不属于这个特定的总体。 在上面的逻辑过程中,H 0的表述非常重要,因为,只有先假定此样本是能够代表这个特定总体,才能套用公式 1.96X X X μσ-≤,这是为什么?这是因为,从任何非常数总体中,随机抽取无数个容量相等的大样本(通常指容量大于等于30),那么样本的均值(无数个X )形成正态分布(其理论均值X μ=μ,标准误X n σ
σ=
);那么, 1.96X X X μσ-≤的概率是95%,也即, 1.96
X n
σ
μ-≤的概
率是95%。反之就是0.05水平上的小概率事件发生了。因此,理解H 0与否,关系着统计检验的理解与否。
练习:从“数据处理一”中随机生产一个样本,并且报告此样本均值的标准分数。看全班同学抽取到的平均值有几个是小概率事件。
第四节 t 分布
存在一个非常数总体,无论其为何种分布。并且此总体平均值μ已知,但其标准差σ未知。用(放回式)随机抽样,获得无数个容量相等的样本,样本均值X 的分布就是t 分布。
t 分布的特点如下表述。
首先,t 分布为对称分布,并且左右对称
其次,t 分布是一簇曲线,并且每个df (即自由度,df=n-1)皆有自己的分布形态。df 越大,t 分布越接近正态分布。 第三,在此情况下,样本均值分布的标准误
,=1X s ss
s s s n n
=-其中是样本的标准差,。,其理论均值X μ等于总体均值μ。 第四,0.05X X X t s μ-≤水平上的临界值的概率是95% ,而0.05X X X t s μ-≥水平上的临界值则为0.05水平上的小概率事件。