基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• • •
计数数据:计算个数的数据,一般取整数 测量数据:借助一定的测量工具或一定的测量标准而获得 的数据
3
数据类型 (续)
•
按数据分布形态划分 得数值的个数是有限的(e.g., 家庭中孩子个数、 筛子点数)
离散数据:通常限于整数,在任何两个数据点之间所取
•
连续数据:任意两个数据点之间都可以细分出无限多个大 小不同的数值(e.g., 年龄、长度、自信分数)
8
课堂练习
下列数据属于什么类型?
1. 2. 3. 4.
身份证号码 华式温度 对三种食品喜爱程度排序 在一个面部表情感知力的研究中,被试需要将照片中人的 情绪归类为生气、难过、恶心、恐惧或惊讶。这里情绪表 达是__数据
9
变量、随机变量、观测值
变量:针对不同个体具有不同值的特性或条件。
常量:是一个特性或条件,它不会变化,并且对每个个体 都是相同的。 随机变量:在统计学上,把在取值之前不能预料到取什么 值得变量,就称为随机变量。一般用X或Y…表示 。
1. 样本频率总是围绕概率上下波动 2. 样本含量n越大,波动幅度越小,频率越接近概率。
18
心理与教育统计基础概念
1
主要内容
数据类型 变量、观测值、随机变量 总体、样本与个体 参数和统计量 次数、频率与概率
2
数据类型
•
什么是数据?
数据是关于自然、社会现象和科学试验的定量或定性的 记录,是科学研究最重要的基础 Data, Number, Digit 按观测方法和来源划分
13
14
参数和统计量的字母表示
(总体)参数(parameter) • 平均数:μ(mu) • 标准差:σ (sigma) •方差:σ2 • 相关系数:ρ (rho) • 回归系数:β (beta)
X
(样本)统计量(statistics) • 平均数:X • 标准差:s (SD) •方差:s2 • 相关系数:r • 回归系数:bYX
• • •
7
数据类型 (续)
• • •
按数据反映的测量水平划分*
等距数据:有相等单位,但无绝对零度的数据。 e.g., 温度、能力测验分数 表明了差异的大小和方向
•可进行加减运算,不能乘除运算;大小比例没有意义 • •
等比数据:有相等单位,也有绝对零度的数据。 e.g., 身高、体重、反应时
•可进行加减乘除运算;大小比例有意义
随机是指在一定条件下可能出现也可能不出现的。
16
小概率事件
• 必然事件Hale Waihona Puke BaiduP = 1 • 随机事件 0 < P < 1 • 不可能事件 P = 0
P ≤ 0.05(5%)或P ≤ 0.01(1%)称 为小概率事件(习惯),
统计学上认为小概率事件在一次试验 中几乎不可能发生。
17
频率与概率的关系
11
总体、样本、个体(续)
样本(sample):从总体中选择出来的个体的集合,通常在 研究中期望代表总体。
• •
样本中个体数目称为样本量(sample size),通常用n表示 总体与样本也可以相互转换
12
参数和统计量
在科学研究中,我们探寻的是关于所有事物总体的说明和解释。 (总体)参数(parameter) • 描述总体情况的统计指 标,反应总体特性; • 是一个常数 (样本)统计量(statistics) •代表样本的特性; • 是一个变量,随着样本 的变化而变化
15
次数、频率与概率
次数(频数):某一事件出现的数目。
频率:又称相对次数,即某一事件发生的次数被总的事件 数目除。通常用比例(proportion)或百分数(percent) 表示
•
样本实际发生率 概率(probability) :随机事件出现可能性大小的客观指标 就是概率。用P表示,取值[0,1]。
观测值:随机变量所取得的值,称为观测值。
10
总体、样本、个体
总体(population):具有某种特征的一类事物的全体/ 研究者希望研究的整个组被称为总体。
• •
可以由人或其他任何希望研究的东西组成 总体大小随研究问题而改变 个体(individual):构成总体的每个基本单元称为个体。 有时又称作样本点。
4
连续数据表述值的含义
5
数据类型 (续)
•
按数据反映的测量水平划分*
称名数据:只说明某一事物与其它事物在属性上的不同或 类别上的差异。不能说明差异的大小或方向。
• •
e.g., 性别、种族、专业 注:有些时候用数字表示类别
6
数据类型 (续)
•
按数据反映的测量水平划分*
顺序数据:按事物某种属性的大小或多少,按次序将各个 事物加以排列后获得的数据资料。 e.g., 大中小号衬衫;成绩等级;比赛名次;重要性排序 表明了差异的方向 数据没有相等单位和绝对零点,不能进行加减乘除运算