如何学习统计研究方法(最终版) ppt课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生 假设(Hypothesis):可验证性的;陈述两个或多个数个变量间的 可能关系,为一种「假设性陈述」。
验 证 过 程
2020/12/8
数据收集
•抽样设计 •研究设计 •问卷设计 •执行管理
数据管理
数据分析
数据呈现
•数据格式的转换 •储存位置
•变量选择
•报表
•加权
•表格
•统计模型的选择
•符号(公式,文字)
2020/12/8
理想的理论
-回答现象为什么--机制 -可验证性,及可以证伪和重复的 -与相关之既有知识或理论一致,不宜抵触,不是孤立理论 -简约,若为统计模型,参数要尽量少 -对应研究之问题 -量化形式,不仅是文字建模也是可以数字建模和图形建模 -具相当广度(有助推论),具有普适性
如何学习统计研究方法(最终版) ppt 课件
引言
• 个人的介绍 • 主题:
I. 分享学习统计的一些心得(理论方法的知识 地图)
II. 回归应用的问题(个案学习)
2020/12/8
统计是什么?
统计是一门致力于研究:收集数据(抽样理论),分析数据(统计 算法),解释数据(背景知识与理论)的学科。 -------- 我个人的心得 ※.外加计算机操作
研究中要注意的一些问题
大众共识
日常用语
学术共识
科学陈述
•理论是观察陈述的前提 •概念术语使用的必要性
操作化(operational definition):用变量代替概念。 变 量 假定(Assumption):在研究中被人为控制(设定,定义)的变 产 量或者常量。针对的是一个变量(常量是特殊的一种变量 )。
数字背后的心理活动 过程,普通人做统计 问题时的思维过程处理随机事件的能力
数字背后的心理活动 过程,研究者做学术 研究时,逻辑的推理 过程
观察数据 调查数据 抽样数据 试验数据
统计中的形象思维:使看不见的随机性被看见
=的意义,赋值和建立、描述相关关系
2020/12/8
基本知识回顾
总体的描述(随机变量的数字特征:X,σ)与样本的描述(样本分布的数 字特征:μ,s)之间连接点是:随机变量的分布。
随机性 随机变量的分布
估计 变量分布的特征
2020/12/8
我们在做什么
科学本质:试验性(包含了证伪性的命题)—在错误中不断求真(广泛的解 释性和高度一致的预测性),理论是怎样产生的呢?波普尔认为,科学只能从问 题开始,理论是为解决问题而做出的尝试,是对问题的猜测,波普尔说:“一种科 学理论,一种解释性理论,只不过是解决一个科学问题的一种尝试”。因此, 理论是大胆的猜测,即使是那些己经充分确认的科学理论也终究还是一种猜测 ,一种假说。正因为理论是猜测,它们就具有不确定性和暂时性,最终会被推 翻,被新理论所替代。
Ⅱ.估计方法: 点估计
(Point Estimation)
区间估计 (Interval Estimation)
•矩法 •似然法 •最小二乘法
•单个总体(估计方差?估计均值?方差已知否?) •两个总体(相关系数)
Ⅲ.对估计量的检验:假设检验
2020/12/8
统计学习分三个部分
统计基本原理
统计软件操作 一统定计选要是择对应软所统用件用计性体方结很现法果强了的解的统目读学计的科应﹑,用对在的象使专和用业条某性件一。有种S所方p了s法s解?之。S前ta,ta?
SAS?统R计?技ST术A水TI平STICA?Minitab……… • 目的• :选描择• 述在:(理经集解济中算原或法则离原,散理学)即习?统最相计恰关意原关义则系后,?的兼差软容异件性?操,…作获H解得0读性。,(操作步骤 • 对象:变中量先类模看型块什和数么个量后数,看;创什抽建么样新,方变对式量应;,的数前统据沿计排性过列程(是e什g.M么D?S)) • 条件• :格参式• 数每:或步数非统据参计录?结入模果格型中式假对;设数数(字据A的排s解s列u读m(。peti(go.n多e)g重. α应)答)
我们是一群问题提出者和企图解答者。
波普尔认为,衡量一个理论真的程度的标准即看该理论是否具有高解释力和 高预测力,而这又是由理论所包含的信息量来决定的。一般说来,理论所包容 的信息量越多,其可解释的范围越广,其预测的力度便越强。但与此同时,科 学理论所包容的信息愈多,它接受的范围愈广,其可错性或被证伪的概率便越 高。也就是说:科学理论真的概率增大的过程,也是科学理论被证伪的可能性 增大的过程,换言之,它是科学理论中可错成分逐渐增多的过程。
• 研究什么?--经过数据计算后产生出有意义 的信息
• 事物之间的相关关系(包括因果关系) • 事物之间的差异(先找出它们的差异然后再找出它们的共性) • 事物的结构统(计层是次以水帮平助)描述,验证思想的工具性学科
2020/12/8
关于随机性规律
生活
思维过程领域
统计的两个应用领域
学术
研究方法领域
2.相关 1.差异
独立 样本
独立样本t检验 Pearson相关系数
非独
立样 本
配对样本t检验
组类相关系数
Intraclass correlation coefficient
在同一对象上两个重复测量值之间的相关系数。 Pearson相关系数研究的是不同变量之间产生的。
2020/12/8
观 察 与 陈述 描 述
• 规范研性究:功命底令水或平鼠标操作正确;探索与重复;
• 检验背后代表的是什么?备择假设!说明了什么现实意义(可证
伪吗?)。
• 试验设计或者验证过程的逻辑严密性。 • 研究经验( eg.每个群的常模,回归的决定系数大小) • 高手的处理技巧(体现在操作化过程)。
2020/12/8
学习归纳统计方法的一个案例
•统计量的含义
•图形
•检验标准(显著性水平)
理论和现象的关系
客观的世界
•物理活动(声,光,机械) •化学变化(无机物变化) •生物活动(新陈代谢) •心理活动(意识与认知) •社会变化(文化,人际,阶 层,传播)
观察 解释
wenku.baidu.com
主观的世界
•不具有运算功能的符号: 绘画,音乐.. •具有运算功能的符号: 逻辑,文字,数字
Ⅰ.估计量的性质: 1. 无偏性(Unbiasedness):样本均值在真值附近摆动而没有系统误差。 2. 有效性(Efficiency):在所有的不同估计量中的方差最小。 3. 一致性(Consistency):当n→∞,估计量在真值附近的概率接近1。 4. 最小离差平方(Mean Square Error):离差最小or方差最小?如果 估计量是无偏时此标准等价于有效性。
验 证 过 程
2020/12/8
数据收集
•抽样设计 •研究设计 •问卷设计 •执行管理
数据管理
数据分析
数据呈现
•数据格式的转换 •储存位置
•变量选择
•报表
•加权
•表格
•统计模型的选择
•符号(公式,文字)
2020/12/8
理想的理论
-回答现象为什么--机制 -可验证性,及可以证伪和重复的 -与相关之既有知识或理论一致,不宜抵触,不是孤立理论 -简约,若为统计模型,参数要尽量少 -对应研究之问题 -量化形式,不仅是文字建模也是可以数字建模和图形建模 -具相当广度(有助推论),具有普适性
如何学习统计研究方法(最终版) ppt 课件
引言
• 个人的介绍 • 主题:
I. 分享学习统计的一些心得(理论方法的知识 地图)
II. 回归应用的问题(个案学习)
2020/12/8
统计是什么?
统计是一门致力于研究:收集数据(抽样理论),分析数据(统计 算法),解释数据(背景知识与理论)的学科。 -------- 我个人的心得 ※.外加计算机操作
研究中要注意的一些问题
大众共识
日常用语
学术共识
科学陈述
•理论是观察陈述的前提 •概念术语使用的必要性
操作化(operational definition):用变量代替概念。 变 量 假定(Assumption):在研究中被人为控制(设定,定义)的变 产 量或者常量。针对的是一个变量(常量是特殊的一种变量 )。
数字背后的心理活动 过程,普通人做统计 问题时的思维过程处理随机事件的能力
数字背后的心理活动 过程,研究者做学术 研究时,逻辑的推理 过程
观察数据 调查数据 抽样数据 试验数据
统计中的形象思维:使看不见的随机性被看见
=的意义,赋值和建立、描述相关关系
2020/12/8
基本知识回顾
总体的描述(随机变量的数字特征:X,σ)与样本的描述(样本分布的数 字特征:μ,s)之间连接点是:随机变量的分布。
随机性 随机变量的分布
估计 变量分布的特征
2020/12/8
我们在做什么
科学本质:试验性(包含了证伪性的命题)—在错误中不断求真(广泛的解 释性和高度一致的预测性),理论是怎样产生的呢?波普尔认为,科学只能从问 题开始,理论是为解决问题而做出的尝试,是对问题的猜测,波普尔说:“一种科 学理论,一种解释性理论,只不过是解决一个科学问题的一种尝试”。因此, 理论是大胆的猜测,即使是那些己经充分确认的科学理论也终究还是一种猜测 ,一种假说。正因为理论是猜测,它们就具有不确定性和暂时性,最终会被推 翻,被新理论所替代。
Ⅱ.估计方法: 点估计
(Point Estimation)
区间估计 (Interval Estimation)
•矩法 •似然法 •最小二乘法
•单个总体(估计方差?估计均值?方差已知否?) •两个总体(相关系数)
Ⅲ.对估计量的检验:假设检验
2020/12/8
统计学习分三个部分
统计基本原理
统计软件操作 一统定计选要是择对应软所统用件用计性体方结很现法果强了的解的统目读学计的科应﹑,用对在的象使专和用业条某性件一。有种S所方p了s法s解?之。S前ta,ta?
SAS?统R计?技ST术A水TI平STICA?Minitab……… • 目的• :选描择• 述在:(理经集解济中算原或法则离原,散理学)即习?统最相计恰关意原关义则系后,?的兼差软容异件性?操,…作获H解得0读性。,(操作步骤 • 对象:变中量先类模看型块什和数么个量后数,看;创什抽建么样新,方变对式量应;,的数前统据沿计排性过列程(是e什g.M么D?S)) • 条件• :格参式• 数每:或步数非统据参计录?结入模果格型中式假对;设数数(字据A的排s解s列u读m(。peti(go.n多e)g重. α应)答)
我们是一群问题提出者和企图解答者。
波普尔认为,衡量一个理论真的程度的标准即看该理论是否具有高解释力和 高预测力,而这又是由理论所包含的信息量来决定的。一般说来,理论所包容 的信息量越多,其可解释的范围越广,其预测的力度便越强。但与此同时,科 学理论所包容的信息愈多,它接受的范围愈广,其可错性或被证伪的概率便越 高。也就是说:科学理论真的概率增大的过程,也是科学理论被证伪的可能性 增大的过程,换言之,它是科学理论中可错成分逐渐增多的过程。
• 研究什么?--经过数据计算后产生出有意义 的信息
• 事物之间的相关关系(包括因果关系) • 事物之间的差异(先找出它们的差异然后再找出它们的共性) • 事物的结构统(计层是次以水帮平助)描述,验证思想的工具性学科
2020/12/8
关于随机性规律
生活
思维过程领域
统计的两个应用领域
学术
研究方法领域
2.相关 1.差异
独立 样本
独立样本t检验 Pearson相关系数
非独
立样 本
配对样本t检验
组类相关系数
Intraclass correlation coefficient
在同一对象上两个重复测量值之间的相关系数。 Pearson相关系数研究的是不同变量之间产生的。
2020/12/8
观 察 与 陈述 描 述
• 规范研性究:功命底令水或平鼠标操作正确;探索与重复;
• 检验背后代表的是什么?备择假设!说明了什么现实意义(可证
伪吗?)。
• 试验设计或者验证过程的逻辑严密性。 • 研究经验( eg.每个群的常模,回归的决定系数大小) • 高手的处理技巧(体现在操作化过程)。
2020/12/8
学习归纳统计方法的一个案例
•统计量的含义
•图形
•检验标准(显著性水平)
理论和现象的关系
客观的世界
•物理活动(声,光,机械) •化学变化(无机物变化) •生物活动(新陈代谢) •心理活动(意识与认知) •社会变化(文化,人际,阶 层,传播)
观察 解释
wenku.baidu.com
主观的世界
•不具有运算功能的符号: 绘画,音乐.. •具有运算功能的符号: 逻辑,文字,数字
Ⅰ.估计量的性质: 1. 无偏性(Unbiasedness):样本均值在真值附近摆动而没有系统误差。 2. 有效性(Efficiency):在所有的不同估计量中的方差最小。 3. 一致性(Consistency):当n→∞,估计量在真值附近的概率接近1。 4. 最小离差平方(Mean Square Error):离差最小or方差最小?如果 估计量是无偏时此标准等价于有效性。