统计学第9讲 第9章 推论统计导论

合集下载

统计学ppt课件

统计学ppt课件

概率的定义
从样本空间到实数的映射,满 足非负性、规范性、可数可加 性。
随机变量及其分布
随机变量的定义
定义在样本空间上的 函数,取值依赖于随 机试验的结果。
离散型随机变量
取值有限或可数可列 的随机变量。
连续型随机变量
取值连续的随机变量 。
分布函数
描述随机变量概率分 布的函数。
概率密度函数
描述连续型随机变量 的函数。
时间序列分析
使用统计方法来分析和预测金融时间序列数据,如股票价格、利率 等。
金融风险管理
使用统计方法来衡量和管理金融风险,如信用风险、市场风险等。
THANKS 感谢观看
行拟合和预测。
时间序列的季节性分析
季节性的定义
01
季节性是指时间序列数据在一年内或固定周期内重复出现的波
动。
季节性分析的意义
02
通过分析时间序列的季节性规律,可以更好地理解数据的周期
性变化,为预测提供依据。
季节性分析的方法
03
常见的季节性分析方法包括绘制季节指数图、计算季节性比率
、构建季节性回归模型等。
策。
统计学可以帮助人们理解数据背 后的规律和趋势,从而做出更明
智的决策。
统计学的应用领域
01
02
03
04
商业
市场调研、消费者行为分析、 销售预测等。
医学
临床试验、流行病学、健康状 况调查等。
社会学
社会调查、民意测验、人口统 计等。
自然科学
实验设计、质量控制、科研数 据分析等。
统计学的历史与发展
统计学的起源可以追溯到17世纪,当时欧洲的一些学者开始研究如何从数据中得出 可靠的结论。

统计学导论

统计学导论

統計學導論 Chapter 14 無母數統計
14-19
14.4 連檢定(2/2) 連檢定(2/2)
µR
2 n1 n 2 = +1 n1 + n 2 2 n1 n 2 ( 2 n1 n 2 − n1 − n 2 ) ( n 1 + n 2 ) 2 ( n 1 + n 2 − 1) R − µR
(14-10)
4 0 刪除
7 3 3
1 –3 3
2 –2 2 –6
2 –2 2 –6
5 1 1 2.5
7 3 3 9.5
6 2 2 6
5 1 1 2.5
9.5 –9.5
統計學導論 Chapter 14 無母數統計
14-18
14.4 連檢定(1/2) 連檢定(1/2)
連檢定(run test)即以樣本觀察值產生的順序為基 連檢定 即以樣本觀察值產生的順序為基 藉以檢定樣本資料是否為隨機產生的, 礎 , 藉以檢定樣本資料是否為隨機產生的 , 亦即 它可用來檢定如下的虛無假設。 它可用來檢定如下的虛無假設。 H0:樣本觀察值是隨機產生的 連的定義 一個或多個代表相同屬性的符號一連串的出現, 一個或多個代表相同屬性的符號一連串的出現 , 則由此所形成的串列稱為連。 則由此所形成的串列稱為連。
統計學導論 Chapter 14 無母數統計 14-4
14.2 等級和檢定
Wilcoxon等級和檢定 等級和檢定 Mann-Whitney檢定 檢定 Kruskal-Wallis檢定 檢定
統計學導論 Chapter 14 無母數統計
14-5
Wilcoxon等級和檢定 Wilcoxon等級和檢定(1/3) 等級和檢定(1/3)
rs = 1 − 6∑ d i n( n2 − 1)

统计学导论课件

统计学导论课件
分类数据和顺序数据阐明是事物旳品质特征-----品质数据或定 性数据;数值型数据是阐明事物旳数量特征----定量数据
2024/10/9
19
按数据旳搜集措施分类
观察数据:经过调查或观察而搜集到旳统计数据。如
有关社会经济数据均为观察数据。
试验数据:在试验中,利用监控手段,经过控制试
验对象而搜集到旳统计数据。如对医药疗效试验数据; 生物成长旳试验数据等。
本章要点是了解统计学旳含义,掌握统计 数据旳基本类型和统计学旳性质,掌握 统计总体与样本、标志与标志体现、统 计指标与指标体系、变量和变量值等概 念。
本章难点在于了解统计学旳性质,总体 与总体单位、标志与统计指标之间旳关 系。
2024/10/9
10
学习目旳
经过本章旳学习,了解统计学是一门 措施论学科,了解统计数据旳基本类型、 统计学旳发展历史,以及统计学中旳几 种基本概念。
大学出版社,2023年版;
《统计学基本概念与措施》 吴喜之等译,《高等教
4育
2024/10/9
什么是统计?请先看看实际数据
2023年中国GDP为89404亿元,比上年增 长8%; 2023年GDP为95933亿元,比上年增长 7.3%; 2023年GDP为246619亿元,比上年增长 11.4%; 我国2023年GDP为30.067万亿元 同比增 长9%
1898)首创,主要代表人物为恩格尔 (C.L.E.Engel,1821~1896)和梅尔(G.V.Mayr, 1841~1925)等人。
2024/10/9
26
三、当代统计课时期
20世纪30年代,费暄(R.A.Fisher, 1890~1962) 旳推断统计学促使数理统计进入当代范围,代表 著作涉及《供研究人员使用旳统计措施》 (1925)、《试验设计》(1955)、《统计措 施与统计推断》(1956)等。

统计学概论讲义

统计学概论讲义

授课目录第一章质量管理概说第二章统计学概论第三章机率概论及机率分配第四章统计制程管制与管制图第五章计量值管制图第六章计数值管制图第七章制程能力分析第八章允收抽样的基本方法第九章计数值抽样计划第十章计量值抽样计划第十一章量具之再现度与再生度第十二章质量管理之新七大手法1. 导论统计学是一探讨如何搜集数据与分析数据的科学研究方法。

在不确定的状态下,藉由样本数据所提供的讯息,经归纳分析、推论检定、决策与预测等过程。

『以事实(数字)作决策』。

2.1认识统计◎自古以来,人类从事各项研究活动均是为求真理,亦是社会文明进步的原动力。

然而通往真理的路上充满混沌与挫折,如何厘清真相,统计学自然就成为一门极重要的科学研究工具。

◎统计学是由搜集数据、整理数据、分析数据及解释意义等规则与程序所组成。

◎统计学研究过程:推论= 估计+ 假设检定Inferential Statistics = Estimation + Testing Hypothesis2.2 统计精神就是科学研究的精神◎ 著名统计学家费雪(R. A. Fisher, 1890-1962)曰:统计方法的目的是基于经验观察,去改进我们对系统的了解---即统计的基本精神。

◎ 架构一系列有组织有系统且可分析的研究过程,以获得客观可靠的结论---即科学研究的精神。

系 统 理 论---线 性 系 统“Ref: The Six Sigma Way , by Peter S. Pande, Robert P. Neuman, & Roland R. Cavanagh, McGraw-Hill.”『系统三要素---输入、过程、输出』常用的几个统计学术语※母体:该次研究中所有欲探讨之事务之全体对象。

※参数:用来描述母体的特征之数值,或称母数。

※样本:由母体中随机抽取部分群体之集合。

※统计量:用来描述此样本的特征之数值。

母体(Population)、参数(Parameter)、样本(Sample)、统计量(Statistics)欲了解致远工管系学生每周平均看书时间,经随机抽样30位该系学生,计算结果:◎该系学生每周平均看书时间为21hrs----点估计。

统计学专业导论

统计学专业导论

统计学的产生与发展是和生产的发展、社会的进步紧密相联的。

统计学的萌芽产生在欧洲。

17世纪中叶至18世纪中叶是统计学的创立时期。

在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。

国势学派又称记述学派,产生于17世纪的德国。

其主要代表人物是海尔曼•康令和阿亨华尔。

康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授政治活动家应具备的知识。

阿亨华尔在哥廷根大学开设“国家学”课程,因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。

该学派为统计学的发展奠定了经济理论基础。

随着资本主义市场经济的发展,该学派后来发生了分裂,分化为图表学派和比较学派。

政治算术学派产生于19世纪中叶的英国,创始人是威廉·配第,其代表作是他于1676年完成的《政治算术》一书。

在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。

因此马克思说:“威廉·佩蒂——政治经济学之父,在某种程度上也是统计学的创始人。

”政治算术学派的另一个代表人物是约翰·格朗特。

他以1604年伦敦教会每周一次发表的“死亡公报”为研究资料,在1662年发表了《关于死亡公报的自然和政治观察》的论著。

他的研究清楚地表明了统计学作为国家管理工具的重要作用。

18世纪末至19世纪末是统计学的发展时期。

在这时期,各种学派的学术观点已经形成,并且形成了两主要学派,即数理统计学派和社会统计学派。

在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。

19世纪中叶,把概率论引进统计学而形成数理学派。

其奠基人是比利时的阿道夫·凯特勒,他把概率论引入统计学,使统计学在“政治算术”所建立的“算术”方法的基础上,在准确化道路上大大跨进了一步,为数理统计学的形成与发展奠定了基础。

社会统计学派产生于19世纪后半叶,创始人是德国经济学家、统计学家克尼斯,他们融合了国势学派与政治算术学派的观点,沿着凯特勒的“基本统计理论”向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立。

《统计》 讲义

《统计》 讲义

《统计》讲义一、什么是统计在我们的日常生活和工作中,常常会听到“统计”这个词。

那么,究竟什么是统计呢?简单来说,统计就是对数据的收集、整理、分析和解释的过程。

想象一下,我们要了解一个班级学生的学习情况。

我们可以收集每个学生的考试成绩,这就是数据收集。

然后,把这些成绩按照从高到低进行排序,或者计算平均分、及格率等,这就是数据整理。

接着,通过分析这些数据,比如比较不同学科的成绩差异,或者观察成绩的分布情况,来发现一些规律和趋势,这就是数据分析。

最后,根据分析的结果,得出关于这个班级学习状况的结论,比如哪个学科需要加强教学,或者哪些学生需要更多的帮助,这就是数据解释。

统计不仅仅局限于学术领域,它在商业、医疗、政府、体育等各个领域都有着广泛的应用。

比如,企业通过统计销售数据来了解市场需求,制定营销策略;医院通过统计病人的病历数据来研究疾病的发病规律,提高治疗效果;政府通过统计人口数据来规划公共服务设施的建设。

二、统计的基本步骤1、数据收集这是统计工作的第一步,也是非常关键的一步。

数据的质量和完整性直接影响到后续的分析结果。

数据收集的方法有很多种,常见的有普查、抽样调查、问卷调查、实验等。

普查就是对研究对象的全体进行调查,比如全国人口普查。

这种方法可以得到全面、准确的信息,但往往需要耗费大量的人力、物力和时间。

抽样调查则是从研究对象的总体中抽取一部分样本进行调查,通过对样本的分析来推断总体的情况。

抽样方法要科学合理,以保证样本具有代表性。

问卷调查是通过设计一系列问题,让被调查者回答来获取数据。

在设计问卷时,要注意问题的清晰性、合理性和有效性。

实验则是在控制其他因素不变的情况下,改变某个因素,观察其对结果的影响。

2、数据整理收集到的数据往往是杂乱无章的,需要进行整理。

这包括对数据进行分类、编码、录入等操作。

比如,将学生的成绩按照学科、分数段进行分类,给不同的类别赋予相应的代码,然后将数据录入到电子表格中。

3、数据分析这是统计的核心环节。

统计学导论课件

统计学导论课件

统计的涵义
统计工作—统计数据的收集活动 统计数据—统计活动的结果 统计学 —分析统计数据的方法和技术
二、统计的产生和发展 (一)统计活动的产生和发展
自从有了国家,便有了统计实践活动。 我国在原始社会末期,在奴隶制形成的过程中,
就已经出现了统计的萌芽。
(二)统计学的产生和发展 1、统计学发展的萌芽期
国势学派或记述学派的创始人是德国的康令和阿 痕瓦尔。17世纪中叶。文字记述为主。
政治算术学派的代表人是英国的威廉. 配第和约 翰。格朗特 。17世纪中叶。用数量说话。
“政治经济学之父”“统计学的创始人”
2、统计学发展的近代期
数理统计学派创始人是比利时的统计学家、数 学家、天文学家凯特勒。19世纪中叶。把概率 论引入统计学。
ophthalmology (眼科学)
pharmaceutics (制药学)
physics (物理学)
political science (政治学)
psychology (心理学)
psychophysics (心理物理学)
quality control (质量控制) religious studies (宗教研究)
econometrics (经济计量学)
education (教育学)
election forecasting and projection (选举预测和策划)
engineering (工程)
epidemiology (流行病学)
finance (金融)
fisheries research (水产渔业研究)
literature (文学)
manpower planning (劳动力计划)
management science (管理科学)

统计学导论-白分析

统计学导论-白分析
2.从总体上研究现象的数量方面 ❖ 每一种社会经济现象的发展变化,都是受多种因素(主
要因素和次要因素)共同作用的结果
2020/10/18
h
12
(三)统计学研究对象的特点
1.数量性
——是对客观现象数量方面的研究
2.总体性
——研究客观现象总体的数量特征(发展变化的规律性) ❖现象的数量规律性只有在总体层面上才能体现出来 ❖研究目的在于说明总体特征,但需要从观察个体数
h
20
理论统计学
研究重点: ——主要研究统计学的一般理论和统计方法的数学基 础,探讨统计学的数学原理和统计公式的来源
包括的主要内容: ——概率理论、抽样理论、实验设计、估计理论、假 设检验理论、决策理论、非参数统计、序列分析、随 机过程等 ——概率论是统计推断的数学和理论基础,所以广义 的统计学亦应包括概率论在内
h
4
(二)三者关系:相互联系,相互影响
实践
统计工作
成果 统计资料
理论 统计学
➢ 统计工作是人们的统计实践,是主观反映客观的过程 ➢ 统计资料是统计工作的结果,两者是过程与结果的关系 ➢ 统计学是统计工作的科学总结与概括 ➢ 统计工作以统计学为指导并在实践中不断完善统计学 ➢ 三者相互联系且不可分割,构成统一的整体——统计
推断统计学
参数估计
假设检验
h
16
描述统计
(descriptive statistics)
1. 研究如何收集、整理和描述
数据的统计学分支
2. 内容

统计数据的搜集方法
50
数据的加工处理方法
数据的显示方法 数据分布特征的概括与分析
25
——描述性分析
3. 目的

【免费下载】 统计学讲义word

【免费下载】 统计学讲义word
29
对全部高中资料试卷电气设备,在安装过程中以及安装结束后进行高中资料试卷调整试验;通电检查所有设备高中资料电试力卷保相护互装作置用调与试相技互术关,系电,力根通保据过护生管高产线中工敷资艺设料高技试中术卷资,配料不置试仅技卷可术要以是求解指,决机对吊组电顶在气层进设配行备置继进不电行规保空范护载高与中带资负料荷试下卷高问总中题体资,配料而置试且时卷可,调保需控障要试各在验类最;管大对路限设习度备题内进到来行位确调。保整在机使管组其路高在敷中正设资常过料工程试况中卷下,安与要全过加,度强并工看且作护尽下关可都于能可管地以路缩正高小常中故工资障作料高;试中对卷资于连料继接试电管卷保口破护处坏进理范行高围整中,核资或对料者定试对值卷某,弯些审扁异核度常与固高校定中对盒资图位料纸置试,.卷保编工护写况层复进防杂行腐设自跨备动接与处地装理线置,弯高尤曲中其半资要径料避标试免高卷错等调误,试高要方中求案资技,料术编试交写5、卷底重电保。要气护管设设装线备备置敷4高、调动设中电试作技资气高,术料课中并3中试、件资且包卷管中料拒含试路调试绝线验敷试卷动槽方设技作、案技术,管以术来架及避等系免多统不项启必方动要式方高,案中为;资解对料决整试高套卷中启突语动然文过停电程机气中。课高因件中此中资,管料电壁试力薄卷高、电中接气资口设料不备试严进卷等行保问调护题试装,工置合作调理并试利且技用进术管行,线过要敷关求设运电技行力术高保。中护线资装缆料置敷试做设卷到原技准则术确:指灵在导活分。。线对对盒于于处调差,试动当过保不程护同中装电高置压中高回资中路料资交试料叉卷试时技卷,术调应问试采题技用,术金作是属为指隔调发板试电进人机行员一隔,变开需压处要器理在组;事在同前发一掌生线握内槽图部内 纸故,资障强料时电、,回设需路备要须制进同造行时厂外切家部断出电习具源题高高电中中源资资,料料线试试缆卷卷敷试切设验除完报从毕告而,与采要相用进关高行技中检术资查资料和料试检,卷测并主处且要理了保。解护现装场置设。备高中资料试卷布置情况与有关高中资料试卷电气系统接线等情况,然后根据规范与规程规定,制定设备调试高中资料试卷方案。

统计推断的理论基础课件

统计推断的理论基础课件

• 例如: A ——到十字路口恰好遇到红灯;

B——恰好抽到一张草花

C——考试分数在90到100之间
统计推断的理论基础
例题:抛掷三枚硬币试验
随机事件
博弈规则
A ——出现三个正面
A、D为甲组,
B——出现二正一反
B、C为乙组, 任意选一组。
C——出现一正二反 D——出现三个反面
抛掷三枚硬币,出现 哪一个组的结果(事 件),押中者为赢。
p( 1.96 σ X 1.96 σ ) 0.95
n
n
p(X 1.96 σ μ X 1.96 σ ) 0.95
n
n
同理可得:p(X 2.58 σ μ X 2.58 σ ) 0.99
n
n
据此可以估计总体平均数所在的置信区间。
统计推断的理论基础
例题
• 已知某区中学二年级语文测验分数的标准差为 10.6, 从中抽取10份卷子, 算得平均数为72分, 求 平均数的标准误, 并求全区此次测验95%的置信 区间。
b
P(x (a,b)) a f (x)dx
则称X为连续型随机变量,f (x) 称为X的概率密
度函数。
统计推断的理论基础
四、概率分布
• 要掌握随机变量的变化规律,首先要了解它可能取 什么值,其次,还要知道取这些值的概率大小。
• 概率分布就是描述随机变量统计规律的重工具。
统计推断的理论基础
一个赌博实例
• 例如:种子发芽数X;考试分数Y;三枚硬币出 现的结果Z。
统计推断的理论基础
(一)离散型随机变量
• 若随机变量X只可能在有限个点上 取值,则称X为离散型随机变量。
统计推断的理论基础

统计基础第九章PPT课件

统计基础第九章PPT课件

静态指数
包括空间指数 和计划完成情 况指数两种。
(五) 按其对 比内容 不同来

.
动态指数
由两个不同时期 的同类经济变量 值对比形成的指 数,说明现象在 不同时间上发展 变化的过程和程
度。 12
三、统计指数的种类
拉氏指数
权数或同度量
因素时间选择
在基期来编制
的指数。1864
年德国学者拉
斯贝尔斯
(Laspeyres)
qp 00
2.质量指标综合指数.
pq 11
pq 01
编制数量指标综合指数时,一般要以基期的质量
指标作为同度量因素;
编制质量指标综合指数时,一般要以报告期的数
量指标作为同度量. 因素。
33
随堂自测: 某企业有关资料如下:
名称
甲 乙
单位
件 支
产品产量
基期 报告期
q0 q1
2000 2200 5000 6000
定来确定。目前共包括食品、烟酒及用品、衣着、
家庭设备用品及服务、医疗保健及个人用品、交通
和通讯、娱乐教育文化用品及服务、居住八大类,
251个基本分类,约700个代表品种。
居民消费价格指数就是在对全国550个样本市县
近3万个采价点进行价格调查的基础上,根据国际
规范的流程和公式. 算出来的。
17
第二节 综合指数的编制及体系因素分析
▪ 质量指数:
k p
p1 q1 p0 q1
其中:p — 指数化指标(质量指标)
q — 同度量因素(数量指标)
作用 同度量作用(统一计算尺度)
.
27
权数作用
质量指标综合指数的两层含义:

《统计学概论》课件

《统计学概论》课件
方法
包括显著性检验、非参数检验和方差分析等。
方差分析
基本思想
通过比较不同组数据的方差来检验各组数据之间是否存在显著差异。
应用场景
常用于比较不同处理方法、不同实验条件下的数据差异,以及分析多因素对总体 数据的影响。
06
回归分析
一元线性回归分析
01 总结词
一元线性回归分析是统计学中 用于探索两个变量之间关系的 分析方法。
距离方法等方法进行检测和处理。
时间序列的平稳性检验与差分
总结词
时间序列的平稳性检验是判断时间序列 是否稳定的重要步骤,如果不稳定则需 要进行差分处理。
VS
详细描述
在进行时间序列分析时,需要判断时间序 列的平稳性。如果时间序列不平稳,则需 要进行差分处理。差分是将时间序列中的 相邻数据相减,以消除非平稳趋势。在进 行差分处理时,可以采用一阶差分、二阶 差分等不同阶数的差分方法。
抽样调查
从总体中选取一部分样 本进行调查,以推断总 体情况。
普查
对总体中所有个体进行 调查,以获取全面、准 确的数据。
重点调查
对总体中部分重点单位 或群体进行调查,以了 解总体趋势。
典型调查
对具有代表性的单位或 群体进行深入调查,以 揭示其特点。
统计数据的整理与显示
A
数据筛选
剔除异常值、错误值和重复值,确保数据质量 。
统计学的研究对象和方法
统计学的研究对象是数据,包括数据的收集、整理、分析和 解释。
统计学的方法包括描述性统计和推断性统计,描述性统计通 过对数据进行整理、概括和可视化,揭示数据的特征和规律 ;推断性统计则通过概率和假设检验等方法,对总体特征进 行推断和预测。
02 统计数据的收集与整理
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3. H0:μ=4.0,α=0.01,双尾检验,计算得双尾p=0.1 。统计结论:因为p>0.01,所以无统计学意义,不拒 绝H0。假设虚无假设实际为假,则所犯错误为( )错误。 4. H0:μ=4.0,α=0.05,双尾检验,计算得双尾 p=0.06。统计结论:因为p>0.05,所以无统计学意义 ,不拒绝H0。假设虚无假设实际为真,则所犯错误 为( )错误。
1问:实际操作中,怎么知道究竟犯了什么错误呢? 答:无从得知,因为无法得知总体参数的真实情况 2问:我们能否识别研究文献中的两类错误呢?
答:无从得知,因为作者的显著水平定为0.05或0.01 ,出现这种错误不可避免。并非作者责任。所以科学 从来就不是绝对正确的。由于这个原因,为了验证结 论的有效性,必须进行独立重复性的研究。 3问:如此说来,我们是否就无法知道哪个实验报告 的统计显著性哪个精确?哪个不精确?
答:可以知道,只有再次研究,如果得到类似结果 ,可肯定没有犯Ⅰ类错误。
需要指出的是,科学研究领域中,重复研究是一个 薄弱环节,人们对研究持有一种普遍观点,即:一 个好的研究必须与众不同并且对科学文献有所建树 。为此,科研人员独自进行研究设计以重复验证研 究结果时,其结果通常不对外公开。
小结
统计的基本问题就是通过样本统计量估计总体参数 在推论统计中,常常需要将获得值与期望值进行 比较。期望值是由恰当的抽样分布得出的,而抽 样分布是样本统计量取值的理论概率分布。我们 知道怎样通过抽样分布来解释样本统计量,而且 还了解了样本大小对抽样分布的影响。小样本往 往与总体参数差别比较大,样本越大,样本平均 数越接近总体平均数。 每个实验中都包含两个完全对立和排斥的假设。 虚无假设和备择假设。
9.3 统计假设的检验----显著性水平
图9-2 从三个 不同总体中 抽取样本量 分别为2、4 、30时的抽 样分布,无 论总体分布 怎样,随着 样本量增加 ,平均数的 分布都接近 正态
例题:假设一个完美的硬币,投掷10次,请预测: “不是5次正面5次反面的概率”是多少?
0.28 0.24 0.2 0.246 0.205 0.205
随机抽取的个 体的分数分布
样本平均数与 总体平均数相 差较大
X XX XXX XXXX
X XX XXX XXXX
N=2
样本平均数与总 体平均数相差较 小
X X X X XX X X XX XX
N=20
X X X X X X X
X X X X
样本平均数与 总体平均数相 差小
N=40
为什么抽样分布如此重要? 答案:一旦知道样本统计量的抽样分布,你就可以 作出各种不同的假设检验。 例题:调查某地化工厂排放污水对环境所致影响, 已知附近的野生海龟平均体重为μ=4,σ=1,理论 上大约65%的海龟在3-5磅之间。
随机抽取一个比较大的海龟的样本,海龟重量接近4 磅。样本平均数越接近总体平均数 假如我们抽样发现海龟重量大约是6磅,大样本也 是如此,你会有什么想法? 答案:这些海龟已经不属于4磅的那个群体了。 另外一个问题,由样本估计总体,误差有多大?如 何估计误差?需要把样本结果与预计的结果进行比 较。而预计结果是根据抽样分布得出的。 抽样分布的性质: 1. 加大样本量,统计量的分布越接近参数分布。 2. 分布形态越对称,接近钟形分布。
答:肯定的,“科学永远是一种概率”。
如果投掷10次硬币,碰巧会出现10次正面,这个硬币 很可能不存在偏向。如果投掷1024次,平均说来,投 掷10次会出现10次正面。如果选择0.05水平,则当H0 为真时,当我们拒绝H0时,犯错误的概率是0.05。 9.5.1 Ⅰ型错误(α错误) 拒绝一个真实的虚无假设时,所犯的错误。 心理或医学常取0.05的显著性水平,在诸如心理治疗 、咨询或医疗实践中, Ⅰ型错误可能导致更大的风 险或使患者承受更大的痛苦。因此可取0.01的显著性 水平。
什么情况拒绝虚无假设呢? 使用0.05的显著性水平,当特定结果发生的概率小于 或等于0.05时,就拒绝虚无假设,同时也就接受备择 假设了。下面给出检验步骤。
1. 假设H0为真 2. 计算抽样分布中样本统计量发生的概率 3. 如果概率足够小,则拒绝虚无假设H0,接受H1. 9.5 统计假设检验:两类错误 问:当拒绝虚无假设时,从统计上讲很难发生的事件 ,偶然会发生呢?
称为0.05的显著性水平(0.05 significance level)或5% 的显著性水平。
2. 在一个抽样分布中,如果一个事件发生的概率≤0.01 时,研究者认为该事件不是偶然因素所致。而是其他 因素引起,例如是对自变量的操纵引起的。称为0.01的 显著性水平(0.01significance level)或5%的显著性水平 实验者推论非偶然因素在某事件所起的作用的显著性 水平称为α水平(αlevel ) ,例如α=0.05或0.01 在投掷硬币中,出现9次正面甚至更为极端情况的概 率是多少呢?
我们关心的“总体”主要是指一个假设整体。在典 型的实验情境中,真实的总体是不存在的。而我们 想得到的是假设这个总体存在时,总体的一些性质 。 例如我们随机抽取一组病人(样本)服用某种药物, 我们希望什么?
我们希望试验结果可以给可能使用这种药物的每一 个人。当然这里是假想的总体。 因为我们无法对总体进行详细研究,只有根据样 本统计量得出关于总体参数的结论。几乎所有的 研究都是对有限的个体进行观察和测量,从中了 解总体的情况。
人们往往认为Ⅱ类错误容易接受,因为没有证明 自变量的影响,但是这样做也可能产生一些负面影响 。例如,由于Ⅱ类错误人们很可能放弃一种实际有意 义的研究结论。降低Ⅱ类错记的术语 总体 样本 抽样分布 二项分布
显著性水平 α水平
虚无假设H0 备择假设H1 双尾概率值 Ⅱ类错误(β错
P(9次正面)+P(10次正面)+P(1次正面)+P(0次正面)= 0.010 +0.001 + 0.010 +0.001 =0.02
投掷硬币10次,出现9次正面这种罕见事件的双尾概 率大约=0.02。如果选择α=0.05,我会认为这个结果 是由非偶然因素造成的(硬币有偏向)。 如果选择α=0.01,则我们不能够判定是偶然所致。 注意:选择什么样的α水平,在研究设计阶段就要确 定下来。我们不能先进行一项研究,然后分析结果 ,得到一个概率值后再去确定α水平。
1. 虚无假设(H0) 表示一个或多个总体参数的假设值 2. 备择假设(H1) 表示总体参数不是虚无假设中的值, 而是另有其值 H0:μ=4.0 (虚无假设) H1:μ≠4.0 (备择假设) H1可以是无方向的(nondirectional) 或双尾(two-tail) 假设。 H1也可以是有方向的(directional) , 不仅表示参数值 不等于H0假设中的值,还说明差异的方向。 H0:μ≤4.0 (虚无假设) H1:μ>4.0 (备择假设)
第9章 推论统计导论
9.1 抽样问题 问题1:你是一位临床心理学者,你想在某一社区进 行心理治疗,你希望了解什么? 答案:社区的情绪问题和发病率。 问题2:如果你感到身体不适,医生想给你验血,医 生想了解什么? 答案:医生想了解你是否患了某种疾病。 以上问题的共同点是什么? 答案:你想知道某总体的参数,通过参数得到结论
只有25%出现 0.16 0.117 5次正面,不 0.12 0.08 是对半的概率 0.044 是75% 0.04 0.0010.01
概率
0 1 2 3 4
0.117 0.044 0.010.001 8 9 10 11
5 6 7 正面向上的次数
如果出现9次正面1次反面,如何对看待这个结果? 答案:我们怀疑这个硬币的可信度,因为太罕见
方向性假设 无方向性假设 单尾概率值 误)
Ⅰ类错误 (α错误)
9.2 抽样分布的概念 从总体中随机抽取N个样本,根据样本统计量推论总 体参数。这些样本统计量可能出现的所有情况,称 为“抽样分布”。每一种统计量都有抽样分布,例 如平均数、标准差、方差、比例、中位数等。 例如,从一个μ=4,σ=1的总体中随机抽取一个相 同容量的样本,大多数的样本平均数会接近4.0, 也可能有极个别的偏离4.0,异常平均数的大小取 决于样本大小。
罕见的情况使我们怀疑这种情况不是偶然因素所致 ,而是硬币有问题。 这里有一个重要问题:“从投掷硬币的问题,我 们能否得出推论的界限在哪里?” 答案:科学的本质是讲概率的,没有所谓绝对的 科学,在科学领域,多数研究者会采纳下列两个 临界点中的一个作为对非偶然性因素的作用进行 推论的依据。 1. 在一个抽样分布中,如果一个事件发生的概率 ≤0.05时,研究者认为该事件不是偶然因素所致。 而是其他因素引起,例如是对自变量的操纵引起 的。
9.4 统计假设的检验 9.4.1 虚无假设和被择假设 我们研究的目的:由样本推论总体 我们希望:如果样本平 均数=6.0,那么总体平 均数必定为6.0 我们只能说:如果 μ=4.0,那么得到一个 样本平均数不同于总 体的概率是多大?
X 6
总体
样本
假定μ=4.0
总体
样本
X 6
推论统计的两种假设
下面4个例子各犯了什么错误? 1. H0:μ=4.0,α=0.05,双尾检验,计算得双尾 p=0.03。统计结论:因为p<0.05,所以具有统计学意 义,拒绝虚无假设。假设虚无假设实际为真,则所犯 错误为( )错误。 2. H0:μ=4.0,α=0.05,双尾检验,计算得双尾 p=0.04。统计结论:因为p<0.05,所以具有统计学意 义,拒绝虚无假设。假设虚无假设实际为假,则所犯 错误为( )错误。
当评估一项研究结果时,无论备择假设是否有方向, 应该使用单尾概率值(one –tail probability value )
9.4.2 间接证明的思想 如果将一枚硬币投掷10次、1000次,如果出现5次或 500次正面,我们能‘证明’它是可靠或无偏向吗? 只能说:我们没有理由拒绝”硬币是可靠的”这一假 设 同样,我们能否证明备择假设正确与否呢? 在一张纸上画两条直线,比较其长度是否存在差异? 你该怎么回答呢? 答:“它们不一样长,长度一定存在差异” 通过拒绝长度相等(虚无假设),你可断定存在差异
相关文档
最新文档