标准误
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
名为均数的标准误,简称标准误,以区别于通常所说的标准差。 标准差表示个体值的分布情形,而标准误则说明样本均数的参差
情况,两者不能混淆。下面用抽样试验进一步说明之。
红细胞数抽样实验用的正态总体 μ=500 σ=43(单位:万/立方厘米)
383 445 465 478 489 500 511 522 535 555
以上介绍了求标准误的三种方法,其实我们平常用 的只是式(3),而通过前两种方法的对比则可使我们明瞭 标准误的含义。标准误是描述样本均数变异情况的一个 指标,它的大小与总体标准差σ(一般只能用S估计)成 正比,而与样本含量n的平方根成反比,因此若标准差 小或样本含量大时,求出的标准误就小(标准误小表示 样本均数与总体均数较接近),X代表μ较可靠,所以假 若手头资料中观察值的变异程度较大(S大)时,为了 保证样本代表总体比较可靠,就得适当增大样本含量 (n)根据中心极限定理样本含量(n)大于30。
σ的估计值。这样,公式中的σ就要用S代替, x 改为
Sχ,
Sx
S n
61.65 10
9.50
(3)
S x 将成为10.74,余类 再若将第2号样本的数字代入, 推。由于不同样本的标准差并不相等,可见 S x 也有抽样 波动,这一点是值得注意的,但它仍不失为 x 的较好 估计值。
标准差(Standard Deviation -S或SD)
标准差与标准误(差)的区别
抽样误差和系统误差不一样,关于系统误差,当人们
一旦发现它之后,是可能找到产生原因而采取一定措施加
以纠正的,而抽样误差则无法避免。因为客观上既然存在
个体差异,那么刚巧这一样本中多抽到几例数值大些的,
所求样本均数就会稍大,另一样本多抽到几例数值小些, 该样本均数就会稍小,这是不言而喻的。 抽样误差既然是样本统计数指标与总体参数指标之间 的误差,那么抽样误差小就表示从样本算得的平均数或百
444 463 477 488 499 509 521 534 551 617
红细胞数抽样试验中的样本举例
样 本 号
红细胞数(万/立方厘米),yi
y
S
1 383 599 534 442 435 486 478 476 2 503 506 520 503 489 410 528 488 3 478 463 617 544 498 485 496 462
是用来反映变异程度,当两 组观察值在单位相同、均数相近的情况下,标准差越大, 说明观察 值间的变异程度越大。即观察值围绕均数的分布较离散,均数的代 表性较差。反之,标准差越小,表明观察值间的变异较小, 观察值围 绕均数的分布较密集,均数的代表性较好。 1 抽样误差的意义 样本与总体以及抽样误差的概念,由于存在人与人之间的个体 差异,即使从同一总体用同样方法随机抽取例数相同的一些样本, 各样本算得的某种指标,如平均数(或百分率),通常也参差不齐 存在一定的差异。样本指标与相应的总体指标之间有或多或少的相 差,这一点是不难理解的。如我们从某学院抽了80名男同学,测量 其身高,计算出均数为168.10cm,若再从我们学院抽80名男同学, 其平均身高未必仍等于168.10cm,也不一定恰好等于我们学校男 同学身高的总体均数,这种差异,即由于抽样而带来的样本与总体 间的误差,统计上叫抽样波动或抽样误差。
459 383 498.4 52.63
482 471 494.9 29.51 . . . . . . . . . . . . . . . .
第一号样本均数与标准差的计算: X=4886/10=488.6 将一百个样本均数加总,得到的数值为50,096.7, 又这一百个样本均数平方之和为25,114,830.91,于是 代入标准差的计算公式,求得一百个样本均数的标准 差又称标准误为
分率与总体的较接近,该样本代表总体说明其特征的可靠
性亦大。但是,通常总体均数或总体方差我们并不知道, 所以抽样误差的数量大小,不能直观地加以说明,只能通 过抽样实验来了解抽样误差的规律性。
2
标准误(Standard error —SE)及其计算
为了表示个体差异的大小,或者说表示某一变量变异程度的
大小,可计算其标准差(Standard error —SE)等变异指标来说
明,现在我们要表示抽样误差的大小,如要问,从同一总体抽取
类似的许多样本,各样本均数(或各率)之间的变异程度如何? 也可用变异指标来说明。这种指标是: 2.1 均数的标准误 为了表示均数的抽样误差大小如何,用的 一种指标称为均数的标准误。我们以样本均数为变量,求出它们
的标准差即可表示其变异程度,所以将样本均数的“标准差”定
431 456 471 484 495 505 516 529 544 578
435 459 472 485 496 506 518 530 545 590
442 461 473 486 497 507 519 531 548 599
442 462 476 487 498 508 520 532 550 600
S
x i2
(
xi ) 2 n
n 1
2421508 4886 2 / 10 61 .65 10 1
将这一百个样本均数加总,得到的数值为50,096.7,又 这一百个样本均数平方之和为25,114,830.91,于是代入 标准差的计算公式,求得一百个样本均数的标准差又称标 准误为 2 25114830 .91 50096 .7 10 S 13.50 (1) 10 1
当总体标准差已知时,可计算理论的标准误 x ,公式是
43 x 13.60 n 10
(2)
由此,可见由一百个样本均数求得的标准误13.50与理论的 标准误13.60比较接近。 在实际工作中,总体标准差往往并不知道,也不象抽样实 验那样从同一总体随机抽取n相等的许多样本,而是只有手头 一个样本。在此情况下,只能以样本标准差S作为总体标准差 以便区别。 S x
410 449 466 479 491 501 512 523 537 556
422 450 468 480 492 502 513 524 538 558
429 452 469 481 493 503 514 527 539 565
430 455 470 482 494 504 515 528 541 569
509 544 488.6 61.65 509 527 498.3 33.97 482 569 509.4 50.96
4 529 465 535 473 531 532 556 521
5 442 493 462 527 520 519 521 412 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
情况,两者不能混淆。下面用抽样试验进一步说明之。
红细胞数抽样实验用的正态总体 μ=500 σ=43(单位:万/立方厘米)
383 445 465 478 489 500 511 522 535 555
以上介绍了求标准误的三种方法,其实我们平常用 的只是式(3),而通过前两种方法的对比则可使我们明瞭 标准误的含义。标准误是描述样本均数变异情况的一个 指标,它的大小与总体标准差σ(一般只能用S估计)成 正比,而与样本含量n的平方根成反比,因此若标准差 小或样本含量大时,求出的标准误就小(标准误小表示 样本均数与总体均数较接近),X代表μ较可靠,所以假 若手头资料中观察值的变异程度较大(S大)时,为了 保证样本代表总体比较可靠,就得适当增大样本含量 (n)根据中心极限定理样本含量(n)大于30。
σ的估计值。这样,公式中的σ就要用S代替, x 改为
Sχ,
Sx
S n
61.65 10
9.50
(3)
S x 将成为10.74,余类 再若将第2号样本的数字代入, 推。由于不同样本的标准差并不相等,可见 S x 也有抽样 波动,这一点是值得注意的,但它仍不失为 x 的较好 估计值。
标准差(Standard Deviation -S或SD)
标准差与标准误(差)的区别
抽样误差和系统误差不一样,关于系统误差,当人们
一旦发现它之后,是可能找到产生原因而采取一定措施加
以纠正的,而抽样误差则无法避免。因为客观上既然存在
个体差异,那么刚巧这一样本中多抽到几例数值大些的,
所求样本均数就会稍大,另一样本多抽到几例数值小些, 该样本均数就会稍小,这是不言而喻的。 抽样误差既然是样本统计数指标与总体参数指标之间 的误差,那么抽样误差小就表示从样本算得的平均数或百
444 463 477 488 499 509 521 534 551 617
红细胞数抽样试验中的样本举例
样 本 号
红细胞数(万/立方厘米),yi
y
S
1 383 599 534 442 435 486 478 476 2 503 506 520 503 489 410 528 488 3 478 463 617 544 498 485 496 462
是用来反映变异程度,当两 组观察值在单位相同、均数相近的情况下,标准差越大, 说明观察 值间的变异程度越大。即观察值围绕均数的分布较离散,均数的代 表性较差。反之,标准差越小,表明观察值间的变异较小, 观察值围 绕均数的分布较密集,均数的代表性较好。 1 抽样误差的意义 样本与总体以及抽样误差的概念,由于存在人与人之间的个体 差异,即使从同一总体用同样方法随机抽取例数相同的一些样本, 各样本算得的某种指标,如平均数(或百分率),通常也参差不齐 存在一定的差异。样本指标与相应的总体指标之间有或多或少的相 差,这一点是不难理解的。如我们从某学院抽了80名男同学,测量 其身高,计算出均数为168.10cm,若再从我们学院抽80名男同学, 其平均身高未必仍等于168.10cm,也不一定恰好等于我们学校男 同学身高的总体均数,这种差异,即由于抽样而带来的样本与总体 间的误差,统计上叫抽样波动或抽样误差。
459 383 498.4 52.63
482 471 494.9 29.51 . . . . . . . . . . . . . . . .
第一号样本均数与标准差的计算: X=4886/10=488.6 将一百个样本均数加总,得到的数值为50,096.7, 又这一百个样本均数平方之和为25,114,830.91,于是 代入标准差的计算公式,求得一百个样本均数的标准 差又称标准误为
分率与总体的较接近,该样本代表总体说明其特征的可靠
性亦大。但是,通常总体均数或总体方差我们并不知道, 所以抽样误差的数量大小,不能直观地加以说明,只能通 过抽样实验来了解抽样误差的规律性。
2
标准误(Standard error —SE)及其计算
为了表示个体差异的大小,或者说表示某一变量变异程度的
大小,可计算其标准差(Standard error —SE)等变异指标来说
明,现在我们要表示抽样误差的大小,如要问,从同一总体抽取
类似的许多样本,各样本均数(或各率)之间的变异程度如何? 也可用变异指标来说明。这种指标是: 2.1 均数的标准误 为了表示均数的抽样误差大小如何,用的 一种指标称为均数的标准误。我们以样本均数为变量,求出它们
的标准差即可表示其变异程度,所以将样本均数的“标准差”定
431 456 471 484 495 505 516 529 544 578
435 459 472 485 496 506 518 530 545 590
442 461 473 486 497 507 519 531 548 599
442 462 476 487 498 508 520 532 550 600
S
x i2
(
xi ) 2 n
n 1
2421508 4886 2 / 10 61 .65 10 1
将这一百个样本均数加总,得到的数值为50,096.7,又 这一百个样本均数平方之和为25,114,830.91,于是代入 标准差的计算公式,求得一百个样本均数的标准差又称标 准误为 2 25114830 .91 50096 .7 10 S 13.50 (1) 10 1
当总体标准差已知时,可计算理论的标准误 x ,公式是
43 x 13.60 n 10
(2)
由此,可见由一百个样本均数求得的标准误13.50与理论的 标准误13.60比较接近。 在实际工作中,总体标准差往往并不知道,也不象抽样实 验那样从同一总体随机抽取n相等的许多样本,而是只有手头 一个样本。在此情况下,只能以样本标准差S作为总体标准差 以便区别。 S x
410 449 466 479 491 501 512 523 537 556
422 450 468 480 492 502 513 524 538 558
429 452 469 481 493 503 514 527 539 565
430 455 470 482 494 504 515 528 541 569
509 544 488.6 61.65 509 527 498.3 33.97 482 569 509.4 50.96
4 529 465 535 473 531 532 556 521
5 442 493 462 527 520 519 521 412 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .