统计学之样本大小
统计学中的统计学原则
统计学中的统计学原则统计学是一门研究数据收集、分析和解释的学科,它在经济学、社会学、医学等领域发挥着重要作用。
在统计学中,有一些基本的原则被广泛运用,以确保数据的有效性和可信度。
本文将介绍统计学中的三个重要原则:样本代表性、随机性和样本大小。
样本代表性样本代表性是指从总体中选取的样本应该能够准确地反映出总体的特征。
在统计学中,总体是指我们感兴趣的所有个体或现象的集合,而样本是从总体中选取的部分个体或现象的集合。
通过分析样本数据,我们可以对总体的特征进行推断。
为了确保样本代表性,我们需要采用随机抽样方法。
随机抽样是一种无偏的抽样方法,每个个体或现象都有相同的被选中的机会。
通过随机抽样,我们可以避免个人主观因素的干扰,并且能够更好地推断总体的特征。
此外,还可以使用分层抽样方法,将总体划分为不同的层次,并在每个层次中进行随机抽样,以确保各层次的代表性。
随机性随机性是统计学中的一个重要原则,它要求我们在数据收集和分析过程中遵循随机的原则。
具体来说,随机性要求我们避免对数据的选择性偏见,以及避免人为干扰。
在数据收集过程中,我们需要使用随机化方法来选择样本或实验单位。
例如,在实验设计中,可以通过随机分组来避免实验组和对照组之间的差异。
在调查研究中,可以使用随机次序来避免顺序效应的影响。
通过随机化,我们可以减少系统性误差,并提高数据的可信度。
样本大小样本大小是指我们从总体中选取的样本的个数。
在统计学中,样本大小对于数据分析的可靠性和推断的精度至关重要。
一般而言,样本大小越大,数据分析的结果越可靠,推断的精度越高。
为了确定合适的样本大小,我们可以使用统计学中的抽样技术和样本大小计算方法。
根据总体的大小、预计误差、置信水平等因素,可以计算出所需的样本大小。
通过合理选择样本大小,我们可以在保证分析结果可信的前提下,降低调查成本和研究时间。
总结在统计学中,样本代表性、随机性和样本大小是三个基本的统计学原则。
遵循这些原则可以确保数据的有效性和可信度,提高数据分析的准确性和推断的精度。
统计学中的抽样方法和样本容量
统计学中的抽样方法和样本容量在统计学中,抽样方法和样本容量的选择对于获取准确的研究结果至关重要。
本文将介绍常用的抽样方法并探讨如何确定合适的样本容量。
一、抽样方法抽样方法是指从总体中选择一部分个体进行研究,以便通过对样本的观察和分析来推断总体的特征。
常见的抽样方法包括:1. 简单随机抽样:简单随机抽样是指从总体中随机选择个体,使每个个体被选中的概率相等。
这样可以确保样本具有代表性,并且每个个体都有被选中的机会。
2. 系统抽样:系统抽样是按照一定的规则从总体中选择样本。
例如,每隔一定间隔选择一个个体作为样本。
这种方法适用于总体有序的情况下,能够保证样本的分布与总体的分布相似。
3. 分层抽样:分层抽样是将总体划分为若干层,然后从每层中分别进行随机抽样。
这样可以保证每个层次都能被充分代表,提高样本的多样性。
4. 整群抽样:整群抽样是将总体划分为若干群,然后随机选择部分群体作为样本,再从每个选中的群体中选择个体进行观察。
这种方法节省了时间和成本,适用于总体分布不均匀的情况。
二、样本容量的确定样本容量的确定需要考虑以下几个因素:1. 总体大小:总体大小是影响样本容量的重要因素。
当总体较大时,相对较小的样本容量就可以提供足够的信息来进行统计推断。
但如果总体较小,可能需要选择较大的样本容量以达到准确性要求。
2. 总体变异程度:总体的变异程度越大,需要选择更大的样本容量来减小抽样误差。
因为变异程度大意味着样本数据的离散度较高,需要更多的样本来保证统计结果的可靠性。
3. 置信水平和置信区间:置信水平和置信区间是指统计推断中的置信程度和变异范围。
较高的置信水平和较窄的置信区间要求选择更大的样本容量,以提高推断的准确性和精确度。
4. 研究目的和资源限制:研究目的和资源限制也是决定样本容量的重要因素。
如果研究目的是获取准确的统计结果,就需要选择较大的样本容量。
但在现实情况下,资源有限可能会限制样本容量的选择。
综上所述,统计学中的抽样方法和样本容量的选择是保证研究结果可靠性和准确性的关键步骤。
大样本与小样本理论在统计学中的区别与应用
大样本与小样本理论在统计学中的区别与应用统计学是一门研究数据收集、分析和解释的学科。
在统计学中,样本是指从总体中选取的一部分个体或观测值。
根据样本的大小,我们可以将样本分为大样本和小样本。
大样本通常指的是样本容量较大,而小样本则相对较小。
在统计学中,大样本和小样本理论有着不同的应用和区别。
一、大样本理论大样本理论是指在样本容量足够大的情况下,对总体参数进行推断的一种方法。
大样本理论的基本原理是当样本容量足够大时,样本统计量的分布会趋近于正态分布。
这是由于大样本的中心极限定理保证的。
根据中心极限定理,当样本容量足够大时,无论总体分布是什么样的,样本均值的分布都会接近于正态分布。
大样本理论的一个重要应用是在总体均值的估计上。
通过计算样本均值和标准差,可以利用大样本理论来估计总体均值的置信区间。
置信区间是指对总体参数的估计范围,给出了一个包含真实总体参数的区间范围。
大样本理论的应用使得我们可以通过样本数据对总体参数进行推断,并给出估计的可信度。
此外,大样本理论还可以用于假设检验。
假设检验是统计学中常用的一种方法,用于判断某个假设是否成立。
通过计算样本均值和标准差,可以利用大样本理论来进行假设检验。
假设检验的结果可以帮助我们判断某个假设是否成立,并对实际问题做出相应的决策。
二、小样本理论与大样本理论相比,小样本理论更适用于样本容量较小的情况。
在小样本情况下,样本统计量的分布不一定服从正态分布。
因此,小样本理论需要对样本分布进行更加精确的推断。
小样本理论的一个重要应用是在总体均值的估计上。
与大样本理论不同,小样本理论需要考虑样本的分布情况。
当样本容量较小时,我们通常会假设样本来自于正态分布总体。
通过计算样本均值和标准差,可以利用小样本理论来估计总体均值的置信区间。
小样本理论的应用使得我们可以在样本容量较小的情况下对总体参数进行推断。
此外,小样本理论还可以用于方差分析。
方差分析是一种用于比较多个总体均值是否相等的方法。
统计学小样本概念的理解
统计学小样本概念的理解统计学中的小样本概念是指在统计分析中,所使用的样本的数量相对较少的情况下所进行的分析和推断。
小样本通常定义为样本容量在30或更少的情况。
相对于大样本来说,小样本的数据量较少,因此在进行统计分析时需要特别注意样本带来的不确定性和偏差。
小样本在统计学中有着重要的应用和意义。
首先,小样本是一种常见的研究方法,在某些领域和条件下难以获得大样本。
例如在医学和心理学研究中,由于时间、成本和伦理等因素的限制,往往只能使用小样本进行研究。
其次,小样本在某些特殊情况下也具有一定的优势。
在一些稀有事件或特定群体的研究中,由于样本数量较少,可以更容易地获得研究对象,并进行深入的研究和分析。
此外,在一些特定的实验设计中,小样本也可以提供有关因果关系的初步证据。
然而,小样本也存在一些问题和限制。
首先,小样本容易引发样本选择偏差,从而使得结果的泛化能力较弱。
由于样本的数量较少,很难保证样本的代表性和随机性,因此得到的结论通常只能适用于当前样本所代表的特定群体或条件。
其次,小样本容易受到异常值和噪声的影响,从而导致结果的不稳定性和误差性。
由于样本的数量有限,即使出现极个别的异常值或噪声,都可能对结果产生较大的影响。
此外,小样本的数据也往往无法满足统计分析的假设条件,如正态性或方差齐性等,这增加了结果的不确定性和偏差。
在进行小样本分析时,需要采用一些特殊的统计方法和技术来解决上述问题。
首先,可以使用非参数统计方法来避免对数据分布的假设。
非参数方法主要基于数据的秩次而非具体数值,在一定程度上减少了对数据分布的依赖,提高了统计推断的可靠性。
其次,可以使用交叉验证等技术来评估预测模型的准确性和稳定性。
在小样本情况下,直接将数据分为训练集和测试集可能导致结果的不稳定,因此可以使用交叉验证将数据多次划分为训练集和测试集,从而得到更稳定和可靠的结果。
此外,还可以使用贝叶斯统计方法来引入先验知识,从而减少样本数量的限制。
统计学计算最小样本量
统计学计算最小样本量在统计学中,样本量是非常重要的一个概念。
样本量的大小直接关系到统计推断的精确性和可靠性。
因此,在进行统计研究时,我们需要合理地确定样本量的大小,以确保我们能够得出准确的结论。
那么,如何计算最小样本量呢?我们需要确定研究的目的和假设。
根据研究的目的和假设,我们可以选择适当的统计方法,并确定所需的显著性水平和效应大小。
显著性水平是我们接受或拒绝原假设的标准,通常取0.05或0.01。
效应大小是指我们希望检测到的实际差异的大小,通常根据经验或先前的研究来确定。
我们需要选择适当的统计检验。
常见的统计检验包括t检验、方差分析、卡方检验等。
每种统计检验都有其适用的条件和假设,我们需要根据研究的具体情况来选择适当的检验方法。
接下来,我们可以利用统计软件或在线计算工具来计算最小样本量。
以t检验为例,我们需要输入显著性水平、效应大小和所需的统计功效。
统计功效是我们希望能够检测到实际差异的概率,通常取0.8或0.9。
计算得出的结果即为最小样本量。
需要注意的是,计算得到的最小样本量是理论上的估计值,实际研究中可能存在其他因素的影响,如样本的可获得性、研究的时间和资源限制等。
因此,在确定最终的样本量时,我们需要综合考虑这些因素,并且在可行的范围内尽量接近计算得到的最小样本量。
我们还可以进行样本量的后续计算和调整。
在实际研究中,我们可能会遇到一些不可预见的情况,如样本的失效、数据的缺失等。
这时,我们可以根据实际情况进行样本量的修正和重新计算,以保证研究的可靠性和有效性。
除了计算最小样本量,我们还可以通过其他方法来评估样本量的合理性。
例如,我们可以进行样本量的敏感性分析,通过改变显著性水平、效应大小和统计功效等参数,来观察样本量的变化情况。
这样可以帮助我们了解样本量的稳定性和健壮性。
统计学计算最小样本量是一项重要的工作,它可以帮助我们合理地确定研究的样本量,从而保证研究结果的可靠性和准确性。
在进行样本量计算时,我们需要明确研究的目的和假设,选择适当的统计方法和检验,利用统计软件或在线工具进行计算,并综合考虑其他因素进行样本量的调整。
统计学中的样本大小与功效分析
统计学中的样本大小与功效分析统计学是一门研究数据收集、分析和解释的学科。
在统计学中,样本大小和功效分析是两个重要的概念。
样本大小是指在进行统计研究时所需要的样本数量,而功效分析则是评估研究结果的可靠性和有效性。
本文将探讨统计学中的样本大小与功效分析的相关内容。
一、样本大小的重要性样本大小在统计研究中起着至关重要的作用。
一个合适的样本大小可以保证研究结果的可靠性和有效性。
如果样本大小过小,可能导致研究结果的偏差和不准确性。
相反,如果样本大小过大,不仅会浪费研究资源,还可能增加研究的成本和时间。
因此,确定一个合适的样本大小是进行统计研究的基础。
二、样本大小的确定方法确定样本大小的方法有多种,其中常用的方法包括效应大小、置信水平、功效和预计的样本方差。
效应大小是指研究中所期望观察到的效果的大小。
置信水平是指对于研究结果的置信程度。
功效是指在给定的效应大小和置信水平下,研究能够检测到该效应的能力。
预计的样本方差是指在样本中观察到的变异程度。
根据这些因素,研究者可以使用统计软件或公式来计算出所需的样本大小。
通过合理的样本大小计算,可以确保研究结果的准确性和可靠性。
三、功效分析的意义功效分析是评估研究结果的可靠性和有效性的方法。
在进行统计研究时,通过计算功效可以确定研究是否具有足够的样本大小来检测到所期望的效应。
功效分析可以帮助研究者评估研究结果的可靠性,并决定是否需要增加样本大小以提高研究的有效性。
功效分析还可以帮助研究者设计合理的研究方案。
通过计算功效,研究者可以确定所需的样本大小和实验设计,以确保研究结果具有统计学上的显著性和实际意义。
四、样本大小与功效分析的应用样本大小和功效分析广泛应用于各个领域的统计研究中。
在医学研究中,确定合适的样本大小可以确保临床试验的结果具有统计学上的意义,并为临床实践提供可靠的依据。
在市场调研中,样本大小和功效分析可以帮助企业确定样本数量,以评估市场需求和消费者行为。
在社会科学研究中,样本大小和功效分析可以帮助研究者确定样本数量,以评估社会问题和行为模式。
样本小 非参数统计
样本小非参数统计
样本小和非参数统计是统计学中的两个重要概念,它们在数据分析和推断中起着关键作用。
首先,让我们来看看样本小的概念。
样本小通常指的是从总体中抽取的样本容量相对较小的情况。
在统计学中,样本大小对于数据分析和推断的可靠性至关重要。
当样本容量较小时,统计推断的可靠性会降低,因为样本的代表性可能受到影响,从而导致推断结果的不确定性增加。
此时需要谨慎对待统计分析的结果,可能需要采取更保守的方法进行推断。
接下来,让我们来谈谈非参数统计。
非参数统计是一种统计推断的方法,它不依赖于总体分布的具体形式。
与参数统计相对,非参数统计不对总体分布做出具体的假设,因此更加灵活。
非参数统计方法通常用于样本容量较小或总体分布未知的情况下,它们能够提供一种更加普适和稳健的统计推断方式。
从样本小和非参数统计的角度来看,我们可以探讨它们在实际应用中的重要性和影响。
首先,样本小可能会导致统计推断的不确定性增加,因此在实际数据分析中,需要对样本小的情况进行特殊
处理,可能需要采用非参数统计方法来进行推断。
非参数统计方法
的灵活性和普适性使得它们在样本小的情况下能够提供可靠的推断
结果,因此在实际应用中非参数统计具有重要意义。
总的来说,样本小和非参数统计都是统计学中非常重要的概念,它们对于数据分析和推断具有重要影响。
在实际应用中,我们需要
根据样本大小和数据特点选择合适的统计方法,以确保推断结果的
可靠性和准确性。
统计学中的样本量的计算公式
统计学中的样本量的计算公式在统计学中,样本量是指用来进行统计推断的样本的大小。
样本量的确定对于统计分析的准确性和可靠性至关重要。
样本量的计算公式是根据统计学原理和假设推导出来的,通过计算得到合适的样本量可以提高统计推断的精确性。
样本量的计算公式主要基于以下几个因素:总体大小、置信水平、置信区间、总体方差、误差限、显著水平、样本误差和效应大小等。
下面将逐一介绍这些因素对样本量计算的影响。
1. 总体大小:总体大小是指所研究的总体中个体的数量。
总体大小对样本量的要求有一定的影响,总体越大,所需的样本量相对较小;总体越小,所需的样本量相对较大。
这是因为总体大小的增加可以提高总体的代表性,从而减少样本误差。
2. 置信水平:置信水平是指统计推断的可信程度,通常表示为1-α,其中α为显著性水平。
常见的置信水平为95%或99%。
置信水平越高,要求的样本量相对较大,因为需要更高的置信度来保证统计推断的准确性。
3. 置信区间:置信区间是指估计总体参数的范围。
置信区间的宽度与样本量有关,置信区间越窄,要求的样本量相对较大。
这是因为较小的置信区间可以提供更精确的估计结果。
4. 总体方差:总体方差是指所研究总体的变异程度。
总体方差越大,要求的样本量相对较大;总体方差越小,要求的样本量相对较小。
这是因为较大的总体方差需要更大的样本量来减少抽样误差。
5. 误差限:误差限是指估计结果与真实值之间的差异。
误差限越小,要求的样本量相对较大;误差限越大,要求的样本量相对较小。
较小的误差限可以提供更精确的估计结果。
6. 显著水平:显著水平是指拒绝零假设的临界值。
显著水平越小,要求的样本量相对较大;显著水平越大,要求的样本量相对较小。
较小的显著水平可以提高统计推断的严谨性。
7. 样本误差:样本误差是指样本统计量与总体参数之间的差异。
样本误差越小,要求的样本量相对较大;样本误差越大,要求的样本量相对较小。
较小的样本误差可以提供更准确的估计结果。
名词解释:样本
名词解释样本在统计学和数据分析领域,样本是从总体中抽取出来的一部分个体,是对总体的一种代表。
本文将对样本的概念、分类、抽样方法以及样本大小进行详细介绍。
一、概念样本(Sample)是从一个总体(Population)中抽取出来的一部分个体。
总体是指研究对象的全体,而样本是总体中的一部分。
通过对样本进行研究,可以对总体的特征进行推断。
二、分类根据抽样的方式,样本可以分为以下几类:1. 简单随机抽样:从总体中随机地抽取 n 个样本,每个样本被抽中的概率相等。
2. 分层抽样:将总体按照某种特征分为若干层,然后从每层中随机抽取一定数量的样本。
3. 系统抽样:从总体中按照一定的间隔抽取样本,例如每隔 10 个抽取一个样本。
4. 整群抽样:将总体划分为若干群,然后随机抽取若干群,对抽中的群内所有个体进行研究。
5. 滚雪球抽样:通过已有样本的介绍,不断扩大样本规模。
三、抽样方法1. 随机抽样:利用随机数表或抽样软件,随机生成抽样框中的样本。
2. 系统抽样:确定抽样间隔,然后从抽样框中按照间隔抽取样本。
3. 分层抽样:确定分层比例,从每层中按照比例抽取样本。
4. 整群抽样:随机抽取群数,对抽中的群内所有个体进行研究。
5. 滚雪球抽样:通过已有样本的介绍,不断扩大样本规模。
四、样本大小样本大小(Sample Size)是指样本中包含的个体数量。
样本大小的选择要充分考虑研究目的、总体特征、研究成本等因素。
一般来说,样本越大,对总体的代表性越好,研究结果越可靠。
然而,过大的样本会导致研究成本增加,且会增加数据分析的难度。
因此,在确定样本大小时,需要在可靠性、实用性和成本之间进行权衡。
总之,样本是统计学和数据分析领域中一个重要的概念,通过对样本的研究,可以对总体的特征进行推断。
样本的分类、抽样方法以及样本大小的选择都会影响研究结果的准确性和可靠性。
统计学中的抽样方法与样本大小选择
统计学中的抽样方法与样本大小选择在统计学中,抽样方法和样本大小选择是进行数据分析和推断的重要步骤。
合理选择抽样方法和样本大小可以确保研究结果的准确性和可靠性。
本文将介绍统计学中常用的抽样方法,并讨论如何选择合适的样本大小。
一、抽样方法1. 简单随机抽样法简单随机抽样法是最基本、最常用的抽样方法之一。
在简单随机抽样中,每个个体都有相等的机会被选入样本。
这种抽样方法可以尽可能地减小样本与总体的差异,使得样本能够代表总体。
2. 系统抽样法系统抽样法是按照一定的间隔从总体中选择样本的方法。
例如,从一个时间段内的每隔一定时间抽取一个数据点。
系统抽样法相对于简单随机抽样法更加方便,但需要注意选择的间隔不能引入任何偏倚。
3. 分层抽样法分层抽样法将总体划分为若干层,然后从每个层中进行简单随机抽样。
这种抽样方法可以使得样本更加代表总体,并且可以针对不同层次的特点进行分析。
4. 整群抽样法整群抽样法是将总体划分为若干个群体,然后随机选择若干个群体作为样本。
整群抽样法适用于群体内部的个体相似性较高的情况,可以减小样本进行抽样的时间和成本。
二、样本大小选择样本大小的选择对于统计推断的准确性至关重要。
样本过小会导致结果的不稳定,样本过大则会浪费资源。
在选择样本大小时,需要考虑以下几个因素:1. 总体大小总体大小决定了样本大小的选择。
总体越大,需要的样本数量就越大,以保证样本的代表性。
2. 抽样误差容忍度抽样误差容忍度是指研究者能够接受的样本估计误差的范围。
通常情况下,希望抽样误差越小越好,但取决于研究目的和可用资源。
3. 抽样变异性样本的抽样变异性反映了研究群体的异质性。
当样本的抽样变异性较小时,需要的样本数量较少;反之,需要的样本数量较多。
4. 统计方法不同的统计方法对样本大小有不同的要求。
例如,回归分析需要的样本大小要比单样本均值检验要大。
综合考虑以上因素,可以借助统计学中的抽样方法与样本大小计算公式来确定合适的样本大小。
中心极限定理 大样本 小样本 置信区间
中心极限定理大样本小样本置信区间中心极限定理、大样本、小样本和置信区间是统计学中的重要概念,它们在数据分析和推断中起着关键作用。
本文将依次介绍这些概念,并探讨它们的内涵和应用。
一、中心极限定理中心极限定理是统计学中的基本定理之一,它描述了在特定条件下,随机变量均值的分布近似服从正态分布。
简单来说,当从一个总体中抽取大量独立同分布的样本时,样本均值的分布趋近于正态分布。
假设有一个总体,其均值为μ,标准差为σ。
接下来我们从总体中抽取大量的样本,每个样本的样本量为n。
根据中心极限定理,当样本量足够大时(一般认为大于30),样本的均值近似服从正态分布,均值的期望值为总体均值μ,标准差为总体标准差σ除以样本量n的平方根(即σ/√n)。
中心极限定理的意义在于,即使总体的分布未知,我们也可以利用样本均值的正态分布性质进行统计推断,如估计总体均值、构建置信区间等。
二、大样本和小样本在统计学中,样本量的大小对于推断的准确性和可靠性有着重要影响。
样本量足够大的情况下,我们可以利用中心极限定理来进行推断,此时称之为大样本。
大样本的优点在于对总体参数的估计更加准确,且推断的结果更加可靠。
相反,样本量较小的情况下,无法直接应用中心极限定理,此时我们需要借助小样本推断方法进行统计分析。
小样本的优势在于数据收集相对较容易,且分析结果更为直观,但相对于大样本,它的推断结果可能存在一定的不确定性。
不同样本量的选择要根据实际情况来确定,需要综合考虑数据收集的可行性、结果的准确性以及实践中的可靠性等因素。
三、置信区间在统计推断中,置信区间是一个常用的统计量。
它可以提供一个对总体参数的估计范围,并给出这个范围的置信程度。
置信区间可以用来描述我们对总体参数的估计,以及该估计的不确定性。
置信区间的构造依赖于样本量和置信水平。
样本量越大,置信区间越窄,估计的准确性越高。
而置信水平则表示我们对估计的可信度,一般常用的置信水平为95%或99%。
统计学中的实验设计与样本大小确定
统计学中的实验设计与样本大小确定在统计学中,实验设计和样本大小的确定是进行科学研究的重要环节。
恰当的实验设计能够提高研究效果,而合理的样本大小则能够确保研究结果的准确性和可靠性。
本文将介绍统计学中常见的实验设计方法,并讨论如何确定合适的样本大小。
一、实验设计方法在统计学中,常见的实验设计方法包括随机化试验设计、区组设计和因子设计。
1. 随机化试验设计随机化试验设计是最常用的实验设计方法之一。
它的主要思想是将研究对象随机分配到不同的处理组中,以降低实验误差和排除实验中的混杂因素。
随机化试验设计的基本步骤包括随机分组、处理实施、数据收集和数据分析。
通过随机分组,每个处理组中的样本具有相似的特征,从而保证实验结果的可比性和有效性。
2. 区组设计区组设计适用于多个因素的实验设计场景。
它的核心概念是将实验对象分为若干均质的区组,每个区组内进行不同的处理。
区组设计的主要目的是控制实验中的混杂因素,并评估因素之间的交互作用。
在区组设计中,需要合理选择区组数量、区组内的对象个数以及处理的组合方式。
3. 因子设计因子设计是实验设计中较为复杂的一种方法。
它涉及多个因素和水平的组合,能够精确地评估各个因素及其交互作用对结果的影响。
因子设计的基本步骤包括选择因素和水平、确定实验方案、进行数据采集和数据分析。
因子设计要求研究人员对研究对象的特征和因素关系有深入的了解,并进行全面的实验设计和分析。
二、样本大小确定确定合适的样本大小是保证研究结果准确性和可靠性的关键步骤。
样本大小的确定基于统计学原理和研究目标,需要考虑显著性水平、效应大小和统计功效等因素。
1. 显著性水平显著性水平是研究人员设定的接受或拒绝原假设的临界值。
常见的显著性水平为0.05或0.01,代表了5%或1%的错误接受原假设的概率。
较高的显著性水平能够提高实验结果的可信度,但可能会导致样本大小的增加。
2. 效应大小效应大小反映了不同处理组之间的差异程度。
效应大小的确定需要基于研究领域的经验和相关文献资料,常用的指标包括Cohen's d值和相关系数。
统计学中的样本量计算
统计学中的样本量计算在统计学中,样本量计算是一项重要的工作,它用于确定研究中所需的样本大小。
样本量的大小直接影响到研究结论的可靠性和实用性。
本文将介绍统计学中的样本量计算方法及其应用。
一、样本量计算的背景与意义在进行统计学研究时,我们通常无法对整个人群或总体进行调查或实验,因此需要从人群中选取一部分样本进行研究。
样本量的大小在很大程度上决定了研究结论的准确性和推广的可信度。
样本量计算的主要目的是保证研究的结果有统计学上的代表性和可信度。
当样本量较小时,研究结果的可靠性较差,无法准确反映总体特征;而当样本量较大时,研究结果更具有代表性和推广性。
二、常见的样本量计算方法在进行样本量计算之前,需要考虑以下几个因素:总体大小、预期效应大小、显著性水平、统计检验的类型以及效应大小的可信区间。
1.总体大小总体大小指的是研究对象的总体规模,即我们想要得出结论的总体。
总体大小的确定需要根据研究目的和可行性进行评估。
2.预期效应大小预期效应大小是指我们期望在研究中观察到的效应大小。
它可以是差异、相关性或显著性等统计指标,根据研究问题的不同而有所差异。
3.显著性水平显著性水平是指进行统计检验时所设定的接受或拒绝零假设的临界点。
常见的显著性水平为0.05或0.01,根据研究需求和领域惯例进行选择。
4.统计检验的类型不同的研究问题和研究设计所要采用的统计检验方法不同,因此需要根据具体情况进行样本量计算。
常见的统计检验方法包括 t 检验、方差分析、卡方检验等。
5.效应大小的可信区间效应大小的可信区间是指我们对预期效应大小的不确定度。
该区间越宽,表示对效应大小的估计越不准确,需要采样较大的样本量来提高可信度。
三、样本量计算的方法常见的样本量计算方法包括经验法、公式法和模拟法。
1.经验法经验法是根据研究经验和领域惯例来确定样本量。
这种方法的优点是简单快捷,但缺点是过于主观,可能导致样本量的过大或过小。
2.公式法公式法是根据一些统计学原理和假设来进行样本量计算的方法。
统计学中的样本量计算方法
统计学中的样本量计算方法统计学中的样本量计算方法是一种重要的工具,用于确定需要多大的样本规模来进行研究。
样本量的确定对于研究结果的准确性和可靠性至关重要。
本文将介绍统计学中常见的样本量计算方法及其应用。
一、样本量计算的重要性在统计学中,样本量的确定是进行研究的前提。
如果样本量过小,很可能导致研究结果的偏倚性,使得结论不具有普遍适用性;而样本量过大则可能浪费时间和资源。
因此,合理地确定样本量对于研究的可靠性和实用性至关重要。
二、常见的样本量计算方法1. 参数估计方法参数估计方法是通过已知的参数来计算样本量。
常见的参数估计方法包括:均值估计、比率估计和方差估计等。
- 均值估计:当我们想要估计总体均值时,可以使用均值估计方法来计算样本量。
通过给定的总体标准差、置信水平和误差限制条件,可以计算出所需的最小样本量。
- 比率估计:当我们想要估计总体比率时,可以使用比率估计方法来确定样本量。
比率估计方法会考虑到比例的变化和置信水平的要求。
- 方差估计:当我们想要估计总体方差时,可以使用方差估计方法来计算样本量。
方差估计方法会给出确保所估计的方差与真实方差相近的最小样本量。
2. 假设检验方法假设检验方法是通过针对特定假设进行检验来确定样本量。
常见的假设检验方法包括:检验总体均值、总体比例、总体方差等。
- 检验总体均值:当我们需要检验总体均值时,可以使用假设检验方法来计算样本量。
根据给定的显著性水平、效应大小和置信度等,可以计算出所需的最小样本量。
- 检验总体比例:当我们需要检验总体比例时,可以使用假设检验方法来确定样本量。
假设检验方法会考虑到误差限制和置信度等因素。
- 检验总体方差:当我们需要检验总体方差时,可以使用假设检验方法来计算样本量。
根据给定的显著性水平和效应大小等条件,可以确定所需的最小样本量。
三、样本量计算方法的应用样本量计算方法广泛应用于各个领域的研究中,如医学、社会科学、市场调查等。
在设计研究时,合理地确定样本量可以确保研究结果的准确性和可靠性。
统计学中的样本大小计算方法
统计学中的样本大小计算方法在统计学中,样本大小计算方法是非常重要的,它决定了研究的可靠性和结果的准确性。
正确选择合适的样本大小可以降低估计误差,提高统计推断的效力。
本文将介绍几种常用的样本大小计算方法。
一、常见的样本大小计算方法1. 参数估计法参数估计法是一种根据总体参数进行估计的方法。
这种方法需要事先对总体特征有一定的了解,并假设总体服从某种特定的概率分布。
通过计算样本的均值、方差等参数,可以推断出总体的估计值。
参数估计法需要提前确定的样本大小。
2. 假设检验法假设检验法是一种根据样本数据进行假设检验的方法。
在进行假设检验时,需要设定一个显著性水平,根据该水平确定样本大小。
通常情况下,显著性水平选择为0.05或0.01。
3. 统计功效法统计功效法是根据检验的功效来确定样本大小的方法。
统计功效是指在给定显著性水平下,能够拒绝错误假设的能力。
通过增加样本大小,可以提高检验的功效。
4. 自助法自助法是一种非参数估计方法,它通过对原始样本进行有放回抽样,生成大量的自助样本,并通过计算自助样本的均值和方差等参数来估计总体的参数。
自助法的样本大小根据所需的估计精度和置信水平来确定。
二、样本大小计算的影响因素确定样本大小时需要考虑以下几个因素:1. 总体的变异程度总体的变异程度越大,样本大小越大,以保证估计结果的可靠性。
2. 置信区间宽度置信区间宽度是指对总体参数的估计范围。
当置信区间要求较小时,样本大小需要相对较大。
3. 显著性水平显著性水平是决定拒绝错误假设的临界点。
较小的显著性水平需要较大的样本大小。
4. 统计功效统计功效越大,样本大小也需要相应增加。
三、样本大小计算的方法1. 样本容量计算公式样本容量计算公式可以根据研究设计和需求来确定样本大小。
常见的样本容量计算公式有:样本容量 =(Zα/2 + Zβ)^2 * (σ^2 / δ^2)其中,Zα/2和Zβ分别为显著性水平和统计功效对应的标准正态分布的分位数。
统计学中的样本容量与效应大小
统计学中的样本容量与效应大小在统计学中,样本容量和效应大小是两个重要的概念。
样本容量是指在研究中所使用的样本的大小,而效应大小则是指所研究的变量之间的差异的大小。
在统计学研究中,合理确定样本容量和考虑效应大小对于研究结果的准确性和可靠性具有重要意义。
一、样本容量的重要性样本容量的大小对于统计学研究的可靠性和推广性至关重要。
一个足够大的样本容量可以减小抽样误差,提高研究结果的精确度。
当样本容量较小时,研究结果可能会受到随机误差的影响,使得结论的可靠性降低。
而当样本容量较大时,可以更准确地反映总体特征,提高研究结论的普适性。
二、样本容量的确定方法确定合适的样本容量是统计学研究的重要一环。
具体而言,样本容量的确定需要考虑以下几个方面:1. 总体大小:总体大小是确定样本容量的重要因素之一。
当总体大小较小时,样本容量的要求相对较小,而当总体大小较大时,样本容量的要求相对较大。
2. 抽样误差:抽样误差是指样本与总体之间的差异,即由于随机性而引起的误差。
抽样误差的大小直接影响样本容量的要求,通常需要根据预先设定的允许误差水平确定样本容量。
3. 置信水平和置信区间:在确定样本容量时,还需要考虑所需的置信水平和置信区间。
置信水平可以理解为结果的可靠性程度,置信区间则是结果的波动范围。
较高的置信水平和较窄的置信区间需要较大的样本容量。
三、效应大小的意义效应大小是统计学研究中的另一个重要因素,它衡量了所研究的变量之间的差异程度。
效应大小的大小直接关系到研究结果的重要性和实际意义。
在统计学中,通常使用效应量来表示效应大小。
效应量的大小可以根据具体研究的内容和分析方法而有所不同,常见的效应量指标有Cohen's d、r和Eta-squared等。
四、样本容量与效应大小的关系样本容量和效应大小之间存在着一定的关系。
较小的样本容量可能会导致对效应大小的低估,因为较小的样本容量可能无法准确地反映总体的特征,从而使得效应变量无法得到充分的体现。
统计学中的统计推断与样本大小
统计学中的统计推断与样本大小统计学是一门研究收集、整理、分析和解释数据的学科,其中统计推断是统计学的重要分支。
统计推断是基于样本数据对总体参数进行估计和假设检验的过程。
而样本大小则是进行统计推断时需要考虑的重要因素之一。
本文将探讨统计学中的统计推断与样本大小的关系以及其对推断结果的影响。
一、统计推断的概念与方法统计推断是通过从样本数据中获得的信息来对总体进行推断的过程。
在进行统计推断时,我们通常关注总体的某些特征参数,如总体均值、总体比例等。
在统计推断中,常用的方法包括点估计和区间估计。
点估计是指通过样本数据估计总体参数的一个具体值。
常见的点估计方法有样本均值、样本比例等。
而区间估计则是通过一个区间来估计总体参数的范围,常见的区间估计方法有置信区间的构建。
二、样本大小的重要性样本大小对统计推断的结果和可靠性有着重要影响。
样本大小较小可能导致推断结果的不准确,而样本大小较大可以提高推断的准确性和可靠性。
首先,样本大小的增加可以减小抽样误差。
抽样误差是指样本统计量与总体参数之间的差异,而样本大小越小,抽样误差越大。
当样本大小增加时,抽样误差减小,使得推断结果更加稳定和可靠。
其次,样本大小的增加可以缩小置信区间的宽度。
置信区间是进行区间估计的一种方法,用于估计总体参数的范围。
当样本大小增加时,置信区间的宽度减小,推断结果更加精确。
此外,样本大小的选择还需要考虑到实际情况和成本因素。
较大的样本大小可能会增加数据收集和分析的成本,而较小的样本大小可能无法提供准确的推断结果。
因此,在选择样本大小时需要综合考虑多种因素,以确保推断结果的准确性和可靠性。
三、样本大小的确定方法确定合适的样本大小是进行统计推断的关键步骤。
样本大小的确定方法主要包括效应大小估计、显著性水平、统计检验力和总体标准差等因素的考虑。
首先,效应大小估计是确定样本大小的重要依据之一。
效应大小指的是总体参数与假设值之间的差异程度。
当效应大小较小时,样本大小要求较大以检测到该差异;而当效应大小较大时,样本大小要求较小即可。
统计学中的样本容量计算方法
统计学中的样本容量计算方法在统计学研究中,样本容量的计算是非常重要的一项工作。
正确的样本容量计算可以保证统计结果的准确性和可靠性。
本文将介绍统计学中常用的几种样本容量计算方法,并对其原理进行详细解析。
一、样本容量计算的背景和意义在进行统计研究之前,我们常常需要确定所需的样本容量。
样本容量的大小直接影响到研究结果的可信度。
如果样本容量过小,可能会导致结果不具有代表性,无法得到准确的结论;而样本容量过大,则会造成资源浪费。
因此,合理的样本容量计算对于统计学研究的科学性至关重要。
二、常见的样本容量计算方法1. 代表性样本容量计算方法代表性样本容量计算方法是一种基于总体特征和置信水平的计算方法。
它通过对总体的特征参数进行估计,然后使用这些参数来确定样本容量的大小。
具体的计算公式如下:n = Z² * p * (1-p) / E²其中,n表示样本容量大小,Z表示标准正态分布的分位数,p表示总体的特征参数值,E表示预期的误差范围。
这种方法能够在一定程度上保证样本具有代表性,但是需要对总体参数有较准确的估计。
2. 力度样本容量计算方法力度样本容量计算方法是一种基于统计功效的计算方法。
统计功效是指在一个给定的显著性水平下,检验能够发现效应的概率。
利用这种方法计算样本容量的大小可以帮助我们确定在给定的显著性水平下是否能够检测到所关心的效应。
计算公式如下:n = 2 * (Z₁-α / E + Z₁-β)²其中,n表示样本容量大小,Z₁-α表示显著性水平的分位数,E表示预期的效应大小,Z₁-β表示统计功效的分位数。
这种方法能够帮助我们在保证结果可靠性的前提下最大程度地节约资源。
3. 特殊设计样本容量计算方法特殊设计样本容量计算方法主要用于特殊设计的统计研究,如配对设计、重复测量设计等。
在这些设计下,样本容量的计算需要考虑到样本间的相关性等因素。
具体的计算方法根据不同的设计进行调整,在此不做详细介绍。
统计学样本量
统计学样本量统计学样本量是统计学研究中非常重要的一个概念。
从总体到样本,良好的统计研究必须以一个可靠的样本量开始,以了解研究问题产生的结论。
在统计学研究中,样本量是指从某类总体中抽取的小范围独立变量的数量。
这些变量的特征将反映总体的特征,反映出研究问题的结果。
样本量的大小有许多因素。
在抽样研究中,样本量的大小与总体的具体情况有关,因此可以根据研究的需要来确定样本量的大小。
例如,在一项群体研究中,若想要得到准确的结果,则必须从总体中抽取一定数量的受试者;如果在某一地区或国家调查某个问题,则需要从相应地区或国家中抽取足够数量的样本来进行研究,以得出准确的结果。
另外,还必须考虑到样本量的大小与总体的规模有关。
一般来说,样本的数量越多,结果就越准确。
因此,当总体规模很大时,样本量将相应增加;而当总体规模较小时,样本量将相应减少。
此外,样本量大小还受到其他因素的影响,包括研究领域的性质、研究问题的复杂性、研究目的、可用资源等。
例如,如果研究复杂而且需要小范围内观察,则通常需要较大的样本量;如果研究目的是获取概括性结果,则可以使用较小的样本量。
资源的不足也会影响样本量的大小,因此,研究人员在设计研究方案时,必须仔细考虑样本量,以确保抽取的样本量足够提供可靠的结论。
统计学样本量是一个复杂且重要的概念,对于统计学研究至关重要。
研究者在设计研究方案时必须充分考虑样本量的大小,以确保抽取的样本量可以提供可靠的结论。
在设计样本量时,应仔细考虑总体的情况、总体的规模、研究的领域、研究问题的复杂性以及可用的资源等因素,以期得到准确的结果。
同时,要记住,样本量越大,结果将越准确,因此,在抽样研究中要尽量抽取足够数量的样本以提供可靠的结论。
数以多少个为一个样本大小?
数以多少个为一个样本大小?在科学研究中,样本大小是一个非常关键的概念。
它指的是为了了解或推断总体特征而从总体中选取的一部分个体或单位的数量。
那么,在实际应用中,我们该如何确定一个合适的样本大小呢?下面,我们将从统计学的角度探讨这个问题。
1. 样本大小的基本概念首先,我们需要明确样本大小的基本概念。
样本大小的确定涉及到统计推断的准确性和可靠性。
一般来说,样本大小越大,推断结果的准确性越高。
但是,样本大小也需要在实际研究中考虑到成本、时间和资源等因素的限制。
2. 样本大小的计算方法为了确定一个适当的样本大小,我们需要考虑以下几个因素:- 总体大小:总体的大小对样本大小的选取有一定的影响。
如果总体很大,那么我们可以选择较小的样本大小;反之,如果总体很小,为了保证推断结果的准确性,我们可能需要选择较大的样本大小。
- 预期误差:预期误差是指在推断过程中所允许的误差范围。
通常情况下,预期误差越小,我们需要选择的样本大小就越大。
- 置信水平:置信水平是指推断结果的可靠程度。
常见的置信水平有95%和99%等。
一般来说,置信水平越高,我们需要选择的样本大小就越大。
- 变异性:变异性是指总体中个体或单位之间的差异程度。
如果总体的变异性很大,那么我们需要选择较大的样本大小才能更准确地推断总体特征。
3. 样本大小的统计方法为了计算样本大小,我们可以使用统计方法,如样本容量计算公式或样本容量表。
这些方法基于统计学原理,通过考虑上述因素,给出了相应的计算公式或表格。
在进行样本大小计算时,我们需要明确研究目的、总体特征以及统计方法等信息。
总之,确定一个合适的样本大小对于科学研究的准确性和可靠性至关重要。
在实际应用中,我们需要综合考虑总体大小、预期误差、置信水平和变异性等因素,通过统计方法计算出一个合理的样本大小。
只有选择了合适的样本大小,我们才能够准确地推断总体特征,从而提高研究的科学价值和实际应用的效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如要查負值之部份, 仍以正值查表。然後, 以0.5減 去表內之累計機率即可。如:Z值-1.96, 查得1.96 之0.475, 以0.5-0.475=0.025, 即是自左尾開始 累計到Z值為-1.96的機率。
相反地, 若要計算由Z值為-1.96開始累計到右尾的 機率, 則將查得之值(0.475)加上0.5, 即0.975。 通常, α=0.05時, 如要查Zα/2值, 是找尋右尾機率為 0.025時之Z值, 即找出由左尾累積得0.975之Z值 1.96。若用Excel之NORMSINV()函數來求算, 其 公式應為:(詳範例光碟Ch04.xlsx『依α査Z值』 工作表) =NORMSINV(1-0.05/2)
先別忙著計算樣本數, 由於本書是介紹Excel之書籍, 故得對所使用到的各相關函數先介紹一下。
4
基本定義
標準差 變異數 標準隨機變數 平均值 m
5
常態分配之Z值
一般統計學之常態數值(Z), 係利用查常態分配 表(附錄二)來得知。如:Z0.025為1.96、Z0.05為 1.645。但於Excel下, 則可利用NORMSINV()標 準常態分配反函數來查得;而若知道Z值, 也可以 NORMSDIST()函數來求得其機率。
=NORMSINV(0.025) 為-1.96
=NORMSINV(0.05) 為-1.645
=NORMSINV(0.5) 為0
=NORMSINV(0.95) 為1.645
=NORMSINV(0.975) 為1.96
10
標準常態分配表
一般統計學之教科書, 均會附有標準常態分配表( 如:附錄二), 以利查常態數值(Z)。由於, 常態 分配是對稱的分配, 故一般僅附上正值之部分, 表 內之累計機率, 是由Z值為0時開始累計。如:Z值 1.96, 查得1.96之0.475, 表示由標準常態分配中 央(Z=0)開始, 累計到Z=1.96的機率。即, 下圖 之陰影部份:
3. 拖曳A3:A4右下角之複製控點, 拉到A33位置, 複製出 0.0、0.1、0.2、…、2.9、3.0等數值
13
4. 於B1輸入『Z值的小數第二位』字串
5. 於B2輸入0.00(僅顯示0), C2輸入0.01
6. 選取B2:C2, 按『數值』群組之 使兩數均可擁有2位小數
『增加小數位』鈕,
7. 拖曳B2:C2右下角之複製控點, 拉到K2位置, 複製出 0.00、0.01、0.02、…、0.08、0.09等數值
樣本變異數(S2)的計算公式為:
其值恰為樣本標準差(S)之平方, 也是用來衡量觀測值與 平均值間的離散程度。
26
由於, 母體變異數未知。故舉行一次試訪, 以範例光碟 Ch04.xlsx『估計均數樣本數σ未知』工作表, 取得120位大 學生之手機平均月費。計算出其樣本變異數(S2)為 109,593、於顯著水準α=0.05(Zα/2=1.96)的情況下, 希 望對母體手機平均月費μ的估計誤差不超過30元, 其樣本數應 為多大?
32
可發現, 其樣本數的極大值1067係發生於母體比率為 0.5時。母體比率<0.5時, 隨母體比率逐漸增加, 樣本數 也逐步增加。母體比率>0.5時, 隨母體比率逐漸增加, 樣本數則逐步減少。
故而, 若我們無法得知母體真正比率p, 要計算樣本數時, 可以採取最保守的估計, 將母體比率設定為0.5。這樣, 由於其樣本數最大, 所獲得之結果也將是各種情況下最正 確的。
將相關值代入公式:
至少應取得1006個樣本, 才有95%的信心, 保證其調查結 果的支持率之誤差不超過±3%。
30
以Excel來安排相關之數字與公式, 將為:(詳範例光碟 Ch04.xlsx『以母體比率求樣本數』工作表)
31
保守估計母體比率
於將前面之抽樣中, 若將不同之p值分別代入, 其樣 本數勢必不同。茲將各種結果彙集成下表來比較: (詳範例光碟Ch04.xlsx『以母體比率求樣本數』 工作表)
將σ=2.5與Zα/2=1.96代入公式
至少應取得267個樣本, 才能有95%的保證其誤差不超 過0.3。 以ChE0x4c.exlB母l來s欄x體安『各標排估儲準相計存差關均格σ之數之=數樣S公Q字本式R與T數分(B公σ別1已式) 為知, :將』為工:作(表詳)範例光碟
Zα/2 =NORMSINV(1-B3/2) 樣本數n =((B4*B2)/B5)^2
將相關之數字輸入Excel, 即可算出, 至少應取得468個樣本, 才能有95%的保證其估計誤差不超過30元:
27
馬上練習
由於, 母體變異數未知。故舉行了一次試訪, 取得40位 大學生之信用卡每月平均簽帳金額。(詳範例 Ch04.xlsx『信用卡問卷樣本數』工作表)於風險顯著 水準α=0.05(Zα/2=1.96)的情況下, 希望對母體信用 卡每月平均簽帳金額μ的估計誤差不超過50元, 其樣本 數應為多大?
17
母體變異數已知時的樣本大小
學過所需之幾個函數後, 現在, 可以
來計算於母體變異數(σ2)已知之情況下的樣本數 (n)。式中: α為顯著水準或風險水準, (1-α)即信賴係數
或信賴水準 e為可容忍誤差 σ為母體標準差
18
假定, 母體變異數σ2=6.25(σ=2.5), 於風險顯著水準 α=0.05(Zα/2=1.96)的情況下, 希望對母體均數μ的 估計誤差e不超過0.3, 其樣本數應為多大?
33
馬上練習
以範例Ch04.xlsx『以保守估計求樣本數』工作表 進行計算, 保守估計執政黨的支持度為50%。要以 90%之信賴水準(風險顯著水準α=0.1), 希望調 查結果之支持率的誤差為±3%, 應取樣多少?
统计学之样本大小
第四章 樣本大小
2
樣本大小之選擇
樣本不要過大, 過大浪費成本;但也不要過小, 過 小則會有太大的抽樣誤差。如何決定適當的樣本大 小?在機率抽樣的情況下, 有關樣本大小的決定及 樣本統計顯著性的判斷, 可藉由機率法則的運用。 (也就是說, 有公式可供計算啦!)
但在非機率抽樣的情況下, 除了依靠抽樣人員的主 觀判斷或假設外, 實無客觀之科學方法可資應用。
異數為4202500。至少應取得多少樣本?才能有 9X%(X為學號最後一位數字)的信賴水準, 保證其 估計誤差不超過1000元
22
平方根SQRT()函數
SQRT(數值) SQRT(number) 本函數是用來求某數值的平方根, 若數值為負值, 本
函數將回應#NUM!之錯誤。如:(詳範例光碟 Ch04.xlsx『平方根』工作表)
=NORMSDIST(-1.96) 為0.025
=NORMSDIST(-1.645) 為0.05
=NORMSDIST(0) 為0.5
=NORMSDIST(1.96)
為0.975
8
常態分配(normal distribution)是次數分配呈中間集 中, 而逐漸向左右兩端勻稱分散的鐘形曲線分佈。根據中 央極限定理, 不論原母體的分配為何?只要樣本數夠大( n>=30), 樣本平均數 的分配, 會趨近於常態分配。
19
假定, 電力公司根據過去之調查經驗, 知道用戶用電度數 的母體變異數為48000(σ2=48000)、於顯著水準 α=0.05(Zα/2=1.96)的情況下, 希望對母體平均用電 度數μ的估計誤差不超過5度, 其樣本數應為多大?
將相關之數字輸入Excel即可算出, 至少應取得7376個 樣本, 才能有95%的保證其估計誤差不超過5度:(詳範 例光碟Ch04.xlsx『估計均數樣本數σ已知1』工作表)
式中:
α為顯著水準或風險水準, (1-α)即信賴係數或信 賴水準
e為可容忍誤差
S為樣本標準差
25
於Excel中, 樣本變異數可以VAR()函數來求得, 其語法為 : VAR(數值1,[數值2],...) VAR(number1,[number2],...) 數值1,[數值2],...為要計算變異數之儲存格或範圍引數, 它是對應於某母體抽樣選出的1到255個數字引數樣本, 方 括號包圍之部份可省略。
3
估計平均數時的樣本大小 母體變異數已知
於母體變異數(σ2)已知之情況下, 樣本數(n)之 求算公式為:
α為顯著水準或風險水準, (1-α)即信賴係數或 信賴水準;顯著水準表示檢定者主觀認定統計量
出現「極端數值」的機率。信賴係數愈高愈好, 表示估計精準。
e為可容忍誤差
σ為母體標準差:是用來衡量觀測值與平均值間的 離散程度。
9
標準常態分配反函數NORMSINV()
NORMSINV(累計機率) :由機率求z值
NORMSINV(probability)
其作用為於標準常態分配(μ = 0, σ = 1), 求某 累計機率所對應之Z值。有了此函數, 即可省去查常 態分配表之Z值的麻煩。如:(詳範例光碟 Ch04.xlsx『NORMSINV』工作表)
28
估計比率時的樣本大小
若研究目的是在估計比率(p, proportion), 其樣 本數(n)之求算公式為:
p為母體的真正比率 α為風險顯著水準, (1-α)即信賴係數 e為可容忍誤差 σp為母體標準差, 其運算公式為:
29
將其代入上式, 即可獲致新的樣本數(n)公式:
不過, 通常我們是無法得知母體之真正比率p, 要計算樣本 數時, 則以過去之調查結果替代。假定, 上個月支持執政黨 之比率為38%(p)。這個月, 於95%的信賴水準下( α=0.05), 希望調查結果之支持率的允許誤差(e)為 3%, 應取樣多少?
23
事實上, 有無此函數並不很重要。利用 ^ 運算符號也可 達成開方之動作。如:=64^(1/2)之結果即 =SQRT(64);但若要求開三方, 那SQRT()可就無能為 力了。但仍可利用 ^ 運算符號來解決(乘冪為1/3即等 於開三方):