学术论文---环境科学领域学术论文中常用数理统计方法的正确使用问题

合集下载

统计学方法在环境科学研究中的应用分析

统计学方法在环境科学研究中的应用分析

统计学方法在环境科学研究中的应用分析随着环境问题的日益凸显,环境科学研究变得越来越重要。

而统计学作为一门重要的科学方法,被广泛应用于环境科学研究中。

本文将从不同角度探讨统计学方法在环境科学研究中的应用。

首先,统计学方法在环境数据分析中起着重要的作用。

环境科学研究中常常需要收集大量的数据,并进行分析和解读。

统计学方法可以帮助研究人员对数据进行合理的整理和归纳,从而得出准确的结论。

例如,在大气污染研究中,研究人员可以使用统计学方法对不同地区和时间段的空气质量数据进行比较和分析,以了解污染程度的差异和变化趋势。

其次,统计学方法在环境模型建立中具有重要意义。

环境模型是研究环境问题的重要工具,可以帮助研究人员预测和评估环境变化的影响。

统计学方法可以用来对环境数据进行建模和拟合,从而构建出准确的环境模型。

例如,在气候变化研究中,研究人员可以使用统计学方法对气温、降雨等气象数据进行建模,以预测未来的气候变化趋势。

此外,统计学方法还可以在环境监测中发挥重要作用。

环境监测是对环境质量进行实时监测和评估的过程,可以帮助研究人员及时发现和解决环境问题。

统计学方法可以用来分析和解读监测数据,从而提供准确的环境评估结果。

例如,在水质监测中,研究人员可以使用统计学方法对水样的各项指标进行分析,以评估水质的优劣程度。

此外,统计学方法还可以在环境风险评估中发挥重要作用。

环境风险评估是对环境中潜在风险的识别、评估和管理的过程,可以帮助研究人员制定有效的环境保护措施。

统计学方法可以用来分析和解读环境数据,评估环境风险的概率和程度。

例如,在土壤污染评估中,研究人员可以使用统计学方法对土壤样本中的重金属含量进行分析,以评估土壤污染的程度和范围。

综上所述,统计学方法在环境科学研究中具有重要的应用价值。

通过对环境数据的分析、环境模型的建立、环境监测的实施和环境风险的评估,统计学方法可以帮助研究人员更好地理解和解决环境问题。

因此,我们应该进一步加强对统计学方法的学习和应用,以推动环境科学研究的发展和进步。

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究

数理统计法在环境监测分析中的研究
高等数学、统计学和计算机科学在环境监测分析中已经发挥了巨大的作用,尤其是数理统计学的应用,它能够带来更为有效和有效的方法,从而更好地获得环境数据的有效和可靠的信息。

本文旨在研究在环境监测分析中数理统计学的应用。

随着现代社会的发展,空气污染和水质恶化等环境问题对人类生活的影响日益增大。

环境管理亟待有效地获取正确的环境数据,从而开展必要的环境改善措施,保护环境。

数学和计算机科学技术在此事项上可算得上极大的帮助。

数理统计学是环境监测分析的一项重要组成部分,它提供了用于环境数据分析的有效和有效的方法。

例如,统计方法可以有效地分析环境样品,如水、空气和土壤,计算污染物的量和其他相关变量,并为形成有效的环境改善策略提供有力的科学依据。

一些关键环境污染指标也可以通过数理统计学方法计算,环境监测数据分析中的许多方法也可以通过数理统计学方法实现,如贝叶斯网络、支持向量机和回归分析等。

除此之外,统计学在空气污染模型建模和排放估算以及数据收集和分析方面也发挥了重要作用。

综上所述,数理统计在环境监测分析中已经发挥了重要的作用,其在分析环境样品、分析环境污染指标、建模排放估算以及数据收集和分析等多个方面都受到了广泛应用,其更新的方法也在不断地提出和开发。

同时,不断发展的环境污染问题和复杂环境系统需求也更多地使用了数理统计学方法,让更切实可行的结果出现。

如何在论文中使用合适的统计分析方法

如何在论文中使用合适的统计分析方法

如何在论文中使用合适的统计分析方法统计分析是科学研究中不可或缺的一部分,它提供了对数据进行整理和解读的方法。

在撰写论文时,正确使用合适的统计分析方法可以增强研究的可信度和说服力。

本文将介绍如何在论文中使用合适的统计分析方法。

一、选择适当的统计分析方法在论文中使用统计分析方法之前,首先需要确定所研究的问题以及数据的性质。

不同的问题和数据类型需要使用不同的统计方法。

例如,如果我们想比较两组数据的平均值是否存在显著差异,可以使用t检验或方差分析;如果我们想探索变量之间的关系,可以使用相关分析或回归分析等。

因此,在选择统计分析方法时,需要对研究问题进行充分的理解,并参考相关的统计学原理和方法。

二、确保数据的准确性和完整性在进行统计分析之前,我们需要确保所使用的数据是准确和完整的。

数据的准确性保证了我们所得到的统计结果的可信度,而数据的完整性则能够提供更全面和准确的信息。

为了确保数据的准确性和完整性,可以采取以下几个方面的措施:1. 数据收集:在收集数据时,可以采用随机抽样或者分层抽样的方法,以保证样本的代表性和可靠性。

同时,需要记录数据的来源、收集时间、样本量等相关信息。

2. 数据清洗:在收集到数据后,需要进行数据清洗的工作,包括删除异常值、处理缺失值等。

这样可以避免因为数据异常而导致的统计结果出现偏差。

3. 数据验证:对于一些关键的变量或者指标,可以进行数据验证的工作,以确保数据的准确性。

例如,可以通过重复测量、对照组比较等方法来验证数据的一致性和可靠性。

三、正确解读统计结果在进行统计分析后,我们需要正确解读统计结果,并与研究问题进行对应。

以下是几个解读统计结果的原则:1. 显著性检验:当进行显著性检验时,需要关注所得到的p值。

如果p值小于设定的显著性水平(通常是0.05),则可以认为所研究的差异或者关系是显著的。

2. 效应大小:除了关注统计显著性外,还需要关注效应的大小。

效应大小反映了变量之间的差异或者关系的实际重要性。

学术论文中数理统计方法的正确使用问题[整理版]

学术论文中数理统计方法的正确使用问题[整理版]

环境科学领域学术论文中常用数理统计方法的正确使用问题张利田,卜庆杰,杨桂华,刘秀兰《环境科学学报》编辑部,北京 100085在环境科学研究中,经常会涉及到对随机变量大小、离散及分布特征描述以及对2个或多个随机变量之间关系比较的问题。

而对随机变量及随机变量之间的关系进行定量描述的数学工具就是数理统计。

由于能否正确使用各种数理统计方法关系到能否得出客观和可信的结论,所以,来稿中使用的数理统计方法是否正确是学术期刊编辑们极为重视的问题。

针对近年来《环境科学学报》作者稿件中常见的数理统计方法方面的错误,我们对环境科学领域学术论文中常用数理统计方法(主要是相关分析和回归分析)的正确使用问题进行了初步分析,希望能对《环境科学学报》的作者们有所帮助。

1 统计软件的选择在进行统计分析时,尽管作者可以自行编写计算程序,但在统计软件很普及的今天,这样做是毫无必要的。

因此,出于对工作效率以及对算法的可靠性、通用性和可比性的考虑,多数科技期刊要求作者采用专门的数理统计软件进行统计分析。

我们在处理稿件时经常发现的问题是,作者未使用专门的数理统计软件,而采用Excel这样的电子表格软件进行统计分析。

由于电子表格软件提供的统计分析功能十分有限,很难满足实际需要,除非比较简单的分析,我们不主张作者采用这样的软件。

目前,国际上已开发出的专门用于统计分析的商业软件很多,比较著名有SPSS(Statistical Package for Social Sciences)、SAS(Statistical Analysis System)、BMDP和STATISTICA等。

其中,SPSS是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到广泛应用);BMDP是专门为生物学和医学领域研究者编制的统计软件。

目前,国际学术界有一条不成文的约定:凡是用SPSS和SAS软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算法。

如何在论文中使用正确的统计分析方法

如何在论文中使用正确的统计分析方法

如何在论文中使用正确的统计分析方法随着科学研究的不断深入,统计分析方法在论文中的重要性也日益凸显。

正确地应用统计分析方法可以为研究者提供有力的证据和结论支持,增加论文的可信度和学术价值。

本文将探讨如何在论文中使用正确的统计分析方法,以确保研究结果的准确性和可靠性。

一、选择适当的统计分析方法在论文中使用统计分析方法之前,首先需要了解研究问题的性质及其所需的数据类型。

不同的研究问题可能需要不同的统计方法。

一般来说,研究的数据可以分为定量数据和定性数据两类。

针对定量数据,常用的统计分析方法包括描述性统计、假设检验、回归分析等;而对于定性数据,适用的方法可能包括卡方检验、因子分析等。

因此,在进行统计分析之前,研究者应该明确研究问题的性质,并选择适当的统计方法进行分析。

二、搜集和整理数据在论文中使用统计分析方法的过程中,搜集和整理数据是非常关键的一步。

研究者需要保证数据的完整性和准确性,以确保统计分析的有效性和可靠性。

在搜集数据时,可以采用问卷调查、实验观测、文献研究等方法,确保数据来源的合理性。

然后,对数据进行整理和清洗,去除异常值和缺失值,以提高数据的可靠性和可用性。

三、运用正确的统计方法进行分析在进行统计分析时,研究者需要熟悉所使用的统计软件和方法,确保分析过程的准确性和可重复性。

常用的统计软件包括SPSS、SAS、R等,它们提供了丰富的统计方法和工具。

根据研究问题和数据类型的不同,研究者可以选择合适的方法进行分析,如描述性统计分析可以用来描述数据的中心趋势和离散程度;假设检验可以用来检验研究假设的成立与否;回归分析可以用来探究变量之间的关系等等。

在进行分析之前,要确保所选择的方法是适用于研究问题的,并且符合统计学的基本原理。

四、正确解读和报告统计结果在论文中,研究者需要正确地解读和报告统计分析的结果。

对于描述性统计分析,可以通过均值、标准差、百分比等指标来描述数据的特征;对于假设检验,需要报告检验统计量、p值和效应大小等结果;对于回归分析,需要报告回归系数、显著性水平等结果。

医学科学研究论文中统计方法的正确应用

医学科学研究论文中统计方法的正确应用

医学科学研究论文中统计方法的正确应用一、统计方法正确应用的重要性医学统计方法很多,各适用于不同的数据。

临床试验中所用统计方法必须根据数据情况认真选用。

这是因为,数理统计是根据一定的数据分布推导出一定的统计方法,它仅适用于一定的数据。

例如,t检验及方差分析是由正态分布数据以及各组方差相同推导出来的,因而要求数据为正态分布(至少接近正态分布)且方差齐性。

但是,在论文的统计方法部分常有如下阐述:一般资料进行χ2检验,其余资料进行t检验,这种不管数据分布是否很偏态,就一概使用某种统计方法不正确。

此外,分类数据与计量数据的统计方法也不同,分类数据中对于名义变量和顺序变量的统计方法也不同。

统计方法应用的错误会使整个精心进行的研究得出错误的结论。

在这一讲中我们将结合目前文献中常见的一些统计方法的错误应用,对如何根据数据的情况来正确地选择统计方法进行讨论。

二、统计方法上常见的一些问题1.t检验和方差分析要求数据服从正态分布:在医学研究中大量的数据并不服从正态分布。

有时可以从报告中的数据看出。

例如,在文献中体温降至正常的平均日数在两组分别为3 .0±1 .7及2 .4±2 .0。

由数据可以看到标准差是平均数的1/2以上,甚至接近平均数。

这就提示数据严重偏离了正态分布。

因为,当数据不可能为负值(如日数),且样本不是过小时,按正态分布规律,平均数减3个标准差仍应是正数。

这里平均数减3个标准差已经是-2.1和-3.6了。

因为日数不可能是负数,这就说明数据偏离了正态分布规律。

又如,文献[2]关于统计分析方法方面写道:“测量参数以x±s表示。

根据性别及骨密度(2.5s为界)分组,用两样本均数t检验对组间各形态计量参数进行统计分析(SPSS8.0软件)。

样本均数与总体均数用t检验比较形态计量学参数与正常参考值之间的差异”。

由文内表格(表1)可以看到有不少标准差大于均数。

数据很可能是很偏态,不宜使用t检验。

论文中使用统计数据的技巧与注意事项

论文中使用统计数据的技巧与注意事项

论文中使用统计数据的技巧与注意事项在撰写论文时,使用统计数据是一种常见的论证手段。

统计数据可以为论文提供客观、可靠的支持,增强论文的说服力。

然而,使用统计数据也需要一些技巧和注意事项。

本文将探讨一些使用统计数据的技巧和注意事项,以帮助读者在论文中更好地运用统计数据。

首先,选择可靠的数据源是使用统计数据的关键。

在互联网时代,我们可以轻松地在各种网站和数据库中找到大量的统计数据。

然而,不是所有的数据源都是可靠的。

为了确保数据的准确性和可信度,我们应该选择来自权威机构、学术期刊或政府部门的数据。

这些机构通常会经过严格的数据收集和处理程序,从而保证数据的可靠性。

其次,了解数据的背景和方法是使用统计数据的重要一步。

在引用统计数据时,我们应该提供数据的来源、收集时间和样本规模等信息。

这些信息可以帮助读者评估数据的可靠性和适用性。

此外,我们还应该了解数据收集的方法和统计分析的过程。

这样可以帮助我们更好地理解数据的含义和局限性,避免错误地解读数据。

在使用统计数据时,我们还应该注意数据的典型性和泛化性。

统计数据通常是通过对样本进行调查或观察得出的。

因此,我们不能仅凭一组数据就对整个群体或现象做出绝对的推断。

我们应该注意数据的典型性,即数据是否代表整个群体的特征。

此外,我们还应该注意数据的泛化性,即数据是否可以推广到其他情境或群体中。

在使用统计数据时,我们应该提供充分的背景信息,以帮助读者评估数据的适用性和推广性。

此外,我们还应该注意数据的可视化和解读。

统计数据通常以表格、图表或图形的形式呈现。

我们应该选择合适的可视化方式来展示数据,以便读者更直观地理解数据。

同时,我们还应该解读数据,解释数据背后的含义和趋势。

我们可以使用统计方法和分析工具来帮助解读数据,从而提供更深入的论证。

最后,我们还应该注意数据的隐私和保密性。

在使用统计数据时,我们应该尊重数据的隐私和保密性。

如果数据涉及个人隐私或敏感信息,我们应该对数据进行匿名处理或获得相关人员的同意。

学术论文中如何正确使用和引用定量研究的统计分析工具和方法

学术论文中如何正确使用和引用定量研究的统计分析工具和方法

学术论文中如何正确使用和引用定量研究的统计分析工具和方法在学术研究中,定量研究方法广泛应用于各个学科领域。

在撰写学术论文时,正确使用和引用定量研究的统计分析工具和方法是非常重要的。

本文将探讨如何正确运用这些工具和方法,并给出一些建议。

首先,正确理解和运用统计分析工具是学术论文中的关键。

在论文中引用统计分析工具时,要确保对该工具的原理和使用方法有准确的理解。

例如,当引用t检验时,需要明确该方法适用于比较两个样本均值是否存在显著差异。

在使用t检验时,还需要注意样本的选取和数据的处理,以确保结果的可靠性。

因此,在引用统计分析工具时,要对其适用范围和使用条件有清晰的认识。

其次,正确引用定量研究的统计分析方法也是非常重要的。

在学术论文中,研究方法的部分通常包括样本选取、数据收集和数据分析等内容。

在引用统计分析方法时,要清楚地描述研究中所用的方法,并给出相应的参考文献。

例如,如果在论文中使用了回归分析方法,就应该明确指出所用的回归模型、自变量和因变量,并引用相关的文献。

这样可以让读者了解到研究方法的来源和可靠性。

此外,正确解读统计分析结果也是学术论文中的重要环节。

在引用统计分析结果时,要准确地描述结果,并进行合理的解释。

例如,如果在论文中引用了一个显著性水平为0.05的p值,就应该说明该结果是具有统计学意义的。

同时,还需要解释该结果与研究问题的关系,以及对研究假设的验证程度。

这样可以使读者更好地理解研究结果,并对其科学价值有所认识。

此外,学术论文中还应该注意引用统计分析工具和方法的来源。

在引用统计工具时,要注明该工具的名称和版本号,并给出相应的参考文献。

在引用统计方法时,要明确该方法的作者和发表年份,并引用相关的文献。

这样可以让读者了解到统计工具和方法的来源,并进一步了解其背后的理论基础。

最后,学术论文中还应该注意引用统计分析工具和方法的局限性。

在使用统计工具和方法时,往往会存在一些假设和限制。

在引用统计工具和方法时,要明确指出这些假设和限制,并对其可能产生的影响进行讨论。

【VIP专享】学术论文中常用数理统计方法的正确使用问题

【VIP专享】学术论文中常用数理统计方法的正确使用问题

学术论文中常用数理统计方法的正确使用问题(转)在环境科学研究中,经常会涉及到对随机变量大小、离散及分布特征描述以及对2个或多个随机变量之间关系比较的问题。

而对随机变量及随机变量之间的关系进行定量描述的数学工具就是数理统计。

由于能否正确使用各种数理统计方法关系到能否得出客观和可信的结论,对环境科学领域学术论文中常用数理统计方法(主要是相关分析和回归分析)的正确使用问题进行了初步分析,希望能对人们有所帮助。

1 统计软件的选择在进行统计分析时,尽管作者可以自行编写计算程序,但在统计软件很普及的今天,这样做是毫无必要的。

因此,出于对工作效率以及对算法的可靠性、通用性和可比性的考虑,多数科技期刊都要求作者采用专门的数理统计软件进行统计分析。

我们在处理稿件时经常发现的问题是,作者未使用专门的数理统计软件,而采用Excel这样的电子表格软件进行统计分析。

由于电子表格软件提供的统计分析功能十分有限,很难满足实际需要,除非比较简单的分析,我们不主张作者采用这样的软件。

目前,国际上已开发出的专门用于统计分析的商业软件很多,比较著名有SPSS(Statistical Package for Social Sciences)、SAS(Statistical Analysis System)、BMDP和STATISTIC A等。

其中,SPSS是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到广泛应用);BMDP是专门为生物学和医学领域研究者编制的统计软件。

目前,国际学术界有一条不成文的约定:凡是用SPSS和SAS软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算法。

由此可见,SPSS和SAS软件已被各领域研究者普遍认可。

我们建议《环境科学学报》的作者们在进行统计分析时尽量使用这2个专门的统计软件。

目前,有关这2个软件的使用教程在书店中可很容易地买到。

2 均值的计算在处理实验数据或采样数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题。

论文中如何使用适当的统计分析方法

论文中如何使用适当的统计分析方法

论文中如何使用适当的统计分析方法在科学研究和学术领域中,统计分析方法是一种重要的工具,可以帮助研究者有效地分析和解释数据,得出科学结论。

在论文撰写过程中,合理运用适当的统计分析方法不仅可以增加研究的可信度和说服力,还可以提升论文的学术价值。

本文将介绍如何在论文中运用适当的统计分析方法,以帮助研究者在学术研究中取得更好的效果。

一、确定研究目的和研究问题在进行统计分析之前,研究者首先需要明确研究的目的和研究问题。

研究目的可以是验证假设、比较不同组别之间的差异、预测未来趋势等。

根据具体的研究目的,确定明确的研究问题,这将有助于选择适用的统计方法和分析策略。

二、选择适当的统计分析方法根据研究目的和研究问题,选择适当的统计分析方法是十分关键的。

常用的统计分析方法包括描述性统计、推论统计、相关分析、回归分析、方差分析等。

例如,在描述性统计中,可以使用均值、中位数、标准差等指标来描述数据的分布情况;在推论统计中,可以使用t检验、方差分析、卡方检验等方法来验证假设;在回归分析中,可以通过构建回归模型来探究变量之间的关系。

三、收集和整理研究数据在进行统计分析之前,研究者需要收集并整理研究所需的数据。

数据可以通过实验观察、调查问卷、文献分析等方式获取。

在收集数据时,研究者需要保证数据的准确性和可靠性,并注意数据的样本容量和数据类型。

同时,对于缺失值和异常值,需要进行适当处理,以保证分析结果的有效性和可靠性。

四、进行数据的描述性统计分析在进行推论分析之前,研究者通常会先进行数据的描述性统计分析。

描述性统计可以帮助研究者对数据进行初步的整理和总结。

例如,可以计算各项指标,如平均值、中位数、标准差、频数等,用于描述数据的分布情况和变异程度。

通过描述性统计分析,研究者可以对数据有一个直观的了解,并进一步选择适当的推论分析方法。

五、进行推论统计分析推论统计分析是统计学中常用的方法之一,用于从样本数据中推断总体的特征和变异。

在进行推论统计分析时,研究者需要根据具体的研究问题和数据类型选择适当的统计方法。

论文写作中存在的数理统计问题

论文写作中存在的数理统计问题

1 统计软件的选择
目前,国际学术界有一条不成文的约定: 目前,国际学术界有一条不成文的约定:凡 是用SPSS和SAS软件进行统计分析所获得的 是用 和 软件进行统计分析所获得的 结果,在国际学术交流中不必说明具体算法。 结果,在国际学术交流中不必说明具体算法。 由此可见, 由此可见,SPSS和SAS软件已被各领域研究 和 软件已被各领域研究 者普遍认可。 者普遍认可。 我们建议作者们在进行统计分析时尽量使用 个专门的统计软件。 这2个专门的统计软件。目前,有关这 个软 个专门的统计软件 目前,有关这2个软 件的使用教程在书店中可很容易地买到。 件的使用教程在书店中可很容易地买到。
1 统计软件的选择
《环境科学学报》的编辑们在处理稿件时 环境科学学报》 经常发现的问题是: 经常发现的问题是:作者未使用专门的数 理统计软件,而采用Excel这样的电子表格 理统计软件,而采用 这样的电子表格 软件进行数据统计分析。 软件进行数据统计分析。 由于电子表格软件提供的统计分析功能十 分有限, 分有限,只能借助它进行较为简单的统计 分析, 分析,故我们不主张作者采用这样的软件 进行统计分析。 进行统计分析。
1 统计软件的选择
统计分析通常涉及大量的数据, 统计分析通常涉及大量的数据,需要较大的计 算工作量。 算工作量。 在进行统计分析时, 在进行统计分析时,尽管作者可以自行编写计 算程序,但在统计软件很普及的今天, 算程序,但在统计软件很普及的今天,这样做 是毫无必要的。 是毫无必要的。 出于对工作效率以及对算法的通用性 工作效率以及对算法的通用性、 出于对工作效率以及对算法的通用性、可比性 的考虑, 的考虑,一些学术期刊要求作者采用专门的数 理统计软件进行统计分析。 理统计软件进行统计分析。
2 均值的计算 :理论问题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第27卷第1期2007年1月环 境 科 学 学 报 Acta Scientiae Circu m stantiaeVol.27,No.1Jan.,2007环境科学领域学术论文中常用数理统计方法的正确使用问题张利田,卜庆杰,杨桂华,刘秀兰《环境科学学报》编辑部,北京100085 在环境科学研究中,经常会涉及到对随机变量大小、离散及分布特征描述以及对2个或多个随机变量之间关系比较的问题.而对随机变量及随机变量之间的关系进行定量描述的数学工具就是数理统计.由于能否正确使用各种数理统计方法关系到能否得出客观和可信的结论,所以,来稿中使用的数理统计方法是否正确是学术期刊编辑们极为重视的问题.针对近年来《环境科学学报》作者稿件中常见的数理统计方法方面的错误,我们对环境科学领域学术论文中常用数理统计方法(主要是相关分析和回归分析)的正确使用问题进行了初步分析,希望能对《环境科学学报》的作者们有所帮助.1 统计软件的选择在进行统计分析时,尽管作者可以自行编写计算程序,但在统计软件很普及的今天,这样做是毫无必要的.因此,出于对工作效率以及对算法的可靠性、通用性和可比性的考虑,多数科技期刊都要求作者采用专门的数理统计软件进行统计分析.我们在处理稿件时经常发现的问题是,作者未使用专门的数理统计软件,而采用Excel这样的电子表格软件进行统计分析.由于电子表格软件提供的统计分析功能十分有限,很难满足实际需要,除非比较简单的分析,我们不主张作者采用这样的软件.目前,国际上已开发出的专门用于统计分析的商业软件很多,比较著名有SPSS(Statistical Package for Social Sciences)、S AS(Statistical Analysis Syste m)、B MDP 和ST ATI STI CA等.其中,SPSS是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到广泛应用);B MDP是专门为生物学和医学领域研究者编制的统计软件.目前,国际学术界有一条不成文的约定:凡是用SPSS 和S AS软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算法.由此可见,SPSS和S AS软件已被各领域研究者普遍认可.我们建议《环境科学学报》的作者们在进行统计分析时尽量使用这2个专门的统计软件.目前,有关这2个软件的使用教程在书店中可很容易地买到.2 均值的计算在处理实验数据或采样数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题.此时,多数作者会不假思索地直接给出算术平均值和标准差.显然,这种做法是不严谨的.在数理统计学中,作为描述随机变量总体大小特征的统计量有算术平均值、几何平均值和中位数等.何时用算术平均值?何时用几何平均值?以及何时用中位数?这不能由研究者根据主观意愿随意确定,而要根据随机变量的分布特征确定.反映随机变量总体大小特征的统计量是数学期望,而在随机变量的分布服从正态分布时,其总体的数学期望就是其算术平均值.此时,可用样本的算术平均值描述随机变量的大小特征.如果所研究的随机变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征.在这种情况下,可通过假设检验来判断随机变量是否服从对数正态分布.如果服从对数正态分布,则可用几何平均值描述该随机变量总体的大小.此时,就可以计算变量的几何平均值.如果随机变量既不服从正态分布也不服从对数正态分布,则按现有的数理统计学知识,尚无合适的统计量描述该变量的大小特征.退而求其次,此时可用中位数来描述变量的大小特征.3 相关分析中相关系数的选择在相关分析中,作者们常犯的错误是简单地计算Pears on积矩相关系数,而且既不给出正态分布检验结果,也往往不明确指出所计算的相关系数就是Pears on积矩相关系数.常用的相关系数除有Pears on积矩相关系数外,还有Spear man秩相关系数和Kendall秩相关系数等.其中,Pears on 积矩相关系数可用于描述2个随机变量的线性相关程度(相应的相关分析方法称为“参数相关分析”,该方法的检验功效高,检验结果明确);Spear man或Kendall秩相关系数用来判断两个随机变量在二维和多维空间中是否具有某种共变趋势,而不考虑其变化的幅度(相应的相关分析称为“非参数相关分析”,该方法的检验功效较参数方法稍差,检验结果也不如参数方法明确).各种成熟的统计软件如SPSS、S AS等均提供了这些相关系数的计算模块.在相关分析中,计算各种相关系数是有前提的.对于二元相关分析,如果2个随机变量服从二元正态分布,或2个随机变量经数据变换后服从二元正态分布,则可以用Pears on积矩相关系数描述这2个随机变量间的相关关系(此时描述的是线性相关关系),而不宜选用功效较低的S pear man或Kendall秩相关系数.如果样本数据或其变换值不服从正态分布,则计算Pears on积矩相关系数就毫无意义.退而求其次,此时只能计算Spear man或Kendall秩相关系数(尽管这样做会导致检验功效的降低).因此,《环境科学学报》编辑部要求作者在报告相关分析结果时,还应提供正态分布检验结果,以证明计算所选择的相关系数是妥当的.需要指出的是,由于Spear man或Kendall秩相关系数是基于顺序变量(秩)设计的相关系数,因此,如果所采集的数据不是确定的数值而仅仅是秩,则使用Spear man环 境 科 学 学 报27卷或Kendall秩相关系数进行非参数相关分析就成为唯一的选择.4 相关分析与回归分析的区别相关分析和回归分析是极为常用的2种数理统计方法,在环境科学及其它科学研究领域有着广泛的用途.然而,由于这2种数理统计方法在计算方面存在很多相似之处,且在一些数理统计教科书中没有系统阐明这2种数理统计方法的内在差别,从而使一些研究者不能严格区分相关分析与回归分析.最常见的错误是,用回归分析的结果解释相关性问题.例如,作者将“回归直线(曲线)图”称为“相关性图”或“相关关系图”;将回归直线的R2(拟合度,或称“可决系数”)错误地称为“相关系数”或“相关系数的平方”;根据回归分析的结果宣称2个变量之间存在正的或负的相关关系.这些情况在《环境科学学报》的来稿中极为普遍.相关分析与回归分析均为研究2个或多个随机变量间关联性的方法,但2种数理统计方法存在本质的差别,即它们用于不同的研究目的.相关分析的目的在于检验两个随机变量的共变趋势(即共同变化的程度),回归分析的目的则在于试图用自变量来预测因变量的值.在相关分析中,两个变量必须同时都是随机变量,如果其中的一个变量不是随机变量,就不能进行相关分析.这是相关分析方法本身所决定的.对于回归分析,其中的因变量肯定为随机变量(这是回归分析方法本身所决定的),而自变量则可以是普通变量(规范的叫法是“固定变量”,有确定的取值)也可以是随机变量.如果自变量是普通变量,采用的回归方法就是最为常用的“最小二乘法”,即模型Ⅰ回归分析;如果自变量是随机变量,所采用的回归方法与计算者的目的有关———在以预测为目的的情况下,仍采用“最小二乘法”,在以估值为目的的情况下须使用相对严谨的“主轴法”、“约化主轴法”或“Bartlett法”,即模型Ⅱ回归分析.显然,对于回归分析,如果是模型Ⅰ回归分析,就根本不可能回答变量的“相关性”问题,因为普通变量与随机变量之间不存在“相关性”这一概念(问题在于,大多数的回归分析都是模型Ⅰ回归分析!).此时,即使作者想描述2个变量间的“共变趋势”而改用相关分析,也会因相关分析的前提不存在而使分析结果毫无意义.如果是模型Ⅱ回归分析,鉴于两个随机变量客观上存在“相关性”问题,但因回归分析方法本身不能提供针对自变量和因变量之间相关关系的准确的检验手段,因此,若以预测为目的,最好不提“相关性”问题;若以探索两者的“共变趋势”为目的,建议作者改用相关分析.需要特别指出的是,回归分析中的R2在数学上恰好是Pears on积矩相关系数r的平方.因此,这极易使作者们错误地理解R2的含义,认为R2就是“相关系数”或“相关系数的平方”.问题在于,对于自变量是普通变量(即其取值具有确定性)、因变量为随机变量的模型Ⅰ回归分析,2个变量之间的“相关性”概念根本不存在,又何谈“相关系数”呢?(说明:二元回归可决系数符号用小写r2)5 显著性水平相关分析及正态分布检验等均为基于假设检验的统计分析方法.而显著性水平的确定是假设检验中至关重要的问题.显著性水平反映了拒绝某一原假设时所犯错误的可能性.通常,拒绝客观上正确的原假设的几率用α值表示,该值被称为假设检验的显著性水平(Significant level).α值一般在进行假设检验前由研究者根据需要确定,常用的取值是0105或0.01.对于前者,相当于在原假设事实上正确的情况下,研究者接受这一假设的可能性为95%;对于后者,则研究者接受事实上正确的原假设的可能性为99%.显然,降低α值可以减少拒绝原假设的可能性.因此,在报告统计分析结果时,必须给出α值.在进行统计分析时,各种统计软件通常在给出检验统计量的同时,也给出该检验统计量取值的相伴概率(即某特定取值及更极端可能值出现的准确概率,用p 表示).p值是否小于事先确定的α值,是接受或拒绝原假设的依据.如果p值小于事先已确定的α值,就意味着原假设成立的可能性很小,因而可以拒绝原假设.相反,如果p值大于事先已确定的α值,就意味着原假设成立的可能性较大,因而不能拒绝原假设.在计算机软件尚不普及的情况下,计算检验统计量并与特定显著性水平的临界值比较是简洁的方法,但在计算机软件很普及的今天,建议直接使用p值进行统计推断,并在结果中给出p,以表达精确错误率.以二元相关分析为例,相关分析中的原假设是“相关系数为零”(即2个随机变量间不存在显著的相关关系).如果计算出的检验统计量的相伴概率(p值)低于事先给定α值(如0.05),就可以认为“相关系数为零”的可能性很低,2个随机变量之间存在明显的相关关系.与相关分析不同,在正态分布检验时,原假设是“样本数据来自服从正态分布的总体”.此时,如果计算出的检验统计量的相伴概率(p值)低于事先给定α值(如0.05),则表明数据不服从正态分布.在本刊来稿中,作者在描述相关分析结果时常有的失误是仅给出相关系数的值,而不给出显著性水平.这就无法判断2个随机变量间的相关性是否显著.此外,作者在论文中常常用“显著相关”和“极显著相关”来描述相关分析结果,即认为p值小于0.05就是显著相关关系(或显著相关),小于0.01就是极显著相关关系(或极显著相关).显然,这也是不规范的.在假设检验中,只有“显著”和“不显著”,没有“极显著”这样的提法(令人遗憾的是,有些统计软件教程中也有此种提法).只要计算出的检验统计量的相伴概率(p 值)低于事先确定的α值,就可以认为检验结果“显著”(相关分析的原假设是“相关系数为零”,故此处的“显著”实际意味着“相关系数不为零”,或说“2个随机变量间有显著的相关关系”);同样,只要计算出的检验统计量的相伴概率(p 值)高于事先确定的α值,就可以认为检验结果“不显著”.因此,不能认为p值小于0.05就是“显著相关”,p值小于0101就是“极显著相关”.换言之,在进行相关分析时,不能同时使用0105和0101这2个显著性水平来决定是否拒绝原2711期张利田等:环境科学领域学术论文中常用数理统计方法的正确使用问题假设,只能使用其中的1个.规范的做法是指出在什么α值(0.01或0.05)下是否显著相关并在括号中给出p值.需要指出的是,有少数作者在报告二元相关分析结果时,针对p 值大于0.05的情形宣称“2个随机变量有相关性但不显著”.这种说法是自相矛盾的.“有相关性”就意味着“检验结果显著”,“检验结果不显著”就意味着“不存在相关性”.在二元相关分析中,如果事先确定的α值为0.05,则只要p值大于0.05,2个随机变量之间就不存在相关关系.反之,如果2个随机变量间存在相关关系,则p值应小于0.05.6 推荐参考书为了能够准确、系统地了解常用的数理统计学概念和方法,适当阅读一些参考书是十分必要的.目前,这方面的出版物很多,作者们可很方便地从书店购得.此处我们推荐作者们阅读以下书籍.1)《应用数理统计方法》.该书由北京大学环境学院陶澍教授编著、中国环境科学出版社1994年出版.该书以环境科学及相邻学科的研究人员为主要对象,以方法应用为主轴,具有很好的可读性.2)《统计学方法与数据分析引论》(上、下).该书由科学出版社2003年出版,原著者为美国学者R.L.奥特和M.朗格内克,中译者为张忠占、王建稳、王强和杨中华.本书同样注重实例分析,可作为文科各专业本科生的统计学引论教程,以及理工科各专业学生应用统计学课程的教材或教学参考书,也可作为无任何统计学基础的一线科研人员阅读的统计学入门书籍.3)《SPSS统计分析方法及应用》.该书由北京市高等教育精品教材立项项目资助、中国人民大学统计学院薛薇教授编著、电子工业出版社2004年出版.这是一本介绍著名统计软件SPSS的教程.4)《SPSS实用统计分析》.该书由郝黎仁、樊元、郝哲欧等学者编著,中国水利水电出版社2003年出版.5)《S AS统计分析实用大全》.该书由北京大学社会学系阮桂海教授等编著,清华大学出版社2003年出版,是一本关于著名统计软件S AS的很系统、全面的教程.致谢:本文在写作过程中主要参考了北京大学环境学院陶澍教授的《应用数理统计方法》一书,且本文第一作者之所以十分重视审查编辑部来稿中的数理统计方法问题,与其在北京大学环境学院攻读博士学位期间选修陶澍教授所讲授的“应用数理统计学”课程密切相关.需要特别感谢的是,陶澍教授还在百忙中拨冗详细审阅了本文,并对文稿进行了重要修改.第一作者简介:张利田(1963—),男,理学博士,《环境科学学报》编委会执行副主编,编辑部主任.研究领域:水环境化学、土壤环境化学1371。

相关文档
最新文档