统计学相关术语(2)
常用统计学术语
统计学术语population 母体sample 样本census 普查sampling 抽样quantitative 量的qualitative/categorical质的discrete 离散的continuous 连续的population parameters 母体参数sample statistics 样本统计量descriptive statistics 叙述统计学抽样调查(sampling survey单纯随机抽样(simple random sampling 系统抽样(systematic sampling分层抽样(stratified sampling整群抽样(cluster sampling多级抽样(multistage sampling实验设计(Design of Experiment)参数(Parameter)Statistics 统计学Population 母体Sample 样本Data analysis 资料分析Statistical table 统计表Statistical chart 统计图Pie chart 圆饼图Stem-and-leaf display 茎叶图Histogram 直方图Bar Chart 长条图Polygon 次数多边图Expectation 期望值Mode 众数Mean 平均数Variance 变异数Standard deviation 标准差Standard error 标准误Covariance matrix 共变异数矩阵Inferential statistics 推论统计学Point estimation 点估计Interval estimation 区间估计Confidence interval 信赖区间Confidence coefficient 信赖系数Testing statistical hypothesis 统计假设检定Regression analysis 回归分析Analysis of variance 变异数分析Correlation coefficient 相关系数Sampling survey 抽样调查Census 普查Sampling 抽样Reliability 信度Validity 效度Sampling error 抽样误差Non-sampling error 非抽样误差Random sampling 随机抽样Simple random sampling 简单随机抽样法Stratified sampling 分层抽样法Cluster sampling 群集抽样法Systematic sampling 系统抽样法Two-stage random sampling 两段随机抽样法Convenience sampling 便利抽样Quota sampling 配额抽样Snowball sampling 雪球抽样Nonparametric statistics 无母数统计The sign test 等级检定Wilcoxon signed rank tests 魏克森讯号等级检定Wilcoxon rank sum tests 魏克森等级和检定Run test 连检定法Discrete uniform densities 离散的均匀密度Binomial densities 二项密度Hypergeometric densities 超几何密度Poisson densities 卜松密度Geometric densities 几何密度Negative binomial densities 负二项密度Continuous uniform densities 连续均匀密度Normal densities 常态密度Exponential densities 指数密度Gamma densities 伽玛密度Beta densities 贝他密度Multivariate analysis 多变量分析Principal components 主因子分析Discrimination analysis 区别分析Cluster analysis 群集分析Factor analysis 因素分析Survival analysis 存活分析Time series analysis 时间序列分析Linear models 线性模式Quality engineering 品质工程Probability theory 机率论Statistical computing 统计计算Statistical inference 统计推论Stochastic processes 随机过程Decision theory 决策理论Discrete analysis 离散分析Mathematical statistics 数理统计统计学: Statistics母体: Population样本: Sample资料分析: Data analysis统计表: Statistical table统计图: Statistical chart圆饼图: Pie chart茎叶图: Stem-and-leaf display盒须图: Box plot直方图: Histogram长条图: Bar Chart次数多边图: Polygon肩形图: Ogive叙述统计学: Descriptive statistics期望值: Expectation众数: Mode平均数: Mean变异数: Variance标准差: Standard deviation标准误: Standard error共变异数矩阵: Covariance matrix推论统计学: Inferential statistics点估计: Point estimation区间估计: Interval estimation信赖区间: Confidence interval信赖系数: Confidence coefficient统计假设检定: Testing statistical hypothesis 回归分析: Regression analysis变异数分析: Analysis of variance相关系数: Correlation coefficient抽样调查: Sampling survey普查: Census抽样: Sampling信度: Reliability效度: Validity抽样误差: Sampling error非抽样误差: Non-sampling error随机抽样: Random sampling简单随机抽样法: Simple random sampling分层抽样法: Stratified sampling群集抽样法: Cluster sampling系统抽样法: Systematic sampling两段随机抽样法: Two-stage random sampling便利抽样: Convenience sampling配额抽样: Quota sampling雪球抽样: Snowball sampling无母数统计: Nonparametric statistics等级检定: The sign test魏克森讯号等级检定: Wilcoxon signed rank tests魏克森等级和检定: Wilcoxon rank sum tests连检定法: Run test离散的均匀密度: Discrete uniform densities二项密度: Binomial densities超几何密度: Hypergeometric densities卜松密度: Poisson densities几何密度: Geometric densities负二项密度: Negative binomial densitie,连续均匀密度:Continuous uniform densities常态密度: Normal densities指数密度: Exponential densities伽玛密度: Gamma densities贝他密度: Beta densities多变量分析: Multivariate analysis 主因子分析: Principal components 区别分析: Discrimination analysis 群集分析: Cluster analysis因素分析: Factor analysis存活分析: Survival analysis时间序列分析: Time series analysis 线性模式: Linear models品质工程: Quality engineering机率论: Probability theory统计计算: Statistical computing统计推论: Statistical inference随机过程: Stochastic processes决策理论: Decision theory离散分析: Discrete analysis数理统计: Mathematical statistics统计名词市调辞典众数(Mode) 普查(census)指数(Index) 问卷(Questionnaire)中位数(Median) 信度(Reliability)百分比(Percentage) 母群体(Population)信赖水准(Confidence level) 观察法(Observational Survey)假设检定(Hypothesis Testing) 综合法(Integrated Survey)卡方检定(Chi-square Test) 雪球抽样(Snowball Sampling)差距量表(Interval Scale) 序列偏差(Series Bias)类别量表(Nominal Scale) 次级资料(Secondary Data)顺序量表(Ordinal Scale) 抽样架构(Sampling frame)比率量表(Ratio Scale) 集群抽样(Cluster Sampling)连检定法(Run Test) 便利抽样(Convenience Sampling)符号检定(Sign Test) 抽样调查(Sampling Sur)算术平均数(Arithmetic Mean) 非抽样误差(non-sampling error) 展示会法(Display Survey)调查名词准确效度(Criterion-Related Validity)元素(Element) 邮寄问卷法(Mail Interview)样本(Sample) 信抽样误差(Sampling error)效度(Validity) 封闭式问题(Close Question)精确度(Precision) 电话访问法(Telephone Interview)准确度(Validity) 随机抽样法(Random Sampling)实验法(Experiment Survey)抽样单位(Sampling unit) 资讯名词市场调查(Marketing Research) 决策树(Decision Trees)容忍误差(Tolerated erro) 资料采矿(Data Mining)初级资料(Primary Data) 时间序列(Time-Series Forecasting)目标母体(Target Population) 回归分析(Regression)抽样偏差(Sampling Bias) 趋势分析(Trend Analysis)抽样误差(sampling error) 罗吉斯回归(Logistic Regression)架构效度(Construct Validity) 类神经网络(Neural Network)配额抽样(Quota Sampling) 无母数统计检定方法(Non-Parametric Test)人员访问法(Interview) 判别分析法(Discriminant Analysis)集群分析法(cluster analysis) 规则归纳法(Rules Induction)内容效度(Content Validity) 判断抽样(Judgment Sampling)开放式问题(Open Question) OLAP(Online Analytical Process)分层随机抽样(Stratified Random sampling) 资料仓储(Data Warehouse)非随机抽样法(Nonrandom Sampling) 知。
《统计学》 各章关键术语(中英文对照)
第二部分 各章关键术语(中英文对照)第1章统计学(statistics)随机性(randomness)描述统计学(descriptive statistics)推断统计学(inferential statistics)总体(population)母体(parent)(parent population)样本、子样(sample)调查对象总体(respondents population)有限总体(finite population)调查的理论总体(survey’s heoretical population)超总体(super population)变量(variable)数据(data)原始数据(original data)派生数据(derived data)定类尺度(nominal scale)定类尺度变量(nominal scale level variable)定类尺度数据(nominal scale level data)定序尺度(ordinal scale)定序尺度变量(ordinal scale level variable)定序尺度数据(ordinal scale level data)定距尺度(interval scale)定距尺度变量(interval scale level variable)定距尺度数据(interval scale level data)定比尺度(ratio scale)定比尺度变量(ratio scale level variable)定比尺度数据(ratio scale level data)分类变量(categorical variable)定性变量、属性变量(qualitative variable)数值变量(numerical variable)定量变量、数量变量(quantitative variable)绝对数变量(absolute number level variable)绝对数数据(absolute number level data)比率变量(ratio level variable)比率数据(ratio level data)实验数据(experimental data)调查数据(survey data)观察数据(observed data)第2章随机性(randomness)随机现象(random phenomenon)随机试验(random experiment)事件(event)基本事件(elementary event)复合事件(union of event)必然事件(certain event)不可能事件(impossible event)基本事件空间(elementary event space)互不相容事件(mutually exclusive events)统计独立(statistical independent)统计相依(statistical dependence)概率(probability)古典方法概率(classical method probability)相对频数方法概率(relative frequency method probability)主观方法概率(subjective method probability)几何概率(geometric probability)条件概率(conditional probability)全概率公式(formula of total probability)贝叶斯公式(Bayes’ formula)先验概率(prior probability)后验概率(posterior probability)随机变量(random variable)离散型随机变量(discrete type random variable)连续型随机变量(continuous type random variable)概率分布(probability distribution)特征数(characteristic number)位置特征数(location characteristic number)数学期望(mathematical expectation)散布特征数(scatter characteristic number)方差(variance)标准差(standard deviation)变异系数(variable coefficient)贝努里分布(Bernoulli distribution)二点分布(two-point distribution)0-1分布(zero-one distribution)贝努里试验(Bernoulli trials)二项分布(binomial distribution)超几何分布(hyper-geometric distribution)正态分布(normal distribution)正态概率密度函数(normal probability density function)正态概率密度曲线(normal probability density curve)正态随机变量(normal random variable)卡方分布(chi-square distribution)F_分布(F-distribution)t_分布(t-distribution)“学生”氏t_分布(Student’s t-distribution)列联表(contingency table)联合概率分布(joint probability distribution)边缘概率分布(marginal probability distribution)条件分布(conditional distribution)协方差(covariance)相关系数(correlation coefficient)第3章统计调查(statistical survey)数据收集(collection of data)统计单位(statistical unit)统计个体(statistical individual)社会经济总体(socioeconomic population)调查对象总体(respondents population)有限总体(finite population)标志(character)标志值(character value)属性标志(attributive character )品质标志(qualitative character )数量标志(numerical indication)不变标志(invariant indication)变异(variation)调查条目(item of survey)指标(indicator)统计指标(statistical indicator)总量指标(total amount indicator)绝对数(absolute number)统计单位总量(total amount of statistical unit )标志值总量(total amount of indication value)(total amount of character value)时期性总量指标(time period total amount indicator)流量指标(flow indicator)时点性总量指标(time point total amount indicator)存量指标(stock indicator)平均指标(average indicator)平均数(average number)相对指标(relative indicator)相对数(relative number)动态相对指标(dynamic relative indicator)发展速度(speed of development)增长速度(speed of growth)增长量(growth amount)百分点(percentage point)计划完成相对指标(relative indicator of fulfilling plan)比较相对指标(comparison relative indicator)结构相对指标(structural relative indicator)强度相对指标(intensity relative indicator)基期(base period)报告期(given period)分组(classification)(grouping)统计分组(statistical classification)(statistical grouping)组(class)(group)分组设计(class divisible design)(group divisible design)互斥性(mutually exclusive)包容性(hold)分组标志(classification character)(grouping character)按品质标志分组(classification by qualitative character)(grouping by qualitative character)按数量标志分组(classification by numerical indication)(grouping by numerical indication)离散型分组标志(discrete classification character)(discrete grouping character)连续型分组标志(continuous classification character)(continuous grouping character)单项式分组设计(single-valued class divisible design)(single-valued group divisible design)组距式分组设计(class interval divisible design)(group interval divisible design)组界(class boundary)(group boundary)频数(frequency)(frequency number)频率(frequency)组距(class interval)(group interval)组限(class limit)(group limit)下限(lower limit)上限(upper limit)组中值(class mid-value)(group mid-value)开口组(open class)(open-end class)(open-end group)开口式分组(open-end grouping)等距式分组设计(equal class interval divisible design)(equal group interval divisible design)不等距分组设计(unequal class interval divisible design)(unequal group interval divisible design)调查方案(survey plan)抽样调查(sample survey)有限总体概率抽样(probability sampling in finite populations)抽样单位(sampling unit)个体抽样(elements sampling)等距抽样(systematic sampling)整群抽样(cluster sampling)放回抽样(sampling with replacement)不放回抽样(sampling without replacement)分层抽样(stratified sampling)概率样本(probability sample)样本统计量(sample statistic)估计量(estimator)估计值(estimate)无偏估计量(unbiased estimator)有偏估计量(biased estimator)偏差(bias)精度(degree of precision)估计量的方差(variance of estimates)标准误(standard error)准确度(degree of accuracy)均方误差(mean square error)估计(estimation)点估计(point estimation)区间估计(interval estimate)置信区间(confidence interval)置信下限(confidence lower limit)置信上限(confidence upper limit)置信概率(confidence probability)总体均值(population mean)总体总值(population total)总体比例(population proportion)总体比率(population ratio)简单随机抽样(simple random sampling)简单随机样本(simple random sample)研究域(domains of study)子总体(subpopulations)抽样框(frame)估计量的估计方差(estimated variance of estimates)第4章频数(frequency)(frequency number)频率(frequency)分布列(distribution series)经验分布(empirical distribution)理论分布(theoretical distribution)品质型数据分布列(qualitative data distribution series)数量型数据分布列(quantitative data distribution series)单项式数列(single-valued distribution series)组距式数列(class interval distribution series)频率密度(frequency density)分布棒图(bar graph of distribution)分布直方图(histogram of distribution)分布折线图(polygon of distribution)累积分布数列(cumulative distribution series)累积分布图(polygon of cumulative distribution)位置特征(location characteristic)位置特征数(location characteristic number)平均值、均值(mean)平均数(average number)权数(weight number)加权算术平均数(weighted arithmetic average)加权算术平均值(weighted arithmetic mean)简单算术平均数(simple arithmetic average)简单算术平均值(simple arithmetic mean)加权调和平均数(weighted harmonic average)加权调和平均值(weighted harmonic mean)简单调和平均数(simple harmonic average)简单调和平均值(simple harmonic mean)加权几何平均数(weighted geometric average)加权几何平均值(weighted geometric mean)简单几何平均数(simple geometric average)简单几何平均值(simple geometric mean)绝对数数据(absolute number data)比率类型数据(ratio level data)中位数(median)众数(mode)耐抗性(resistance)散布特征(scatter characteristic)散布特征数(scatter characteristic number)极差、全距(range)四分位差(quartile deviation)四分间距(inter-quartile range)上四分位数(upper quartile)下四分位数(lower quartile)在外截断点(outside cutoffs)平均差(mean deviation)方差(variance)标准差(standard deviation)变异系数(variable coefficient)第5章随机样本(random sample)简单随机样本(simple random sample)参数估计(parameter estimation)矩(moment)矩估计(moment estimation)修正样本方差(modified sample variance)极大似然估计(maximum likelihood estimate)参数空间(space of paramete)似然函数(likelihood function)似然方程(likelihood equation)点估计(point estimation)区间估计(interval estimation)假设检验(test of hypothesis)原假设(null hypothesis)备择假设(alternative hypothesis)检验统计量(statistic for test)观察到的显著水平(observed significance level)显著性检验(test of significance)显著水平标准(critical of significance level)临界值(critical value)拒绝域(rejection region)接受域(acceptance region)临界值检验规则(test regulation by critical value)双尾检验(two-tailed tests)显著水平(significance level)单尾检验(one-tailed tests)第一类错误(first-kind error)第一类错误概率(probability of first-kind error)第二类错误(second-kind error)第二类错误概率(probability of second-kind error)P_值(P_value)P_值检验规则(test regulation by P_value)经典统计学(classical statistics)贝叶斯统计学(Bayesian statistics)第6章方差分析(analysis of variance,ANOV A)方差分析恒等式(analysis of variance identity equation)单因子方差分析(one-factor analysis of variance)双因子方差分析(two-factor analysis of variance)总变差平方和(total variation sum of squares)总平方和SST(total sum of squares)组间变差平方和(among class(group) variation sum of squares),回归平方和SSR (regression sum of squares)组内变差平方和(within variation sum of squares)误差平方和SSE(error sum of squares)皮尔逊χ2统计量(Pearson’s chi-statistic)分布拟合(fitting of distrbution)分布拟合检验(test of fitting of distrbution)皮尔逊χ2检验(Pearson’s chi-square test)列联表(contingency table)独立性检验(test of independence)数量变量(quantitative variable)属性变量(qualitative variable)对数线性模型(loglinear model)回归分析(regression analysis)随机项(random term)随机扰动项(random disturbance term)回归系数(regression coefficient)总体一元线性回归模型(population linear regression model with a single regressor)总体多元线性回归模型(population multiple regression model with a single regressor)完全多重共线性(perfect multicollinearity)遗漏变量(omitted variable)遗漏变量偏差(omitted variable bias)面板数据(panel data)面板数据回归(panel data regressions)工具变量(instrumental variable)工具变量回归(instrumental variable regressions)两阶段最小平方估计量(two stage least squares estimator)随机化实验(randomized experiment)准实验(quasi-experiment)自然实验(natural experiment)普通最小平方准则(ordinary least squares criterion)最小平方准则(least squares criterion)普通最小平方(ordinary least squares,OLS)最小平方(least squares)最小平方法(least squares method)第7章简单总体(simple population)复合总体(combined population)个体指数:价比(price relative),量比(quantity relative)总指数(general index)(combined index)统计指数(statistical indices)类指数、组指数(class index)动态指数(dynamic index)比较指数(comparison index)计划完成指数(index of fulfilling plan)数量指标指数(quantitative indicator index)物量指数(quantitative index)(quantity index)(quantum index)质量指标指数(qualitative indicator index)价格指数、物价指数(price index)综合指数(aggregative index)(composite index)拉斯贝尔指数(Laspeyres’ index)派许指数(Paasche’s index)阿斯·杨指数(Arthur Young’s index)马歇尔—埃奇沃斯指数(Marshall-Edgeworth’s index)理想指数(ideal index)加权综合指数(weighted aggregate index)平均指数(average index)加权算术平均指数(weighted arithmetic average index)加权调和平均指数(weighted harmonic average index)因子互换(factor-reversal)购买力平价(purchasing power parity,PPP)环比指数(chain index)定基指数(fixed base index)连环替代因素分析法(factor analysis by chain substitution method)不变结构指数、固定构成指数(index of invariable construction)结构指数、结构影响指数(structural index)第8章截面数据(cross-section data)时序数据(time series data)动态数据(dynamic data)时间数列(time series)发展水平(level of development)基期水平(level of base period)报告期水平(level of given period)平均发展水平(average level of development)序时平均数(chronological average)增长量(growth quantity)平均增长量(average growth amount)发展速度(speed of development)增长速度(speed of growth)增长率(growth rate)环比发展速度(chained speed of development)定基发展速度(fixed base speed of development)环比增长速度(chained growth speed)定基增长速度(fixed base growth speed)平均发展速度(average speed of development)平均增长速度(average speed of growth)平均增长率(average growth rate)算术图(arithmetic chart)半对数图(semilog graph)时间数列散点图(scatter diagram of time series)时间数列折线图(broken line graph of time series)水平型时间数列(horizontal patterns in time series data)趋势型时间数列(trend patterns in time series data)季节型时间数列(season patterns in time series data)趋势—季节型时间数列(trend-season patterns in time series data)一次指数平滑平均数(simple exponential smoothing mean)一次指数平滑法(simple exponential smoothing method)最小平方法(leas square method)最小平方准则(least squares criterion)原资料平均法(average of original data method)季节模型(seasonal model)(seasonal pattern)长期趋势(secular trends)季节变动(变差)(seasonal variation)季节波动(seasonal fluctuations)不规则变动(变差)(erratic variation)不规则波动(random fluctuations)时间数列加法模型(additive model of time series)时间数列乘法模型(multiplicative model of time series)11。
统计学相关术语
统计学相关术语1、概率(proability):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。
一随机事件的慨率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对事件发生的相信程度。
2、统计学(statistics):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
也就是收集、处理、分析、解释数据并从数据中得出结论的科学。
主要又分为描述统计学和推断统计学。
3、描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
目的是描述数据特征,找出数据的基本规律。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
4、推断统计(Inferential Statistics):推断统计是研究如何根据样本数据来推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
主要包括参数估计与假设检验两种方法。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
5、数值型数据(metric data):按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。
6、分类数据(categorical data) :只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。
7、总体(population):所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。
分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的;无限总体所包括的元素是无限的,不可数的。
常用统计术语
常用统计术语统计术语在现代社会中扮演着重要的角色,它们被广泛运用于各个领域,如经济学、社会学、医学等等。
对于研究人员、决策者和普通公众来说,了解和掌握常用的统计术语是至关重要的。
本文将介绍一些常用的统计术语,帮助读者更好地理解和运用统计数据。
1. 样本(Sample):从总体中选取的一部分观察对象,以代表总体。
选择样本的目的在于降低调查成本和时间,并且在一定程度上能够提供总体的真实情况。
2. 总体(Population):研究对象的全体。
总体可以是人群、产品、事件等等。
3. 随机抽样(Random Sampling):一种抽样方法,所有样本具有相同的机会被选中的概率,从而保证样本的代表性和可靠性。
4. 样本容量(Sample Size):样本中的观察对象数量。
样本容量的选择应根据研究目的和研究对象的特点来确定,样本容量越大,结果越可靠。
5. 参数(Parameter):总体的数值指标,如总体均值、总体方差等。
参数通常用希腊字母表示,如μ表示总体均值,σ表示总体标准差。
6. 统计量(Statistic):样本的数值指标,如样本均值、样本方差等。
统计量是通过样本来估计参数。
7. 平均值(Mean):一组数据的加权平均数,可以代表数据的集中趋势。
常用符号X表示样本平均值,μ表示总体平均值。
8. 中位数(Median):把一组数据从小到大排列,位于中间位置的数值。
中位数可以代表数据的中间位置。
9. 众数(Mode):一组数据中出现次数最多的数值。
众数可以代表数据的峰值。
10. 标准差(Standard Deviation):衡量数据的离散程度,是每个数据与该组数据平均值的差异的平方和的平均值的平方根。
11. 偏度(Skewness):衡量数据的偏斜程度,描述数据分布偏向左侧或右侧的程度。
偏度为正表示数据分布向右偏,为负表示数据分布向左偏。
12. 峰度(Kurtosis):衡量数据的峰态程度,描述数据分布的尖锐程度。
统计专业术语
统计专业术语
统计学:作为一门学科,统计学涉及收集、整理、分析和解释数据的方法和技巧。
样本:被用于进行统计分析的数据子集。
总体:指整个群体或研究对象的集合,统计学中的分析结果通常是关于总体的。
抽样:从总体中选择以获得样本的过程。
标本误差:样本结果与总体结果之间的差异。
均值:一组数值的平均值,通过将所有数值相加并除以数值的总数来计算得到。
中位数:将一组数值按顺序排列后,位于中间位置的数值。
众数:一组数值中出现次数最多的数。
方差:度量一组数值离其均值的差异程度。
标准差:方差平方根,度量一组数值的离散程度。
相关性:指两个变量之间的关联程度。
回归分析:用于预测一个变量与其他变量之间关系的统计方法。
假设检验:用于评估统计推断中的假设的方法,通常将一个观察结果与一个预期结果进行比较。
置信区间:对一个估计值的不确定性进行度量的区间。
显著性水平:用于判断一个结果是否足够令人信服的概率阈值。
p值:表示观察到的统计数据在假设为真的情况下出现的概率。
设计效应:抽样过程中的某些因素对样本结果的影响。
统计显著性:指在统计学中观察到的差异超出了偶然误差的程度。
SPSS:一种常用的统计软件,用于数据分析和统计建模。
R语言:一种开源统计计算和图形化工具,广泛用于统计学和
数据分析。
这只是统计学中的一些常见专业术语,还有许多其他概念和方法,可以进一步探索和研究。
统计学概论主要术语
第1章统计学研究什么?主要术语1. 统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。
3. 推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。
4. 变量(variable):每次观察都会得到不同结果的某种特征。
5. 分类变量(categorical variable):又称无序分类变量,观测结果表现为某种类别的变量。
6. 顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。
7. 数值变量(metric variable):又称定量变量,观测结果表现为数字的变量。
8. 分类数据(categorical data):只能归于某一类别的非数字型数据。
9. 顺序数据(rank data):只能归于某一有序类别的非数字型数据。
10. 数值型数据(metric data):按数字尺度测量的数据。
11. 总体(population):包含所研究的全部个体(数据)的集合。
12. 样本(sample):从总体中抽取的一部分元素的集合。
13. 样本量(sample size):构成样本的元素的数目。
14. 简单随机抽样(simple random sampling):从含有N个元素的总体中,抽取n个元素组成一个样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。
15. 分层抽样(stratified sampling):也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。
16. 系统抽样(systematic sampling):也称等距抽样,先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素组成一个样本。
统计学术语
统计学术语1. 平均数:平均值,又称平均算术,是统计学中分析数据及描述数据特征的常用统计量。
2. 中位数:中位数是一组有序数据中居于中间位置的数据项。
3. 众数:一组数据中出现次数最多的数据项即为众数。
4. 极差:极差是最大值减去最小值的结果,用来表示一组数据范围大小的统计量。
5. 标准差:标准差是一组数据离均值偏差程度的反映,用来衡量一组数据离散程度。
6. 方差:方差是一组数据平均分布情况的反映,用来衡量一组数据离散度。
7. 协方差:协方差是一组数据关联和变化特征的反映,用来统计数据间的线性相关程度。
8. 相关系数:相关系数是对数据关联程度的反映,用来统计数据间的线性相关性。
9. 相关分析:相关分析是统计学中的研究方法,用来研究两个或两个以上变量之间的关系和联系。
10. 误差估计:误差估计是统计学及其应用中经常使用的统计量,用来研究某统计量的估计值和真实值之间的差异。
11. 测度:测度是衡量变量本质特征的方法,可以用来研究变量的取值范围大小、数据的分布特点等。
12. 抽样技术:抽样技术是指在样本中抽取部分数据进行定量研究的方法,使用的抽样方法有简单随机抽样、系统抽样、分层抽样和多方抽样等。
13. 模拟:模拟是指根据现实中或实验中的相关数据,以近似真实环境的方式模拟出理论模型,计算机模拟是应用最广泛的一种数学模拟方法。
14. 回归分析:回归分析是指研究两变量或多变量之间相互关系,并用线性等数学模型对该关系进行拟合和估计的统计学分析方法。
15. 分类分析:分类分析是对对象进行分组的统计学分析方法,可以使用适当的统计方法进行分类比较,以揭示不同群体之间的差异。
16. 抽象数量分析:抽象数量分析是指使用抽象的统计模型分析实验数据的方法,准确确定模型参数,有效地估计观察值。
17. 分位数:分位数是一组有序数据中,从最小到最大排列后比例所处位置的数值,它可以用来衡量数据中位置分布的特点。
18. 箱线图:箱线图是一种用来表示数据分布特征的统计图,可以观察分布的中位数、四分位数等重要信息。
统计学中的专业术语
Canonical correlation, 典型相关Caption, 纵标目Case-control study, 病例对照研究Categorical variable, 分类变量Catenary, 悬链线Cauchy distribution, 柯西分布Cause-and-effect relationship, 因果关系Cell, 单元Censoring, 终检Center of symmetry, 对称中心Centering and scaling, 中心化和定标Central tendency, 集中趋势Central value, 中心值CHAID -χ2 Automatic Interaction Detector, 卡方自动交互检测Chance, 机遇Chance error, 随机误差Chance variable, 随机变量Characteristic equation, 特征方程Characteristic root, 特征根Characteristic vector, 特征向量Chebshev criterion of fit, 拟合的切比雪夫准则Chernoff faces, 切尔诺夫脸谱图Chi-square test, 卡方检验/χ2检验Choleskey decomposition, 乔洛斯基分解Circle chart, 圆图Class interval, 组距Class mid-value, 组中值Class upper limit, 组上限Classified variable, 分类变量Cluster analysis, 聚类分析Cluster sampling, 整群抽样Code, 代码Coded data, 编码数据Coding, 编码Coefficient of contingency, 列联系数Coefficient of determination, 决定系数Coefficient of multiple correlation, 多重相关系数Coefficient of partial correlation, 偏相关系数Coefficient of production-moment correlation, 积差相关系数Coefficient of rank correlation, 等级相关系数Coefficient of regression, 回归系数Coefficient of skewness, 偏度系数Coefficient of variation, 变异系数Cohort study, 队列研究Column, 列Column effect, 列效应Column factor, 列因素Combination pool, 合并Combinative table, 组合表Common factor, 共性因子Common regression coefficient, 公共回归系数Common value, 共同值Common variance, 公共方差Common variation, 公共变异Communality variance, 共性方差Comparability, 可比性Comparison of bathes, 批比较Comparison value, 比较值Compartment model, 分部模型Compassion, 伸缩Complement of an event, 补事件Complete association, 完全正相关Complete dissociation, 完全不相关Complete statistics, 完备统计量Completely randomized design, 完全随机化设计Composite event, 联合事件Composite events, 复合事件Concavity, 凹性Conditional expectation, 条件期望Conditional likelihood, 条件似然Conditional probability, 条件概率Conditionally linear, 依条件线性Confidence interval, 置信区间Confidence limit, 置信限Confidence lower limit, 置信下限Confidence upper limit, 置信上限Confirmatory Factor Analysis , 验证性因子分析Confirmatory research, 证实性实验研究Confounding factor, 混杂因素Conjoint, 联合分析Consistency, 相合性Consistency check, 一致性检验Consistent asymptotically normal estimate, 相合渐近正态估计Consistent estimate, 相合估计Constrained nonlinear regression, 受约束非线性回归Constraint, 约束Contaminated distribution, 污染分布Contaminated Gausssian, 污染高斯分布Contaminated normal distribution, 污染正态分布Contamination, 污染Contamination model, 污染模型Contingency table, 列联表Contour, 边界线Contribution rate, 贡献率Control, 对照Controlled experiments, 对照实验Conventional depth, 常规深度Convolution, 卷积Corrected factor, 校正因子Corrected mean, 校正均值Correction coefficient, 校正系数Correctness, 正确性Correlation coefficient, 相关系数Correlation index, 相关指数Correspondence, 对应Counting, 计数Counts, 计数/频数Covariance, 协方差Covariant, 共变Cox Regression, Cox回归Criteria for fitting, 拟合准则Criteria of least squares, 最小二乘准则Critical ratio, 临界比Critical region, 拒绝域Critical value, 临界值Cross-over design, 交叉设计Cross-section analysis, 横断面分析Cross-section survey, 横断面调查Crosstabs , 交叉表Cross-tabulation table, 复合表Cube root, 立方根Cumulative distribution function, 分布函数Cumulative probability, 累计概率Curvature, 曲率/弯曲Curvature, 曲率Curve fit , 曲线拟和Curve fitting, 曲线拟合Curvilinear regression, 曲线回归Curvilinear relation, 曲线关系Cut-and-try method, 尝试法Cycle, 周期Cyclist, 周期性。
一般统计术语与用于概率的术语
一般统计术语与用于概率的术语统计学是研究数据收集、分析和解释的学科,而概率论则是研究随机现象的可能性的学科。
在统计学和概率论中,有许多常用的术语被广泛应用于描述和解释数据和概率的特征。
本文将介绍一些常见的一般统计术语和用于概率的术语,并对其进行解释和应用。
一般统计术语:1. 样本(Sample):指代从总体中选取的一部分数据,用于对总体进行分析和推断。
2. 总体(Population):指代研究对象的全体,可以是人群、产品、事件等。
3. 参数(Parameter):指代总体的特征或属性,如总体的平均值、标准差等。
4. 统计量(Statistic):指代从样本中计算得出的数值,用于对总体参数进行估计。
5. 抽样(Sampling):指从总体中选择样本的过程,以代表总体进行研究。
6. 假设检验(Hypothesis testing):通过对样本数据进行统计推断,判断总体参数是否符合某个假设。
7. 置信区间(Confidence interval):用于估计总体参数真值的范围,通常以置信水平表示。
8. 方差(Variance):衡量数据分散程度的统计量,是各观察值与均值之差的平方和的平均值。
9. 标准差(Standard deviation):方差的正平方根,用于度量数据的离散程度。
10. 相关性(Correlation):用于描述两个变量之间关系的统计指标,可为正相关、负相关或无关。
用于概率的术语:1. 随机变量(Random variable):描述随机试验结果的数学变量,可以是离散型或连续型。
2. 概率(Probability):用于度量随机事件发生的可能性,取值范围为0到1。
3. 概率分布(Probability distribution):描述随机变量可能取值的概率情况。
4. 期望值(Expected value):随机变量的平均值,表示随机变量的平均水平。
5. 方差(Variance):度量随机变量取值在期望值附近的离散程度。
统计学相关术语
统计学相关术语关键信息项:1、统计学术语定义名称:____________________解释:____________________2、术语应用场景场景描述:____________________具体示例:____________________3、术语的重要性对数据分析的影响:____________________在决策中的作用:____________________11 术语定义111 均值(Mean)均值是一组数据的算术平均值。
计算方法是将所有数据相加,然后除以数据的个数。
例如,对于数据集合{2, 4, 6, 8, 10},均值为(2 + 4 + 6 + 8 + 10) / 5 = 6。
112 中位数(Median)将一组数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则中间的那个数就是中位数;如果数据个数是偶数,则中间两个数的平均值就是中位数。
例如,对于数据集合{1, 3, 5, 7, 9},中位数是 5;对于数据集合{2, 4, 6, 8},中位数是(4 + 6) / 2 = 5。
113 众数(Mode)一组数据中出现次数最多的数。
例如,对于数据集合{1, 2, 2, 3, 3, 3},众数是 3。
114 方差(Variance)用来衡量一组数据的离散程度。
方差越大,说明数据的离散程度越大;方差越小,说明数据越集中。
115 标准差(Standard Deviation)方差的平方根,与原始数据的单位相同,更直观地反映数据的离散程度。
12 术语应用场景121 市场调研在市场调研中,均值可用于了解消费者对某产品的平均评价得分;中位数可用于确定大多数消费者的评价水平;众数可帮助发现最常见的消费者意见。
122 质量控制在生产过程中,通过计算产品质量指标的方差和标准差,来判断生产过程是否稳定,是否需要进行调整。
123 教育评估学生考试成绩的分析中,利用这些术语来评估学生的整体表现、成绩的分布情况等。
统计学术语
统计学中的专业术语arithmetic mean 算术平均数abscissa(X-axis) 横坐标(X-轴)a priori 事前假设alpha(α)error α错误alpha level α水平alternative hypothesis 备择假设addition rule 加法定理additive effect 累加效应analysis of variance(ANOV A) 方差分析adjusted residual 调整后残差binomial test 二项测验between-subjects variable 被试间变量between-groups variance 组间方差binomial distribution 二项分布bar graph 条形图box-and-whisker plot 箱线图bimodal 双峰biased estimate 有偏估计beta(β)error β错误biased estimate 有偏估计binomial estimate 二项估计Cohen’s Kappa Cohen的kappa系数Gramer’s coefficient Gramer系数cause and effect 原因和结果comparison 比较confounding 混淆constant 常量correlation 相关continuous variables 连续变量class 组(分组)cumulative frequency 累积频数cumulative percentage 累积百分比chartjunk 统计图中的画蛇添足class intervals or class widths 组距或组宽coefficient of determination r2决定系数coefficient of nondetermination 非决定系数correlation 相关correlation coefficient 相关系数correlation matrix 相关矩阵covariance 协方差covariance sum of squares 协方差平方和curvilinear relation 曲线关系deviation score 离差分数classical definition of probability 概率的古典定义conditional probabilities 条件概率continuous variable 连续变量carry-over effect 滞留效应counterbalancing 对抗平衡central limit theorem 中心极限定理conceptual hypothesis 概念假设conditional conclusion 条件性结论confidence interval 置信区间directional hypothesis 方向性假设discrete variable 离散变量data 数据discontinuous or discrete variables 非连续或间断变量dependent variable(DV)因变量descriptive statistics 描述统计direct replication 直接复制definitional equation 定义性公式dot chart 点图direct difference method 直接差异法degrees of freedom 自由度effect size 效应大小error term 误差estimate of s(s=arrange/6)估计标准差experiment 实验experimental variable 实验变量extraneous variable 无关变量exploratory data analysis 探索性数据分析extreme scores 极端值error sum of squares 误差平方和empirical definition of probability 概率的经验定义experiment wise error 同一实验中多重t检验误差frequency distribution 频数分布fourth moment about the mean 四级动差figure 数字frequency curve or line graph 频数分布曲线或线性图factorial design 因素设计factor 因素F-ratio F值graph 统计图gambler’s fallacy 赌徒谬误goodness-of-fit-test 拟合优度检验general linear model 广义线性模型homogeneity 同质性histogram 直方图homoscedasicity 方差齐性homogeneity of variance 方差齐性interval scale 等距量表independent variable(IV)自变量inferential statistics 推论统计intact group 完整组intercept(a)截距(a)independent groups 独立组independent or independence 独立或独立性interaction 交互作用joint probability 联合概率kurtosis 峰度kurtosis(s4)峰度leptokurtic distribution 尖峰分布Lake Wobegon Effect Lake Wobegon效应least squares method 最小平方法leptokurtic 尖峰的linear relation 线性关系levels of a factor 单因素的水平measurement 测量mesokurtic distribution 中峰分布measures of central tendency 集中趋势的测量median 中位数mode 众数multimodal 多峰mesokurtic 中峰的man-who statistics 基于特例的统计解释误差marginal probabilities or unconditional probabilities 边缘概率或无条件概率mutually exclusive 互不相容multiplication rule for independent events 独立事件的乘法定律multiplication rule for dependent events 非独立事件的乘法定理main effect 主效应modus tollens 证伪法nondirectional hypothesis 无方向性假设null hypothesis 虚无假设negative skew 负偏态nominal scale 称名量表nuisance variable 干扰变量normal distribution 正态分布negative relationship 负相关nondetermination 非决定性percentages 百分比proportions 比例population 总体percentile rank 百分等级platykurtic distribution 偏锋分布positive skew 正偏态positive skew 正偏态positive skew 正偏态positive skew 正偏态platykurtic 低峰的pictographs 图片统计图Pearson r(product-moment correlation coefficient)皮尔逊相关系数(积矩相关系数)positive relationship 正相关post hoc fallacy 事后错误partitioning the sum of squares 平方和分解partition 方差分解parametric test 参数检验power of a test 统计检验力point estimation 点估计probabilities 概率ordinal scale 顺序量表operational definition 操作定义outliers 极端数据outlier 异常值ordinate (Y-axis)纵坐标(Y轴)omnibus statistical test 复合统计检验one-way ANOV A 单因素方差分析omega squared(w²)w²one-tailed probability 单尾概率variable 变量random sample 随机样本ratio scale 比率量表real limits of a number 数的实限rules of priority 优先规则random assignment 随机分派replication 复制research design 研究设计range 全距regression line 回归线regression sum of squares 回归平方和regression to the mean 对平均数的回归residual variance 残差robust 检验的强劲性random 随机reject Hοrules 拒绝的原则sample 样本statistics 统计学statistic 统计量subject variable 被试变量systematic replication 系统复制skew 偏态stem-and-leaf-plot 茎叶分布图semi-interquarile range 四分位差standard deviation 标准差second moment about the mean 二级动差skew(s3)偏态sum of square(ss)平方和standard scores 标准分数standard deviation 标准差standard normal distribution 标准正态分布standardized residual 标准残差transformations to z-scores z分数转化scatter plot 散点图Spearman correlation 斯皮尔曼相关系数spurious correlation 虚假相关slop(bx,by)斜率standard error of estimate 估计标准误sample space 样本空间self-fulfilling prophecies 自我实现预言sequential sampling 序列取样simple random sampling 简单随机取样法statistical generalization 统计概括subjective probability 主观概率standard error the difference between means 平均数差异的标准误student’s t-distribution t分布student’s t-ratio t比率sampling distribution 抽样的分布sampling error 抽样误差significance level 显著性水平standard error of the mean 平均数的标准误statistical hypothesis 统计假设statistical significance 统计显著temporal directionality 原因和结果的持续时间third variable problem 第三变量问题truncated range 相关范围缩小效应T-score T分数truncating 削峰third moment about the mean 三级动差table 统计表t critical 临界t值t observed 观测t值two-factor or two-way ANOV A 两因素方差分析total variance 总方差two-way ANOV A 双因素方差分析treatment variance 处理方差treatment population 处理总体two-tailed probabilities 双尾概率type I(α)error I型或α型错误typeⅡ(β)error Ⅱ型错误unexplained or unaccounted for variation 无法解释的变量unbiased estimate 无偏估计unbiased estimate 无偏估计variance(s2) 方差validity 效度within-subjects variable 被试内变量within-groups variance 组内方差x²test x²检验z-score z分数Z critical 临界z值Z observed 观测z值。
统计学相关术语讲解学习
统计学相关术语1、概率(proability):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。
一随机事件的慨率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对事件发生的相信程度。
2、统计学(statistics):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
也就是收集、处理、分析、解释数据并从数据中得出结论的科学。
主要又分为描述统计学和推断统计学。
3、描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
目的是描述数据特征,找出数据的基本规律。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
4、推断统计(Inferential Statistics):推断统计是研究如何根据样本数据来推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
主要包括参数估计与假设检验两种方法。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
5、数值型数据(metric data):按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。
6、分类数据(categorical data) :只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。
7、总体(population):所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。
分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的;无限总体所包括的元素是无限的,不可数的。
measure of variation统计学名词
measure of variation统计学名词
以下是一些常见的"measure of variation"统计学名词:
1. 标准差(Standard deviation):标准差是最常用的衡量数据变异性的指标之一。
它反映了数据围绕平均值的分散程度。
较小的标准差表示数据更加聚集在平均值附近,而较大的标准差表示数据更加分散。
2. 方差(Variance):方差是标准差的平方,它也是衡量数据变异性的一种指标。
方差与标准差具有相同的单位,但方差在数学上更加便于计算和分析。
3. 极差(Range):极差是数据集中最大值与最小值之间的差值。
它简单地反映了数据的最大范围,但对于数据分布的形状和中间值的信息提供较少。
4. 四分位数间距(Interquartile range):四分位数间距是数据集的上四分位数与下四分位数之间的差值。
它提供了数据中间部分的变异性信息,并且对于异常值相对较为稳健。
5. 平均绝对偏差(Mean absolute deviation):平均绝对偏差是每个数据点与平均值之间的绝对差值的平均值。
它关注每个数据点与平均值的偏离程度。
这些"measure of variation"统计量可以帮助我们了解数据的分布情况、识别异常值、比较不同数据集的变异性以及评估数据的集中趋势。
在实际应用中,选择合适的"measure of variation"取决于数据的特点和分析的目的。
统计学常用词汇
统计词汇统计术语TAG:教育理论Aacceptanee region 接受区域adjusted 校正的allocation 配星、布局alternative hypothesis 备择假设*analysis of variance 方差分析*analysis of covariance 协方差分析ANOCOVA =Analysis of covariance*ANOVA =Analysis of variance arithmetic mean 算术平均值associatio n 关联性*assumed mean 假定平均值*asymmetric distribution 非对称分布autoregressive 自回归(的)averages 平均量Bbar chart 条线图Bartlett\'s test 巴特利特检脸* Bayes, -ian 贝叶斯的、贝叶斯beta function 贝塔函数betwee n(间)内bias 偏倚biased question 有偏质问binomial distribution 二项分布binomial theorem 二项定理bioassay 生物鉴定法bivariate normal distribution 二元正态分布blind test 盲检法Bonferronits in equality Bonferroni 不等式bootstrap 自助法Box-Cox transformation Box-Cox 变换ccanonical correlation 典型相关case control study 案例对照研究categorizatio n 分类categorize 分类category 类别causality 因果关系central limit theorem 中心极限定理Chebyshev\'s inequality 切比雪夫不等式x2-statistic x2 统计量X2-test x2 检验classificatio n 分类cluster analysis 聚类分析coding 编码coefficient of concordanee —致性系数coefficient of determination 可决系数cohort 同辈common factors 公共因子,公因数communality 公因子方差、公共因子方差comparis on 比较comp on ent 成分conditional probability 条件槪率*confidence coefficient 置信系数*confidence interval 置信区间*confidence limits 置信界限*confound, -ing 混杂.混杂法*confounding design 混杂设计*consumer\'s price index 消费物价指数consumer\'s risk 用方风险*contribution 基值confirmatory 确定的consistent, consistency 一致(的).一致性contingency table 列联表continuous distribution 连续分布control (group)控制、控制(群)convergence in probability 概率收敛convergence in law (distribution)依法则收敛(依分布收敛)correction 校正.修正correction factor 校正因子correction for continuity 连续校正correlati on 相关correlation coefficient 相关系数correlation ratio 相关比correlogram 相关图covariate 共变向量covariati on 共变criterion variable 基准变量critical region 判別区域*cross-section 横截而*cross-tabulation 交叉表*cumulative frequency 累积频率cumulative distribution function 累积分布函数*cumulative relative frequency 累积频率curvilinear 曲线(的)D*data 数据*data analysis 数据分析* degree of freedom 自由度density 密度density function 密度函数* dependent variable 应变数* descriptive statistics 描述性统计deviate 偏差deviation 偏、偏差(cf. standa rd — , mean dichotomous question 二分搜索法discriminant analysis 判別分析discriminant function 判別函数discrimi natio n 判別discrete distribution 离散分布distribution 分布D.K. (Don\'t Know)dose-response curve (relationship) 用虽:反应曲线(关系) double blind test 二重盲检法* downward trend 下降倾向drop out 脱落例Durbin-Watson statistic (ratio) Durbin-Watson 统计量(比) Eefficient, efficiency 有效的.有效性* Engel\'s coefficient 恩格尔系数en tropy 爛epidemiology 流行病学error 误差error margin 误差幅度error of the first kind (type I error) error of the second kind (type II error) error term 误差项estimable 可估的estimate 估计量*estimation 估计estimator 估计量event 事件exact probability test 直接概率法*expectation 期望*expected frequency 期待度数experimental design 试脸设计*explanatory variable 说明变虽:exploratory 探索的exponential distribution 指数分布face sheet factor 因子*factor analysis *factor loadings factorial effects 因子分析因子输入量(系数)析因效应factorial experiment 析因试验fiducial probability 置信概率filter, -ing 滤子finite population Fisher information* fitting 拟合第1类误差第2类误差有限总体费希尔信息fixed-effect model 固宦效应模型follow-up study 追跡研究 force of mortality 死力 fractional factorial design free-answe 「question * frequency 频率* frequency distribution F statistic (ratio, test) G Gauss, Gaussian * genetic algorithm 分步实施计划设计 自由回答法 频率分布F 统计量(F 比.F 检验) geometric distribution geometric mean goodness of fit 高斯(的) 遗传算法 几何分布 Greco-Latin square Hharmonic mean hazard function heteroscedastic, -ity * histogram 直方图 homoscedastic, -ity hypergeometric distribution hypothesis 假说 I * independence 独立 * independent variable in finite populatio n input 入力 in spectio n 检査 几何平均值 拟合优度 正交拉丁方调和平均 故障率函数 异方差(性)同方差(性) 超几何分布独立变量 无限总体interactio n 相互作用intercept 切片*interval estimation 区间推定*interval scale 间隔尺度interviewee 被调査者interviewer 调査员interviewing method 而试调査法item 项JJacknife 刀切法KKaplan-Meier estimate Kaplan-Meier'估计*Kendall\'s rank correlation coefficients 肯徳尔等级相关系数Kullback-Leibler information number 库尔贝克-莱布勒信息函数*kurtosis 峰度Llag 时间滞后large sample 大样本Latin square 拉丁方law of large numbers 大数定律(strong weak-: 強定律、弱定律)least significant difference, LSD. 最低显著性差异*least square 最小二乘法*level of significance 显著水平life table 生命表likelihood 似然linear discriminant function 线形判别函数local control 局部控制logistic function 逻辑斯蒂函数logit analysis (transformation )分对数分析(变换)log-linear model 对数线性模型log-log 对数log-normal distribution 对数正态分布longitudinal 经度的,纵的loss function 损失函数MMahalanobisV generalized distanee Mahalanobis 广义距离mail survey 邮送调査main effect 主效应marginal 边缘(的)Markov, -ian 马尔科夫(的)mathematical statistics 数理统计学*maximum 最大(pl. maxima)maximuim likelihood estimate (estimation)最大似然佔计(估计法)McNemar\'s test McNemar 测试*mean 平均(值)*mean deviation 平均偏差mean effect 平均效应*median 中位数meta-analy引s 元分析*minimum 最小(pl. minima)missing value 缺区值*mode 众数model, -ing 模型(建模)moment 矩moving average 移动平均multicolinear, -ity 多重共线(性)multidimensional scaling (MDS)多维换算multiple answer 重复回答multiple choice 多重选择multiple comparison 多重比较*multiple correlation coefficient 多重相关系数*multiple regression 多重回归multi-stage sampling 多阶段抽样*multivariate analysis 多变量分析Multivariate analy引s of variance 多元方差分析multivariate normal distribution 多变量正态分布* MANOVA = Multivariate analysis of variance*multiway table 多路表N*nxm table n xm 表*nominal scale 额定尺度non-central 无心non parametric 非参数的normal approximation 正态近似*normal distribution 正态分布normal equation 正规方程null hypothesis 原假设observational error 观测误差*observed frequency 观测频率observed value 观测值OC (operating characteristic) curve 作用特性曲线odds 奇odds ratio 奇数比one-sided 单侧1-way layout 1元布局法optimum allocation 最佳分配法ordered clas引fication 顺序化*ordinal scale 序数尺度orthogonal polynomial 正交多项式outlier 边际值output 输出.结果ppaired comparison 成对比较法panel survey 固定样本调查parameter 系数partial confounding 部分混杂(法)*partial correlation coefficient 偏相关系数Pearson\'s product moment correlation coefficient 皮尔逊矩相关系数percentile 百分数periodic 周期的periodogram 周期图phi coefficient 系数pie chart 饼状图plot 点图*point estimation 点估计*Poisson distribution 泊松分布pooled variance estimate 联合方差估计*population 总体population correlation coefficient 总体相关系数*population mean 总体平均值*population variance 总体方差posterior probability (distribution)后验概率(分布)power (function)幕(函数)pre-coding 预编码predicted value 预测值*prediction 预测predictive 预测(的)presentation 表示、表现(法)primary sampling unit 第1次抽样的单位prin cipal comp orient, ― an alysis 主成分(分析)prior probability (distribution)先验槪率(分布)*probability 概率*probability distribution 概率分布probability proportionate sampling 概率比例抽样probit analysis 概率单位分析process 过程producer\'s risk 生产者风险project io n pursuit 投影寻踪proporti on 比例proportional hazard model 比例风险模型prospective study 远景调査Qquartile 四分位(数)quartile deviation 四分位偏差*quality 质qualitative 定性的qualitative data 定性的数据*quantity 量quantitative 定量的、计量的quota system 定额系统R*radar chart 雷达图random 随机的「andomization概率化、随机化random walk 随机游动* range 范帀(区域)* rank 秩* rank correlation coefficients等级相关系数 ranking method 秩评定法* rank-size rule 秩规模规则rank test 秩检验* regression coefficient 回归系数regression diagnosis 回归诊断* regression equation (line )回归方程(直线) * rejection region拒绝区域 * relative frequency相对频率relative risk 相对风险 reliability (coefficient ) 信赖性(系数)* re 引dual 残差response curve (surface )相应曲线(曲而) retrospective study追溯调查risk 风险risk factor 风险因素robust, -ness 稳健的(性)run 取遍* randomness 随机性random number随机数 random sampling 随机抽样rating method比率法 * ratio scale 比率尺度* regression 回归*sample 样本*sample mean 样本均值*sample size 样本量(大小)*sample variance 样本方差*sampling 抽样sampling error 抽样误差sampling interval 抽样间隔sampling unit 抽样单位*scales 尺度*scattergram, scatter plot (diagram)点状图Scheffe\'s test Scheffe 检验score 得分seasonality 季节性secondary sampling unit 第2 次单位抽样serial correlation 序列相关self-adminstrati on 自管理semi-log 半对数sigmoid 拟S 型、S 状signal to noise ratio SN (信噪)比signed rank test 带符号的秩检验* significanee, significant 显著(的)* significanee probability 显著概率simple random sampling 简单随机抽样引mple regression 简单回归single replication 1 次重复size proportionate allocation 比例布局,去skewed 斜的skewness 失貞.slope 斜率spectral window 谱窗spectrogram 谱图spectrum 谱*Spearman\'s rank correlation coefficients 斯皮尔曼等级相关系数*spurious correlation 伪相关square 平方*standard deviation, S.D. 标准方差*standard error 标准误差*standard score 标准得分start number 起始编号*stationary 平稳的*statistic (for inference) 统计量(统计推论的)statistical 统计的statistically significant 统计显著的stem-and-leaf presentation 茎叶表现stereotype 陈腔滥调stochastic process 随机过程*stratification 分层stratified sampling 分层抽样*stratum ([pl.] strata) 层Student(\'s) 学生(的)studentized range 学生化范围study 研究sub-sampli ng 二次抽样sufficiency 充分性sufficient statistic 充分统计量supervisor 管理者survival analy引s 生存时间分析survey 调查systematic sampling 系统抽样taxonomy 分类(学)tail 尾*test 检验*test of goodness of fit 拟合良好性检定*test of independence 无关性检验3-way layout 3元布局法threshold 阈值tie 结tie correction 结修正*time series 时间序列total variation 全变差treatment 处理*trend 趋势trend analysis 趋势分析trial 尝试*t-statistic z -test, -ratio t 统计量(t 检验、t 比)two-sided 双边的*2-sample t-test 2 样本t 检脸2-stage sampling 2 阶段抽样法two-by-two contingency table 2x2 歹ij联表2-way layout 2元布局法*2-way table 2 重表two-stage sampling 2 阶段抽样法Uunbiased estimator 无偏估计量unbiased variance 无偏方差uncorrelated 不相关(的)uniform distribution 均匀分布uniform random numbers 均匀随机数un ique ness 唯一性updating 更新*upward trend 向上趋向Vvalidity 有效性variate 变量*variance 方差varianee ratio 方差比varimax rotation varimax 旋度varimax solution varimax 解variati on 变差variability 变异性Wweighted sampling 加权抽样Welch\'s test Welch 检验within (级)间with probability 1 (w.p.l) 以概率1 wording 措辞XYYates\' correction Yates 修正z*Zipf\'s law Zipf 法則。
统计学名词解释汇总
统计学名词解释汇总概述本文档收集了一些常见的统计学名词解释,旨在帮助读者更好地理解统计学领域中的相关概念和术语。
名词解释1. 总体(Population): 指研究对象的全体,包括对研究感兴趣的所有个体或单位。
总体(Population): 指研究对象的全体,包括对研究感兴趣的所有个体或单位。
2. 样本(Sample): 从总体中选取的一部分个体或单位,用来代表整个总体进行研究。
样本(Sample): 从总体中选取的一部分个体或单位,用来代表整个总体进行研究。
3. 抽样(Sampling): 从总体中选取样本的过程,可以通过随机抽样、分层抽样等方法进行。
抽样(Sampling): 从总体中选取样本的过程,可以通过随机抽样、分层抽样等方法进行。
4. 参数(Parameter): 描述总体特征的数值,例如总体均值、总体方差等。
参数(Parameter): 描述总体特征的数值,例如总体均值、总体方差等。
5. 统计量(Statistic): 根据样本数据计算得出的数值,用来代表总体参数的估计。
统计量(Statistic): 根据样本数据计算得出的数值,用来代表总体参数的估计。
6. 标准差(Standard Deviation): 描述数据集合离散程度或波动性的度量,是方差的平方根。
标准差(Standard Deviation): 描述数据集合离散程度或波动性的度量,是方差的平方根。
7. 假设检验(Hypothesis Testing): 根据样本数据来统计推断总体参数的过程,包括设定原假设和备择假设、计算统计量、确定显著性水平等步骤。
假设检验(Hypothesis Testing): 根据样本数据来统计推断总体参数的过程,包括设定原假设和备择假设、计算统计量、确定显著性水平等步骤。
8. 置信区间(Confidence Interval): 用于对总体参数的估计范围进行区间估计,根据样本数据计算得出。
置信区间(Confidence Interval): 用于对总体参数的估计范围进行区间估计,根据样本数据计算得出。
统计学常用术语
食品研发试验设计统计学基础知识总体、个体和样本总体:在数理统计中,根据研究目的确定的研究对象的全体集合称为总体,总体具有大量性、同质性、差异性。
其中每一研究单元称为个体。
样本:依据统计原理由总体中抽取的部分个体组成的集合称为样本。
样本是测定、分析、研究的直接对象,要求具有一定的数量和代表性。
样本容量与样本个数:例如采用不重复抽样方法,从1、2、3这3个数字组成的总体中抽取2个组成样本。
则样本容量是2,样本个数是6。
参数和统计量用来描述总体特征的量称为参数,常用希腊字母表示,如用μ表示总体平均数。
用来描述样本特征的量称为统计量,常用拉丁字母表示。
总体参数通常无法获得,常由相应的统计量来估计,如用S2估计σ2。
准确性与精确性准确性也称准确度,是指试验中某一指标或性状的观测值与其真值接近的程度。
精确性也称精确度,是指同一指标在重复试验中,其观测值之间彼此接近的程度。
随机误差和系统误差随机误差也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成的。
随机误差影响试验结果的精确性。
统计上提到的试验误差通常指随机误差,其越小,试验的精确性越高。
系统误差也称片面误差,这是由于试验对象相差较大,或实验周期较长,试验条件控制不一致以,或测量仪器不准,或标准试剂未经校正,以及观测、记载、抄录、计算中的错误所引起的。
其影响试验结果的准确性。
统计特征数算数平均数:算术平均数=总体标志值(数据)总和/总体单位的总数。
加权算术平均数:计算公式为:分组数据中,x表示各组水平值,f代表各组变量值出现的频数。
算术平均数的性质:1 离差之和等于零;2 离差平方和最小。
调和平均数:计算如平均速率时需要用调和平均数,用H表示。
调和平均数就是变量倒数的算术平均数的倒数。
几何平均数:在统计分析中,当资料中的观测值呈几何级数变化趋势,需要计算平均增长率时,常以几何平均数表示其平均值,以G标记。
计算公式:简单几何平均数加权几何平均数中位数:中位数是指资料中的观测值由大到小(或由小到大)依次排列后,居于中间位置的那个观测值。
统计学的术语和简介
统计学的术语和简介 统计学是通过搜索、整理、分析、描述数据等⼿段,以达到推断所测对象的本质,甚⾄预测对象未来的⼀门综合性科学。
以下是由店铺整理关于什么是统计学的内容,希望⼤家喜欢! 统计学的起源 统计学的英⽂statistics最早源于现代拉丁⽂statisticum collegium(国会)、意⼤利⽂statista(国民或政治家)以及德⽂Statistik,最早是由Gottfried Achenwall于1749年使⽤,代表对国家的资料进⾏分析的学问,也就是“研究国家的科学”。
⼗九世纪,统计学在⼴泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。
统计学是⼀门很古⽼的科学,⼀般认为其学理研究始于古希腊的亚⾥斯多德时代,迄今已有两千三百多年的历史。
它起源于研究社会经济问题,在两千多年的发展过程中,统计学⾄少经历了“城邦政情”、“政治算数”和“统计分析科学”三个发展阶段。
所谓“数理统计”并⾮独⽴于统计学的新学科,确切地说,它是统计学在第三个发展阶段所形成的所有收集和分析数据的新⽅法的⼀个综合性名词。
概率论是数理统计⽅法的理论基础,但是它不属于统计学的范畴,⽽是属于数学的范畴。
统计学的主要术语 统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。
描述统计(descriptive statistics):研究数据收集、处理和描述的统计学⽅法。
推断统计(inferential statistics):研究如何利⽤样本数据来推断总体特征的统计学⽅法。
变量(variable):每次观察会得到不同结果的某种特征。
分类变量(categorical variable):观测结果表现为某种类别的变量。
顺序变量(rank variable):⼜称有序分类变量,观测结果表现为某种有序类别的变量。
数值型变量(metric variable):⼜称定量变量,观测结果表现为数字的变量。
统计学词汇及符号 第1部分
统计学词汇及符号第1部分(原创版)目录1.统计学概述2.统计学基本概念3.描述性统计4.推断性统计5.统计学符号与术语正文一、统计学概述统计学是一门研究收集、整理、分析、解释、展示数据的方法和技巧的科学。
统计学的应用广泛,涉及自然科学、社会科学和商业等多个领域。
统计学的主要目的是从数据中获取有关现象和事物的信息,以便对未来事件进行预测和决策。
二、统计学基本概念1.数据:数据是统计学的基础,是对观察到的事物或现象的记录。
数据可以是数字、文字或图像等形式。
2.样本:样本是从总体中抽取的一部分数据。
通过对样本的研究,可以推断总体的性质和规律。
3.总体:总体是指研究对象的全体。
总体可以分为参数和统计量。
4.参数:参数是描述总体性质的数值,如总体均值、方差等。
5.统计量:统计量是根据样本数据计算的用于描述总体的数值,如样本均值、样本方差等。
三、描述性统计描述性统计是通过计算各种统计量,对数据进行概括和描述的方法。
常用的描述性统计方法有:1.均值:均值是数据的平均数,用于衡量数据的中心位置。
2.中位数:中位数是将数据从小到大排序后,位于中间位置的数值。
3.众数:众数是数据中出现次数最多的数值。
4.方差:方差是数据与其均值之差的平方的平均数,用于衡量数据的离散程度。
5.标准差:标准差是方差的平方根,用于衡量数据的离散程度。
四、推断性统计推断性统计是通过样本数据,对总体参数进行估计和推断的方法。
常用的推断性统计方法有:1.假设检验:假设检验是通过比较样本统计量与总体参数的差异,对原假设进行检验的方法。
2.置信区间:置信区间是对总体参数的区间估计,表示我们对总体参数的精确度有一定的把握。
3.回归分析:回归分析是研究两个或多个变量之间关系的方法,包括线性回归、多元回归等。
五、统计学符号与术语1.符号:统计学中使用特定的符号表示各种统计量和概念,如σ表示标准差,μ表示均值等。
2.术语:统计学中使用专业的术语描述各种概念和方法,如误差、偏差、峰度等。
总体 统计学术语
总体统计学术语统计总体(population)简称总体:指统计所要研究的事物或现象的全体,由客观存在的,具有某种共同特征的许多个别事物构成的整体。
统计学强调数据所依附的载体。
总体单位(item unit):指构成统计总体的个别事物。
样本(sample):指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。
构成样本的个体数目称为样本容量。
通常用小写字母n表示,相对于N而言,n一般只是一个很小的数。
2 统计标志、统计指标与指标体系统计标志(characteristic)简称标志:指每个个体所共同具有的属性或特征,它用于说明个体的属性或特征的具体名称。
根据符号的性质,可以分为质量符号和数量符号。
质量标志表示个体属性的特征,其标志只能用文字说明,不能用数字说明;符号表示个体的数量特征,其符号表现可以用数字表示。
根据符号的变化,可分为常号和变号。
不变符号是指一个符号的具体表现对所有个体都是一样的。
可变标志是指某一标志的具体表现在个体之间是不同的。
统计学:指反映统计总体数量特征的概念和数量。
统计指标可分为数量指标和质量指标。
反应现象的总规模和水平的所有统计指标称为定量指标。
反映相对反应水平和工作质量的统计指标称为质量指标。
统计指标与统计标志的关系:统计指标反映整体单位的属性和特征,统计指标反映整体的数量关系。
统计和统计标志是整体和个体的关系。
指标体系:指由一系列相互关联的统计指标组成的有机整体。
以反映所研究现象的各个方面的相互依赖和相互制约。
3 总体参数和样本统计量总体参数(parameter):指研究总体的某个特征值。
通常关心的参数有总体平均数、标准差、总体比例等。
样本统计量(statistic):指根据样本统计数据计算出来的一个量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学相关术语1、概率(proability):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。
一随机事件的慨率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对事件发生的相信程度。
2、统计学(statistics):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
也就是收集、处理、分析、解释数据并从数据中得出结论的科学。
主要又分为描述统计学和推断统计学。
3、描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
目的是描述数据特征,找出数据的基本规律。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
4、推断统计(Inferential Statistics):推断统计是研究如何根据样本数据来推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
主要包括参数估计与假设检验两种方法。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
5、数值型数据(metric data):按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。
6、分类数据(categorical data) :只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。
7、总体(population):所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。
分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的;无限总体所包括的元素是无限的,不可数的。
8、样本 (sample):从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量 (sample size)。
9、变量(variable):说明现象某种特征的概念,如商品销售额、性别等,变量的具体表现称为变量值,即数据。
变量基本分类可分为分类变量:说明事物类别的名称;数值型变量:说明事物数字特征的名称。
其他分类可分为随机变量与非随机变量;经验变量和理论变量。
10、平均数(mean):是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置,易受极端值的影响,是反映数据集中趋势的一项指标。
它包括算术平均数、加权算术平均数、调和平均数和几何平均数。
11、众数(mode):是指一组数据中出现次数最多的变量值(数据值),不受极端值的影响,一组数据可能没有众数或有几个众数。
众数适合于数据量较多时,并且在数据分布偏斜程度较大且有明显峰值时应用。
12、中位数(median):是另外一种反映数据的中心位置的指标,其确定方法是将所有数据以由小到大的顺序排列,位于中央的数据值就是中位数,不受极端值的影响。
中位数在数据分布偏斜程度较大时应用。
13、四分位数(quartile):一组数据中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的数据就是四分位数,不受极端值的影响。
四分位数在统计学中的箱线图绘制方面应用较为广泛。
14、算术平均数(Arithmetic mean)简称平均数、均数或均值,是指在一组数据中所有数据之和再除以数据的个数。
它是反映数据集中趋势的一项指标。
算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。
15、加权平均数(Weighted mean)是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算。
加权算术平均数主要用于处理经分组整理的数据。
加权算术平均数同时受到两个因素的影响,一个是各组数值的大小,另一个是各组分布频数的多少。
16、调和平均数(Harmonic mean)调和平均数是总体各单位标志值倒数的算术平均数的倒数,也称倒数平均数。
调和平均数易受极端值的影响,且受极小值的影响比受极大值的影响更大。
只要有一个变量值为零,就不能计算调和平均数。
调和平均数应用的范围较小。
17、几何平均数(Geometric mean)n个变量值乘积的n次方根就是几何平均数。
适用于对比率数据的平均,主要用于计算平均增长率。
21、极差(range)一组数据的最大值与最小值之差,极差也称为全距。
它是数据离散程度的最简单测度值,极差越大,离散程度越大,反之,离散程度越小。
极差易受极端值影响,未考虑数据的分布。
22、平均差(mean deviation)各标志值与其平均数离差绝对值的平均数。
平均差是一种平均离差。
离差是总体各单位的标志值与算术平均数之差。
因离差和为零,离差的平均数不能将离差和除以离差的个数求得,而必须讲离差取绝对数来消除正负号。
23、方差(variance)是各个数据与平均数之差的平方和的平均数,表示一系列数据或统计总体的分布特征的值。
通俗点讲,就是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。
在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。
24、标准差(Standard Deviation)也称均方差,是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根。
标准差是方差的算术平方根。
标准差能反映一个数据集的离散程度。
平均数相同的,标准差未必相同。
25、变异系数(coefficient of variation)又称“标准差率”,表示离散程度,是标准差和相应平均数的比值,记为。
当进行两组或多组数据离散程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。
如果单位和(或)平均数不同时,比较其离散程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。
简单来说就是:在表示离散程度上,标准差并不是全能的,当度量单位或平均数不同时,只能用变异系数了,它也是表示离散程度,是标准差和相应平均数的比值。
26、偏度(skewness)是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
偏度=0为对称分布,偏度> 0为右偏分布,偏度< 0为左偏分布。
27、峰度(kurtosis)是用来反映频数分布曲线顶端尖峭或扁平程度的指标。
有时两组数据的算术平均数、标准差和偏度都相同,但他们分布曲线顶端的高耸程度却不同。
峰度=0扁平峰度适中,峰度<0为扁平分布,峰度>0为尖峰分布。
28、分组根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。
有等距分组和不等距分组两种方式,进行分组要遵循两个原则:穷尽原则、互斥原则。
29、频数(frequency)频数是指一组数据中个别数据重复出现的次数。
例如某校A班学生共50名同学,按性别进行分组,分为男与女两个组别,男同学的频数为30,女同学的频数为20。
30、频率频率是每个小组的频数与数据总数的比值,它代表某组在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。
31、绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也是数据分析中常用的指标,如GDP、总人口等。
此外,绝对数也可以表现为在一定时间、地点条件下数量增减变化的绝对数,比如A国人口比B国人口多1000万人。
32、相对数是指由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。
计算公式=比较数值(比值)/基础数值(基数)。
分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。
相对数一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。
使用相对数时需要注意指标的可比性,同时要与总量指标(绝对数)结合使用。
33、百分比(percent)百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
百分比通常采用百分号(%)来表示,如8%,50%,168%等。
由于百分比的分母都是100,也就是都以1%作为度量单位,因此便于比较,在数据分析中的应用非常广泛。
34、百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。
常有人混淆了百分比与百分点的概念。
表示构成的变动幅度不宜用百分数,而应用百分点。
35、比例是指在总体中,各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比如A班共有学生50人,男生30人,女生20人,则男生的比例是30/50,女生的比例是20/50。
由此可以看出,比例的基数(也就是分母)都是全体学生人数,即为同一个基数。
36、比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
比如A班共有学生50人,男生30人,女生20人,则男生与女生的比率是30/20,这一指标经常会用在社会经济领域,比如我国的人口性别比就是用每100名女性数量相对的男性数量来表示的。
37、倍数是一个数除以另一个数所得的商。
如A÷B=C,就是说A是B的C倍。
需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。
38、番数是指原来数量的2的N次方倍。
比如翻一番为原来数量的2倍(2的1次方),翻两番为4倍(2的2次方)。
39、同比为与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。
例如2010年12月与2009年12月相比。
40、环比为与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。
例如2010年12月与2010年11月相比。