统计学相关术语
《统计学》_各章关键术语(中英文对照)
《统计学》_各章关键术语(中英⽂对照)第⼆部分各章关键术语(中英⽂对照)第1章统计学(statistics)随机性(randomness)描述统计学(descriptive statistics)推断统计学(inferential statistics)总体(population)母体(parent)(parent population)样本、⼦样(sample)调查对象总体(respondents population)有限总体(finite population)调查的理论总体(survey’s heoretical population)超总体(super population)变量(variable)数据(data)原始数据(original data)派⽣数据(derived data)定类尺度(nominal scale)定类尺度变量(nominal scale level variable)定类尺度数据(nominal scale level data)定序尺度(ordinal scale)定序尺度变量(ordinal scale level variable)定序尺度数据(ordinal scale level data)定距尺度(interval scale)定距尺度变量(interval scale level variable)定距尺度数据(interval scale level data)定⽐尺度(ratio scale)定⽐尺度变量(ratio scale level variable)定⽐尺度数据(ratio scale level data)分类变量(categorical variable)定性变量、属性变量(qualitative variable)数值变量(numerical variable)定量变量、数量变量(quantitative variable)绝对数变量(absolute number level variable)绝对数数据(absolute number level data)⽐率变量(ratio level variable)⽐率数据(ratio level data)实验数据(experimental data)调查数据(survey data)观察数据(observed data)第2章随机性(randomness)随机现象(random phenomenon)随机试验(random experiment)事件(event)基本事件(elementary event)复合事件(union of event)必然事件(certain event)不可能事件(impossible event)基本事件空间(elementary event space)互不相容事件(mutually exclusive events)统计独⽴(statistical independent)统计相依(statistical dependence)概率(probability)古典⽅法概率(classical method probability)相对频数⽅法概率(relative frequency method probability)主观⽅法概率(subjective method probability)⼏何概率(geometric probability)条件概率(conditional probability)全概率公式(formula of total probability)贝叶斯公式(Bayes’ formula)先验概率(prior probability)后验概率(posterior probability)随机变量(random variable)离散型随机变量(discrete type random variable)连续型随机变量(continuous type random variable)概率分布(probability distribution)特征数(characteristic number)位置特征数(location characteristic number)数学期望(mathematical expectation)散布特征数(scatter characteristic number)⽅差(variance)标准差(standard deviation)变异系数(variable coefficient)贝努⾥分布(Bernoulli distribution)⼆点分布(two-point distribution) 0-1分布(zero-one distribution)贝努⾥试验(Bernoulli trials)⼆项分布(binomial distribution)超⼏何分布(hyper-geometric distribution)正态分布(normal distribution)正态概率密度函数(normal probability density function)正态概率密度曲线(normal probability density curve)正态随机变量(normal random variable)卡⽅分布(chi-square distribution)F_分布(F-distribution)t_分布(t-distribution) “学⽣”⽒t_分布(Student’s t-distribution)列联表(contingency table)联合概率分布(joint probability distribution)边缘概率分布(marginal probability distribution)条件分布(conditional distribution)协⽅差(covariance)相关系数(correlation coefficient)第3章统计调查(statistical survey)数据收集(collection of data)统计单位(statistical unit)统计个体(statistical individual)社会经济总体(socioeconomic population)调查对象总体(respondents population)有限总体(finite population)标志(character)标志值(character value)属性标志(attributive character )品质标志(qualitative character )数量标志(numerical indication)不变标志(invariant indication)变异(variation)调查条⽬(item of survey)指标(indicator)统计指标(statistical indicator)总量指标(total amount indicator)绝对数(absolute number)统计单位总量(total amount of statistical unit )标志值总量(total amount of indication value)(total amount of character value)时期性总量指标(time period total amount indicator)流量指标(flow indicator)时点性总量指标(time point total amount indicator)存量指标(stock indicator)平均指标(average indicator)平均数(average number)相对指标(relative indicator)相对数(relative number)动态相对指标(dynamic relative indicator)发展速度(speed of development)增长速度(speed of growth)增长量(growth amount)百分点(percentage point)计划完成相对指标(relative indicator of fulfilling plan)⽐较相对指标(comparison relative indicator)结构相对指标(structural relative indicator)强度相对指标(intensity relative indicator)基期(base period)报告期(given period)分组(classification)(grouping)统计分组(statistical classification)(statistical grouping)组(class)(group)分组设计(class divisible design)(group divisible design)互斥性(mutually exclusive)包容性(hold)分组标志(classification character)(grouping character)按品质标志分组(classification by qualitative character)(grouping by qualitative character)按数量标志分组(classification by numerical indication)(grouping by numerical indication)离散型分组标志(discrete classification character)(discrete grouping character)连续型分组标志(continuous classification character)(continuous grouping character)单项式分组设计(single-valued class divisible design)(single-valued group divisible design)组距式分组设计(class interval divisible design)(group interval divisible design)组界(class boundary)(group boundary)频数(frequency)(frequency number)频率(frequency)组距(class interval)(group interval)组限(class limit)(group limit)下限(lower limit)上限(upper limit)组中值(class mid-value)(group mid-value)开⼝组(open class)(open-end class)(open-end group)开⼝式分组(open-end grouping)等距式分组设计(equal class interval divisible design)(equal group interval divisible design)不等距分组设计(unequal class interval divisible design)(unequal group interval divisible design)调查⽅案(survey plan)抽样调查(sample survey)有限总体概率抽样(probability sampling in finite populations)抽样单位(sampling unit)个体抽样(elements sampling)等距抽样(systematic sampling)整群抽样(cluster sampling)放回抽样(sampling with replacement)不放回抽样(sampling without replacement)分层抽样(stratified sampling)概率样本(probability sample)样本统计量(sample statistic)估计量(estimator)估计值(estimate)⽆偏估计量(unbiased estimator)有偏估计量(biased estimator)偏差(bias)精度(degree of precision)估计量的⽅差(variance of estimates)标准误(standard error)准确度(degree of accuracy)均⽅误差(mean square error)估计(estimation)点估计(point estimation)区间估计(interval estimate)置信区间(confidence interval)置信下限(confidence lower limit)置信上限(confidence upper limit)置信概率(confidence probability)总体均值(population mean)总体总值(population total)总体⽐例(population proportion)总体⽐率(population ratio)简单随机抽样(simple random sampling)简单随机样本(simple random sample)研究域(domains of study)⼦总体(subpopulations)抽样框(frame)估计量的估计⽅差(estimated variance of estimates)第4章频数(frequency)(frequency number)频率(frequency)分布列(distribution series)经验分布(empirical distribution)理论分布(theoretical distribution)品质型数据分布列(qualitative data distribution series)数量型数据分布列(quantitative data distribution series)单项式数列(single-valued distribution series)组距式数列(class interval distribution series)频率密度(frequency density)分布棒图(bar graph of distribution)分布直⽅图(histogram of distribution)分布折线图(polygon of distribution)累积分布数列(cumulative distribution series)累积分布图(polygon of cumulative distribution)位置特征(location characteristic)位置特征数(location characteristic number)平均值、均值(mean)平均数(average number)权数(weight number)加权算术平均数(weighted arithmetic average)加权算术平均值(weighted arithmetic mean)简单算术平均数(simple arithmetic average)简单算术平均值(simple arithmetic mean)加权调和平均数(weighted harmonic average)加权调和平均值(weighted harmonic mean)简单调和平均数(simple harmonic average)简单调和平均值(simple harmonic mean)加权⼏何平均数(weighted geometric average)加权⼏何平均值(weighted geometric mean)简单⼏何平均数(simple geometric average)简单⼏何平均值(simple geometric mean)绝对数数据(absolute number data)⽐率类型数据(ratio level data)中位数(median)众数(mode)耐抗性(resistance)散布特征(scatter characteristic)散布特征数(scatter characteristic number)极差、全距(range)四分位差(quartile deviation)四分间距(inter-quartile range)上四分位数(upper quartile)下四分位数(lower quartile)在外截断点(outside cutoffs)平均差(mean deviation)⽅差(variance)标准差(standard deviation)变异系数(variable coefficient)第5章随机样本(random sample)简单随机样本(simple random sample)参数估计(parameter estimation)矩(moment)矩估计(moment estimation)修正样本⽅差(modified sample variance)极⼤似然估计(maximum likelihood estimate)参数空间(space of paramete)似然函数(likelihood function)似然⽅程(likelihood equation)点估计(point estimation)区间估计(interval estimation)假设检验(test of hypothesis)原假设(null hypothesis)备择假设(alternative hypothesis)检验统计量(statistic for test)观察到的显著⽔平(observed significance level)显著性检验(test of significance)显著⽔平标准(critical of significance level)临界值(critical value)拒绝域(rejection region)接受域(acceptance region)临界值检验规则(test regulation by critical value)双尾检验(two-tailed tests)显著⽔平(significance level)单尾检验(one-tailed tests)第⼀类错误(first-kind error)第⼀类错误概率(probability of first-kind error)第⼆类错误(second-kind error)第⼆类错误概率(probability of second-kind error)P_值(P_value)P_值检验规则(test regulation by P_value)经典统计学(classical statistics)贝叶斯统计学(Bayesian statistics)第6章⽅差分析(analysis of variance,ANOVA)⽅差分析恒等式(analysis of variance identity equation)单因⼦⽅差分析(one-factor analysis of variance)双因⼦⽅差分析(two-factor analysis of variance)总变差平⽅和(total variation sum of squares)总平⽅和SST(total sum of squares)组间变差平⽅和(among class(group) variation sum of squares),回归平⽅和SSR(regression sum of squares)组内变差平⽅和(within variation sum of squares)误差平⽅和SSE(error sum ofsquares)⽪尔逊χ2统计量(Pearson’s chi-statistic)分布拟合(fitting of distrbution)分布拟合检验(test of fitting of distrbution)⽪尔逊χ2检验(Pearson’s chi-square test)列联表(contingency table)独⽴性检验(test of independence)数量变量(quantitative variable)属性变量(qualitative variable)对数线性模型(loglinear model)回归分析(regression analysis)随机项(random term)随机扰动项(random disturbance term)回归系数(regression coefficient)总体⼀元线性回归模型(population linear regression model with a single regressor)总体多元线性回归模型(population multiple regression model with a single regressor)完全多重共线性(perfect multicollinearity)遗漏变量(omitted variable)遗漏变量偏差(omitted variable bias)⾯板数据(panel data)⾯板数据回归(panel data regressions)⼯具变量(instrumental variable)⼯具变量回归(instrumental variable regressions)两阶段最⼩平⽅估计量(two stage least squares estimator)随机化实验(randomized experiment)准实验(quasi-experiment)⾃然实验(natural experiment)普通最⼩平⽅准则(ordinary least squares criterion)最⼩平⽅准则(least squares criterion)普通最⼩平⽅(ordinary least squares,OLS)最⼩平⽅(least squares)最⼩平⽅法(least squares method)第7章简单总体(simple population)复合总体(combined population)个体指数:价⽐(price relative),量⽐(quantity relative)总指数(general index)(combined index)统计指数(statistical indices)类指数、组指数(class index)动态指数(dynamic index)⽐较指数(comparison index)计划完成指数(index of fulfilling plan)数量指标指数(quantitative indicator index)物量指数(quantitative index)(quantity index)(quantum index)质量指标指数(qualitative indicator index)价格指数、物价指数(price index)综合指数(aggregative index)(composite index)拉斯贝尔指数(Laspeyres’ index)派许指数(Paasche’s index)阿斯·杨指数(Arthur Young’s index)马歇尔—埃奇沃斯指数(Marshall-Edgeworth’s index)理想指数(ideal index)加权综合指数(weighted aggregate index)平均指数(average index)加权算术平均指数(weighted arithmetic average index)加权调和平均指数(weighted harmonic average index)因⼦互换(factor-reversal)购买⼒平价(purchasing power parity,PPP)环⽐指数(chain index)定基指数(fixed base index)连环替代因素分析法(factor analysis by chain substitution method)不变结构指数、固定构成指数(index of invariable construction)结构指数、结构影响指数(structural index)第8章截⾯数据(cross-section data)时序数据(time series data)动态数据(dynamic data)时间数列(time series)发展⽔平(level of development)基期⽔平(level of base period)报告期⽔平(level of given period)平均发展⽔平(average level of development)序时平均数(chronological average)增长量(growth quantity)平均增长量(average growth amount)发展速度(speed of development)增长速度(speed of growth)增长率(growth rate)环⽐发展速度(chained speed of development)定基发展速度(fixed base speed of development)环⽐增长速度(chained growth speed)定基增长速度(fixed base growth speed)平均发展速度(average speed of development)平均增长速度(average speed of growth)平均增长率(average growth rate)算术图(arithmetic chart)半对数图(semilog graph)时间数列散点图(scatter diagram of time series)时间数列折线图(broken line graph of time series)⽔平型时间数列(horizontal patterns in time series data)趋势型时间数列(trend patterns in time series data)季节型时间数列(season patterns in time series data)趋势—季节型时间数列(trend-season patterns in time series data)⼀次指数平滑平均数(simple exponential smoothing mean)⼀次指数平滑法(simple exponential smoothing method)最⼩平⽅法(leas square method)最⼩平⽅准则(least squares criterion)原资料平均法(average of original data method)季节模型(seasonal model)(seasonal pattern)长期趋势(secular trends)季节变动(变差)(seasonal variation)季节波动(seasonal fluctuations)不规则变动(变差)(erratic variation)不规则波动(random fluctuations)时间数列加法模型(additive model of time series)时间数列乘法模型(multiplicative model of time series)。
常用统计术语
常用统计术语一、总体与样本在统计学中,总体是指研究对象的全体,样本是指从总体中选取的一部分个体。
总体的特征称为参数,样本的特征称为统计量。
总体参数常用符号表示,如总体均值用μ表示,总体方差用σ²表示。
二、抽样与抽样误差抽样是指从总体中选取样本的过程,目的是通过样本推断总体的特征。
抽样误差是指由于样本的随机性导致的样本统计量与总体参数之间的差异。
三、描述统计与推断统计描述统计是对收集到的数据进行整理、总结和描绘的过程,常用的描述统计指标有平均数、中位数、标准差等。
推断统计是根据样本数据对总体进行推断的过程,通过样本推断总体的特征。
四、频数与频率频数是某个数值在数据中出现的次数,频率是某个数值在数据中出现的相对比例。
频率可以通过频数除以总样本量得到,通常以百分数或小数形式表示。
五、参数估计与假设检验参数估计是通过样本数据对总体参数进行估计的过程,常用的参数估计方法有点估计和区间估计。
假设检验是根据样本数据对总体参数进行推断的过程,常用的假设检验方法有单样本检验、双样本检验等。
六、相关与回归相关分析是研究两个或多个变量之间关系的统计方法,常用的相关系数有皮尔逊相关系数、斯皮尔曼相关系数等。
回归分析是研究自变量与因变量之间关系的统计方法,常用的回归模型有线性回归、多项式回归等。
七、方差分析与卡方检验方差分析是用于比较两个或多个样本均值之间差异的统计方法,常用的方差分析方法有单因素方差分析、多因素方差分析等。
卡方检验是用于比较观察频数与期望频数之间差异的统计方法,常用的卡方检验有卡方拟合优度检验、卡方独立性检验等。
八、正态分布与偏态分布正态分布是一种对称的连续概率分布,符合正态分布的数据呈钟形分布,均值、中位数和众数相等。
偏态分布是一种不对称的概率分布,偏态分布的数据在均值两侧的分布不对称。
九、标准化与归一化标准化是将数据按照一定的比例进行缩放,使得数据具有相同的尺度,常用的标准化方法有Z-score标准化、Min-Max标准化等。
统计学术语及符号
统计学术语及符号统计学术语population 母体sample样本cen sus普查sampling 抽样quantitative 量的qualitative/categoric al 质的discrete离散的continuous 连续的populati on parameters 母体参数sample statistics 样本统计量descriptive statistics叙述统计学inferen tial/in ductive statistics 推论...抽样调查(samplii ng survey 单纯随机抽样( simple ran dom sampli ng系统抽样(systematic sampli ng分层抽样(stratified sampli ng 整群抽样(clustersampli ng多级抽样(multistage sampli ng常态分配(Parametric Statistics) 无母数统计学(Non parametric Statistics)实验设计(Design of Experime nt)参数(Parameter)Statistics 统计学Population 母体Sample样本Data analysis 资料分析Statistical table 统计表Statistical chart 统计图Pie chart圆饼图Stem-a nd-leaf display 茎叶图Box plot盒须图Histogram 直方图Bar Chart 长条图Polygon 次数多边图Ogive肩形图Descriptivestatistics叙述统计学Expectation 期望值Mode众数Mean平均数Varianee变异数Sta ndard deviation 标准差Sta ndard error 标准误Covaria nee matrix共变异数矩阵Inferen tial statistics推论统计学Point estimation 点估计Interval estimation 区间估计Con fide nee interval信赖区间Con fide nee coefficient信赖系数Test ingstatistic alhypothesis 统计假设检定Regressi on analysis回归分析An alysis of varianee 变异数分析Correlati on eoeffieient相关系数Sampling survey 抽样调查Cen sus普查Sampling 抽样Reliability 信度Validity 效度Sampli ng error 抽样误差Non-sampli ng error非抽样误差Ran dom sampli ng 随机抽样Simple ran domsampling简单随机抽样法Stratifi ed sampling分层抽样法Cluster sampling 群集抽样法Systematic sampling系统抽样法Two-stage random sampling 两段随机抽样法Convenience sampling 便利抽样Quota sampling 配额抽样Sno wball sampling 雪球抽样Non parametric statistics 无母数统计The sign test 等级检定Wilcox on sig nedrank tests魏克森讯号连续均匀密度等级检定Normal den sities Wilcox on rank 常态密度sum tests魏克森等级和检定Run test连检定法Discrete uniform densities离散的均匀密度Bin omial den sities 二项密度Hypergeometric den sities超几何密度Poisson densities 卜松密度Geometric den sities几何密度Negative bino mial densities负二项密度Con ti nu ous uniform den sitiesExp onential den sities指数密度Gamma densities 伽玛密度Beta densities 贝他密度Multivariat e analysis多变量分析Prin cipal components 主因子分析Discrimi natio n analysis区别分析Cluster analysis 群集分析Factor an alysis 因素分析Survival analysis 存活分析Time series Statisticsanalysis 时间序列分析Lin ear models 线性模式Quality engineering 品质工程Probability theory机率论Statistic al computing 统计计算Statistic al inference 统计推论Stochasti c processes随机过程Decision theory 决策理论Discreteanalysis 离散分析Mathematical statistics数理统计统计学: 母体:Population样本:Sample 资料分析:Dataan alysis统计表:Statistical table统计图:Statistical chart 圆饼图:Pie chart茎叶图:Stem-a nd-leaf display 盒须图:Box plot直方图:Histogram长条图:Bar Chart次数多边图:Polyg on肩形图:Ogive 叙述统计学:Descriptive statistics Con fide nee coefficie nt期望值: 统计假设检定: Expectati on Testi ngstatistic 众数:Mode hypothesis平均数:Mean 回归分析:变异数:Regressi on an alysis Varia nee 变异数分析: 标准差: An alysis of varia nce Stan dard deviati on 相关系数: 标准误:Correlati on coefficientSta ndard error共变异数矩阵:抽样调查:Covariance matrix Sampli ng survey推论统计学:普查:Census Inferen tial statistics 抽样:Sampling 点估计:Point 信度:Reliability estimati on 效度:Validity 区间估计:抽样误差: In terval estimati on Sampli ng error信赖区间:非抽样误差:Con fide nce in terval Non-sampli ng error信赖系数: 随机抽样: Random sampling 等级检定:The简单随机抽样法:sign testSimple ran dom 魏克森讯号等级sampli ng分层抽样法Stratified sampli ng群集抽样法Cluster sampli ng系统抽样法Systematic sampli ng 两段随机抽样法Two-stage ran dom sampli ng便利抽样Convenience sampli ng 配额抽样:Quota sampli ng雪球抽样Sno wball sampli ng 无母数统计Non parametric statistics检定: Wilcox on sig ned rank tests魏克森等级和检定: Wilcox on rank sum tests连检定法:Run test离散的均匀密度Discrete un iform den sities二项密度:Bin omial den sities超几何密度: Hypergeometricden sities卜松密度: Poiss on den sities几何密度: Geometric densities负二项密度:Negative bino mialden sitie,连续均匀密度:Con ti nu ousuniform den sities常态密度:Normal den sities指数密度:Exp onen tial den sities伽玛密度:Gamma den sities贝他密度:Beta den sities多变量分析:Multivariate an alysis 主因子分析:Prin cipal comp onents区别分析:Discrimi natio nan alysis群集分析Cluster an alysis因素分析Factor an alysis存活分析Survival an alysis 时间序列分析Time series an alysis线性模式Lin ear models品质工程Quality engin eeri ng机率论Probability theory统计计算Statistical comput ing统计推论Statistical inference随机过程Stochastic processes决策理论Decisi on theory离散分析:Discrete an alysis数理统计:Mathematicalstatistics统计名词市调辞典众数(Mode)普查(cen sus)指数(Index)问卷(Questi onn aire) 中位数(Median) 信度(Reliability)百分比(Percentage)母群体(Populati on)信赖水准(Con fide nee level)观察法(Observational Survey)假设检定(Hypothesis Test ing) 综合法(Integrated Survey)卡方检定(Chi-square Test) 雪球抽样(Sno wball Sampli ng)差距量表(Interval Scale) 序列偏差(Series Bias)类别量表(Nom in al Scale)次级资料(Sec on dary Data)顺序量表(Ordinal Scale)抽样架构(Sampli ng frame) 比率量表(Ratio Scale)集群抽样(Cluster Sampli ng) 连检定法(Run Test)便利抽样(ConvenienceSampli ng)符号检定(Sign Test)抽样调查(Sampli ng Sur)算术平均数(Arithmetic Mean)非抽样误差(non-sampli ng error)展示会法(Display Survey)调查名词准确效度(Criteri on-Related Validity)元素(Element) 邮寄问卷法(Mail In terview)样本(Sample)信抽样误差(Sampling error) 效度(Validity)封闭式问题(CloseQuesti on)精确度(Precision) 电话访问法(TelephoneIn terview)准确度(Validity) 随机抽样法(Random Sampli ng)实验法(Experime nt Survey)抽样单位(Sampling unit)资讯名词市场调查(Marketi ng Research) 决策树(Decision Trees)容忍误差(Tolerated erro) 资料采矿(Data Mining)初级资料(Primary Data)时间序列(Time-Series Forecasti ng) 目标母体(Target Populatio n)回归分析(Regressi on)抽样偏差(Sampling Bias)趋势分析(Tre nd An alysis)抽样误差(sampling error)罗吉斯回归(Logistic Regressi on)架构效度(Co nstruct Validity) 类神经网络(Neural Network)配额抽样(Quota Sampling)无母数统计检定方法(Non-Parametric Test)人员访问法(Interview) 判别分析法(Discrim inantAn alysis)集群分析法(cluster analysis)规贝V 归纳法(Rules In ducti on)内容效度(Content Validity) 判断抽样(Judgme nt Sampli ng) 开放式问题(Open Questi on) OLAP( On li ne An alytical Process) 分层随机抽样(Stratified Ran dom sampling)资料仓储(Data Warehouse)非随机抽样法(Nonran dom Sampli ng) 知识发现(Kno wledge Discover。
统计学术语
统计学术语统计学术语是将统计学术语言的概念用在实践统计学中的一种重要形式。
统计学是一门应用科学,它将数量和经验数据作为分析证据,在一定的条件和技术条件下进行研究,并根据统计学术语来得出结论。
统计学术语的定义是指“带有数字或数字,表示一个群体的总体特征的描述或声明”。
它最常用来描述群体的特征,比如人口数量,年龄分布,性别比例,教育水平,收入水平等。
它也可以用来表示群体之间的差异,比如平均收入水平和教育水平之间的收入差距等。
统计学术语被广泛应用于统计学分析中,包括数据统计、统计学推断、抽样理论、统计测试、比较等。
在实际操作中,统计学术语的使用是一种支持统计学分析所必需的工具,得出的结论往往是有效的。
统计学术语的主要用语包括:均值(Mean)、中位数(Median)、众数(Mode)、变异数(Variance)、标准差(Standard Deviation)、系数(Coefficient)、置信度(Confidence Level)、显著性(Significance)、回归(Regression)、相关性(Correlation)等。
其中,均值是一种描述数据中值的平均值;中位数是将样本的数据排序后取中间值;众数是重复出现最多的特定数字值;变异数是衡量样本数据依据均值跳动的程度;标准差是度量个人收入的测量;系数是表示两个变量之间相互影响的度量;置信度是表示结论的可靠性;显著性是表示结果在统计上是否有意义;回归分析是检验两个变量之间存在着强烈关系;而相关性是分析两个变量之间是否存在着某种关系。
掌握统计学术语的使用可以帮助人们进行统计学分析,比如多项式回归分析、假设检验分析等。
此外,使用统计学术语也可以促进人们之间的沟通,以便更有效地分析理解统计数据,得出科学而精准的结论。
综上所述,统计学术语是一种非常重要的统计学形式,它可以帮助人们全面理解统计学,应用统计学术语可以更有效地进行统计学分析,更能够深刻理解统计数据,让统计学从理论到实践更加有序有效地运作。
常用统计术语
常用统计术语统计术语在现代社会中扮演着重要的角色,它们被广泛运用于各个领域,如经济学、社会学、医学等等。
对于研究人员、决策者和普通公众来说,了解和掌握常用的统计术语是至关重要的。
本文将介绍一些常用的统计术语,帮助读者更好地理解和运用统计数据。
1. 样本(Sample):从总体中选取的一部分观察对象,以代表总体。
选择样本的目的在于降低调查成本和时间,并且在一定程度上能够提供总体的真实情况。
2. 总体(Population):研究对象的全体。
总体可以是人群、产品、事件等等。
3. 随机抽样(Random Sampling):一种抽样方法,所有样本具有相同的机会被选中的概率,从而保证样本的代表性和可靠性。
4. 样本容量(Sample Size):样本中的观察对象数量。
样本容量的选择应根据研究目的和研究对象的特点来确定,样本容量越大,结果越可靠。
5. 参数(Parameter):总体的数值指标,如总体均值、总体方差等。
参数通常用希腊字母表示,如μ表示总体均值,σ表示总体标准差。
6. 统计量(Statistic):样本的数值指标,如样本均值、样本方差等。
统计量是通过样本来估计参数。
7. 平均值(Mean):一组数据的加权平均数,可以代表数据的集中趋势。
常用符号X表示样本平均值,μ表示总体平均值。
8. 中位数(Median):把一组数据从小到大排列,位于中间位置的数值。
中位数可以代表数据的中间位置。
9. 众数(Mode):一组数据中出现次数最多的数值。
众数可以代表数据的峰值。
10. 标准差(Standard Deviation):衡量数据的离散程度,是每个数据与该组数据平均值的差异的平方和的平均值的平方根。
11. 偏度(Skewness):衡量数据的偏斜程度,描述数据分布偏向左侧或右侧的程度。
偏度为正表示数据分布向右偏,为负表示数据分布向左偏。
12. 峰度(Kurtosis):衡量数据的峰态程度,描述数据分布的尖锐程度。
统计专业术语
统计专业术语
统计学:作为一门学科,统计学涉及收集、整理、分析和解释数据的方法和技巧。
样本:被用于进行统计分析的数据子集。
总体:指整个群体或研究对象的集合,统计学中的分析结果通常是关于总体的。
抽样:从总体中选择以获得样本的过程。
标本误差:样本结果与总体结果之间的差异。
均值:一组数值的平均值,通过将所有数值相加并除以数值的总数来计算得到。
中位数:将一组数值按顺序排列后,位于中间位置的数值。
众数:一组数值中出现次数最多的数。
方差:度量一组数值离其均值的差异程度。
标准差:方差平方根,度量一组数值的离散程度。
相关性:指两个变量之间的关联程度。
回归分析:用于预测一个变量与其他变量之间关系的统计方法。
假设检验:用于评估统计推断中的假设的方法,通常将一个观察结果与一个预期结果进行比较。
置信区间:对一个估计值的不确定性进行度量的区间。
显著性水平:用于判断一个结果是否足够令人信服的概率阈值。
p值:表示观察到的统计数据在假设为真的情况下出现的概率。
设计效应:抽样过程中的某些因素对样本结果的影响。
统计显著性:指在统计学中观察到的差异超出了偶然误差的程度。
SPSS:一种常用的统计软件,用于数据分析和统计建模。
R语言:一种开源统计计算和图形化工具,广泛用于统计学和
数据分析。
这只是统计学中的一些常见专业术语,还有许多其他概念和方法,可以进一步探索和研究。
统计学概论主要术语
第1章统计学研究什么?主要术语1. 统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。
3. 推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。
4. 变量(variable):每次观察都会得到不同结果的某种特征。
5. 分类变量(categorical variable):又称无序分类变量,观测结果表现为某种类别的变量。
6. 顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。
7. 数值变量(metric variable):又称定量变量,观测结果表现为数字的变量。
8. 分类数据(categorical data):只能归于某一类别的非数字型数据。
9. 顺序数据(rank data):只能归于某一有序类别的非数字型数据。
10. 数值型数据(metric data):按数字尺度测量的数据。
11. 总体(population):包含所研究的全部个体(数据)的集合。
12. 样本(sample):从总体中抽取的一部分元素的集合。
13. 样本量(sample size):构成样本的元素的数目。
14. 简单随机抽样(simple random sampling):从含有N个元素的总体中,抽取n个元素组成一个样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。
15. 分层抽样(stratified sampling):也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。
16. 系统抽样(systematic sampling):也称等距抽样,先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素组成一个样本。
统计学术语
统计学术语1. 平均数:平均值,又称平均算术,是统计学中分析数据及描述数据特征的常用统计量。
2. 中位数:中位数是一组有序数据中居于中间位置的数据项。
3. 众数:一组数据中出现次数最多的数据项即为众数。
4. 极差:极差是最大值减去最小值的结果,用来表示一组数据范围大小的统计量。
5. 标准差:标准差是一组数据离均值偏差程度的反映,用来衡量一组数据离散程度。
6. 方差:方差是一组数据平均分布情况的反映,用来衡量一组数据离散度。
7. 协方差:协方差是一组数据关联和变化特征的反映,用来统计数据间的线性相关程度。
8. 相关系数:相关系数是对数据关联程度的反映,用来统计数据间的线性相关性。
9. 相关分析:相关分析是统计学中的研究方法,用来研究两个或两个以上变量之间的关系和联系。
10. 误差估计:误差估计是统计学及其应用中经常使用的统计量,用来研究某统计量的估计值和真实值之间的差异。
11. 测度:测度是衡量变量本质特征的方法,可以用来研究变量的取值范围大小、数据的分布特点等。
12. 抽样技术:抽样技术是指在样本中抽取部分数据进行定量研究的方法,使用的抽样方法有简单随机抽样、系统抽样、分层抽样和多方抽样等。
13. 模拟:模拟是指根据现实中或实验中的相关数据,以近似真实环境的方式模拟出理论模型,计算机模拟是应用最广泛的一种数学模拟方法。
14. 回归分析:回归分析是指研究两变量或多变量之间相互关系,并用线性等数学模型对该关系进行拟合和估计的统计学分析方法。
15. 分类分析:分类分析是对对象进行分组的统计学分析方法,可以使用适当的统计方法进行分类比较,以揭示不同群体之间的差异。
16. 抽象数量分析:抽象数量分析是指使用抽象的统计模型分析实验数据的方法,准确确定模型参数,有效地估计观察值。
17. 分位数:分位数是一组有序数据中,从最小到最大排列后比例所处位置的数值,它可以用来衡量数据中位置分布的特点。
18. 箱线图:箱线图是一种用来表示数据分布特征的统计图,可以观察分布的中位数、四分位数等重要信息。
统计学相关术语
统计学相关术语1、概率(proability):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。
一随机事件的慨率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对事件发生的相信程度。
2、统计学(statistics):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
也就是收集、处理、分析、解释数据并从数据中得出结论的科学。
主要又分为描述统计学和推断统计学。
3、描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
目的是描述数据特征,找出数据的基本规律。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
4、推断统计(Inferential Statistics):推断统计是研究如何根据样本数据来推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
主要包括参数估计与假设检验两种方法。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
5、数值型数据(metric data):按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。
6、分类数据(categorical data) :只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。
7、总体(population):所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。
分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的;无限总体所包括的元素是无限的,不可数的。
统计学中的专业术语
Canonical correlation, 典型相关Caption, 纵标目Case-control study, 病例对照研究Categorical variable, 分类变量Catenary, 悬链线Cauchy distribution, 柯西分布Cause-and-effect relationship, 因果关系Cell, 单元Censoring, 终检Center of symmetry, 对称中心Centering and scaling, 中心化和定标Central tendency, 集中趋势Central value, 中心值CHAID -χ2 Automatic Interaction Detector, 卡方自动交互检测Chance, 机遇Chance error, 随机误差Chance variable, 随机变量Characteristic equation, 特征方程Characteristic root, 特征根Characteristic vector, 特征向量Chebshev criterion of fit, 拟合的切比雪夫准则Chernoff faces, 切尔诺夫脸谱图Chi-square test, 卡方检验/χ2检验Choleskey decomposition, 乔洛斯基分解Circle chart, 圆图Class interval, 组距Class mid-value, 组中值Class upper limit, 组上限Classified variable, 分类变量Cluster analysis, 聚类分析Cluster sampling, 整群抽样Code, 代码Coded data, 编码数据Coding, 编码Coefficient of contingency, 列联系数Coefficient of determination, 决定系数Coefficient of multiple correlation, 多重相关系数Coefficient of partial correlation, 偏相关系数Coefficient of production-moment correlation, 积差相关系数Coefficient of rank correlation, 等级相关系数Coefficient of regression, 回归系数Coefficient of skewness, 偏度系数Coefficient of variation, 变异系数Cohort study, 队列研究Column, 列Column effect, 列效应Column factor, 列因素Combination pool, 合并Combinative table, 组合表Common factor, 共性因子Common regression coefficient, 公共回归系数Common value, 共同值Common variance, 公共方差Common variation, 公共变异Communality variance, 共性方差Comparability, 可比性Comparison of bathes, 批比较Comparison value, 比较值Compartment model, 分部模型Compassion, 伸缩Complement of an event, 补事件Complete association, 完全正相关Complete dissociation, 完全不相关Complete statistics, 完备统计量Completely randomized design, 完全随机化设计Composite event, 联合事件Composite events, 复合事件Concavity, 凹性Conditional expectation, 条件期望Conditional likelihood, 条件似然Conditional probability, 条件概率Conditionally linear, 依条件线性Confidence interval, 置信区间Confidence limit, 置信限Confidence lower limit, 置信下限Confidence upper limit, 置信上限Confirmatory Factor Analysis , 验证性因子分析Confirmatory research, 证实性实验研究Confounding factor, 混杂因素Conjoint, 联合分析Consistency, 相合性Consistency check, 一致性检验Consistent asymptotically normal estimate, 相合渐近正态估计Consistent estimate, 相合估计Constrained nonlinear regression, 受约束非线性回归Constraint, 约束Contaminated distribution, 污染分布Contaminated Gausssian, 污染高斯分布Contaminated normal distribution, 污染正态分布Contamination, 污染Contamination model, 污染模型Contingency table, 列联表Contour, 边界线Contribution rate, 贡献率Control, 对照Controlled experiments, 对照实验Conventional depth, 常规深度Convolution, 卷积Corrected factor, 校正因子Corrected mean, 校正均值Correction coefficient, 校正系数Correctness, 正确性Correlation coefficient, 相关系数Correlation index, 相关指数Correspondence, 对应Counting, 计数Counts, 计数/频数Covariance, 协方差Covariant, 共变Cox Regression, Cox回归Criteria for fitting, 拟合准则Criteria of least squares, 最小二乘准则Critical ratio, 临界比Critical region, 拒绝域Critical value, 临界值Cross-over design, 交叉设计Cross-section analysis, 横断面分析Cross-section survey, 横断面调查Crosstabs , 交叉表Cross-tabulation table, 复合表Cube root, 立方根Cumulative distribution function, 分布函数Cumulative probability, 累计概率Curvature, 曲率/弯曲Curvature, 曲率Curve fit , 曲线拟和Curve fitting, 曲线拟合Curvilinear regression, 曲线回归Curvilinear relation, 曲线关系Cut-and-try method, 尝试法Cycle, 周期Cyclist, 周期性。
第一章 统计学基础知识-1
直 图 方
30 25 20 15 10 5 0 120% 100% 80% 60% 40% 20% 0%
频 率 累 % 积
频率
5.55 7.05 8.55 10.05 11.55 13.05 14.55 16.05 17.55 其 他
蔗 含 % 糖 量
第三节 统计特征数
反映数据资料的集中性趋势或分散程度的一些特 征数字,统称为统计特征数。 平均数,方差。 征数字,统称为统计特征数。如,平均数,方差 。 平均数: 一、集中性趋势的度量--平均数: 集中性趋势的度量 平均数 描述数据资料的集中性趋势, 描述数据资料的集中性趋势 , 反映资料的一般水 平及中心位置, 平及中心位置,并可作为资料的代表跟其它资料 比较。 比较。
(2)随机误差(偶然误差): )随机误差(偶然误差) 由很多不可避免且无法控制的偶然因素引起的误差。 由很多不可避免且无法控制的偶然因素引起的误差 。 分析测试中: 分析测试中: 分析方法本身的不完善性、仪器、环境、 分析方法本身的不完善性 、仪器、 环境、操作等各个 方面的偶然变化。 方面的偶然变化。 生物试验中: 生物试验中:产生随机误差的原因 供试材料的不均一性如种子质量、 供试材料的不均一性如种子质量、秧苗素质不可能完 全一致; 全一致; 光照、温度、湿度等影响生长的环境因子也可能随时 光照、温度、 随地发生的变化; 随地发生的变化; 农时操作的不一致性; 农时操作的不一致性; 其它不可预测的自然或人为因素的干扰。 其它不可预测的自然或人为因素的干扰。
编号 0 1 2 3 4 5 6 7 8 9 0 11.8 14.1 12.8 14.6 14.9 10.1 11.6 11.0 15.1 13.4 1 13.1 11.9 15.3 10.4 15.0 12.4 12.2 13.0 14.9 10.6 2 9.2 16.7 12.6 13.4 12.1 10.8 7.5 9.2 12.6 6.5 3 8.7 7.4 16.1 14.6 12.6 11.3 13.4 7.0 14.1 11.0 4 12.9 10.0 17.2 10.5 13.0 6.3 14.7 13.2 11.4 11.9 5 13.7 4.4 13.5 8.6 14.1 15.7 14.2 9.0 9.4 11.8 6 9.6 13.2 11.9 15.2 14.4 14.3 14.0 14.0 12.4 12.6 7 13.7 13.8 16.7 11.1 13.1 15.0 15.1 13.2 15.0 9.5 8 8.5 9.1 9.6 14.5 13.3 12.5 6.5 15.0 9.4 12.2 9 15.7 11.9 15.1 12.1 15.0 11.8 8.7 13.8 12.9 8.2
统计学术语
统计学中的专业术语arithmetic mean 算术平均数abscissa(X-axis) 横坐标(X-轴)a priori 事前假设alpha(α)error α错误alpha level α水平alternative hypothesis 备择假设addition rule 加法定理additive effect 累加效应analysis of variance(ANOV A) 方差分析adjusted residual 调整后残差binomial test 二项测验between-subjects variable 被试间变量between-groups variance 组间方差binomial distribution 二项分布bar graph 条形图box-and-whisker plot 箱线图bimodal 双峰biased estimate 有偏估计beta(β)error β错误biased estimate 有偏估计binomial estimate 二项估计Cohen’s Kappa Cohen的kappa系数Gramer’s coefficient Gramer系数cause and effect 原因和结果comparison 比较confounding 混淆constant 常量correlation 相关continuous variables 连续变量class 组(分组)cumulative frequency 累积频数cumulative percentage 累积百分比chartjunk 统计图中的画蛇添足class intervals or class widths 组距或组宽coefficient of determination r2决定系数coefficient of nondetermination 非决定系数correlation 相关correlation coefficient 相关系数correlation matrix 相关矩阵covariance 协方差covariance sum of squares 协方差平方和curvilinear relation 曲线关系deviation score 离差分数classical definition of probability 概率的古典定义conditional probabilities 条件概率continuous variable 连续变量carry-over effect 滞留效应counterbalancing 对抗平衡central limit theorem 中心极限定理conceptual hypothesis 概念假设conditional conclusion 条件性结论confidence interval 置信区间directional hypothesis 方向性假设discrete variable 离散变量data 数据discontinuous or discrete variables 非连续或间断变量dependent variable(DV)因变量descriptive statistics 描述统计direct replication 直接复制definitional equation 定义性公式dot chart 点图direct difference method 直接差异法degrees of freedom 自由度effect size 效应大小error term 误差estimate of s(s=arrange/6)估计标准差experiment 实验experimental variable 实验变量extraneous variable 无关变量exploratory data analysis 探索性数据分析extreme scores 极端值error sum of squares 误差平方和empirical definition of probability 概率的经验定义experiment wise error 同一实验中多重t检验误差frequency distribution 频数分布fourth moment about the mean 四级动差figure 数字frequency curve or line graph 频数分布曲线或线性图factorial design 因素设计factor 因素F-ratio F值graph 统计图gambler’s fallacy 赌徒谬误goodness-of-fit-test 拟合优度检验general linear model 广义线性模型homogeneity 同质性histogram 直方图homoscedasicity 方差齐性homogeneity of variance 方差齐性interval scale 等距量表independent variable(IV)自变量inferential statistics 推论统计intact group 完整组intercept(a)截距(a)independent groups 独立组independent or independence 独立或独立性interaction 交互作用joint probability 联合概率kurtosis 峰度kurtosis(s4)峰度leptokurtic distribution 尖峰分布Lake Wobegon Effect Lake Wobegon效应least squares method 最小平方法leptokurtic 尖峰的linear relation 线性关系levels of a factor 单因素的水平measurement 测量mesokurtic distribution 中峰分布measures of central tendency 集中趋势的测量median 中位数mode 众数multimodal 多峰mesokurtic 中峰的man-who statistics 基于特例的统计解释误差marginal probabilities or unconditional probabilities 边缘概率或无条件概率mutually exclusive 互不相容multiplication rule for independent events 独立事件的乘法定律multiplication rule for dependent events 非独立事件的乘法定理main effect 主效应modus tollens 证伪法nondirectional hypothesis 无方向性假设null hypothesis 虚无假设negative skew 负偏态nominal scale 称名量表nuisance variable 干扰变量normal distribution 正态分布negative relationship 负相关nondetermination 非决定性percentages 百分比proportions 比例population 总体percentile rank 百分等级platykurtic distribution 偏锋分布positive skew 正偏态positive skew 正偏态positive skew 正偏态positive skew 正偏态platykurtic 低峰的pictographs 图片统计图Pearson r(product-moment correlation coefficient)皮尔逊相关系数(积矩相关系数)positive relationship 正相关post hoc fallacy 事后错误partitioning the sum of squares 平方和分解partition 方差分解parametric test 参数检验power of a test 统计检验力point estimation 点估计probabilities 概率ordinal scale 顺序量表operational definition 操作定义outliers 极端数据outlier 异常值ordinate (Y-axis)纵坐标(Y轴)omnibus statistical test 复合统计检验one-way ANOV A 单因素方差分析omega squared(w²)w²one-tailed probability 单尾概率variable 变量random sample 随机样本ratio scale 比率量表real limits of a number 数的实限rules of priority 优先规则random assignment 随机分派replication 复制research design 研究设计range 全距regression line 回归线regression sum of squares 回归平方和regression to the mean 对平均数的回归residual variance 残差robust 检验的强劲性random 随机reject Hοrules 拒绝的原则sample 样本statistics 统计学statistic 统计量subject variable 被试变量systematic replication 系统复制skew 偏态stem-and-leaf-plot 茎叶分布图semi-interquarile range 四分位差standard deviation 标准差second moment about the mean 二级动差skew(s3)偏态sum of square(ss)平方和standard scores 标准分数standard deviation 标准差standard normal distribution 标准正态分布standardized residual 标准残差transformations to z-scores z分数转化scatter plot 散点图Spearman correlation 斯皮尔曼相关系数spurious correlation 虚假相关slop(bx,by)斜率standard error of estimate 估计标准误sample space 样本空间self-fulfilling prophecies 自我实现预言sequential sampling 序列取样simple random sampling 简单随机取样法statistical generalization 统计概括subjective probability 主观概率standard error the difference between means 平均数差异的标准误student’s t-distribution t分布student’s t-ratio t比率sampling distribution 抽样的分布sampling error 抽样误差significance level 显著性水平standard error of the mean 平均数的标准误statistical hypothesis 统计假设statistical significance 统计显著temporal directionality 原因和结果的持续时间third variable problem 第三变量问题truncated range 相关范围缩小效应T-score T分数truncating 削峰third moment about the mean 三级动差table 统计表t critical 临界t值t observed 观测t值two-factor or two-way ANOV A 两因素方差分析total variance 总方差two-way ANOV A 双因素方差分析treatment variance 处理方差treatment population 处理总体two-tailed probabilities 双尾概率type I(α)error I型或α型错误typeⅡ(β)error Ⅱ型错误unexplained or unaccounted for variation 无法解释的变量unbiased estimate 无偏估计unbiased estimate 无偏估计variance(s2) 方差validity 效度within-subjects variable 被试内变量within-groups variance 组内方差x²test x²检验z-score z分数Z critical 临界z值Z observed 观测z值。
统计学相关术语讲解学习
统计学相关术语1、概率(proability):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。
一随机事件的慨率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对事件发生的相信程度。
2、统计学(statistics):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
也就是收集、处理、分析、解释数据并从数据中得出结论的科学。
主要又分为描述统计学和推断统计学。
3、描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
目的是描述数据特征,找出数据的基本规律。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
4、推断统计(Inferential Statistics):推断统计是研究如何根据样本数据来推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
主要包括参数估计与假设检验两种方法。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
5、数值型数据(metric data):按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。
6、分类数据(categorical data) :只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。
7、总体(population):所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。
分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的;无限总体所包括的元素是无限的,不可数的。
统计学常用词汇
统计词汇统计术语TAG:教育理论Aacceptanee region 接受区域adjusted 校正的allocation 配星、布局alternative hypothesis 备择假设*analysis of variance 方差分析*analysis of covariance 协方差分析ANOCOVA =Analysis of covariance*ANOVA =Analysis of variance arithmetic mean 算术平均值associatio n 关联性*assumed mean 假定平均值*asymmetric distribution 非对称分布autoregressive 自回归(的)averages 平均量Bbar chart 条线图Bartlett\'s test 巴特利特检脸* Bayes, -ian 贝叶斯的、贝叶斯beta function 贝塔函数betwee n(间)内bias 偏倚biased question 有偏质问binomial distribution 二项分布binomial theorem 二项定理bioassay 生物鉴定法bivariate normal distribution 二元正态分布blind test 盲检法Bonferronits in equality Bonferroni 不等式bootstrap 自助法Box-Cox transformation Box-Cox 变换ccanonical correlation 典型相关case control study 案例对照研究categorizatio n 分类categorize 分类category 类别causality 因果关系central limit theorem 中心极限定理Chebyshev\'s inequality 切比雪夫不等式x2-statistic x2 统计量X2-test x2 检验classificatio n 分类cluster analysis 聚类分析coding 编码coefficient of concordanee —致性系数coefficient of determination 可决系数cohort 同辈common factors 公共因子,公因数communality 公因子方差、公共因子方差comparis on 比较comp on ent 成分conditional probability 条件槪率*confidence coefficient 置信系数*confidence interval 置信区间*confidence limits 置信界限*confound, -ing 混杂.混杂法*confounding design 混杂设计*consumer\'s price index 消费物价指数consumer\'s risk 用方风险*contribution 基值confirmatory 确定的consistent, consistency 一致(的).一致性contingency table 列联表continuous distribution 连续分布control (group)控制、控制(群)convergence in probability 概率收敛convergence in law (distribution)依法则收敛(依分布收敛)correction 校正.修正correction factor 校正因子correction for continuity 连续校正correlati on 相关correlation coefficient 相关系数correlation ratio 相关比correlogram 相关图covariate 共变向量covariati on 共变criterion variable 基准变量critical region 判別区域*cross-section 横截而*cross-tabulation 交叉表*cumulative frequency 累积频率cumulative distribution function 累积分布函数*cumulative relative frequency 累积频率curvilinear 曲线(的)D*data 数据*data analysis 数据分析* degree of freedom 自由度density 密度density function 密度函数* dependent variable 应变数* descriptive statistics 描述性统计deviate 偏差deviation 偏、偏差(cf. standa rd — , mean dichotomous question 二分搜索法discriminant analysis 判別分析discriminant function 判別函数discrimi natio n 判別discrete distribution 离散分布distribution 分布D.K. (Don\'t Know)dose-response curve (relationship) 用虽:反应曲线(关系) double blind test 二重盲检法* downward trend 下降倾向drop out 脱落例Durbin-Watson statistic (ratio) Durbin-Watson 统计量(比) Eefficient, efficiency 有效的.有效性* Engel\'s coefficient 恩格尔系数en tropy 爛epidemiology 流行病学error 误差error margin 误差幅度error of the first kind (type I error) error of the second kind (type II error) error term 误差项estimable 可估的estimate 估计量*estimation 估计estimator 估计量event 事件exact probability test 直接概率法*expectation 期望*expected frequency 期待度数experimental design 试脸设计*explanatory variable 说明变虽:exploratory 探索的exponential distribution 指数分布face sheet factor 因子*factor analysis *factor loadings factorial effects 因子分析因子输入量(系数)析因效应factorial experiment 析因试验fiducial probability 置信概率filter, -ing 滤子finite population Fisher information* fitting 拟合第1类误差第2类误差有限总体费希尔信息fixed-effect model 固宦效应模型follow-up study 追跡研究 force of mortality 死力 fractional factorial design free-answe 「question * frequency 频率* frequency distribution F statistic (ratio, test) G Gauss, Gaussian * genetic algorithm 分步实施计划设计 自由回答法 频率分布F 统计量(F 比.F 检验) geometric distribution geometric mean goodness of fit 高斯(的) 遗传算法 几何分布 Greco-Latin square Hharmonic mean hazard function heteroscedastic, -ity * histogram 直方图 homoscedastic, -ity hypergeometric distribution hypothesis 假说 I * independence 独立 * independent variable in finite populatio n input 入力 in spectio n 检査 几何平均值 拟合优度 正交拉丁方调和平均 故障率函数 异方差(性)同方差(性) 超几何分布独立变量 无限总体interactio n 相互作用intercept 切片*interval estimation 区间推定*interval scale 间隔尺度interviewee 被调査者interviewer 调査员interviewing method 而试调査法item 项JJacknife 刀切法KKaplan-Meier estimate Kaplan-Meier'估计*Kendall\'s rank correlation coefficients 肯徳尔等级相关系数Kullback-Leibler information number 库尔贝克-莱布勒信息函数*kurtosis 峰度Llag 时间滞后large sample 大样本Latin square 拉丁方law of large numbers 大数定律(strong weak-: 強定律、弱定律)least significant difference, LSD. 最低显著性差异*least square 最小二乘法*level of significance 显著水平life table 生命表likelihood 似然linear discriminant function 线形判别函数local control 局部控制logistic function 逻辑斯蒂函数logit analysis (transformation )分对数分析(变换)log-linear model 对数线性模型log-log 对数log-normal distribution 对数正态分布longitudinal 经度的,纵的loss function 损失函数MMahalanobisV generalized distanee Mahalanobis 广义距离mail survey 邮送调査main effect 主效应marginal 边缘(的)Markov, -ian 马尔科夫(的)mathematical statistics 数理统计学*maximum 最大(pl. maxima)maximuim likelihood estimate (estimation)最大似然佔计(估计法)McNemar\'s test McNemar 测试*mean 平均(值)*mean deviation 平均偏差mean effect 平均效应*median 中位数meta-analy引s 元分析*minimum 最小(pl. minima)missing value 缺区值*mode 众数model, -ing 模型(建模)moment 矩moving average 移动平均multicolinear, -ity 多重共线(性)multidimensional scaling (MDS)多维换算multiple answer 重复回答multiple choice 多重选择multiple comparison 多重比较*multiple correlation coefficient 多重相关系数*multiple regression 多重回归multi-stage sampling 多阶段抽样*multivariate analysis 多变量分析Multivariate analy引s of variance 多元方差分析multivariate normal distribution 多变量正态分布* MANOVA = Multivariate analysis of variance*multiway table 多路表N*nxm table n xm 表*nominal scale 额定尺度non-central 无心non parametric 非参数的normal approximation 正态近似*normal distribution 正态分布normal equation 正规方程null hypothesis 原假设observational error 观测误差*observed frequency 观测频率observed value 观测值OC (operating characteristic) curve 作用特性曲线odds 奇odds ratio 奇数比one-sided 单侧1-way layout 1元布局法optimum allocation 最佳分配法ordered clas引fication 顺序化*ordinal scale 序数尺度orthogonal polynomial 正交多项式outlier 边际值output 输出.结果ppaired comparison 成对比较法panel survey 固定样本调查parameter 系数partial confounding 部分混杂(法)*partial correlation coefficient 偏相关系数Pearson\'s product moment correlation coefficient 皮尔逊矩相关系数percentile 百分数periodic 周期的periodogram 周期图phi coefficient 系数pie chart 饼状图plot 点图*point estimation 点估计*Poisson distribution 泊松分布pooled variance estimate 联合方差估计*population 总体population correlation coefficient 总体相关系数*population mean 总体平均值*population variance 总体方差posterior probability (distribution)后验概率(分布)power (function)幕(函数)pre-coding 预编码predicted value 预测值*prediction 预测predictive 预测(的)presentation 表示、表现(法)primary sampling unit 第1次抽样的单位prin cipal comp orient, ― an alysis 主成分(分析)prior probability (distribution)先验槪率(分布)*probability 概率*probability distribution 概率分布probability proportionate sampling 概率比例抽样probit analysis 概率单位分析process 过程producer\'s risk 生产者风险project io n pursuit 投影寻踪proporti on 比例proportional hazard model 比例风险模型prospective study 远景调査Qquartile 四分位(数)quartile deviation 四分位偏差*quality 质qualitative 定性的qualitative data 定性的数据*quantity 量quantitative 定量的、计量的quota system 定额系统R*radar chart 雷达图random 随机的「andomization概率化、随机化random walk 随机游动* range 范帀(区域)* rank 秩* rank correlation coefficients等级相关系数 ranking method 秩评定法* rank-size rule 秩规模规则rank test 秩检验* regression coefficient 回归系数regression diagnosis 回归诊断* regression equation (line )回归方程(直线) * rejection region拒绝区域 * relative frequency相对频率relative risk 相对风险 reliability (coefficient ) 信赖性(系数)* re 引dual 残差response curve (surface )相应曲线(曲而) retrospective study追溯调查risk 风险risk factor 风险因素robust, -ness 稳健的(性)run 取遍* randomness 随机性random number随机数 random sampling 随机抽样rating method比率法 * ratio scale 比率尺度* regression 回归*sample 样本*sample mean 样本均值*sample size 样本量(大小)*sample variance 样本方差*sampling 抽样sampling error 抽样误差sampling interval 抽样间隔sampling unit 抽样单位*scales 尺度*scattergram, scatter plot (diagram)点状图Scheffe\'s test Scheffe 检验score 得分seasonality 季节性secondary sampling unit 第2 次单位抽样serial correlation 序列相关self-adminstrati on 自管理semi-log 半对数sigmoid 拟S 型、S 状signal to noise ratio SN (信噪)比signed rank test 带符号的秩检验* significanee, significant 显著(的)* significanee probability 显著概率simple random sampling 简单随机抽样引mple regression 简单回归single replication 1 次重复size proportionate allocation 比例布局,去skewed 斜的skewness 失貞.slope 斜率spectral window 谱窗spectrogram 谱图spectrum 谱*Spearman\'s rank correlation coefficients 斯皮尔曼等级相关系数*spurious correlation 伪相关square 平方*standard deviation, S.D. 标准方差*standard error 标准误差*standard score 标准得分start number 起始编号*stationary 平稳的*statistic (for inference) 统计量(统计推论的)statistical 统计的statistically significant 统计显著的stem-and-leaf presentation 茎叶表现stereotype 陈腔滥调stochastic process 随机过程*stratification 分层stratified sampling 分层抽样*stratum ([pl.] strata) 层Student(\'s) 学生(的)studentized range 学生化范围study 研究sub-sampli ng 二次抽样sufficiency 充分性sufficient statistic 充分统计量supervisor 管理者survival analy引s 生存时间分析survey 调查systematic sampling 系统抽样taxonomy 分类(学)tail 尾*test 检验*test of goodness of fit 拟合良好性检定*test of independence 无关性检验3-way layout 3元布局法threshold 阈值tie 结tie correction 结修正*time series 时间序列total variation 全变差treatment 处理*trend 趋势trend analysis 趋势分析trial 尝试*t-statistic z -test, -ratio t 统计量(t 检验、t 比)two-sided 双边的*2-sample t-test 2 样本t 检脸2-stage sampling 2 阶段抽样法two-by-two contingency table 2x2 歹ij联表2-way layout 2元布局法*2-way table 2 重表two-stage sampling 2 阶段抽样法Uunbiased estimator 无偏估计量unbiased variance 无偏方差uncorrelated 不相关(的)uniform distribution 均匀分布uniform random numbers 均匀随机数un ique ness 唯一性updating 更新*upward trend 向上趋向Vvalidity 有效性variate 变量*variance 方差varianee ratio 方差比varimax rotation varimax 旋度varimax solution varimax 解variati on 变差variability 变异性Wweighted sampling 加权抽样Welch\'s test Welch 检验within (级)间with probability 1 (w.p.l) 以概率1 wording 措辞XYYates\' correction Yates 修正z*Zipf\'s law Zipf 法則。
统计学名词解释汇总
统计学名词解释汇总概述本文档收集了一些常见的统计学名词解释,旨在帮助读者更好地理解统计学领域中的相关概念和术语。
名词解释1. 总体(Population): 指研究对象的全体,包括对研究感兴趣的所有个体或单位。
总体(Population): 指研究对象的全体,包括对研究感兴趣的所有个体或单位。
2. 样本(Sample): 从总体中选取的一部分个体或单位,用来代表整个总体进行研究。
样本(Sample): 从总体中选取的一部分个体或单位,用来代表整个总体进行研究。
3. 抽样(Sampling): 从总体中选取样本的过程,可以通过随机抽样、分层抽样等方法进行。
抽样(Sampling): 从总体中选取样本的过程,可以通过随机抽样、分层抽样等方法进行。
4. 参数(Parameter): 描述总体特征的数值,例如总体均值、总体方差等。
参数(Parameter): 描述总体特征的数值,例如总体均值、总体方差等。
5. 统计量(Statistic): 根据样本数据计算得出的数值,用来代表总体参数的估计。
统计量(Statistic): 根据样本数据计算得出的数值,用来代表总体参数的估计。
6. 标准差(Standard Deviation): 描述数据集合离散程度或波动性的度量,是方差的平方根。
标准差(Standard Deviation): 描述数据集合离散程度或波动性的度量,是方差的平方根。
7. 假设检验(Hypothesis Testing): 根据样本数据来统计推断总体参数的过程,包括设定原假设和备择假设、计算统计量、确定显著性水平等步骤。
假设检验(Hypothesis Testing): 根据样本数据来统计推断总体参数的过程,包括设定原假设和备择假设、计算统计量、确定显著性水平等步骤。
8. 置信区间(Confidence Interval): 用于对总体参数的估计范围进行区间估计,根据样本数据计算得出。
置信区间(Confidence Interval): 用于对总体参数的估计范围进行区间估计,根据样本数据计算得出。
统计学基础名词解释及简答题
统计学基础知识名词解释及简答题一、名词解释1、统计学统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。
2、指标和标志标志是说明总体单位属性或特征的名称。
指标是说明总体综合数量特征和数量关系的数字资料。
3、总体、样本和单位统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。
简称总体。
构成总体的个体则称为总体单位,简称单位。
样本是从总体中抽取的一部分单位。
4、统计调查统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。
它是取得统计数据的重要手段。
5、统计绝对数和统计相对数反映总体规模的绝对数量值,在社会经济统计中称为总量指标。
统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。
6、时期指标和时点指标时期指标是反映总体在一段时期内累计总量的数字资料,是流量。
时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。
7、抽样估计和假设检验抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。
假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。
8、变量和变异标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。
数量标志和指标在统计中称为变量。
9、参数和统计量参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。
统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。
10、抽样平均误差样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。
重复抽样的抽样平均误差为总体标准差的1/n。
11、抽样极限误差抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。
我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。
统计学名词解释及公式
统计学名词解释及公式公司内部编号:(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。
本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。
本章各节的主要内容和学习要点如下表所示。
概念:统计学,描述统计,推断统计。
统计在工商管理中的应用。
统计的其他应用领域。
概念:分类数据,顺序数据,数值型数据。
不同数据的特点。
概念:观测数据,实验数据。
概念:截面数据,时间序列数据。
统计数据的间接来源。
二手数据的特点。
概念:抽样调查,普查。
数据的间接来源。
数据的收集方法。
调查方案的内容。
概念。
抽样误差,非抽样误差。
统计数据的质量。
概念:总体,样本。
概念:参数,统计量。
概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。
二、主要术语1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2.描述统计:研究数据收集、处理和描述的统计学分支。
3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4.分类数据:只能归于某一类别的非数字型数据。
5.顺序数据:只能归于某一有序类别的非数字型数据。
6.数值型数据:按数字尺度测量的观察值。
7.观测数据:通过调查或观测而收集到的数据。
8.实验数据:在实验中控制实验对象而收集到的数据。
9.截面数据:在相同或近似相同的时间点上收集的数据。
10.时间序列数据:在不同时间上收集到的数据。
11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
12.普查:为特定目的而专门组织的全面调查。
13.总体:包含所研究的全部个体(数据)的集合。
14.样本:从总体中抽取的一部分元素的集合。
15.样本容量:也称样本量,是构成样本的元素数目。
16.参数:用来描述总体特征的概括性数字度量。
统计学相关术语
统计学相关术语关键信息项:1、统计学术语定义名称:____________________解释:____________________2、术语应用场景场景描述:____________________具体示例:____________________3、术语的重要性对数据分析的影响:____________________在决策中的作用:____________________11 术语定义111 均值(Mean)均值是一组数据的算术平均值。
计算方法是将所有数据相加,然后除以数据的个数。
例如,对于数据集合{2, 4, 6, 8, 10},均值为(2 + 4 + 6 + 8 + 10) / 5 = 6。
112 中位数(Median)将一组数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则中间的那个数就是中位数;如果数据个数是偶数,则中间两个数的平均值就是中位数。
例如,对于数据集合{1, 3, 5, 7, 9},中位数是 5;对于数据集合{2, 4, 6, 8},中位数是(4 + 6) / 2 = 5。
113 众数(Mode)一组数据中出现次数最多的数。
例如,对于数据集合{1, 2, 2, 3, 3, 3},众数是 3。
114 方差(Variance)用来衡量一组数据的离散程度。
方差越大,说明数据的离散程度越大;方差越小,说明数据越集中。
115 标准差(Standard Deviation)方差的平方根,与原始数据的单位相同,更直观地反映数据的离散程度。
12 术语应用场景121 市场调研在市场调研中,均值可用于了解消费者对某产品的平均评价得分;中位数可用于确定大多数消费者的评价水平;众数可帮助发现最常见的消费者意见。
122 质量控制在生产过程中,通过计算产品质量指标的方差和标准差,来判断生产过程是否稳定,是否需要进行调整。
123 教育评估学生考试成绩的分析中,利用这些术语来评估学生的整体表现、成绩的分布情况等。
一般统计术语与用于概率的术语
一般统计术语与用于概率的术语统计学是研究数据收集、分析和解释的学科,而概率论则是研究随机现象的可能性的学科。
在统计学和概率论中,有许多常用的术语被广泛应用于描述和解释数据和概率的特征。
本文将介绍一些常见的一般统计术语和用于概率的术语,并对其进行解释和应用。
一般统计术语:1. 样本(Sample):指代从总体中选取的一部分数据,用于对总体进行分析和推断。
2. 总体(Population):指代研究对象的全体,可以是人群、产品、事件等。
3. 参数(Parameter):指代总体的特征或属性,如总体的平均值、标准差等。
4. 统计量(Statistic):指代从样本中计算得出的数值,用于对总体参数进行估计。
5. 抽样(Sampling):指从总体中选择样本的过程,以代表总体进行研究。
6. 假设检验(Hypothesis testing):通过对样本数据进行统计推断,判断总体参数是否符合某个假设。
7. 置信区间(Confidence interval):用于估计总体参数真值的范围,通常以置信水平表示。
8. 方差(Variance):衡量数据分散程度的统计量,是各观察值与均值之差的平方和的平均值。
9. 标准差(Standard deviation):方差的正平方根,用于度量数据的离散程度。
10. 相关性(Correlation):用于描述两个变量之间关系的统计指标,可为正相关、负相关或无关。
用于概率的术语:1. 随机变量(Random variable):描述随机试验结果的数学变量,可以是离散型或连续型。
2. 概率(Probability):用于度量随机事件发生的可能性,取值范围为0到1。
3. 概率分布(Probability distribution):描述随机变量可能取值的概率情况。
4. 期望值(Expected value):随机变量的平均值,表示随机变量的平均水平。
5. 方差(Variance):度量随机变量取值在期望值附近的离散程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学相关术语1、概率(proability):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。
一随机事件的慨率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对事件发生的相信程度。
2、统计学(statistics):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
也就是收集、处理、分析、解释数据并从数据中得出结论的科学。
主要又分为描述统计学和推断统计学。
3、描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
目的是描述数据特征,找出数据的基本规律。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
4、推断统计(Inferential Statistics):推断统计是研究如何根据样本数据来推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
主要包括参数估计与假设检验两种方法。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
5、数值型数据(metric data):按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。
6、分类数据(categorical data) :只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。
7、总体(population):所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。
分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的;无限总体所包括的元素是无限的,不可数的。
8、样本(sample):从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量(sample size)。
9、变量(variable):说明现象某种特征的概念,如商品销售额、性别等,变量的具体表现称为变量值,即数据。
变量基本分类可分为分类变量:说明事物类别的名称;数值型变量:说明事物数字特征的名称。
其他分类可分为随机变量与非随机变量;经验变量和理论变量。
10、平均数(mean):是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置,易受极端值的影响,是反映数据集中趋势的一项指标。
它包括算术平均数、加权算术平均数、调和平均数和几何平均数。
11、众数(mode):是指一组数据中出现次数最多的变量值(数据值),不受极端值的影响,一组数据可能没有众数或有几个众数。
众数适合于数据量较多时,并且在数据分布偏斜程度较大且有明显峰值时应用。
12、中位数(median):是另外一种反映数据的中心位置的指标,其确定方法是将所有数据以由小到大的顺序排列,位于中央的数据值就是中位数,不受极端值的影响。
中位数在数据分布偏斜程度较大时应用。
13、四分位数(quartile):一组数据中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的数据就是四分位数,不受极端值的影响。
四分位数在统计学中的箱线图绘制方面应用较为广泛。
14、算术平均数(Arithmetic mean)简称平均数、均数或均值,是指在一组数据中所有数据之和再除以数据的个数。
它是反映数据集中趋势的一项指标。
算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。
15、加权平均数(Weighted mean)是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算。
加权算术平均数主要用于处理经分组整理的数据。
加权算术平均数同时受到两个因素的影响,一个是各组数值的大小,另一个是各组分布频数的多少。
16、调和平均数(Harmonic mean)调和平均数是总体各单位标志值倒数的算术平均数的倒数,也称倒数平均数。
调和平均数易受极端值的影响,且受极小值的影响比受极大值的影响更大。
只要有一个变量值为零,就不能计算调和平均数。
调和平均数应用的范围较小。
17、几何平均数(Geometric mean)n个变量值乘积的n次方根就是几何平均数。
适用于对比率数据的平均,主要用于计算平均增长率。
21、极差(range)一组数据的最大值与最小值之差,极差也称为全距。
它是数据离散程度的最简单测度值,极差越大,离散程度越大,反之,离散程度越小。
极差易受极端值影响,未考虑数据的分布。
22、平均差(mean deviation)各标志值与其平均数离差绝对值的平均数。
平均差是一种平均离差。
离差是总体各单位的标志值与算术平均数之差。
因离差和为零,离差的平均数不能将离差和除以离差的个数求得,而必须讲离差取绝对数来消除正负号。
23、方差(variance)是各个数据与平均数之差的平方和的平均数,表示一系列数据或统计总体的分布特征的值。
通俗点讲,就是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。
在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。
24、标准差(Standard Deviation)也称均方差,是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根。
标准差是方差的算术平方根。
标准差能反映一个数据集的离散程度。
平均数相同的,标准差未必相同。
25、变异系数(coefficient of variation)又称“标准差率”,表示离散程度,是标准差和相应平均数的比值,记为C.V。
当进行两组或多组数据离散程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。
如果单位和(或)平均数不同时,比较其离散程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。
简单来说就是:在表示离散程度上,标准差并不是全能的,当度量单位或平均数不同时,只能用变异系数了,它也是表示离散程度,是标准差和相应平均数的比值。
26、偏度(skewness)是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
偏度=0为对称分布,偏度> 0为右偏分布,偏度< 0为左偏分布。
27、峰度(kurtosis)是用来反映频数分布曲线顶端尖峭或扁平程度的指标。
有时两组数据的算术平均数、标准差和偏度都相同,但他们分布曲线顶端的高耸程度却不同。
峰度=0扁平峰度适中,峰度<0为扁平分布,峰度>0为尖峰分布。
28、分组根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。
有等距分组和不等距分组两种方式,进行分组要遵循两个原则:穷尽原则、互斥原则。
29、频数(frequency)频数是指一组数据中个别数据重复出现的次数。
例如某校A班学生共50名同学,按性别进行分组,分为男与女两个组别,男同学的频数为30,女同学的频数为20。
30、频率频率是每个小组的频数与数据总数的比值,它代表某组在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。
31、绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也是数据分析中常用的指标,如GDP、总人口等。
此外,绝对数也可以表现为在一定时间、地点条件下数量增减变化的绝对数,比如A国人口比B国人口多1000万人。
32、相对数是指由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。
计算公式=比较数值(比值)/基础数值(基数)。
分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。
相对数一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。
使用相对数时需要注意指标的可比性,同时要与总量指标(绝对数)结合使用。
33、百分比(percent)百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
百分比通常采用百分号(%)来表示,如8%,50%,168%等。
由于百分比的分母都是100,也就是都以1%作为度量单位,因此便于比较,在数据分析中的应用非常广泛。
34、百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。
常有人混淆了百分比与百分点的概念。
表示构成的变动幅度不宜用百分数,而应用百分点。
35、比例是指在总体中,各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比如A班共有学生50人,男生30人,女生20人,则男生的比例是30/50,女生的比例是20/50。
由此可以看出,比例的基数(也就是分母)都是全体学生人数,即为同一个基数。
36、比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
比如A班共有学生50人,男生30人,女生20人,则男生与女生的比率是30/20,这一指标经常会用在社会经济领域,比如我国的人口性别比就是用每100名女性数量相对的男性数量来表示的。
37、倍数是一个数除以另一个数所得的商。
如A÷B=C,就是说A是B的C倍。
需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。
38、番数是指原来数量的2的N次方倍。
比如翻一番为原来数量的2倍(2的1次方),翻两番为4倍(2的2次方)。
39、同比为与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。
例如2010年12月与2009年12月相比。
40、环比为与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。
例如2010年12月与2010年11月相比。
Welcome To Download !!!欢迎您的下载,资料仅供参考!。