Point estimation and interval estimation
可信区间
在区间估计中,总体参数虽未知,但却 是固定的值(且只有一个),而不是随 机变量值 。
-2
11 12 13 14 15
0.25 0.50
1.000 0.816 0.765 0.741 0.727
0.718 0.711 0.706 0.703 0.700
0.697 0.695 0.694 0.692 0.691
0.20 0.40
1.376 1.061 0.978 0.941 0.920
0.906 0.896 0.889 0.883 0.879
3.143 2.998 2.896 2.821 2.764
1.796 1.782 1.771 1.761 1.753
2.201 2.179 2.160 2.145 2.131
2.718 2.681 2.650 2.624 2.602
-t
0
t
0.005 0.01
63.657 9.925 5.841 4.604 4.032
点估计
直接用样本统计量作为总体参数的估计值
–方法简单,但未考虑抽样误差的大小 –在实际问题中,总体参数往往是未知的,但它们
是固定的值,并不是随机变量值。而样本统计量 随样本的不同而不同,属随机的。
区间估计
按一定的概率或可信度(1- )用一个区间估计
总体参数所在范围,这个范围称作可信度为1-
的可信区间(confidence interval, CI),又称置
4.437 4.318 4.221 4.140 4.073
单侧检验和双侧检验单侧检验和双侧检验
断。
统计推断(statistical infere
组别
有效例数 无效例数
合计
A药
80
20
100
B药
60
40
100
合计
140
60
200
有效率 (%) 80.0 60.0 70.0
P1 >P2 → π1 >π2 ?
统计推断(statistical inference)
无效假设(null hypothesis)H0 : π1=π2 备择假设(alternative hypothesis) H1 :π1≠π2 然后根据检验假设, π1=π2=70%,成立的情况 下,计算由于抽样误差得到目前样本及更极端情况 的可能性大小。本例用卡方检验,得到检验统计量 χ2=9.524,根据检验统计量的分布计算概率(可 能性大小)P值,P=0.002,可能性很小。
统计推断指用样本推断总体。 总体(population):一个统计问题所研究对象的全体。
总体中每一个研究对象称为个体(individual)。 有限总体:有确定的时间和空间范围,总体内观察单
位是有限的。 无限总体:没有时间和空间范围限制,因而观察单位
数无限。
统计推断(statistical inference)
统计推断(statistical inference)
概率论认为:在一次试验中小概率事件不可能发生。 在统计 中,一 般公认 为 P≤0.05为小 概 率 。本 例 P=0.002<0.05,因此可认为假如π1=π2,即使抽 样误差也不可能得到目前样本,于是检验假设, π1 = π2 不 成 立 ; 与 检 验 假 设 对 立 的 备 择 假 设 成 立 , 即π1≠π2 ,A药组的总体有效率不同于B药组的总 体有效率,从本例情况,A药组的总体有效率大于 B药组的总体有效率。
名词解释(谢哲宇修改
Chapter 1Statistics(统计学):研究数据资料的收集、整理、分析和解释(interpretation)的科学。
Biostatistics(生物统计学):统计学应用于生物科学Variable(变量):指某种特征,它的表现在不同个体间或不同组间存在变异性。
Observation(观测值):指对变量的表现进行观察或测量所获得的数值,有时也被称为变数(variate)Population(总体):又叫“统计总体”,是指一个统计问题研究对象的全体,它是具有某种(或某些)共同特征的元素的集合。
Individual(个体):总体中每一个研究对象称作个体。
Sample(样本):从总体中按一定方法抽取部分具有代表性的个体,这部分个体称为样本。
Parameter(参数):描述总体特征的数,如总体平均数、总体方差等。
Statistic(统计量):描述样本特征的量,如样本平均数、样本方差、样本相关系数等。
Accuracy(准确性):指观测值或估计值与真值的接近程度。
Precision(精确性):对同一物体的重复观察值或估计值彼此之间的接近程度。
Chapter 2Raw data(直接数据):数据调查与实验未经处理的数据;Continuous data(连续性数据):指在一定范围内可取任何实数值的数据。
Discrete data(离散性数据):在一定范围内只能取有限种可能值的数据。
Count data(计数数据):用计数的方式得到的数据资料,必须用整数来表示。
Classification data(分类资料):可自然的或人为的分为2个或多个不同类别的资料。
例如:男生记做1 女生记做2频数(率)分布(frequency distribution);;下四分位数(lower quartile);中位数(median);上四分位数(upper quartile);条形图(bar chart);直方图(histogram);饼图(pie chart);散点图(scatter plot),组间距(interval)Percentile(百分位数):一组n个观测值按数值大小排列,小于某数值的数据个数占全体个数的x%,则为x%分位数。
第四章 参数的区间估计(Confidence Interval Estimation)
Chap 4-34
PHStat用于解决此类问题
PHStat | confidence intervals | estimate for the population total Excel spreadsheet for the voucher example
第四章 参数的区间估计 (Confidence Interval Estimation)
阅读教材:第7章
Chap 4-1
本章概要
估计的步骤(Estimation process) 点估计(Point estimates) 区间估计(Interval estimates) 均值的置信区间( 已知) 样本容量的确定(Determining sample size) 均值的置信区间 ( 未知) 比例的置信区间
n
) 1
Chap 4-9
区间估计的要素
置信度
区间内包含未知总体参数的确定程度 与未知参数的接近程度 获得容量为 n 的样本所需付出的代价
精度
成本
Chap 4-10
置信度
以 100 1 %表示,如:90%,95%,99% 相对频率意义上的解释
从长期来看, 所构建的所有置信区间中,100 1 % 的置信区间都将含有未知参数,即未知参数落入区间的 概率;
n
( z 2 ) (1 )
2
E2
其中: E z 2
(1 )
n
2. 3.
E的取值一般小于0.1 (=p) 未知时,可取最大值0.5
[教育]应用统计方法第二章参数估计
统计方法
统计方法
统计方法
统计方法 •2.3.3 Bayes估计
统计方法
统计方法
统计方法
•注:假如不用先验信息,只用样本和总体信息,那么事件A 发生的概率的最大似然估计为:
•例如:在产品抽检中,只区分合格品与不合格品,对质 量好的一批产品,抽检的产品常为合格品. • 但“抽检3个全为合格品” • “抽检的10个全为合格品”(更信得过)
本章中介绍了参数估计的基本方法。
参数的估计有点估计、贝叶斯估计和区间估计。矩估计法和 极大似然估计法是求参数的点估计量的两种最基本的方法, 务必牢固掌握。衡量估计量好坏的标准有无偏性,最小方差 无偏估计,有效性和相合性(一致性)等,要学会验证一个 估计量是符合哪种标准的估计量,这对了解估计量的特性是 非常重要的。
•(3)先验信息:抽样或试验之前有关统计问题的一些信息.一般说来,
•先验信息来自经验或历史资料.先验信息在日常生活和工作中是很 重要的
统计方法
•Bayes统计学:基于三种信息所进行的统计推断的统计学
•Bayes统计重视总体信息和样本信息的同时,还注意先验 信息的收集,挖掘和加工,使它数量化,形成先验分布,参加到 统计推断中来.以提高统计推断的质量,忽略先验信息的利 用,有时是一种浪费,有时还会导出不合理的结论. •Bayes学派的基本观点:任一未知参数都可以看成随机变量, 可用一个概率分布去描述,这个分布称为先验分布.在获得样 本之后,总体分布,样本,和先验分布通过Bayes公式结合起来 得到关于未知参数的新的分布…..后验分布
当样本符合或接近统计模型的假设时, 该估计应有好的或较好的估计效果;当 样本偏离偏离模型的假设时,即受到干 扰时,该估计量应具有一定的抗干扰能 力而不至于使估计效果变得太坏。
统计学之估计与置信区间(英文版)
17
Example: Confidence Interval for a Mean – σ Known
The American Management Association wishes to have information on the mean income of middle managers in the retail industry. A random sample of 256 managers reveals a sample mean of $45,420. The standard deviation of this population is $2,050. The association would like answers to the following questions:
5. Construct a confidence interval for a population proportion(总体比例).
6. Determine the sample size for attribute and variable sampling.
4
Point Estimates and Confidence Intervals for a Mean
7
Population Standard Deviation (σ) Known
A confidence interval estimate is a range of values constructed from sample data so that the population parameter is likely to occur within that range at a specified probability. The specified probability is called the level of confidence(置信水平).
CFA考试必考点精讲-数量分析方法:抽样与估计考点解析
CFA考试必考点精讲-数量分析方法:抽样与估计考点解析对于很多想参加CFA考试的同学来说,对于CFA的考试内容还不是很了解。
我就为大家分享一下CFA考试的考试科目:1、道德与职业行为标准(Ethics and Professional Standards)2、定量分析(Quantitative)3、经济学(Economics)4、财务报表分析(Financial Statement Analysis)5、公司理财(Corporate Finance)6、权益投资(Equity Investments)7、固定收益投资(Fixed Income)8、衍生工具(Derivatives)9、其他类投资(Alternative Investments)10、投资组合管理(Portfolio Management)推断统计是研究如何利用样本数据来推断总体特征的统计方法。
可以分为三个步骤:✔抽样(sampling):采取一定的方法从总体中抽取一部分个体,组成样本(我们可以从总体中获得无数个样本);✔估计(estimation):根据样本信息估计总体特征;✔假设检验(hypothesis test):利用样本信息判断在一定的置信水平下对总体的假设是否成立。
详述:抽样当总体中个体数量非常大时,我们不可能对个体进行一一观测。
例如,想要了解中国人的平均身高,我们就不可能对13亿人口都进行问卷调查,这时就需要进行抽样。
简单随机抽样假设一个总体内包含N个个体,如果通过逐个抽取的方法从中抽取n个个体组成一个样本,并且每次抽取时每个个体被抽到的概率相等,那么这样的抽样方法叫做简单随机抽样。
简单随机抽样的特征:✔每个个体被抽中的概率相等,个体之间是完全独立的。
✔总体个数N是有限的。
✔样本数n小于等于样本总体的个数N。
✔样本是逐个抽取的。
✔简单随机抽样是一种不放回的抽样。
分层随机抽样分层随机抽样首先将个体按一定的标准分为几类(或几层);然后根据各类型个体数与总个体数的比例,确定每个类型应该抽取多少个个体;最后,根据随机抽样原则,从各类型中抽取相应数量的个体,组成最终的样本。
统计学术语中英文对照09134
population 母体sample 样本census 普查sampling 抽样quantitative 量的qualitative/categorical质的discrete 离散的continuous 连续的population parameters 母体参数sample statistics 样本统计量descriptive statistics 叙述统计学inferential/inductivestatistics 推论 ...抽样调查(sampliing survey单纯随机抽样(simple randomsampling系统抽样(systematic sampling分层抽样(stratified sampling整群抽样(cluster sampling多级抽样(multistage sampling常态分配(ParametricStatistics)无母数统计学(NonparametricStatistics)实验设计(Design of Experiment)参数(Parameter)Data analysis 资料分析Statistical table 统计表Statistical chart 统计图Pie chart 圆饼图Stem-and-leaf display 茎叶图Box plot 盒须图Histogram 直方图Bar Chart 长条图Polygon 次数多边图Ogive 肩形图Descriptive statistics 叙述统计学Expectation 期望值Mode 众数Mean 平均数Variance 变异数Standard deviation 标准差Standard error 标准误Covariance matrix 共变异数矩阵Inferential statistics 推论统计学Point estimation 点估计Interval estimation 区间估计Confidence interval 信赖区间Confidence coefficient 信赖系数Testing statistical hypothesis统计假设检定Regression analysis 回归分析Analysis of variance 变异数分析Correlation coefficient 相关系数Sampling survey 抽样调查Census 普查Sampling 抽样Reliability 信度Validity 效度Sampling error 抽样误差Non-sampling error 非抽样误差Random sampling 随机抽样Simple random sampling 简单随机抽样法Stratified sampling 分层抽样法Cluster sampling 群集抽样法Systematic sampling 系统抽样法Two-stage random sampling 两段随机抽样法Convenience sampling 便利抽样Quota sampling 配额抽样Snowball sampling 雪球抽样Nonparametric statistics 无母数统计The sign test 等级检定Wilcoxon signed rank tests 魏克森讯号等级检定Wilcoxon rank sum tests 魏克森等级和检定Run test 连检定法Discrete uniform densities 离散的均匀密度Binomial densities 二项密度Hypergeometric densities 超几何密度Poisson densities 卜松密度Geometric densities 几何密度Negative binomial densities 负二项密度Continuous uniform densities连续均匀密度Normal densities 常态密度Exponential densities 指数密度Gamma densities 伽玛密度Beta densities 贝他密度Multivariate analysis 多变量分析Principal components 主因子分析Discrimination analysis 区别分析Cluster analysis 群集分析Factor analysis 因素分析Survival analysis 存活分析Time series analysis 时间序列分析Linear models 线性模式Quality engineering 品质工程Probability theory 机率论Statistical computing 统计计算Statistical inference 统计推论Stochastic processes 随机过程Decision theory 决策理论Discrete analysis 离散分析Mathematical statistics 数理统计统计学 : Statistics母体 : Population样本 : Sample资料分析 : Data analysis统计表 : Statistical table统计图 : Statistical chart圆饼图 : Pie chart茎叶图 : Stem-and-leaf display盒须图 : Box plot直方图 : Histogram长条图 : Bar Chart次数多边图 : Polygon肩形图 : Ogive叙述统计学: Descriptive statistics期望值 : Expectation众数 : Mode平均数 : Mean变异数 : Variance标准差 : Standard deviation标准误 : Standard error共变异数矩阵: Covariancematrix推论统计学: Inferentialstatistics点估计 : Point estimation区间估计 : Interval estimation信赖区间 : Confidence interval信赖系数: Confidencecoefficient统计假设检定: Testingstatistical hypothesis回归分析 : Regression analysis变异数分析: Analysis ofvariance相关系数: Correlationcoefficient抽样调查 : Sampling survey普查 : Census抽样 : Sampling信度 : Reliability效度 : Validity抽样误差 : Sampling error非抽样误差: Non-sampling error随机抽样 : Random sampling简单随机抽样法 : Simple random sampling分层抽样法: Stratified sampling群集抽样法 : Cluster sampling系统抽样法: Systematicsampling两段随机抽样法: Two-stagerandom sampling便利抽样: Conveniencesampling配额抽样 : Quota sampling雪球抽样 : Snowball sampling无母数统计: Nonparametricstatistics等级检定 : The sign test魏克森讯号等级检定 : Wilcoxonsigned rank tests魏克森等级和检定 : Wilcoxonrank sum tests连检定法 : Run test离散的均匀密度: Discreteuniform densities二项密度 : Binomial densities超几何密度 : Hypergeometricdensities卜松密度 : Poisson densities几何密度 : Geometric densities负二项密度 : Negative binomial densities连续均匀密度: Continuous uniform densities常态密度 : Normal densities指数密度: Exponential densities伽玛密度 : Gamma densities贝他密度 : Beta densities多变量分析: Multivariateanalysis主因子分析: Principalcomponents区别分析: Discriminationanalysis群集分析 : Cluster analysis因素分析 : Factor analysis存活分析 : Survival analysis时间序列分析: Time seriesanalysis线性模式 : Linear models品质工程 : Quality engineering机率论 : Probability theory统计计算: Statisticalcomputing统计推论: Statisticalinference随机过程: Stochasticprocesses决策理论 : Decision theory离散分析 : Discrete analysis数理统计: Mathematical statistics统计名词市调辞典众数(Mode) 普查(census)指数(Index) 问卷(Questionnaire)中位数(Median) 信度(Reliability)百分比(Percentage) 母群体(Population)信赖水准(Confidence level) 观察法(Observational Survey)假设检定(Hypothesis Testing)综合法(Integrated Survey)卡方检定(Chi-square Test) 雪球抽样(Snowball Sampling)差距量表(Interval Scale) 序列偏差(Series Bias)类别量表(Nominal Scale) 次级资料(Secondary Data)顺序量表(Ordinal Scale) 抽样架构(Sampling frame)比率量表(Ratio Scale) 集群抽样(Cluster Sampling)连检定法(Run Test) 便利抽样(Convenience Sampling)符号检定(Sign Test) 抽样调查(Sampling Sur)算术平均数(Arithmetic Mean)非抽样误差(non-sampling error)展示会法(Display Survey)调查名词准确效度(Criterion-Related Validity)元素(Element) 邮寄问卷法(MailInterview)样本(Sample) 信抽样误差(Sampling error)效度(Validity) 封闭式问题(Close Question)精确度(Precision) 电话访问法(Telephone Interview)准确度(Validity) 随机抽样法(Random Sampling)实验法(Experiment Survey)抽样单位(Sampling unit) 资讯名词市场调查(Marketing Research) 决策树(Decision Trees)容忍误差(Tolerated erro) 资料采矿(Data Mining)初级资料(Primary Data) 时间序列(Time-Series Forecasting)目标母体(Target Population)回归分析(Regression)抽样偏差(Sampling Bias) 趋势分析(Trend Analysis)抽样误差(sampling error) 罗吉斯回归(Logistic Regression)架构效度(Construct Validity)类神经网络(Neural Network)配额抽样(Quota Sampling) 无母数统计检定方法(Non-ParametricTest)人员访问法(Interview) 判别分析法(Discriminant Analysis)集群分析法(cluster analysis)规则归纳法(Rules Induction)内容效度(Content Validity) 判断抽样(Judgment Sampling)开放式问题(Open Question)OLAP(Online Analytical Process)分层随机抽样(StratifiedRandom sampling) 资料仓储(DataWarehouse)非随机抽样法(NonrandomSampling) 知识发现(KnowledgeDiscoveryAbsolute deviation, 绝对离差Absolute number, 绝对数Absolute residuals, 绝对残差Acceleration array, 加速度立体阵Acceleration in an arbitrary direction, 任意方向上的加速度Acceleration normal, 法向加速度Acceleration space dimension, 加速度空间的维数Acceleration tangential, 切向加速度Acceleration vector, 加速度向量Acceptable hypothesis, 可接受假设Accumulation, 累积Accuracy, 准确度Actual frequency, 实际频数Adaptive estimator, 自适应估计量Addition, 相加Addition theorem, 加法定理Additive Noise, 加性噪声Additivity, 可加性Adjusted rate, 调整率Adjusted value, 校正值Admissible error, 容许误差Aggregation, 聚集性Alpha factoring,α因子法Alternative hypothesis, 备择假设Among groups, 组间Amounts, 总量Analysis of correlation, 相关分析Analysis of covariance, 协方差分析Analysis Of Effects, 效应分析Analysis Of Variance, 方差分析Analysis of regression, 回归分析Analysis of time series, 时间序列分析Analysis of variance, 方差分析Angular transformation, 角转换ANOVA (analysis of variance), 方差分析ANOVA Models, 方差分析模型ANOVA table and eta, 分组计算方差分析Arcing, 弧/弧旋Arcsine transformation, 反正弦变换Area 区域图Area under the curve, 曲线面积AREG , 评估从一个时间点到下一个时间点回归相关时的误差ARIMA, 季节和非季节性单变量模型的极大似然估计Arithmetic grid paper, 算术格纸Arithmetic mean, 算术平均数Arrhenius relation, 艾恩尼斯关系Assessing fit, 拟合的评估Associative laws, 结合律Asymmetric distribution, 非对称分布Asymptotic bias, 渐近偏倚Asymptotic efficiency, 渐近效率Asymptotic variance, 渐近方差Attributable risk, 归因危险度Attribute data, 属性资料Attribution, 属性Autocorrelation, 自相关Autocorrelation of residuals, 残差的自相关Average, 平均数Average confidence interval length, 平均置信区间长度Average growth rate, 平均增长率Bar chart, 条形图Bar graph, 条形图Base period, 基期Bayes' theorem , Bayes定理Bell-shaped curve, 钟形曲线Bernoulli distribution, 伯努力分布Best-trim estimator, 最好切尾估计量Bias, 偏性Binary logistic regression, 二元逻辑斯蒂回归Binomial distribution, 二项分布Bisquare, 双平方Bivariate Correlate, 二变量相关Bivariate normal distribution, 双变量正态分布Bivariate normal population, 双变量正态总体Biweight interval, 双权区间Biweight M-estimator, 双权M估计量Block, 区组/配伍组BMDP(Biomedical computer programs),BMDP统计软件包Boxplots, 箱线图/箱尾图Breakdown bound, 崩溃界/崩溃点Canonical correlation, 典型相关Caption, 纵标目Case-control study, 病例对照研究Categorical variable, 分类变量Catenary, 悬链线Cauchy distribution, 柯西分布Cause-and-effect relationship, 因果关系Cell, 单元Censoring, 终检Center of symmetry, 对称中心Centering and scaling, 中心化和定标Central tendency, 集中趋势Central value, 中心值CHAID -χ2 Automatic Interaction Detector, 卡方自动交互检测Chance, 机遇Chance error, 随机误差Chance variable, 随机变量Characteristic equation, 特征方程Characteristic root, 特征根Characteristic vector, 特征向量Chebshev criterion of fit, 拟合的切比雪夫准则Chernoff faces, 切尔诺夫脸谱图Chi-square test, 卡方检验/χ2检验Choleskey decomposition, 乔洛斯基分解Circle chart, 圆图Class interval, 组距Class mid-value, 组中值Class upper limit, 组上限Classified variable, 分类变量Cluster analysis, 聚类分析Cluster sampling, 整群抽样Code, 代码Coded data, 编码数据Coding, 编码Coefficient of contingency, 列联系数Coefficient of determination, 决定系数Coefficient of multiple correlation, 多重相关系数Coefficient of partial correlation, 偏相关系数Coefficient of production-moment correlation, 积差相关系数Coefficient of rank correlation, 等级相关系数Coefficient of regression, 回归系数Coefficient of skewness, 偏度系数Coefficient of variation, 变异系数Cohort study, 队列研究Collinearity, 共线性Column, 列Column effect, 列效应Column factor, 列因素Combination pool, 合并Combinative table, 组合表Common factor, 共性因子Common regression coefficient, 公共回归系数Common value, 共同值Common variance, 公共方差Common variation, 公共变异Communality variance, 共性方差Comparability, 可比性Comparison of bathes, 批比较Comparison value, 比较值Compartment model, 分部模型Compassion, 伸缩Complement of an event, 补事件Complete association, 完全正相关Complete dissociation, 完全不相关Complete statistics, 完备统计量Completely randomized design, 完全随机化设计Composite event, 联合事件Composite events, 复合事件Concavity, 凹性Conditional expectation, 条件期望Conditional likelihood, 条件似然Conditional probability, 条件概率Conditionally linear, 依条件线性Confidence interval, 置信区间Confidence limit, 置信限Confidence lower limit, 置信下限Confidence upper limit, 置信上限Confirmatory Factor Analysis , 验证性因子分析Confirmatory research, 证实性实验研究Confounding factor, 混杂因素Conjoint, 联合分析Consistency, 相合性Consistency check, 一致性检验Consistent asymptotically normalestimate, 相合渐近正态估计Consistent estimate, 相合估计Constrained nonlinear regression,受约束非线性回归Constraint, 约束Contaminated distribution, 污染分布Contaminated Gausssian, 污染高斯分布Contaminated normal distribution,污染正态分布Contamination, 污染Contamination model, 污染模型Contingency table, 列联表Contour, 边界线Contribution rate, 贡献率Control, 对照, 质量控制图Controlled experiments, 对照实验Conventional depth, 常规深度Convolution, 卷积Corrected factor, 校正因子Corrected mean, 校正均值Correction coefficient, 校正系数Correctness, 正确性Correlation coefficient, 相关系数Correlation, 相关性Correlation index, 相关指数Correspondence, 对应Counting, 计数Counts, 计数/频数Covariance, 协方差Covariant, 共变Cox Regression, Cox回归Criteria for fitting, 拟合准则Criteria of least squares, 最小二乘准则Critical ratio, 临界比Critical region, 拒绝域Critical value, 临界值Cross-over design, 交叉设计Cross-section analysis, 横断面分析Cross-section survey, 横断面调查Crosstabs , 交叉表Crosstabs 列联表分析Cross-tabulation table, 复合表Cube root, 立方根Cumulative distribution function, 分布函数Cumulative probability, 累计概率Curvature, 曲率/弯曲Curvature, 曲率Curve Estimation, 曲线拟合Curve fit , 曲线拟和Curve fitting, 曲线拟合Curvilinear regression, 曲线回归Curvilinear relation, 曲线关系Cut-and-try method, 尝试法Cycle, 周期Cyclist, 周期性D test, D检验Data acquisition, 资料收集Data bank, 数据库Data capacity, 数据容量Data deficiencies, 数据缺乏Data handling, 数据处理Data manipulation, 数据处理Data processing, 数据处理Data reduction, 数据缩减Data set, 数据集Data sources, 数据来源Data transformation, 数据变换Data validity, 数据有效性Data-in, 数据输入Data-out, 数据输出Dead time, 停滞期Degree of freedom, 自由度Degree of precision, 精密度Degree of reliability, 可靠性程度Degression, 递减Density function, 密度函数Density of data points, 数据点的密度Dependent variable, 应变量/依变量/因变量Dependent variable, 因变量Depth, 深度Derivative matrix, 导数矩阵Derivative-free methods, 无导数方法Design, 设计Determinacy, 确定性Determinant, 行列式Determinant, 决定因素Deviation, 离差Deviation from average, 离均差Diagnostic plot, 诊断图Dichotomous variable, 二分变量Differential equation, 微分方程Direct standardization, 直接标准化法Direct Oblimin, 斜交旋转Discrete variable, 离散型变量DISCRIMINANT, 判断Discriminant analysis, 判别分析Discriminant coefficient, 判别系数Discriminant function, 判别值Dispersion, 散布/分散度Disproportional, 不成比例的Disproportionate sub-class numbers,不成比例次级组含量Distribution free, 分布无关性/免分布Distribution shape, 分布形状Distribution-free method, 任意分布法Distributive laws, 分配律Disturbance, 随机扰动项Dose response curve, 剂量反应曲线Double blind method, 双盲法Double blind trial, 双盲试验Double exponential distribution, 双指数分布Double logarithmic, 双对数Downward rank, 降秩Dual-space plot, 对偶空间图DUD, 无导数方法Duncan's new multiple range method,新复极差法/Duncan新法Error Bar, 均值相关区间图Effect, 实验效应Eigenvalue, 特征值Eigenvector, 特征向量Ellipse, 椭圆Empirical distribution, 经验分布Empirical probability, 经验概率单位Enumeration data, 计数资料Equal sun-class number, 相等次级组含量Equally likely, 等可能Equivariance, 同变性Error, 误差/错误Error of estimate, 估计误差Error type I, 第一类错误Error type II, 第二类错误Estimand, 被估量Estimated error mean squares, 估计误差均方Estimated error sum of squares, 估计误差平方和Euclidean distance, 欧式距离Event, 事件Event, 事件Exceptional data point, 异常数据点Expectation plane, 期望平面Expectation surface, 期望曲面Expected values, 期望值Experiment, 实验Experimental sampling, 试验抽样Experimental unit, 试验单位Explained variance (已说明方差)Explanatory variable, 说明变量Exploratory data analysis, 探索性数据分析Explore Summarize, 探索-摘要Exponential curve, 指数曲线Exponential growth, 指数式增长EXSMOOTH, 指数平滑方法Extended fit, 扩充拟合Extra parameter, 附加参数Extrapolation, 外推法Extreme observation, 末端观测值Extremes, 极端值/极值F distribution, F分布F test, F检验Factor, 因素/因子Factor analysis, 因子分析Factor Analysis, 因子分析Factor score, 因子得分Factorial, 阶乘Factorial design, 析因试验设计False negative, 假阴性False negative error, 假阴性错误Family of distributions, 分布族Family of estimators, 估计量族Fanning, 扇面Fatality rate, 病死率Field investigation, 现场调查Field survey, 现场调查Finite population, 有限总体Finite-sample, 有限样本First derivative, 一阶导数First principal component, 第一主成分First quartile, 第一四分位数Fisher information, 费雪信息量Fitted value, 拟合值Fitting a curve, 曲线拟合Fixed base, 定基Fluctuation, 随机起伏Forecast, 预测Four fold table, 四格表Fourth, 四分点Fraction blow, 左侧比率Fractional error, 相对误差Frequency, 频率Frequency polygon, 频数多边图Frontier point, 界限点Function relationship, 泛函关系Gamma distribution, 伽玛分布Gauss increment, 高斯增量Gaussian distribution, 高斯分布/正态分布Gauss-Newton increment, 高斯-牛顿增量General census, 全面普查Generalized least squares, 综合最小平方法GENLOG (Generalized liner models), 广义线性模型Geometric mean, 几何平均数Gini's mean difference, 基尼均差GLM (General liner models), 通用线性模型Goodness of fit, 拟和优度/配合度Gradient of determinant, 行列式的梯度Graeco-Latin square, 希腊拉丁方Grand mean, 总均值Gross errors, 重大错误Gross-error sensitivity, 大错敏感度Group averages, 分组平均Grouped data, 分组资料Guessed mean, 假定平均数Half-life, 半衰期Hampel M-estimators, 汉佩尔M估计量Happenstance, 偶然事件Harmonic mean, 调和均数Hazard function, 风险均数Hazard rate, 风险率Heading, 标目Heavy-tailed distribution, 重尾分布Hessian array, 海森立体阵Heterogeneity, 不同质Heterogeneity of variance, 方差不齐Hierarchical classification, 组内分组Hierarchical clustering method, 系统聚类法High-leverage point, 高杠杆率点High-Low, 低区域图Higher Order Interaction Effects,高阶交互作用HILOGLINEAR, 多维列联表的层次对数线性模型Hinge, 折叶点Histogram, 直方图Historical cohort study, 历史性队列研究Holes, 空洞HOMALS, 多重响应分析Homogeneity of variance, 方差齐性Homogeneity test, 齐性检验Huber M-estimators, 休伯M估计量Hyperbola, 双曲线Hypothesis testing, 假设检验Hypothetical universe, 假设总体Image factoring,, 多元回归法Impossible event, 不可能事件Independence, 独立性Independent variable, 自变量Index, 指标/指数Indirect standardization, 间接标准化法Individual, 个体Inference band, 推断带Infinite population, 无限总体Infinitely great, 无穷大Infinitely small, 无穷小Influence curve, 影响曲线Information capacity, 信息容量Initial condition, 初始条件Initial estimate, 初始估计值Initial level, 最初水平Interaction, 交互作用Interaction terms, 交互作用项Intercept, 截距Interpolation, 内插法Interquartile range, 四分位距Interval estimation, 区间估计Intervals of equal probability, 等概率区间Intrinsic curvature, 固有曲率Invariance, 不变性Inverse matrix, 逆矩阵Inverse probability, 逆概率Inverse sine transformation, 反正弦变换Iteration, 迭代Jacobian determinant, 雅可比行列式Joint distribution function, 分布函数Joint probability, 联合概率Joint probability distribution, 联合概率分布K-Means Cluster逐步聚类分析K means method, 逐步聚类法Kaplan-Meier, 评估事件的时间长度Kaplan-Merier chart, Kaplan-Merier图Kendall's rank correlation,Kendall等级相关Kinetic, 动力学Kolmogorov-Smirnove test, 柯尔莫哥洛夫-斯米尔诺夫检验Kruskal and Wallis test, Kruskal及Wallis检验/多样本的秩和检验/H检验Kurtosis, 峰度Lack of fit, 失拟Ladder of powers, 幂阶梯Lag, 滞后Large sample, 大样本Large sample test, 大样本检验Latin square, 拉丁方Latin square design, 拉丁方设计Leakage, 泄漏Least favorable configuration, 最不利构形Least favorable distribution, 最不利分布Least significant difference, 最小显著差法Least square method, 最小二乘法Least Squared Criterion,最小二乘方准则Least-absolute-residualsestimates, 最小绝对残差估计Least-absolute-residuals fit, 最小绝对残差拟合Least-absolute-residuals line, 最小绝对残差线Legend, 图例L-estimator, L估计量L-estimator of location, 位置L估计量L-estimator of scale, 尺度L估计量Level, 水平Leveage Correction,杠杆率校正Life expectance, 预期期望寿命Life table, 寿命表Life table method, 生命表法Light-tailed distribution, 轻尾分布Likelihood function, 似然函数Likelihood ratio, 似然比line graph, 线图Linear correlation, 直线相关Linear equation, 线性方程Linear programming, 线性规划Linear regression, 直线回归Linear Regression, 线性回归Linear trend, 线性趋势Loading, 载荷Location and scale equivariance, 位置尺度同变性Location equivariance, 位置同变性Location invariance, 位置不变性Location scale family, 位置尺度族Log rank test, 时序检验Logarithmic curve, 对数曲线Logarithmic normal distribution,对数正态分布Logarithmic scale, 对数尺度Logarithmic transformation, 对数变换Logic check, 逻辑检查Logistic distribution, 逻辑斯特分布Logit transformation, Logit转换LOGLINEAR, 多维列联表通用模型Lognormal distribution, 对数正态分布Lost function, 损失函数Low correlation, 低度相关Lower limit, 下限Lowest-attained variance, 最小可达方差LSD, 最小显著差法的简称Lurking variable, 潜在变量Main effect, 主效应Major heading, 主辞标目Marginal density function, 边缘密度函数Marginal probability, 边缘概率Marginal probability distribution, 边缘概率分布Matched data, 配对资料Matched distribution, 匹配过分布Matching of distribution, 分布的匹配Matching of transformation, 变换的匹配Mathematical expectation, 数学期望Mathematical model, 数学模型Maximum L-estimator, 极大极小L 估计量Maximum likelihood method, 最大似然法Mean, 均数Mean squares between groups, 组间均方Mean squares within group, 组内均方Means (Compare means), 均值-均值比较Median, 中位数Median effective dose, 半数效量Median lethal dose, 半数致死量Median polish, 中位数平滑Median test, 中位数检验Minimal sufficient statistic, 最小充分统计量Minimum distance estimation, 最小距离估计Minimum effective dose, 最小有效量Minimum lethal dose, 最小致死量Minimum variance estimator, 最小方差估计量MINITAB, 统计软件包Minor heading, 宾词标目Missing data, 缺失值Model specification, 模型的确定Modeling Statistics , 模型统计Models for outliers, 离群值模型Modifying the model, 模型的修正Modulus of continuity, 连续性模Morbidity, 发病率Most favorable configuration, 最有利构形MSC(多元散射校正)Multidimensional Scaling (ASCAL),多维尺度/多维标度Multinomial Logistic Regression ,多项逻辑斯蒂回归Multiple comparison, 多重比较Multiple correlation , 复相关Multiple covariance, 多元协方差Multiple linear regression, 多元线性回归Multiple response , 多重选项Multiple solutions, 多解Multiplication theorem, 乘法定理Multiresponse, 多元响应Multi-stage sampling, 多阶段抽样Multivariate T distribution, 多元T分布Mutual exclusive, 互不相容Mutual independence, 互相独立Natural boundary, 自然边界Natural dead, 自然死亡Natural zero, 自然零Negative correlation, 负相关Negative linear correlation, 负线性相关Negatively skewed, 负偏Newman-Keuls method, q检验NK method, q检验No statistical significance, 无统计意义Nominal variable, 名义变量Nonconstancy of variability, 变异的非定常性Nonlinear regression, 非线性相关Nonparametric statistics, 非参数统计Nonparametric test, 非参数检验Nonparametric tests, 非参数检验Normal deviate, 正态离差Normal distribution, 正态分布Normal equation, 正规方程组Normal P-P, 正态概率分布图Normal Q-Q, 正态概率单位分布图Normal ranges, 正常范围Normal value, 正常值Normalization 归一化Nuisance parameter, 多余参数/讨厌参数Null hypothesis, 无效假设Numerical variable, 数值变量Objective function, 目标函数Observation unit, 观察单位Observed value, 观察值One sided test, 单侧检验One-way analysis of variance, 单因素方差分析Oneway ANOVA , 单因素方差分析Open sequential trial, 开放型序贯设计Optrim, 优切尾Optrim efficiency, 优切尾效率Order statistics, 顺序统计量Ordered categories, 有序分类Ordinal logistic regression , 序数逻辑斯蒂回归Ordinal variable, 有序变量Orthogonal basis, 正交基Orthogonal design, 正交试验设计Orthogonality conditions, 正交条件ORTHOPLAN, 正交设计Outlier cutoffs, 离群值截断点Outliers, 极端值OVERALS , 多组变量的非线性正规相关Overshoot, 迭代过度Paired design, 配对设计Paired sample, 配对样本Pairwise slopes, 成对斜率Parabola, 抛物线Parallel tests, 平行试验Parameter, 参数Parametric statistics, 参数统计Parametric test, 参数检验Pareto, 直条构成线图(又称佩尔托图)Partial correlation, 偏相关Partial regression, 偏回归Partial sorting, 偏排序Partials residuals, 偏残差Pattern, 模式PCA(主成分分析)Pearson curves, 皮尔逊曲线Peeling, 退层Percent bar graph, 百分条形图Percentage, 百分比Percentile, 百分位数Percentile curves, 百分位曲线Periodicity, 周期性Permutation, 排列P-estimator, P估计量Pie graph, 构成图,饼图Pitman estimator, 皮特曼估计量Pivot, 枢轴量Planar, 平坦Planar assumption, 平面的假设PLANCARDS, 生成试验的计划卡PLS(偏最小二乘法)Point estimation, 点估计Poisson distribution, 泊松分布Polishing, 平滑Polled standard deviation, 合并标准差Polled variance, 合并方差Polygon, 多边图Polynomial, 多项式Polynomial curve, 多项式曲线Population, 总体Population attributable risk, 人群归因危险度Positive correlation, 正相关Positively skewed, 正偏Posterior distribution, 后验分布Power of a test, 检验效能Precision, 精密度Predicted value, 预测值Preliminary analysis, 预备性分析Principal axis factoring,主轴因子法Principal component analysis, 主成分分析Prior distribution, 先验分布Prior probability, 先验概率Probabilistic model, 概率模型probability, 概率Probability density, 概率密度Product moment, 乘积矩/协方差Profile trace, 截面迹图Proportion, 比/构成比Proportion allocation instratified random sampling, 按比例分层随机抽样Proportionate, 成比例Proportionate sub-class numbers,成比例次级组含量Prospective study, 前瞻性调查Proximities, 亲近性Pseudo F test, 近似F检验Pseudo model, 近似模型Pseudosigma, 伪标准差Purposive sampling, 有目的抽样QR decomposition, QR分解Quadratic approximation, 二次近似Qualitative classification, 属性分类Qualitative method, 定性方法Quantile-quantile plot, 分位数-分位数图/Q-Q图Quantitative analysis, 定量分析Quartile, 四分位数Quick Cluster, 快速聚类Radix sort, 基数排序Random allocation, 随机化分组Random blocks design, 随机区组设计Random event, 随机事件Randomization, 随机化Range, 极差/全距Rank correlation, 等级相关Rank sum test, 秩和检验Rank test, 秩检验Ranked data, 等级资料Rate, 比率Ratio, 比例Raw data, 原始资料Raw residual, 原始残差Rayleigh's test, 雷氏检验Rayleigh's Z, 雷氏Z值Reciprocal, 倒数Reciprocal transformation, 倒数变换Recording, 记录Redescending estimators, 回降估计量Reducing dimensions, 降维Re-expression, 重新表达Reference set, 标准组Region of acceptance, 接受域Regression coefficient, 回归系数Regression sum of square, 回归平方和Rejection point, 拒绝点Relative dispersion, 相对离散度Relative number, 相对数Reliability, 可靠性Reparametrization, 重新设置参数Replication, 重复Report Summaries, 报告摘要Residual sum of square, 剩余平方和residual variance (剩余方差) Resistance, 耐抗性Resistant line, 耐抗线Resistant technique, 耐抗技术R-estimator of location, 位置R估计量R-estimator of scale, 尺度R估计量Retrospective study, 回顾性调查Ridge trace, 岭迹Ridit analysis, Ridit分析Rotation, 旋转Rounding, 舍入Row, 行Row effects, 行效应Row factor, 行因素RXC table, RXC表Sample, 样本Sample regression coefficient, 样本回归系数Sample size, 样本量Sample standard deviation, 样本标准差Sampling error, 抽样误差SAS(Statistical analysis system ),SAS统计软件包Scale, 尺度/量表Scatter diagram, 散点图Schematic plot, 示意图/简图Score test, 计分检验Screening, 筛检SEASON, 季节分析Second derivative, 二阶导数Second principal component, 第二主成分SEM (Structural equation modeling), 结构化方程模型Semi-logarithmic graph, 半对数图Semi-logarithmic paper, 半对数格纸Sensitivity curve, 敏感度曲线Sequential analysis, 贯序分析Sequence, 普通序列图Sequential data set, 顺序数据集Sequential design, 贯序设计Sequential method, 贯序法Sequential test, 贯序检验法Serial tests, 系列试验Short-cut method, 简捷法Sigmoid curve, S形曲线Sign function, 正负号函数Sign test, 符号检验Signed rank, 符号秩Significant Level, 显著水平Significance test, 显著性检验Significant figure, 有效数字Simple cluster sampling, 简单整群抽样Simple correlation, 简单相关Simple random sampling, 简单随机抽样Simple regression, 简单回归simple table, 简单表Sine estimator, 正弦估计量Single-valued estimate, 单值估计Singular matrix, 奇异矩阵Skewed distribution, 偏斜分布Skewness, 偏度Slash distribution, 斜线分布Slope, 斜率Smirnov test, 斯米尔诺夫检验Source of variation, 变异来源Spearman rank correlation, 斯皮尔曼等级相关Specific factor, 特殊因子Specific factor variance, 特殊因子方差Spectra , 频谱Spherical distribution, 球型正态分布Spread, 展布SPSS(Statistical package for the social science), SPSS统计软件包Spurious correlation, 假性相关Square root transformation, 平方根变换Stabilizing variance, 稳定方差Standard deviation, 标准差Standard error, 标准误Standard error of difference, 差别的标准误Standard error of estimate, 标准估计误差Standard error of rate, 率的标准误Standard normal distribution, 标准正态分布Standardization, 标准化Starting value, 起始值Statistic, 统计量Statistical control, 统计控制Statistical graph, 统计图Statistical inference, 统计推断Statistical table, 统计表Steepest descent, 最速下降法Stem and leaf display, 茎叶图Step factor, 步长因子Stepwise regression, 逐步回归Storage, 存Strata, 层(复数)Stratified sampling, 分层抽样Stratified sampling, 分层抽样Strength, 强度Stringency, 严密性Structural relationship, 结构关系Studentized residual, 学生化残差/t化残差Sub-class numbers, 次级组含量Subdividing, 分割Sufficient statistic, 充分统计量Sum of products, 积和Sum of squares, 离差平方和Sum of squares about regression, 回归平方和Sum of squares between groups, 组间平方和Sum of squares of partialregression, 偏回归平方和Sure event, 必然事件Survey, 调查Survival, 生存分析Survival rate, 生存率Suspended root gram, 悬吊根图Symmetry, 对称Systematic error, 系统误差Systematic sampling, 系统抽样Tags, 标签Tail area, 尾部面积Tail length, 尾长Tail weight, 尾重Tangent line, 切线Target distribution, 目标分布。
统计学8 参数估计
第二节 均值区间估计
有一定的概率P(95%或99%)保证,
x
请思考:P 与
与
x
三者怎样联系起来
???
答案:统计量
x 的分布是将三者联系起来的桥。
一、抽样分布与抽样误差
从总体中随机抽取一份样本,计算均数。 这个均数不同于总体均数!为什么? 再从该总体中随机抽取一份样本,再计 算均数。 前后两个均数不等,为什么?
S SE= = n n
标准误的特点
抽样的样本量越大,标准误就越小; 原来总体变异度小,标准误就越小。 标准误反映了样本均值间的离散程度,也反映了样本 均值与总体均值之间的差异。当标准误大时,用样本 均值对总体均值的估计的可靠程度就小;反之亦然。
标准误用途
衡量样本均值的可靠性:标准误越小,表明样本 均值越可靠; 参数估计:估计总体均值的置信区间(区域); 假设检验:用于总体均值的假设检验(比较)。
总体参数的点估计公式
1.样本均值 2.样本方差
1 x x n 1 2 2 s ( x x ) n 1
X,S 2 作为总体的参
即用样本的 数的点估计值。
点估计的优点在于它能够明确地估计总体 参数,但由于样本是随机的,抽出一个具 体的样本得到的估计值很可能不同于总体 真值。 它与真值的误差﹑估计的可靠性怎样,我 们无法知道,而区间估计则可弥补这种不 足之处。
二、均值的区间估计(教材p139)
当置信度为1-=0.95时,置信区间为:
[ x 1.96
n
n
, x 1.96
统计学专业名词中英对照
统计学专业名词·中英对照Lansexy我大学毕业已经多年,这些年来,越发感到外刊的重要性。
读懂外刊要有不错的英语功底,同时,还需要掌握一定的专业词汇。
掌握足够的专业词汇,在国内外期刊的阅读和写作中会游刃有余。
在此小结,按首字母顺序排列。
这些词汇的来源,一是专业书籍,二是网上查找,再一个是比较重要的期刊。
当然,这些仅是常用专业词汇的一部分,并且由于个人精力、文献查阅的限制,难免有不足和错误之处,希望读者批评指出。
Aabscissa 横坐标absence rate 缺勤率Absolute deviation 绝对离差Absolute number 绝对数absolute value 绝对值Absolute residuals 绝对残差accident error 偶然误差Acceleration array 加速度立体阵Acceleration in an arbitrary direction 任意方向上的加速度Acceleration normal 法向加速度Acceleration space dimension 加速度空间的维数Acceleration tangential 切向加速度Acceleration vector 加速度向量Acceptable hypothesis 可接受假设Accumulation 累积Accumulated frequency 累积频数Accuracy 准确度Actual frequency 实际频数Adaptive estimator 自适应估计量Addition 相加Addition theorem 加法定理Additive Noise 加性噪声Additivity 可加性Adjusted rate 调整率Adjusted value 校正值Admissible error 容许误差Aggregation 聚集性Alpha factoring α因子法Alternative hypothesis 备择假设Among groups 组间Amounts 总量Analysis of correlation 相关分析Analysis of covariance 协方差分析Analysis of data 分析资料Analysis Of Effects 效应分析Analysis Of Variance 方差分析Analysis of regression 回归分析Analysis of time series 时间序列分析Analysis of variance 方差分析Angular transformation 角转换ANOVA (analysis of variance)方差分析ANOVA Models 方差分析模型ANOVA table and eta 分组计算方差分析Arcing 弧/弧旋Arcsine transformation 反正弦变换Area 区域图Area under the curve 曲线面积AREG 评估从一个时间点到下一个时间点回归相关时的误差ARIMA 季节和非季节性单变量模型的极大似然估计Arithmetic grid paper 算术格纸Arithmetic mean 算术平均数Arithmetic weighted mean 加权算术均数Arrhenius relation 艾恩尼斯关系Assessing fit 拟合的评估Associative laws 结合律Assumed mean 假定均数Asymmetric distribution 非对称分布Asymmetry coefficient 偏度系数Asymptotic bias 渐近偏倚Asymptotic efficiency 渐近效率Asymptotic variance 渐近方差Attributable risk 归因危险度Attribute data 属性资料Attribution 属性Autocorrelation 自相关Autocorrelation of residuals 残差的自相关Average 平均数Average confidence interval length 平均置信区间长度average deviation 平均差Average growth rate 平均增长率BBar chart/graph 条形图Base period 基期Bayes' theorem Bayes 定理Bell-shaped curve 钟形曲线Bernoulli distribution 伯努力分布Best-trim estimator 最好切尾估计量Bias 偏性Biometrics 生物统计学Binary logistic regression 二元逻辑斯蒂回归Binomial distribution 二项分布Bisquare 双平方Bivariate Correlate 二变量相关Bivariate normal distribution 双变量正态分布Bivariate normal population 双变量正态总体Biweight interval 双权区间Biweight M-estimator 双权M 估计量Block 区组/配伍组BMDP(Biomedical computer programs) BMDP 统计软件包Box plot 箱线图/箱尾图Breakdown bound 崩溃界/崩溃点CCanonical correlation 典型相关Caption 纵标目Cartogram 统计图Case fatality rate 病死率Case-control study 病例对照研究Categorical variable 分类变量Catenary 悬链线Cauchy distribution 柯西分布Cause-and-effect relationship 因果关系Cell 单元Censoring 终检census 普查Center of symmetry 对称中心Centering and scaling 中心化和定标Central tendency 集中趋势Central value 中心值CHAID -χ2 Automatic Interaction Detector 卡方自动交互检测Chance 机遇Chance error 随机误差Chance variable 随机变量Characteristic equation 特征方程Characteristic root 特征根Characteristic vector 特征向量Chebshev criterion of fit 拟合的切比雪夫准则Chernoff faces 切尔诺夫脸谱图chi-sguare(X2) test 卡方检验卡方检验/χ2 检验Choleskey decomposition 乔洛斯基分解Circle chart 圆图Class interval 组距Classification 分组、分类Class mid-value 组中值Class upper limit 组上限Classified variable 分类变量Cluster analysis 聚类分析Cluster sampling 整群抽样Code 代码Coded data 编码数据Coding 编码Coefficient of contingency 列联系数Coefficient of correlation 相关系数Coefficient of determination 决定系数Coefficient of multiple correlation 多重相关系数Coefficient of partial correlation 偏相关系数Coefficient of production-moment correlation 积差相关系数Coefficient of rank correlation 等级相关系数Coefficient of regression 回归系数Coefficient of skewness 偏度系数Coefficient of variation 变异系数Cohort study 队列研究Collection of data 资料收集Collinearity 共线性Column 列Column effect 列效应Column factor 列因素Combination pool 合并Combinative table 组合表Combined standard deviation 合并标准差Combined variance 合并方差Common factor 共性因子Common regression coefficient 公共回归系数Common value 共同值Common variance 公共方差Common variation 公共变异Communality variance 共性方差Comparability 可比性Comparison of bathes 批比较Comparison value 比较值Compartment model 分部模型Compassion 伸缩Complement of an event 补事件Complete association 完全正相关Complete dissociation 完全不相关Complete statistics 完备统计量Complete survey 全面调查Completely randomized design 完全随机化设计Composite event 联合事件Composite events 复合事件Concavity 凹性Conditional expectation 条件期望Conditional likelihood 条件似然Conditional probability 条件概率Conditionally linear 依条件线性Confidence interval 置信区间Confidence level 可信水平,置信水平Confidence limit 置信限Confidence lower limit 置信下限Confidence upper limit 置信上限Confirmatory Factor Analysis 验证性因子分析Confirmatory research 证实性实验研究Confounding factor 混杂因素Conjoint 联合分析Consistency 相合性Consistency check 一致性检验Consistent asymptotically normal estimate 相合渐近正态估计Consistent estimate 相合估计Constituent ratio 构成比,结构相对数Constrained nonlinear regression 受约束非线性回归Constraint 约束Contaminated distribution 污染分布Contaminated Gausssian 污染高斯分布Contaminated normal distribution 污染正态分布Contamination 污染Contamination model 污染模型Continuity 连续性Contingency table 列联表Contour 边界线Contribution rate 贡献率Control 对照质量控制图Control group 对照组Controlled experiments 对照实验Conventional depth 常规深度Convolution 卷积Coordinate 坐标Corrected factor 校正因子Corrected mean 校正均值Correction coefficient 校正系数Correction for continuity 连续性校正Correction for grouping 归组校正Correction number 校正数Correction value 校正值Correctness 正确性Correlation 相关,联系Correlation analysis 相关分析Correlation coefficient 相关系数Correlation 相关性Correlation index 相关指数Correspondence 对应Counting 计数Counts 计数/频数Covariance 协方差Covariant 共变Cox Regression Cox 回归Criteria for fitting 拟合准则Criteria of least squares 最小二乘准则Critical ratio 临界比Critical region 拒绝域Critical value 临界值Cross-over design 交叉设计Cross-section analysis 横断面分析Cross-section survey 横断面调查Crosstabs 交叉表Crosstabs 列联表分析Cross-tabulation table 复合表Cube root 立方根Cumulative distribution function 分布函数Cumulative frequency 累积频率Cumulative probability 累计概率Curvature 曲率/弯曲Curvature 曲率Curve Estimation 曲线拟合Curve fit 曲线拟和Curve fitting 曲线拟合Curvilinear regression 曲线回归Curvilinear relation 曲线关系Cut-and-try method 尝试法Cycle 周期Cyclist 周期性DD test D 检验data 资料Data acquisition 资料收集Data bank 数据库Data capacity 数据容量Data deficiencies 数据缺乏Data handling 数据处理Data manipulation 数据处理Data processing 数据处理Data reduction 数据缩减Data set 数据集Data sources 数据来源Data transformation 数据变换Data validity 数据有效性Data-in 数据输入Data-out 数据输出Dead time 停滞期Degree of freedom 自由度degree of confidence 可信度,置信度degree of dispersion 离散程度Degree of precision 精密度Degree of reliability 可靠性程度degree of variation 变异度Degression 递减Density function 密度函数Density of data points 数据点的密度Dependent variableDepth 深度Derivative matrix 导数矩阵Derivative-free methods 无导数方法Design 设计design of experiment 实验设计Determinacy 确定性Determinant 行列式Determinant 决定因素Deviation 离差Deviation from average 离均差diagnose accordance rate 诊断符合率Diagnostic plot 诊断图Dichotomous variable 二分变量Differential equation 微分方程Direct standardization 直接标准化法Direct Oblimin 斜交旋转Discrete variable 离散型变量DISCRIMINANT 判断Discriminant analysis 判别分析Discriminant coefficient 判别系数Discriminant function 判别值Dispersion 散布/分散度Disproportional 不成比例的Disproportionate sub-class numbers 不成比例次级组含量Distribution free 分布无关性/免分布Distribution shape 分布形状Distribution-free method 任意分布法Distributive laws 分配律Disturbance 随机扰动项Dose response curve 剂量反应曲线Double blind method 双盲法Double blind trial 双盲试验Double exponential distribution 双指数分布Double logarithmic 双对数Downward rank 降秩Dual-space plot 对偶空间图DUD 无导数方法Duncan's new multiple range method 新复极差法/Duncan 新法EError Bar 均值相关区间图Effect 实验效应Effective rate 有效率Eigenvalue 特征值Eigenvector 特征向量Ellipse 椭圆Empirical distribution 经验分布Empirical probability 经验概率单位Enumeration data 计数资料Equal sun-class number 相等次级组含量Equally likely 等可能Equation of linear regression 线性回归方程Equivariance 同变性Error 误差/错误Error of estimate 估计误差Error of replication 重复误差Error type I 第一类错误Error type II 第二类错误Estimand 被估量Estimated error mean squares 估计误差均方Estimated error sum of squares 估计误差平方和Euclidean distance 欧式距离Event 事件Exceptional data point 异常数据点Expectation plane 期望平面Expectation surface 期望曲面Expected values 期望值Experiment 实验Experiment design 实验设计Experiment error 实验误差Experimental group 实验组Experimental sampling 试验抽样Experimental unit 试验单位Explained variance (已说明方差)Explanatory variable 说明变量Exploratory data analysis 探索性数据分析Explore Summarize 探索-摘要Exponential curve 指数曲线Exponential growth 指数式增长EXSMOOTH 指数平滑方法Extended fit 扩充拟合Extra parameter 附加参数Extrapolation 外推法Extreme observation 末端观测值Extremes 极端值/极值FF distribution F 分布F test F 检验Factor 因素/因子Factor analysis 因子分析Factor Analysis 因子分析Factor score 因子得分Factorial 阶乘Factorial design 析因试验设计False negative 假阴性False negative error 假阴性错误Family of distributions 分布族Family of estimators 估计量族Fanning 扇面Fatality rate 病死率Field investigation 现场调查Field survey 现场调查Finite population 有限总体Finite-sample 有限样本First derivative 一阶导数First principal component 第一主成分First quartile 第一四分位数Fisher information 费雪信息量Fitted value 拟合值Fitting a curve 曲线拟合Fixed base 定基Fluctuation 随机起伏Forecast 预测Four fold table 四格表Fourth 四分点Fraction blow 左侧比率Fractional error 相对误差Frequency 频率Freguency distribution 频数分布Frequency polygon 频数多边图Frontier point 界限点Function relationship 泛函关系GGamma distribution 伽玛分布Gauss increment 高斯增量Gaussian distribution 高斯分布/正态分布Gauss-Newton increment 高斯-牛顿增量General census 全面普查Generalized least squares 综合最小平方法GENLOG (Generalized liner models) 广义线性模型Geometric mean 几何平均数Gini's mean difference 基尼均差GLM (General liner models) 通用线性模型Goodness of fit 拟和优度/配合度Gradient of determinant 行列式的梯度Graeco-Latin square 希腊拉丁方Grand mean 总均值Gross errors 重大错误Gross-error sensitivity 大错敏感度Group averages 分组平均Grouped data 分组资料Guessed mean 假定平均数HHalf-life 半衰期Hampel M-estimators 汉佩尔M 估计量Happenstance 偶然事件Harmonic mean 调和均数Hazard function 风险均数Hazard rate 风险率Heading 标目Heavy-tailed distribution 重尾分布Hessian array 海森立体阵Heterogeneity 不同质Heterogeneity of variance 方差不齐Hierarchical classification 组内分组Hierarchical clustering method 系统聚类法High-leverage point 高杠杆率点High-Low 低区域图Higher Order Interaction Effects,高阶交互作用HILOGLINEAR 多维列联表的层次对数线性模型Hinge 折叶点Histogram 直方图Historical cohort study 历史性队列研究Holes 空洞HOMALS 多重响应分析Homogeneity of variance 方差齐性Homogeneity test 齐性检验Huber M-estimators 休伯M 估计量Hyperbola 双曲线Hypothesis testing 假设检验Hypothetical universe 假设总体IImage factoring 多元回归法Impossible event 不可能事件Independence 独立性Independent variable 自变量Index 指标/指数Indirect standardization 间接标准化法Individual 个体Inference band 推断带Infinite population 无限总体Infinitely great 无穷大Infinitely small 无穷小Influence curve 影响曲线Information capacity 信息容量Initial condition 初始条件Initial estimate 初始估计值Initial level 最初水平Interaction 交互作用Interaction terms 交互作用项Intercept 截距Interpolation 内插法Interquartile range 四分位距Interval estimation 区间估计Intervals of equal probability 等概率区间Intrinsic curvature 固有曲率Invariance 不变性Inverse matrix 逆矩阵Inverse probability 逆概率Inverse sine transformation 反正弦变换Iteration 迭代JJacobian determinant 雅可比行列式Joint distribution function 分布函数Joint probability 联合概率Joint probability distribution 联合概率分布KK-Means Cluster 逐步聚类分析K means method 逐步聚类法Kaplan-Meier 评估事件的时间长度Kaplan-Merier chart Kaplan-Merier 图Kendall's rank correlation Kendall 等级相关Kinetic 动力学Kolmogorov-Smirnove test 柯尔莫哥洛夫-斯米尔诺夫检验Kruskal and Wallis test Kruskal 及Wallis 检验/多样本的秩和检验/H 检验Kurtosis 峰度LLack of fit 失拟Ladder of powers 幂阶梯Lag 滞后Large sample 大样本Large sample test 大样本检验Latin square 拉丁方Latin square design 拉丁方设计Leakage 泄漏Least favorable configuration 最不利构形Least favorable distribution 最不利分布Least significant difference 最小显著差法Least square method 最小二乘法Least Squared Criterion,最小二乘方准则Least-absolute-residuals estimates 最小绝对残差估计Least-absolute-residuals fit 最小绝对残差拟合Least-absolute-residuals line 最小绝对残差线Legend 图例L-estimator L 估计量L-estimator of location 位置L 估计量L-estimator of scale 尺度L 估计量Level 水平Leveage Correction,杠杆率校正Life expectance 预期期望寿命Life table 寿命表Life table method 生命表法Light-tailed distribution 轻尾分布Likelihood function 似然函数Likelihood ratio 似然比line graph 线图Linear correlation 直线相关Linear equation 线性方程Linear programming 线性规划Linear regression 直线回归Linear Regression 线性回归Linear trend 线性趋势Loading 载荷Location and scale equivariance 位置尺度同变性Location equivariance 位置同变性Location invariance 位置不变性Location scale family 位置尺度族Log rank test 时序检验Logarithmic curve 对数曲线Logarithmic normal distribution 对数正态分布Logarithmic scale 对数尺度Logarithmic transformation 对数变换Logic check 逻辑检查Logistic distribution 逻辑斯特分布Logit transformation Logit 转换LOGLINEAR 多维列联表通用模型Lognormal distribution 对数正态分布Lost function 损失函数Low correlation 低度相关Lower limit 下限Lowest-attained variance 最小可达方差LSD 最小显著差法的简称Lurking variable 潜在变量MMain effect 主效应Major heading 主辞标目Marginal density function 边缘密度函数Marginal probability 边缘概率Marginal probability distribution 边缘概率分布Matched data 配对资料Matched distribution 匹配过分布Matching of distribution 分布的匹配Matching of transformation 变换的匹配Mathematical expectation 数学期望Mathematical model 数学模型Maximum L-estimator 极大极小L 估计量Maximum likelihood method 最大似然法Mean 均数Mean squares between groups 组间均方Mean squares within group 组内均方Means (Compare means) 均值-均值比较Median 中位数Median effective dose 半数效量Median lethal dose 半数致死量Median polish 中位数平滑Median test 中位数检验Minimal sufficient statistic 最小充分统计量Minimum distance estimation 最小距离估计Minimum effective dose 最小有效量Minimum lethal dose 最小致死量Minimum variance estimator 最小方差估计量MINITAB 统计软件包Minor heading 宾词标目Missing data 缺失值Model specification 模型的确定Modeling Statistics 模型统计Models for outliers 离群值模型Modifying the model 模型的修正Modulus of continuity 连续性模Morbidity 发病率Most favorable configuration 最有利构形MSC(多元散射校正)Multidimensional Scaling (ASCAL) 多维尺度/多维标度Multinomial Logistic Regression 多项逻辑斯蒂回归Multiple comparison 多重比较Multiple correlation 复相关Multiple covariance 多元协方差Multiple linear regression 多元线性回归Multiple response 多重选项Multiple solutions 多解Multiplication theorem 乘法定理Multiresponse 多元响应Multi-stage sampling 多阶段抽样Multivariate T distribution 多元T 分布Mutual exclusive 互不相容Mutual independence 互相独立NNatural boundary 自然边界Natural dead 自然死亡Natural zero 自然零Negative correlation 负相关Negative linear correlation 负线性相关Negatively skewed 负偏Newman-Keuls method q 检验NK method q 检验No statistical significance 无统计意义Nominal variable 名义变量Nonconstancy of variability 变异的非定常性Nonlinear regression 非线性相关Nonparametric statistics 非参数统计Nonparametric test 非参数检验Nonparametric tests 非参数检验Normal deviate 正态离差Normal distribution 正态分布Normal equation 正规方程组Normal P-P 正态概率分布图Normal Q-Q 正态概率单位分布图Normal ranges 正常范围Normal value 正常值Normalization 归一化Nuisance parameter 多余参数/讨厌参数Null hypothesis 无效假设Numerical variable 数值变量OObjective function 目标函数Observation unit 观察单位Observed value 观察值One sided test 单侧检验One-way analysis of variance 单因素方差分析Oneway ANOVA 单因素方差分析Open sequential trial 开放型序贯设计Optrim 优切尾Optrim efficiency 优切尾效率Order statistics 顺序统计量Ordered categories 有序分类Ordinal logistic regression 序数逻辑斯蒂回归Ordinal variable 有序变量Orthogonal basis 正交基Orthogonal design 正交试验设计Orthogonality conditions 正交条件ORTHOPLAN 正交设计Outlier cutoffs 离群值截断点Outliers 极端值OVERALS 多组变量的非线性正规相关Overshoot 迭代过度PPaired design 配对设计Paired sample 配对样本Pairwise slopes 成对斜率Parabola 抛物线Parallel tests 平行试验Parameter 参数Parametric statistics 参数统计Parametric test 参数检验Pareto 直条构成线图(佩尔托图)Partial correlation 偏相关Partial regression 偏回归Partial sorting 偏排序Partials residuals 偏残差Pattern 模式PCA(主成分分析)Pearson curves 皮尔逊曲线Peeling 退层Percent bar graph 百分条形图Percentage 百分比Percentile 百分位数Percentile curves 百分位曲线Periodicity 周期性Permutation 排列P-estimator P 估计量Pie graph 构成图饼图Pitman estimator 皮特曼估计量Pivot 枢轴量Planar 平坦Planar assumption 平面的假设PLANCARDS 生成试验的计划卡PLS(偏最小二乘法)Point estimation 点估计Poisson distribution 泊松分布Polishing 平滑Polled standard deviation 合并标准差Polled variance 合并方差Polygon 多边图Polynomial 多项式Polynomial curve 多项式曲线Population 总体Population attributable risk 人群归因危险度Positive correlation 正相关Positively skewed 正偏Posterior distribution 后验分布Power of a test 检验效能Precision 精密度Predicted value 预测值Preliminary analysis 预备性分析Principal axis factoring 主轴因子法Principal component analysis 主成分分析Prior distribution 先验分布Prior probability 先验概率Probabilistic model 概率模型probability 概率Probability density 概率密度Product moment 乘积矩/协方差Profile trace 截面迹图Proportion 比/构成比Proportion allocation in stratified random sampling 按比例分层随机抽样Proportionate 成比例Proportionate sub-class numbers 成比例次级组含量Prospective study 前瞻性调查Proximities 亲近性Pseudo F test 近似F 检验Pseudo model 近似模型Pseudosigma 伪标准差Purposive sampling 有目的抽样QQR decomposition QR 分解Quadratic approximation 二次近似Qualitative classification 属性分类Qualitative method 定性方法Quantile-quantile plot 分位数-分位数图/Q-Q 图Quantitative analysis 定量分析Quartile 四分位数Quick Cluster 快速聚类RRadix sort 基数排序Random allocation 随机化分组Random blocks design 随机区组设计Random event 随机事件Randomization 随机化Range 极差/全距Rank correlation 等级相关Rank sum test 秩和检验Rank test 秩检验Ranked data 等级资料Rate 比率Ratio 比例Raw data 原始资料Raw residual 原始残差Rayleigh's test 雷氏检验Rayleigh's Z 雷氏Z 值Reciprocal 倒数Reciprocal transformation 倒数变换Recording 记录Redescending estimators 回降估计量Reducing dimensions 降维Re-expression 重新表达Reference set 标准组Region of acceptance 接受域Regression coefficient 回归系数Regression sum of square 回归平方和Rejection point 拒绝点Relative dispersion 相对离散度Relative number 相对数Reliability 可靠性Reparametrization 重新设置参数Replication 重复Report Summaries 报告摘要Residual sum of square 剩余平方和residual variance (剩余方差)Resistance 耐抗性Resistant line 耐抗线Resistant technique 耐抗技术R-estimator of location 位置R 估计量R-estimator of scale 尺度R 估计量Retrospective study 回顾性调查Ridge trace 岭迹Ridit analysis Ridit 分析Rotation 旋转Rounding 舍入Row 行Row effects 行效应Row factor 行因素RXC table RXC 表SSample 样本Sample regression coefficient 样本回归系数Sample size 样本量Sample standard deviation 样本标准差Sampling error 抽样误差SAS(Statistical analysis system ) SAS 统计软件包Scale 尺度/量表Scatter diagram 散点图Schematic plot 示意图/简图Score test 计分检验Screening 筛检SEASON 季节分析Second derivative 二阶导数Second principal component 第二主成分SEM (Structural equation modeling) 结构化方程模型Semi-logarithmic graph 半对数图Semi-logarithmic paper 半对数格纸Sensitivity curve 敏感度曲线Sequential analysis 贯序分析Sequence 普通序列图Sequential data set 顺序数据集Sequential design 贯序设计Sequential method 贯序法Sequential test 贯序检验法Serial tests 系列试验Short-cut method 简捷法Sigmoid curve S 形曲线Sign function 正负号函数Sign test 符号检验Signed rank 符号秩Significant Level 显著水平Significance test 显著性检验Significant figure 有效数字Simple cluster sampling 简单整群抽样Simple correlation 简单相关Simple random sampling 简单随机抽样Simple regression 简单回归simple table 简单表Sine estimator 正弦估计量Single-valued estimate 单值估计Singular matrix 奇异矩阵Skewed distribution 偏斜分布Skewness 偏度Slash distribution 斜线分布Slope 斜率Smirnov test 斯米尔诺夫检验Source of variation 变异来源Spearman rank correlation 斯皮尔曼等级相关Specific factor 特殊因子Specific factor variance 特殊因子方差Spectra 频谱Spherical distribution 球型正态分布Spread 展布SPSS(Statistical package for the social science) SPSS 统计软件包Spurious correlation 假性相关Square root transformation 平方根变换Stabilizing variance 稳定方差Standard deviation 标准差Standard error 标准误Standard error of difference 差别的标准误Standard error of estimate 标准估计误差Standard error of rate 率的标准误Standard normal distribution 标准正态分布Standardization 标准化Starting value 起始值Statistic 统计量Statistical control 统计控制Statistical graph 统计图Statistical inference 统计推断Statistical table 统计表Steepest descent 最速下降法Stem and leaf display 茎叶图Step factor 步长因子Stepwise regression 逐步回归Storage 存Strata 层(复数)Stratified sampling 分层抽样Stratified sampling 分层抽样Strength 强度Stringency 严密性Structural relationship 结构关系Studentized residual 学生化残差/t 化残差Sub-class numbers 次级组含量Subdividing 分割Sufficient statistic 充分统计量Sum of products 积和Sum of squares 离差平方和Sum of squares about regression 回归平方和Sum of squares between groups 组间平方和Sum of squares of partial regression 偏回归平方和Sure event 必然事件Survey 调查Survival 生存分析Survival rate 生存率Suspended root gram 悬吊根图Symmetry 对称Systematic error 系统误差Systematic sampling 系统抽样TTags 标签Tail area 尾部面积Tail length 尾长Tail weight 尾重Tangent line 切线Target distribution 目标分布Taylor series 泰勒级数Test(检验)Test of linearity 线性检验Tendency of dispersion 离散趋势Testing of hypotheses 假设检验Theoretical frequency 理论频数Time series 时间序列Tolerance interval 容忍区间Tolerance lower limit 容忍下限Tolerance upper limit 容忍上限Torsion 扰率Total sum of square 总平方和Total variation 总变异Transformation 转换Treatment 处理Trend 趋势Trend of percentage 百分比趋势Trial 试验Trial and error method 试错法Tuning constant 细调常数Two sided test 双向检验Two-stage least squares 二阶最小平方Two-stage sampling 二阶段抽样Two-tailed test 双侧检验Two-way analysis of variance 双因素方差分析Two-way table 双向表Type I error 一类错误/α错误Type II error 二类错误/β错误UUMVU 方差一致最小无偏估计简称Unbiased estimate 无偏估计Unconstrained nonlinear regression 无约束非线性回归Unequal subclass number 不等次级组含量Ungrouped data 不分组资料Uniform coordinate 均匀坐标Uniform distribution 均匀分布Uniformly minimum variance unbiased estimate 方差一致最小无偏估计Unit 单元Unordered categories 无序分类Unweighted least squares 未加权最小平方法Upper limit 上限Upward rank 升秩VVague concept 模糊概念Validity 有效性V ARCOMP (Variance component estimation) 方差元素估计Variability 变异性Variable 变量Variance 方差Variation 变异Varimax orthogonal rotation 方差最大正交旋转V olume of distribution 容积WW test W 检验Weibull distribution 威布尔分布Weight 权数Weighted Chi-square test 加权卡方检验/Cochran 检验Weighted linear regression method 加权直线回归Weighted mean 加权平均数Weighted mean square 加权平均方差Weighted sum of square 加权平方和Weighting coefficient 权重系数Weighting method 加权法W-estimation W 估计量W-estimation of location 位置W 估计量Width 宽度Wilcoxon paired test 威斯康星配对法/配对符号秩和检验Wild point 野点/狂点Wild value 野值/狂值Winsorized mean 缩尾均值Withdraw 失访X此组的词汇还没找到YYouden's index 尤登指数ZZ test Z 检验Zero correlation 零相关Z-transformation Z 变换。
统计学复习资料
99%,故常用95%和99%的可信区间。
13.变异(variation):同质事物间的差别。由于观察单位通常即为观察个体,故变异亦称为个体变异
(individual variation)。
14.组间变异(variation between group):用各组均数与总均数的离均差平方和表示
3.样本(sample):从总体中随机抽取的部分个体。
4.样本含量(samplesize):样本中所包含的个体数。
5.变量(variable):观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异,观察
结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。变量的取值称
设检验方法,比较的是分布而不是参数,故称为非参数检验。
非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估计量,直接对比较数据的分布
进行统计检验的方法,称为非参数检验(nonparametric test).
39.率(rate):又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万
19.变异系数(coefficient of variance, CV):亦称离散系数(coefficient of dispersion),为标准差与均数之
比,常用百分数表示。CVs/X100%,变异系数没有度量衡单位,常用于比较度量单位不同或
均数相差悬殊的两组或多组资料的离散程度。
20.统计表(statistical table):统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项
社会统计学 第九章 参数估计
[例]研究者要调查某社区居民家庭收入分 布的差异情况,现随机抽查了10户,得到样本 方差为=200(元2)。试以此资料估计总体家庭 收入分布的差异情况。
[解] 因为样本容量较小,宜用修正样本 方差作为总体方差点估计量。即
=
=ห้องสมุดไป่ตู้
=222.2
第二节 区间估计(Interval estimation)
区间估计的任务是,在点估计值的两侧设置 一个区间,使得总体参数被估计到的概率大大增 加。可靠性和精确性(即信度和效度)在区间估计中 是相互矛盾的两个方面。
10元以内,问样本容量为多少? (2)若置信水平为90%,平均收入的最大误差在
10元以内,问样本容量为多少? (3)若置信水平为99%,平均收入的最大误差在
10元以内,问样本容量为多少? (4)若置信水平为95%,平均收入的最大误差在
20元以内,问样本容量为多少? (5)改变最大误差,对样本大小有什么影响? (6)改变置信水平,对样本大小有什么影响? (983,697,1704,246)
率度
=
(24)=2.064
代入公式得
=52±2.064
=52±5.06
因此,置信水平95%的总体均值的置信区 间是从46.94到57.06。
2. 大样本总体成数的估计 从总体的均值估计过渡到总体的成数估计,其方法和
思路完全相同,只要用 代替 ,用 代替
若总体成数未知,允许误差取 或
[例]假若从某社区抽取一个由200个家庭组成的样 本,发现其中有36%的家庭由丈夫在家庭开支上作决 定的次数超过半数。试问家庭开支的半数以上由丈夫 决定的家庭的置信区间是多少?(置信水平99%)
层内方差的平均(层间方差不进入): 回置抽样:
估计与假设检验(1)
2、 计算公式
〔1〕重置抽样必要样本容量确实定
对 tt 2 进行恒,等 得n变 t2换 2
x
x
n
x 2
x
对 pPtt
P Q进行恒,等 得n变 t2换 P Q
n
x 2
x
〔2〕不重置抽样必要样本容量确实定
对 tt xx
n2(1 -N n)进行恒 ,得 等 nxN 变 N 2t 2t换 2 22
x
对 pPtt
〔接上页〕
如果允许误差 来减 的 1/ 2少 ,到 即 x= 原 0.45片,
根据 t=t s
x
x
n
s2t2 n2
3232 0.452
40(瓶 0)
x
练习:某冷库对储藏一批禽蛋的变质率进展调查,根据 以往的资料,禽蛋的变质率分别为53%、49%、48%, 现在允许误差不超过5%,推断的概率保证程度为95 %,问至少要抽取多少禽蛋进展检查?
Annual Salary Program?
Management Training
49094.3
Yes
53263.9
Yes
49643.5
Yes
…
…
假设根据该样本求得的年薪样本平均数、标准差及 参加过培训方案人数比例分别为:
x x i n 155 /34 0 5 41 2 .0 8 0 0 14
▼注意: 在大样本下〔>=30〕,不管总体分布形式如何,均可用上述
方法进展总体均值的区间估计,这时,如果总体方差未知,那么直 接用样本方差代替。
在前面中层干部平均年薪例中, 如果假设总体均值及方差未知,一次容量为30的抽样的样本均 值及方差分别为51814与3347.72, 由于是大样本,那么可求置信度为95%的置信区间如下:
统计学第4章 参数估计
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被
估计的总体参数
抽样分布
中,样本 P(ˆ)
均值、比 率、方差
无偏
有偏
分别是总
A
B
体均值、
比率、方
差的无偏
估4计- 2量3
ˆ
统计学
STATISTICS
有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计
置信水平(1-α)表达了区间估计的可靠性。 它是区间估计的可靠概率。
显著性水平α表达了区间估计的不可靠的概 率。
4 - 20
统计学§4.2 点估计的评价标准
STATISTICS
对于同一个未知参数,不同的方法得到的估 计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用 标准
4 - 21
(1) 无偏性 (2) 有效性 (3) 一致性
统计学 定义 STATISTICS
无偏性
(unbiasedness)
若 E(ˆ)
则称 ˆ是 的无偏估计量.
定义的合理性
我们不可能要求每一次由样本得到的
估计值与真值都相等,但可以要求这些估 计值的期望与真值相等.
4 - 22
统计学
量,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
无偏估计量还 必须与总体参 数的离散程度
比较小
4 - 24
A
ˆ2 的抽样分布
ˆ
统计学
有效性
STATISTICS
定义 设 ˆ1 1(X1, X 2, , X n )
数据分析方法2(1估计)
注意:置信区间的论述是由区间和置信度两部分组成。 置信区间是对参数给出的一个范围 置信度为其可信程度 有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区 间),比如 “收视率为53%±3%”; 不给出置信度,也不给出被 调查的人数。这是不负责的表现!!!
区间估计
降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。 如果给出被调查的人数,则内行可以由此推算出置信度,反之亦然。
, x z /2 x z /2 n n
总体标准差未知
s s , x t /2 x t /2 n n
区间估计的例子(1)
例5.1 (数据:noodle.txt, noodle.sav, noodle.sas7bdat) 某厂家生产的挂面包装上写明“净含量450克”。在用天 平称量了商场中的48包挂面之后,得到样本量为48的关于 挂面重量(单位:克)的一个样本(我们假定,挂面重量 所代表的总体分布服从正态分布 ):
统计推断
从数据得到对现实世界结论的过程
估计
总体代表我们所关心的那部分世界。而在利用样本中的信息来 对总体进行推断之前人们往往对代表总体的变量假定了分布族。 (描述数据时不用假定)比如假定人们的身高属于正态分布族;在抽 样调查时假定了二项分布族等等(这些假定可能有风险!)。这些模型 基本上是根据“经验”来假定的,仅仅是对现实世界的一个近似。
总体比例(Bernoulli试验成功概率)之差 p1 -p2的区间估计 (大样本、大总体)
ˆ1 p ˆ 2 ) z /2 (p ˆ1 (1 p ˆ1 ) p ˆ2 (1 p ˆ2 ) p n1 n2
例4 在两个地区对于某商品认可与否的调查结果显示,第一个地 区被调查的950人中有423人认可,而在第二个地区的被调查的 1102人中只有215人认可。求这两个总体比例之差p1 -p2的95%置 信区间。得到(0.211,0.289)
点估计与区间估计
n
n
gets better. However, since σ is usually unknown, it is replaced by s,
the sample standard deviation; in this case, the approximate CI is
s
s
( X - Zα/2 n , X + Zα/2 n )
Q. Why is it necessary to understand the property of confidence interval in the above statement when in practice you will only have a single realization?
. If we use
, then
So, setting alpha=0.05 leads to the 95% CI of p: (0.45-1.96*sqrt(0.45*0.55/100), 0.45+1.96*sqrt(0.45*0.55/100)) =(0.352, 0.548)
n
n
□ Example: (See the textbook.)
Confidence interval for the population mean without NORMALITY assumption: an application of CLT
X1,X2,…,Xn ~ F(•), an unknown distribution with E(X)=µ and
realizations, then, in average, they will cover the true parameter close to 95 times in 100 replicates. (In a long run !!) (Frequentist’s point of view!!)
第九章 点估计
ˆ ) max L( x , x , L( x1 , x2 , , xn , 1 2 则称 ˆ 为参数 的极大似然估计值。
, xn , )
极大似然估计法的具体步骤
求解方法: (1) 构造似然函数 L( ) f ( x1 , x2 , (2) 取自然对数 ln L( x1 , x2 , , xn , ) ln f ( xi , ) i 1 d ln L (3) 令 0 d 其解 ˆ 即为参数 的极大似然估计值。
1 n 样本的k阶原点矩,记作 Ak X i k n i 1
1 n 样本的k阶中心矩,记作 Bk ( X i X )k n i 1
2. 矩法估计 用样本的矩作为总体矩的估计量
即
n 1 n 1 Vk Ak X i k , U k Bk ( X i X )k n i 1 n i 1
如果构造两个统计量 1 ( X1 , X 2 ,
, Xn ) 和
, X n ), 而用(1 , 2 )来作为参数 可能取值范围的估计,称为参数的区间估计。
2 ( X1 , X 2 ,
§9.2 估计方法
点估计的方法:数字特征法、矩法估计、极大似然估计法
一、数字特征法
以样本的数字特征作为相应总体数字特征的估计量
i 1
n
n
1 2
e
( xi )2 2 2
求偏导数,并令其为0 ln L n 2( xi )( 1) 2 2 i 1
( xi ) 2 ln 2 ln 2 2 i 1
例题 设总体的数学期望E(X)和方差D(X)都存在, n 1 2 证明:样本均值 X 、样本方差 S 2 ( X X ) i n 1 i 1 分别是E(X)、D(X)的无偏估计。
统计学第7章
P(ˆ) 较大的样本量 B
较小的样本量
A
ˆ
7.2 一个总体参数的区间估计
7.2.1 总体均值的区间估计 7.2.2 总体比例的区间估计 7.2.3 总体方差的区间估计
7.2.1 总体均值的区间估计
1. 正态总体且方差已知,或非正态总体且大样本. 2. 正态总体且方差未知、小样本.
2
t (n 1)
2
s 2.131 24.77 13.2
n
16
从而 的 95 %置信区间为
(1476.8, 1503.2 )
该种灯泡平均使用寿命的置信区间为1476.8小时~1503.2小时.
练习题
一大型超市为研究顾客的购买额,抽取了100个样 本顾客,这些顾客的平均花费水平为80元,标准差为 25元,求90%的置信区间。
影响区间宽度的因素
1、总体数据的离散程度,用来测度
2、样本容量, X
n
3、置信水平 (1 - ),影响 z 的大小
7.1.3 评价估计量的标准
1.无偏性(unbiasedness) 估计量抽样分布的数学期望等于被估计的总体参数。
设 ˆ 为未知参数 的估计量,若
E(ˆ)
则称 ˆ 为 的无偏估计量。
Z
2
1.96 0.15 0.098
n
9
根据 公式,得 的 0.95 置信区间为
(21.4- 0.098, 21.4 0.098)
即
(21.302, 21.498)
总体均值的区间估计(例题分析)
例4 某大学从该校学生中随机抽取 100 人,调查到 他们平均每天参加体育锻炼的时间为 26 分钟。试以 95% 的置信水平估计该大学全体学生平均每天参加体育锻炼的 时间(已知总体方差为 36)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Statistical estimation
Estimate
Point estimate
• sample mean • sample proportion
Interval estimate
• confidence interval for mean • confidence interval for proportion
Testing of hypotheses
Definition of p-value.
p-value = probability of observing a value more extreme that actual value observed, if the null hypothesis is true The smaller the p-value, the more unlikely the null hypothesis seems an explanation for the data Interpretation for the example If results falls outside green lines, p<0.05, if it falls inside green lines, p>0.05
Type I and Type II Errors
The probability of making a Type II () can be decreased by increasing the level of significance. it will increase the chance of a Type I error
Type I and Type II Errors. Example.
Decision Not diagnosed Diagnosed No disease OK Type I error Disease Type II error OK
treated but not harmed by the treatment Decision:
If a person is erroneously diagnosed as having the disease and treated, no physical damage is done.
To which type of error you are willing to risk ?
Testing of hypotheses
HA :
H0 :
Testing of hypotheses
Definition of p-value.
90 80 70 60 50 40 30 20 10 0 23.8 28.8 33.8 38.8 43.8 48.8 53.8 58.8
2.5%
95%
2.5%
AGE
If our observed age value lies outside the green lines, the probability of getting a value as extreme as this if the null hypothesis is true is < 5%
Confidence interval (CI)
2%
14% -1.0
-1.96
34%
34%
14% 1.0
1.96
2% 2.0 3.0 z
2.58
-3.0 -2.0
-2.58
0.0
Interval estimation
Confidence interval (CI), interpretation and example
level of confidence, containes a true value CI for the population means
9 5%CI x 1.9 6S E M 9 9%CI x 2.5 8S E M SD S EM n
Interval estimation
Testing of hypotheses
Type I and Type II Errors
No study is perfect, there is always the chance for error
Decision Accept H0 / reject HA Reject H0 /accept HA
H0 true / HA false H0 false / HA true Type II error () OK p=1- Type I error () p= p= OK p=1-
1- - power of the test
- level of significance
Testing of hypotheses
If the disease really exists and is diagnosed early, it can be successfully treated
If it is not diagnosed and treated, the person will become severely disabled
Statistical inference. Role of chance.
Scientific knowledge
Reason and intuition
Empirical observation
Formulate hypotheses
Collect data to test hypotheses
Point estimation and interval estimation
learning objectives:
»to understand the relationship between point estimation and interval estimation »to calculate and interpret the confidence interval
Research question:
Does the lactation nurse have an effect on attitudes towards breast feeding ?
The lactation nurse has an effect on attitudes towards breast feeding. The lactation nurse has no effect on attitudes towards breast feeding.
irreparable damage would be done
to avoid Type error II, have high level of significance
Type I and Type II Errors
α =0.05
there is only 5 chance in 100 that the result termed "significant" could occur by chance alone
The probability of making a Type I (α) can be decreased by altering the level of significance.
Statistical inference. Role of chance.
Systematic error
Formulate hypotheses
Collect data to test hypotheses
CHANCE
Accept hypothesis Reject hypothesis
Random error (chance) can be controlled by statistical significance or by confidence interval
Testing of hypotheses
learning objectives: »to understand the role of significance test »to distinguish the null and alternative hypotheses »to interpret p-value, type I and II errors
Statistical method are used to test hypotheses
The null hypothesis is the basis for statistical test.
Testing of hypotheses
Example
The purpose of the study: to assess the effect of the lactation nurse on attitudes towards breast feeding among women
Question:
Is it possible that the “true” age of nurses from HUS surgical hospitals was 41 years and observed mean ages differed just because of sampling error?
Statistical estimation
Every member of the population has the same chance of being selected in the sams
estimation
Random sample
Statistics
Testing of hypotheses
Significance test