(参考资料)同等学力-管理科学与工程知识点整理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用统计学

1、品质标志表明事物的性质或属性特征的,如性别、颜色、产品等级、生产厂家等,只能用文字来表现;数量标志说明事物数量特性的,如温度、产量、年龄等,可以用数值表示。

2、按照数据的某种标志分组,把全部数据在各组中的分配状况称为频率分布,分配在各组内的数据个数称为频数。各组频数与全部频数之和的比值称为该组的频率。将分组标志、各组频数及频率列成表格便形成了频数频率分布表。

3、饼形图适用于分组个数比较少的情况,并且多用于描述和表现各成分或某一成分占全部的百分比。各成分的总和应当是100%。

4、组距分组法(频率直方图):求极差,即数据中最大值与最小值的差;确定分组个数k,计算组距h(样本容量50以下,分组个数5-6、50-100,6-10、100-250,7-12、250以上,10-20);确定各组距界限,确定分点;列出各组频数,计算频率,制作频数频率分布表和直方图。各组距都是相等的。

5、条形图和柱状图本质上没有区别,都是用来对各项信息进行比较的图形。但是,如果数据是对同一事物在若干时间点或者段上的度量,一般采取柱状图,即横坐标表示时间。如果数据不是按照时间排列,而且各项信息的标识过长,最好采取条形图。并列条形图或者柱状图便于对两组以上的并列数据进行比较。

6、茎叶图是将数组中的数按位数进行比较。将每个数据分为茎和叶两部分茎为十位上的数字,叶为个位上的数字;将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;将各个数据的叶按大小次序写在其茎右(左)侧。茎叶图也是一种条形图,它直观地显示了数据所在的范围以及数据的总体水平。

7、众数是数据中出现次数最多的变量值,众数可以不止一个。中位数是将数据按大小顺序排列,处于中间位置的那个标志值,用Me表示,若数据偶数个,则是中间两个数的平均值。平均数(或均值) 平均指标是指同质总体中各单位某一数量标志值在一定时间和空间条件下所达到的一般水平的综合指标。加权平均数,数据乘权重或频率。上四分位数:n*0.75后向上取整,即10*0.75=7.5取第8个数作为上四分位数;下四分位数:n*0.25后向上取整,即10*0.25=2.5取第3个数作为下四分位数;中数(中位数)对极端值(奇异值)不像平均数那么敏感。众数:主要缺点是一个数据集可能没有众数(频数一样时),或者众数不惟一,而平均数和中数都是存在并且唯一的。平均数的优点在于容易理解,易于计算,主要缺点对极端值特别敏感,不考虑数据在数据集中的重要性,一律平等对待。加权平均数克服了平均数不考虑数据在数据集中重要性的缺陷,采用权重反映数据在数据集中的重要性,并且具有容易计算的优点。

8、极差也称全距:数据的最大值与最小值之差,表示数据的跨度。易受极端数

值的影响。四分位差:一般不受极端数值的影响。方差(),标准差与数据具有相同的单位。极差:最简单,最容易计算的度量数据

离散程度的指标,但是它容易受到极端值的影响。四分位差:不像极差那么容易受到极端值的影响,但是仍然存在没有充分利用数据所有信息的缺陷。方差和标准差:是统计中常用的度量数据离散程度的指标,它用数据自身与平均数之差的大小加权,比较合理地反映了不同数据对离散度量的作用,缺点是计算比较繁琐,并且方差的单位常常没有意义,且与原数据集不一致。离散度量数值越小质量越

稳定。

9、随机变量:对随机试验E而言,Ω是它的样本空间,对Ω中每一个样本点,都有唯一的一个实数与之对应,称这种对应关系为随机变量,用X,Y,等表示。分离散型随机变量和连续型随机变量。

10、随机变量数学期望,方差

,标准差()

11、0-1分布P(X=K)=p k(1-p)1-k,k=0,1,E(X)=p,D(X)=p(1-p);二项分布

(),!

!!

,E(X)= np ,D(X)= np(1-p)

12、正态分布:连续型随机变量X的概率密度函数为()

,称X

服从均值为μ方差为的正态分布,记为X~N(μ,),e=2.71828

性质:对于任意的μ和,密度函数p(x)与x轴之间的面积都是1;密度函数曲线关于直线x=μ对称,μ是正态分布的位置参数;方差的大小决定了密度曲线的高矮胖瘦,越大越矮胖,越小越高瘦。概率密度函数在x 的上方,即f (x)>0;正态曲线的最高点在均值μ,它也是分布的中位数和众数;正态分布是一个分布族,每一特定正态分布通过均值μ的标准差来区分。μ决定曲线的高度,决定曲线的平缓程度,即宽度;曲线f(x)相对于均值μ对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交。

13、标准正态分布,μ=0,的正态分布,记为Z~N(0,1),与一般正态分布关系,φ(x)=φ0(),P(a≤x≤b)=φ0()-φ0(),

φ(-x)=1-φ(x),φ0(-a≤x≤a)=2φ0(a)-1

14、总体:研究对象的全体(有限总体、无限总体);个体:组成总体的每一个基本元素;一个样本:总体中抽取若干个体所组成的集合;样本容量:样本中所含个体的个数。

15、简单随机抽样:无限总体中进行的无放回独立抽样或在有限总体中进行的有放回随机抽样,每次抽取时各个个体被抽到的概率相等,实施较难。分层抽样:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,对于层内成员差异较小、层间成员差异较大时,可以提高估计的精度。整群抽样:将总体中的成员分为若干组,从这些组中抽取部分组,调查对象时被抽中的这些群中的所有成员,准确性较差,通过多抽弥补。系统抽样:将总体平均分成几部分,然后按照一定的规则,从每一部分抽取一些个体作为样本,也称等距抽样,实施方便,但样本只有一种组合,不再具有随机性。

16、统计量:如果样本X1,X2,…,Xn的函数g(X1,X2,…,Xn),g中不含任何未知参数,则称g(X1,X2,…,Xn)是一个统计量。g(x1,x2,…,xn)是g(X1,X2,…,Xn)的观测值。常用统计量样本平均值、样本方差S2、标准差S、k阶原

点矩A k、k阶中心矩B k,对应的观测值,样本方差s2、标准差s、k阶

原点矩a k、k阶中心矩b k。

17、设X1,X2,…,Xn是来自N(0,1)的样本,则随机变量服

相关文档
最新文档