统计分布
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
谢谢观看
在社会经济现象中,钟型分布多表现为对称分布。对称分布的特征是中间的变量值分布的次数最多,以标志 变量中心为对称轴。两侧变量值分布的次数随着与中心变量值距离的增大而渐次减少,并且围绕中心变量值两侧 呈对称分布。这种分布在统计学中称为正态分布。在社会经济现象中,许多变量的分布近似于正态分布类型。如 从业人员的年收入、农作物单产、零件尺寸、学生考试成绩、社会财富分布等。正态分布在社会经济统计学中具 有重要意义。这是因为,一方面。社会经济现象中大部分分布呈近似正态分布;另一方面,正态分布理论是抽样 推断的基础。
分配数列的第二个构成要素就是各组对应的单位数——次数,次数也叫频数,常用表示。各组单位数占总体 单位总数的比重称频率,常用表示。各组的频率要大于0且小于1,即,所有组的频率总和一定等于1,即。总体 按某标志所分的组(或以各组的组中值来代表)与各组对应的频率所形成的频率分布也是统计分布,与次数分布 的作用是相同的。次数分布和频率分布都是分配数列。
向上累计就是向变量的上限方向累计,是指将各组频数或频率由变量值较低的组向变量值较高的组累计,各 累计数的意义是各组上限以下的累计频数或频率。当我们标志值较小的各组分布情况时,可采用向上累计方法。
向下累计就是向变量的下限方向累计,是指将各组频数或频率由变量值较高的组向变量值较低的组累计,各 累计数的意义是各组下限以上的累计频数或频率。当我们标志值较大的各组分布情况时,可采用向下累计方法。
的种类和特征
频数和频率
分配数列的种类
次数分布的特征
分配数列有两个构成要素。即总体按某标志所分的组和各组对应的次数或频率。
分配数列的第一个构成要素就是总体按某标志所分的组。根据分组标志的不同,分配数列可分为品质分配数 列和变量分配数列。按品质标志分组形成的分配数列叫品质分配数列,简称品质数列;按数量标志分组形成的分 配数列叫变量分配数列,简称变量数列。变量数列又可以分为单项式数列和组距式数列,组距式数列又可以分为 等距数列和不等距数列。它们都是由相应的统计分组形成的。
社会经济现象总体的性质不同,其次数分布的特征也不同。各种社会经济现象总体的次数分布,归纳起来主 要有钟型分布、U型分布、J型分布和洛伦兹分布四种类型。
钟型分布
钟型分布是正态分布的俗称,其特征是“中间高,两头低”,即靠近中间的变量值分布的次数多,靠近两边 的变量值分布的次数少,形如古钟(见图1)。
图1钟型分布Biblioteka 在变量分配数列中,频数或频率表明对应组标志值的作用程度。频数或频率数值越大,表明该组标志值对总 体水平所起的作用也越大;反之,频数或频率数值越小,表明该组标志值对总体水平所起的作用越小。
分配数列中各组的频数或频率不能为0,如果某一组的频数或频率为0,应删除这一组。
有时候,为了更简便地概括总体各单位的分布特征,还需要编制累计频数数列和累计频率数列。累计方法有 向上累计和向下累计两种。
的意义
在统计分组的基础上,把总体的所有单位数按组归并排列,形成各组单位数在总体中的分布,称统计分布。 统计分布的实质是,把总体的全部单位按某标志所分的组进行分配所形成的数列,也可称为分配数列或分布数列。 在每次把某个单位分配到某一组时,人们常常说分配了一次,所以,分配数列又叫次数分布。分配数列有两个构 成要素:一是总体按某标志所分的组;二是各组对应的单位数——次数。
统计分布
统计学研究方法
目录
01 的意义
03 分配数列的编制
02 的种类和特征
统计分布(frequency distribution)亦称“次数(频数)分布(分配)”。在统计分组的基础上,将总 体中的所有单位按组归类整理,形成总体单位在各组间的分布。分布在各组中的单位数叫做次数或频数。各组次 数与总次数(全部总体单位数)之比,称为比率或频率。将各组别与次数依次编排而成的数列就叫做统计分布数 列,简称分布数列或分配数列。它可以反映总体中所有单位在各组间的分布状态和分布特征,研究这种分布特征 是统计分析的一项重要内容。统计分布及其分布数列,可以用表格或图形来表示。
统计分布形式十分简单,但在统计研究中却有着重要的意义。统计分布是统计分析结果的一种重要表现形式, 也是统计分析的一种重要方法。它可以表明总体各单位的分布特征和结构状况,并有助于我们进一步研究标志的 构成、平均水平及其变动规律。从文字含义看,统计分布理论性强一些,分配数列更通俗一点。以下交叉使用这 两名词 。
分配数列的编制
(一)将原始资料按其数值大小重新排列 只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组 距和组数作准备。 (二)确定全距 确定全距前,要检查数据组两端有没有极端值。如果有极端值且个数较少,应考虑将极端值归入开口组,计 算全距前,可去掉极端值。 (三)确定组距和组数 组距=全距/组数,当全距一定时。组距越大,组数就越少;组距越小,组数就越多,在实际应用中。组距一 般应采用整数,最好是5或10的整倍数。 (四)确定组限 组限要根据变量的性质来确定。如果变量值相对集中,无特大或特小的极端值时,则采用闭口式:反之,如 果有特大或特小的极端值时,则采用开口式,将极端蚊归入开口组中。
对品质数列来说,由于用品质标志来区分事物的各种类型表现得比较明确,因此,品质数列一般比较稳定, 能较好地反映总体各单位的分布特征。但对变量数列来说,因为事物性质的差异是用数量界限来表现的,而数量 界限往往会受人们主观认识的影响,同一数量标志分组可能会出现多种分布状态。这就涉及各组频数和频率的问 题。