(优选)统计分析社会调查统计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 例:调查11位同学的年龄如下:17岁、18岁、18岁、 19岁、19岁、20岁、20岁、21岁、21岁、22岁、。
• 首先,求出Q1和Q3的位置:
• Q1 的位置= n 1 = 11 1 =3
4
4
•
Q3的位置= 3(n 1) = 3 (11 1) =9
4
4
• 其次,从数序中找出Q1=18,Q3=21 • 则四分位差Q= Q3—Q1=21—18=3
• 公式如下: •
VR n fmo n
• 其中n是全部个案总数,fmo 是众数出现的频数,二者之差就是 非众数的频数。这个公式所要求出的,是在全部的个案中有多少 是偏离众数。不属于众数的个案所占的比率愈大,就表示众数的 代表性愈小,以之作估计或预测时所犯的错误也就愈大。
•
• 例:假设甲校有学生550名,其中父亲职业最多的是农 民,有288人;乙校有学生480名,其中父亲职业最多 的也是农民,有295人。则:
(3)四分位差Interquartile Range
• 先将一组数据按大小排列顺序,然后将其4 等分,去掉序列中最高的1/4和最低的1/4, 仅就中间的一半数值来测定序列的全距。
• Q1的位置(第一个四分位点)=(n+1)/4 • Q3的位置(第三个四分位点)=3(n+1)/4 • Q=Q3—Q1
1、标志值的个数是奇数
例:7名工人生产某种产品,日产量(件)分别 为4、6、6、8、9、12、14。位于中间位置的第四 名工人的日产量8件为中位数。
• 2、标志值的个数是偶数.
• 上例增加为8名工人,日产量为4、6、6、8、9、 12、13、14。中位数位置在第四和第五名中间,取 这两者的平均数为中位数。
• 例2:某校三个系各选5名同学,参加智力竞 赛,他们的成绩如下:
• 中文系:78 79 80 81 82 • 数学系:65 72 80 88 95 • 英语系:35 78 89 98 100 • 无论从团体总分来看,还是从平均分来看,这
三个系代表队的成绩都是相同的。那么,均值 到底对哪一个代表队的代表性高呢?用前面的 公式可得: • 中文系=1.414 • 数学系=10.8 • 英语系=23.8 • 由此证明,平均成绩对中文系代表队的代表性 最大,对英语系的代表性最小。
3、离散趋势分析
• 离散趋势分析指用一个特别的数值来反映 一组数据Βιβλιοθήκη Baidu互之间的差异程度。
• 最常见的离散量数有全距(极差)、异 众比率、四分位差、标准差、离散系 数.
(1)全距(极差)(Range)
• 全距指一组数据的最大值与最小值之差. • 全距(极差)越大,在一定程度上说明这组数据的
离散程度越大,集中量数的代表性越低。 • 计算公式:
(5)离散系数Coefficient of Variation
• 离散系数:标准差与平均数的比值,用百分比表 示.
• 离散系数越大,说明总体内部数值之间的差异越 大;反之则越小。
• 公式:
CV s 100% X
• 则 x 8 18 14 19 13.7 10
s (8 13.7)2 (18 13.7)2 (19 13.7)2 10
• 标准差是3.6。 • 换言之,平均每乡有13.7%是卫生户,而反映各
乡差异的标准差数值是3.6。在这里要解释的是, 标准差数值在相互比较中更能突出其意义。例如, 在调查乙乡的卫生户比率时,假定均值是18.5, 标准差是1.7,对比之下,乙地各乡的差异程度小 于甲地。
• 总体中出现次数最多的标志值是众数。
• 例: • 7名工人日产量(件)为4、5、6、6、6、7、8。 • 众数是6。
(3)中位数(Md)
把一组数据按值的大小顺序排列起来,处于中央 位置的那个数值就叫中位数. 它的含义是整个数据中
有一半数值在她之上,另一半数值在它之下. 公式为: Md=(n+1)÷2
R Maximum{xi} Minimum{xi}
例: 5名学生的成绩为50、69、76、88、97 则R=97-50=47
(2)异众比率Variation Ratio
• 异众比率指一组数据中非众数的次数相对于总体全部单位的比率。 异众比率越小,说明众数的代表性越好,反之,异众比率越大, 则说明众数的代表性越差。
(4)标准差Standard Deviation
• 标准差是各数值与其均值之差的平方和除以总体 数的平方根。它是一组数据平均值分散程度的 一种度量。一个较大的标准差,代表大部分数 值和其平均值之间差异较大;一个较小的标准 差,代表这些数值较接近平均值。
s (X X )2
n
• 例1:在调查甲地的十个乡的卫生情况时,发现每个 乡的卫生户比率如下:8 18 14 14 8 15 12 17 12 19
(优选)统计分析社会调查统 计
(1)平均数(mean)
• 平均数数是指总体各单位数值之和除 以总体单位数目所得之商
统计分析中习惯以X来表示.其计算公
式如下 ∑X n
• 例:
• 某班10名学生的年龄分别为20、21、19、 19、19、20、20、21、22、18、20岁,求 他们的平均年龄。
(2)众数( m0)
•
甲校VR=550-288/550=0.476
•
乙校VR=480-295/480=0.385
• 甲、乙两校学生的父亲职业,众数都是农民,但离异程 度不同。甲校有47.6%的个案不是农民,而乙校只有 38.5%不是农民。因此,根据异众比率,甲校的离异幅
度大于乙校。也就是说,在两校作估计或预测时,虽然 应用同一个众数,但在甲校所犯的错误会大于乙校。