电大社会统计学

合集下载

国家开放大学电大本科《社会统计学》形考任务4试题及答案精选全文

国家开放大学电大本科《社会统计学》形考任务4试题及答案精选全文

可编辑修改精选全文完整版国家开放大学电大本科《社会统计学》形考任务4试题及答案形考任务4一、单项选择题(每题2分,共20分)题目1以下关于因变量与自变量的表述不正确的是()选择一项:A. 自变量的变化是以因变量的变化为前提B. 因变量是由于其他变量的变化而导致自身发生变化的变量C. 自变量是引起其他变量变化的变量D. 因变量的变化不以自变量的变化为前提题目2某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为()选择一项:A. 6小时B. 5小时C. 5.5小时D. 6.5小时题目3以下关于条形图的表述,不正确的是()选择一项:A. 条形图中条形的长度(或高度)表示各类别频数的多少B. 条形图通常是适用于所有类型数C. 条形图的矩形通常是紧密排列的D. 条形图中条形的宽度是固定的题目4下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组组别选择一项:A. 第3组B. 第4组C. 第6组D. 第5组题目5某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。

某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩考得更好。

选择一项:A. 语文B. 数学C. 无法判断散D. 两门课程一样题目6在假设检验中,不拒绝虚无假设意味着()选择一项:A. 没有证据证明虚无假设是正确的B. 没有证据证明虚无假设是错误的C. 虚无假设肯定是错误的D. 虚无假设是肯定正确的题目7根据一个样本均值求出的90%的置信区间表明()选择一项:B. 总体均值一定落入该区间内C. 总体均值有10%的概率会落入该区间内D. 总体均值有90%的概率会落入该区间内题目8在回归方程中,若回归系数等于0,这表明()选择一项:A. 自变量x对因变量y的影响是不显著的B. 因变量y对自变量x的影响是显著的C. 因变量y对自变量x的影响是不显著的D. 自变量x对因变量y的影响是显著的题目9中心极限定理认为不论总体分布是否服从正态分布,从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为()、方差为()的正态分布。

电大 社会统计学 第六章 正态分布

电大 社会统计学  第六章  正态分布

maxLeabharlann 第一节 正态分布f(x)
二、正态分布的特点 (二)正态分布是对称的
0
µ
正态分布曲线位于横轴上方,呈钟形。中间大,两头小,左 右对称。 正态分布曲线以均数所在处最高,且以均数(x=μ)为中心 左右对称。 在正态分布中,平均数=中数=众数,此点对应y值最大。 X=μ ±σ为图像的拐点,在(μ-σ,μ+σ)内是凹的,其他范 围是秃的。 x轴是渐近线。
( x) 1 ( x).
P(x1<X<x2)=P(X<x2)-P(x1<X)=F(x2)-F(x1)
例题1
• 已知X~N(1.5,4),求P(X<-4)和P(|X|>2)。 • 解:因为X服从μ=1,5,σ=4的正态分布,故:
- 4 1.5 P( X -4 ) ( ) (-2.75 ) 1 (2.75 ) 0.003 2 P ( X 2 ) P ( X 2 ) P ( X 2 )
X

~N(0,1),
Z=(X—μ)/σ
• 某班同学平均体重为50公斤,标准差为10,某同学体重为70 公斤,将这个分数转化为Z值。 • Z=(X—μ)/σ=(70—50)/10= 2 • 表明这个同学的体重在分布中高于均值2个标准差。
68—95—99.7规则(重要)
• 约有68%的数据在平均数加减1个标准差的范围之内; • 约有95%的数据在平均数加减2个标准差的范围之内; • 约有99.7%的数据在平均数加减3个标准差的范围之内。 • 这就是68—95—99.7规则,由此可见,X的取值几乎全部落 在(μ—3σ,μ+3σ)之间,即在均值的3个标准差范围之 内。X值几乎不可能在区间

国家开放大学电大本科《社会统计学》2023-2024期末试题及答案(试卷代号:1318)

国家开放大学电大本科《社会统计学》2023-2024期末试题及答案(试卷代号:1318)

国家开放大学电大本科《社会统计学》2023-2024期末试题及答案(试卷代号:1318)一、单项选择题(每题只有一个正确答案,请将正确答案的字母填写在括号内。

每题2分,共20分)1.为了解某地区的消费,从该地区随机抽取8000户家庭进行调查,其中80%的家庭回答他们的月消费在3000元以上,20%的家庭回答他们每月用于通讯.网络的费用在300元以上,此处8000户家庭是( )。

A.样本B.总体C.变量D.统计量2.某地区家庭年均收人可以分为以下六组:1)1500元及以下;2)1500- 2500元;3)2500- 3500元;4)3500-4500元;5)4500- 5500元;6)5500元及以上,则该分组的组距近似为( ) 。

A.500 元B.1500元C.1250元D.1000 元3.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为( )。

A.简单随机抽样B.系统抽样C.整群抽样D.分层抽样4.在正态分布中,当均值μ相等时,σ值越小,则( )。

A.离散趋势越小B.离散趋势越大.C.曲线越低平D.变量值越分散5.对于左偏分布,平均效、中位数和众数之间的关系是( )。

A.平均数>中位数>众数B.中位数>平均数>众数C.众数>中位数>平均数D.众数>平均数>中位数6.有甲,乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,示准差为3,以下甲,乙两人打靶的稳定性水平表述正确的是( )。

A.甲的离散程度小,稳定性水平低B.甲的离散程度小,稳定性水平高C.乙的离散程度小,稳定性水平低D.乙的离散程度大,稳定性水平高7.下表是某单位工作人员年龄分布表,该单位工作人员的平均年龄是( )。

A.37B.35C.36D.398.某单位对该厂第-.加工车间残品率估计高于13%,而该车间主任认为该比例偏高,如果要检验该说法是否正确,则假设形式应该为()。

年国家开放大学电大《社会统计学》考题题库

年国家开放大学电大《社会统计学》考题题库

年国家开放大学电大《社会统计学》考题题库《《社会统计学》形成性考核作业形成性考核作业一表1 是某大学二年级135 个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS 软件,并(1)对考试成绩进行排序和分组(40分),(2)制作频数分布表(30 分)并绘制频数分析统计图(30 分)。

请注意分组时按照下列标准:等级A A- B+ B B- C+ C C- D+ D F 分数90-100 86-89 83-85 80-82 76-79 73-75 70-72 66-69 63-65 60-62 0-59 表表1 某专业二年级同学社会统计学期末考试成绩(百分制)学生成绩学生成绩学生成绩学生成绩学生成绩1 86 28 34 55 88 82 70 109 71 2 60 29 65 56 93 83 88 110 80 3 65 30 30 57 85 84 88 111 87 4 28 31 78 58 83 85 68 112 66 5 85 32 86 59 93 86 87 113 846 87 33 84 60 95 87 88 114 83 7 70 34 87 61 71 88 91 115 85 8 64 35 85 62 90 89 76 116 78 9 51 36 93 63 86 90 87 117 81 10 58 37 96 64 89 91 81 118 81 11 90 38 82 65 89 92 61 119 71 12 50 39 78 66 83 93 72 120 86 13 87 40 80 67 84 94 86 121 9114 82 41 74 68 44 95 29 122 66 15 65 42 72 69 68 96 37 123 58 16 68 43 73 70 89 97 82 124 68 17 86 44 86 71 84 98 82 125 80 18 80 45 85 72 86 99 82 126 77 19 81 46 90 73 79 100 85 127 55 20 70 47 69 74 78 101 78 128 54 21 80 48 86 75 87 102 80 129 62 22 49 49 86 76 88 103 90 130 5423 80 50 84 77 82 104 82 131 65 24 70 51 81 78 83 105 72 132 74 25 59 52 90 79 92 106 86 133 70 26 80 53 34 80 86 107 80 134 72 27 52 54 84 81 86 108 82 135 73 答案如下:1 、按成绩低至高排序如下表:学生成绩学生成绩学生成绩学生成绩学生成绩学生成绩学生成绩4 28 8 64 42 72 40 80 78 83 63 86 65 89 95 29 3 65 93 72 102 80 114 83 72 86 70 89 30 30 15 65 105 72 107 80 33 84 80 86 11 90 28 34 29 65 134 72 110 80 50 84 81 86 46 90 53 34 131 65 43 73 125 80 54 84 94 86 52 90 96 37 112 66 135 73 19 81 67 84 106 86 62 90 68 44 122 66 41 74 51 81 71 84 120 86 103 9022 49 16 68 132 74 91 81 113 84 6 87 88 91 12 50 69 68 89 76 117 81 5 85 13 87 121 91 9 51 85 68 126 77 118 81 35 85 34 87 79 9227 52 124 68 31 78 14 82 45 85 75 87 36 93 128 54 47 69 39 78 38 82 57 85 86 87 56 93 130 54 7 70 74 78 77 82 100 85 90 87 59 93 127 55 20 70 101 78 97 82 115 85 111 87 60 95 10 58 24 70 116 78 98 82 1 86 55 88 37 96 123 58 82 70 73 79 99 82 17 86 76 8825 59 133 70 18 80 104 82 32 86 83 882 60 61 71 21 80 108 82 44 86 84 8892 61 109 71 23 80 58 83 48 86 87 88129 62 119 71 26 80 66 83 49 86 64 892 、成绩分组表如下:等级A A- B+ B B- C+ C C- D+ D F分数90-10 86-8 83-8 80-8 76-7 73-7 70-7 66-6 63-6 60-6 0-5 人数13 28 16 22 8 4 12 7 5 3 17 3、制作频数分布表如下:等级A A- B+ B B- C+ C C- D+ D F分90-10 86-8 83-8 80-8 76-7 73-7 70-7 66-6 63-6 60-6 0-5数人数13 28 16 22 8 4 12 7 5 3 17 百分比9.63% 20.74%11.85% 16.3% 5.93% 2.96% 8.89% 5.19% 3.7% 2.2%% 12.59% 4、、频数分析统计图如下:***-*****XX年30分数90-1086-883-880-876-773-770-766-663-660-60-5等级A A- B+ B B- C+ C C- D+ D F百分比系列2系列3形成性考核作业二表1 为某大学对100 个学生进行了一周的上网时间调查,请用SPSS软件:(1)计算学生上网时间的中心趋势测量各指标(20 分)和离散趋势测量各指标(30 分)。

最新电大《社会统计学》期末考试简答题与计算题复习资料必备知识点复习考点归纳总结

最新电大《社会统计学》期末考试简答题与计算题复习资料必备知识点复习考点归纳总结

三一文库()*电大考试*电大社会统计学复习材料考点归纳总结简答题1、统计数据的质量要求:1、精度:最低的抽样误差或随机误差;2、准确性:最小的非抽样误差或偏差;3、关联性:满足用户决策、管理和研究的需要;4、及时性:在最短的时间里取得并公布数据;5、一致性:保持时间序列的可比性;6、最低成本:以最经济的方式取得数据。

2、抽样误差及其影响因素:1、由于抽样的随机性所带来的误差;2、所有样本可能的结果与总体真值之间的平均性差异;3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。

3、判断计量优劣的评判标准:用样本的估计量直接作为总体参数的估计值,无偏性:估计量抽样分布的数学期望等于被估计的总体参数;有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。

4、假设检验的一般步骤:(1)陈述原假设和备择假设;(2)从所研究的总体中抽出一个随机样本;(3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域;(5)将统计量的值与临界值进行比较,作出决策;(6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。

5、假设检验中的两类错误及其之间的关系错误:1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a,即显著性水平;2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b。

a和b的关系就像翘翘板,a小b就大,a大b就小。

因此,在样本容量n固定情况下,不能同时减少两类错误!一般采用增加样本容量的办法来解决。

关系:当显著性水平a减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是接受域增大了,因此纳伪的概率b要增大。

反之亦然(P235)。

也就是说如果要减小b,就增大显著性水平a。

6、置信区间与置信度的关系表达式:称作置信区间。

国开电大社会统计学形考一二三四答案

国开电大社会统计学形考一二三四答案

国开电大社会统计学形考一二三四答案形考任务1(占比20%)表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS软件,并(1)对考试成绩进行排序和分组(40分),(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。

国开电大社会统计学形考二答案形考任务2(占比20%)表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件。

(1)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)。

(2)计算学生上网时间的标准分(Z值)及其均值和标准差。

(20分)(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。

(30分)(1)集中趋势各指标:均数为15.2、中位数为14.0、众数为10。

离散趋势:四分位数分别为P25为10、P50为14、P75为20、方差为39.515、标准差为6.286、极差为29。

步骤:Analyze——Descriptive Statistics——Frequencies——上网时间——(勾选集中趋势指标:mean,median,mode,minimum,maximun离散趋势指标:quartiles,Variance,Std.deviation,Range)(2)标准分Z值。

步骤Analyze —— Descriptive Statistics——Descriptive——Save standardized values as varianles即可。

均数位15.2,标准差6.286步骤Analyze —— Descriptive Statistics——Descriptive——Options——勾选(mean,Std.deviation)(3)一周上网时间超过20小时的学生所占比例21%。

步骤1:Analyze —— Select Cases——if 上网时间>20h步骤2:Analyze —— Descriptive Statistics——Descriptive——上网时间超过20h。

电大社会统计学第三章数据的组织与展示

电大社会统计学第三章数据的组织与展示
然后指定未选中个案的处理方式。 filter out unselected cases 表示在那些未选中的个案号
码上做一个/标记;delete unselected cases 表示删除 未选中的个案;copy selected to a new detaset 表示 将选中的个案复Байду номын сангаас为一个新文件。
升序:Ascending 降序:Descending
三、应用SPSS对数据进行整理与分组
2、筛选 点击Date→Select Cases 然后选择何种方式筛选个 案。 if condition is satisfied 是根据某特定条件选择个案
random sample of case 是随机选取个案
三、应用SPSS对数据进行整理与分组
3、分组 相当于变量的重新编码。
• 首先选中要赋值的变量,点击箭头进入它右边 的空白框中。
• 在Output Variable 下面的Name and Label 框 中填写要新生成的变量的名称和标签,点击 change 按钮,则对中间的新旧变量名配对,然 后点击Old and New Value 进行变量的重新赋 值,赋值完毕之后点击OK即可。
第二节 频数分布表
(一)相关概念
3、百分比
百分比就是一个总体中某一类别或某一小组中数据个数(频数)占总体数据的比重乘以100, 各个小组百分比之和为100,即频率乘以100。它是将对比的基数抽象为100而计算出来的,用% 号表示,数值表示每100个分母中包含多少个分子。上面例子中,优、良、及格、不及格四个组 的百分比分别为18%、52%、21%、9%。
• 操作示范
第二节 频数分布表
(一)相关概念
1、频数

最新国家开放大学电大本科《社会统计学》名词解释题简答题题库及答案(试卷号:1318)

最新国家开放大学电大本科《社会统计学》名词解释题简答题题库及答案(试卷号:1318)

最新国家开放大学电大本科《社会统计学》名词解释题简答题题库及答案(试卷号:1318)一、名词解释题1.非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。

2.二维表:二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。

3.置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。

4.卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。

5.非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。

6.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。

7.置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。

8.卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。

9.整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。

10.Z值:Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:Z=(X-μ)/σ11.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。

12.误差减少比例:在预测变量Y的值时,知道变量x的值时所减少的误差(E.- Ez)与总误差E,的比值称为误差减少比例,简称PRE。

电大社会统计学名词解释归纳法与演绎法

电大社会统计学名词解释归纳法与演绎法

电大社会统计学名词解释归纳法与演绎法
归纳法是社会统计学中一种研究方法,通过从具体的观察事实出发,逐步总结归纳出一般规律和原则。

它通过对大量个别事实进行观察和研究,从中找出共同的特征和规律,从而推断出普遍的结论和规律。

归纳法常用于描述和解释现象的特点、规律、趋势等,并通过具体案例的论证,得出一般性的结论。

演绎法是社会统计学中一种研究方法,通过从一般原理或规律出发,推演出具体情况或具体结论。

它通常从已知的一般结论出发,根据某些具体的前提条件,通过逻辑推理,得出具体的结论或预测。

演绎法常用于验证和应用社会统计学中的理论、原则和规律,通过推理和论证,得出某个具体情况下的结论和解释。

综上所述,归纳法主要从具体事实出发总结归纳出一般规律和原理,而演绎法则从一般规律出发推演出具体的结论和解释。

两种方法常常相互补充,用于深入理解和解释社会统计学中的现象和规律。

国开(中央电大)本科《社会统计学》网上形考任务试题及答案

国开(中央电大)本科《社会统计学》网上形考任务试题及答案

国开(中央电大)本科《社会统计学》网上形考任务试题及答案国开(中央电大)本科《社会统计学》网上形考任务试题及答案章节测试试题及答案一、试题部分1.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。

这种调查方法属于( )。

2.以下关于因变量与自变量的表述不正确的是( )。

3.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。

此处5000户是( )。

4.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。

这种调查方法属于( )。

1.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;1/ 174)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为( )。

2.下表为某专业一年级学生平均每周上网时间的频率分布表,按照向上累积的方法计算第5组的累积频率是( )。

3.以下关于条形图的表述,不正确的是( )。

等距分组和不等距分组有什么区别?请举例说明。

某行业管理局所属40个企业20XX年产品销售额数据如下所示。

要求:(1)对20XX年销售额按由低到高进行排序,求出众数、中位数和平均数。

(2)如果按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。

某大学有六门选修课,全校学生可以随意选择,不受任何限制。

根据教务处最终选课结果发现,全校一年级20XX年名学生中,有200人选修大学生心理分析,有400人选修影视欣赏,有180人选修古代中国文学鉴赏,有350人选修人格魅力的欣赏与2/ 17培养,有570人选修社会统计方法及SPSS软件的应用,有300人选修当代中国外交分析。

2020年国家开放大学电大考试《社会统计学》考题题库及答案

2020年国家开放大学电大考试《社会统计学》考题题库及答案
30
57
85
84
88
111
87
4
28
31
78
58
83
85
68
112
66
5
85
32
86
59
93
86
87
113
84
6
87
33
84
60
95
87
88
114
83
7
70
34
87
61
71
88
91
115
85
8
64
35
85
62
90
89
76
116
78
9
51
36
93
63
86
90
87
117
81
10
58
37
96
64
89
91
81
D
F
分数
90-100
86-89
83-85
80-82
76-79
73-75
70-72
66-69
63-65
60-62
0-59
表1某专业二年级同学社会统计学期末考试成绩(百分制)
学生
成绩
学生
成绩
学生
成绩
学生
成绩
学生
成绩
1
86
28
34
55
88
82
70
109
71
2
60
29
65
56
93
83
88
110
80
3
65

2024年电大《社会统计学》期末考试试题及答案

2024年电大《社会统计学》期末考试试题及答案

2024年电大《社会统计学》期末考试试题及答案很抱歉,但我不能提供实际的考试试题和答案,尤其是在它们涉及到版权受保护的教育材料时。

不过,我可以帮您创建一份关于社会统计学概念的模拟试题和答案的文档示例。

请注意,以下内容仅用于教育和信息目的,并且不应被视为真实的考试内容或用于任何非法或未经授权的活动。

---2024年电大《社会统计学》期末考试试题及答案第一部分:选择题(每题2分,共计20分)1. 以下哪项是描述统计学的一个主要组成部分?A. 概率论B. 推断统计学C. 调查方法论D. 社会心理学答案:(A) 概率论2. 当研究者想要确定某个群体中某个特定特征的普遍性时,他们通常会使用哪种统计技术?A. 频数分布B. 标准差C. t检验D. 方差分析答案:(A) 频数分布3. 以下哪项不是解释方差分析(ANOVA)的基本假设之一?A. 数据应该满足正态性分布B. 各组之间的方差必须相等C. 观测值之间应该是独立的D. 数据应该满足同方差性答案:(D) 数据应该满足同方差性第二部分:简答题(每题10分,共计40分)4. 请解释什么是标准差,以及它在社会统计学中的应用。

答案:(标准差是衡量一组数据离散程度的统计量。

它是方差的平方根,用来描述数据点围绕平均值的分散程度。

在社会统计学中,标准差可以用来评估调查数据或实验数据的离散程度,帮助研究者理解变量变动的范围。

例如,在比较不同国家的平均收入时,标准差可以显示这些国家收入差异的大小。

)5. 请描述如何使用卡方检验来评估两个分类变量之间是否存在关联。

答案:(卡方检验是一种常用的统计方法,用来检验两个分类变量是否独立。

基本步骤包括:构建一个列联表来展示两个变量的交叉频数;计算卡方统计量,它基于观察频数和期望频数之间的差异;根据自由度和卡方分布表,确定卡方统计量的显著性水平。

如果卡方统计量的p值小于显著性水平(通常是0.05),则拒绝原假设,认为两个变量不独立。

)第三部分:案例分析(40分)6. 某研究者正在比较两个不同城市的犯罪率。

电大《社会统计学》考题题库及答案-社会统计学试题及答案

电大《社会统计学》考题题库及答案-社会统计学试题及答案

《社会统计学》形成性考核作业形成性考核作业一表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS软件,并(1)对考试成绩进行排序和分组(40分),(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。

请注意分组时按照下列标准:表1某专业二年级同学社会统计学期末考试成绩(百分制)答案如下:1、按成绩低至高排序如下表:2、成绩分组表如下:3、制作频数分布表如下:4、频数分析统计图如下:形成性考核作业二表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS 软件:(1)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)。

(2)计算学生上网时间的标准分(Z值)及其均值和标准差。

(20分)(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。

(30分)表1某专业一年级同学一周上网时间(小时)答案如下:形成性考核作业三一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内。

每小题2分,共20分)1.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。

这项研究的总体是(C)A.22000名学生B.2200名学生C.22000名学生的每月生活费用D.2200名学生的每月生活费用2.从变量分类看,下列变量属于定序变量的是(C)A.专业B.性别C.产品等级D.收入3.在频数分布表中,比率是指(D)A.各组频数与上一组频数之比B.各组频数与下一组频数之比C.各组频数与总频数之比D.不同小组的频数之比4.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(D)A.茎叶图B.环形图C.饼图D.线图5.根据一个样本均值求出的90%的置信区间表明(C)A.总体均值一定落入该区间内B.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落入该区间内D.总体均值有10%的概率会落入该区间内6.判断下列哪一个不可能是相关系数(C)A.-0.89B.0.34C.1.32D.07.期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。

电大 社会统计学 第一章统计学在社会研究中的应用

电大 社会统计学  第一章统计学在社会研究中的应用

第二节 数据收集与分析 一、变量类型
变量:说明事物某种特征的概念. 变量值:变量的具体取值。
性别:男,女 受教育程度:小学、初中、高中、本科、硕士、博士 年龄:1,2,3,4,5... 定类变量
测量水平 变量类型 定序变量 定距变量 定比变量 离散变量 连续变量 自变量 因变量
变量值是否连续 变量之间的相互关系
(一)按测量水平分类
4、定比变量(= or≠ >or<
+or- × or÷ )
变量除了具有上述三种变量的全部特征外,还可以 计算两个变量值之间的比值。 eg:身高、年龄、收入、一个地区的人口数,某产品的 生产量。 工人甲的收入1000 工人乙的收入2000 乙的收入是甲的收入两倍 工人丙的收入0 丙没有收入 定比变量有绝对零点。
正确:受教育程度提高,收入增加。 错误:小树长高,我也长高。 (自变量与因变量之间不仅有先后关系,还有因果关系) 常用自变量:性别、年龄、民族、居住地... 因变量:生育水平、生育态度...
二、数据收集
(一)相关概念 个体:构成总体的基本的单位 总体:所有个体的集合 样本:从总体中按照一定方式抽取的一部分个体的集合。 抽样单位:一次直接抽样所使用的基本单位。(班级) 抽样框:一次直接抽样时样本中所有抽样单位的名单。
2015、4、17
2015、5、8
2015、5、22 2015、6、5
2015、6、19
第一章
统计学在社会研究中的应用
学习目标:
1、了解统计学和社会统计学的概念
2、掌握并能判断ห้องสมุดไป่ตู้据的类型
3、了解数据分析的逻辑过程
第一节 统计学与社会研究
一、统计与统计学
统计作为一种社会实践有着悠久的历史,其产生可以追溯到 原始社会末期。 原始社会末期,为了分配食物,采用结绳计量。奴隶社会, 为了统计和管理的需要,开始了人口、土地和财产登记。封建社 会,统计的发展初具规模,开始出现户口资料的记载。如今,统 计的领域日益扩展,产生了工业、农业、商业、外贸、银行、保 险、交通、人口、医学等专业的社会统计。

《社会统计学》电大课程:第四章 中心趋势测量

《社会统计学》电大课程:第四章 中心趋势测量

121 182 …
363 545 …
36.3 54.5
上界累计百分比U%
(1)根据统计表中的累计百分比,找出含有50%的区间 (2)求出含有50%区间的上界值U、下界值L、上界累计百分比 U%,下界累计百分比L%和组距h (3)利用线性插值法,求出累计百分比为50%的变量值

U%
54,5%
X 50% L% U L U % L%
Mo:无党派人士 还是 140?
1、众数≠频次 2、若每个数值出现的次数相同,则没有众数 3、若出现次数最多的数值不止一个,则该数据为多峰分布
中位数(Median)
定义:将数据按从小到大或从大到小的顺序排列, 位于中间位置的数值,就是中位数。
1、 根据原始资料求中位数
当数值的个数是奇数时,中位数即是中间位置的数值
3、根据分组数据求均值
计算公式:
bn X n
i i
i
其中,bi为第i组的组中值 ni为第i组的频次
表1:工人日加工零件频数分布表
组号 1 2 日加工零件数 105-110 110-115 频数(ni) 3 5 中心值( bi ) bi× ni 107.5 112.5 117.5 322.5 562.5 940.0
根据中心值计算的均值(123.2)与原始数据计算的均值 (122.2)相比,有一定误差,但对于社会学研究来说, 其精度已经可以接受。
三者的关系
一般情况下,众数,中位数和均值三者具有以下关系:
三者相等 Mo = Me = X
左偏分布
右偏分布 Mo < Me < X
X < Me < Mo
三种集中趋势量数的比较
三种选择集中值的做法: 1、根据频次:哪个变量值具有的频次最多,就选择哪个变量值。 2、根据居中:变量排序后,选择处于中间位置的变量值。 3、根据平均:计算变量的平均值作为集中值。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、基本概念
1、众数
众数是一组数据中出现频数最多的数值,用Mo表示。

例如,一个城市有多种产业,但如果以旅游业为最多,那么旅游业就是众数,这个城市也被称为旅游城市。

2、中位数
中位数是中心趋势的一种测量,是将一组数据排序后,处于中间位置的变量值,用Me 表示。

中位数处于中间位置,前后每部分均包括50%的数据,而且前面部分小于中位数、后面部分大于中位数。

例如,在职工收入水平差异比较大的单位,要了解职工收入的一般水平,用职工收入分布的中位数作为收入水平的代表值要比用算术平均数更恰当,因为它排除了极端数据的影响。

3、四分位数
四分位数是将一组数据排序后,找出将该组数据等分为四等份的三个点,每份包括25%的数据,这三个点上的数据就是四分位数。

第二个四分位数就是中位数,它前面包括50%数据,后面也包括50%数据,因而,平时所说的四分位数主要是指第一个四分位数和第三个四分位数。

通常,我们将第一个四分位数称为下四分位数(QL),将第三个四分位数称为上四分位数(QU)。

4、均值
均值是集中趋势最主要的测量值,它是将全部数据进行加总然后除以数据总个数,也称为算数平均数。

均值包含一组数据中所有数值,它是先将所有数值进行加总,然后进行平均,在均值中所有数值都有所体现。

因而,我们说均值是集中趋势最主要的测量值。

二、基本方法
1、众数的计算
(1)众数的计算比较简单,就是找出频数最大的即可。

例如“甲城居民对交通满意度调查”,调查者在甲城市随机抽取统计500人调查,调查结果发现,选择“非常不满意”的有50人,“不满意”的有98人,选择“一般”的有204人,选择“满意”的有110人,选择“非常满意”的有38人。

从调查结果可以看出,选择“一般”的居民最多,为204人,占总数的40.8%,因而众数为“一般”这一变量值,即Mo=“一般”。

对于数值型数据,计算众数时,最好先对数据进行排序,有利于计算各变量值频数,避免出错。

(2)对于分组数据,计算具体数值时,根据公式:
对于任意一组数据,基本都存在频数最多的数值,这个数值可能有一个,也可能是两个,或者三个甚至更多,不管存在几个,它们均是该组数据的众数。

但是,有些数据组的分布没有明显的中心趋势,例如各变量值分布很均匀,即每个观察值出现的次数相同,其就可能不存在众数。

2、中位数的计算
(1)对于未分组数据,在计算中位数时首先要对所有数据进行排序,然后确定中位数的位置。

具体公式为:
n为奇数时,中位数位置=(n+1)/2
n为偶数时,中位数介于n/2和(n/2)+1之间,
其中,n为数据的个数,然后确定中位数的值。

从某个班级随机抽取11位同学,调查期末考试英语成绩,11位同学成绩分别为:98,87,90,89,87,95,83,72,91,93,85。

这是数值型数据,首先对数据进行排序,如下:
72,83,85,87,87,89,90,91,93,95,98
中位数位置=(11+1)/2=6,中位数为89,即Me=89。

再比如,假设从本班抽取10名同学,并进行排序:
72,83,85,87,87,89,90,91,93,95
数据个数为10,是偶数,因而中位数位于第5、6个数据中间,
中位数为Me=(87+89)/2=88
(2)对于分组数据,按照以下公式计算:
其中,L为中位数所在组的下限值,i为中位数所在组组距,fm为中位数所在组频数,Sm—1为中位数所在组之前各组的累积频数。

3、四分位数的计算
(1)对于未分组的数据,首先将数据排序,然后确定四分位数的位置:
QL=(n+1)/4,QU=3*(n+1)/4
(2)对于分组的定序数据,各四分位数的位置:
QL=n/4,QU=3n/4
同样,当四分位数不在某一数值上时,可以根据四分位数的位置,按比例分摊四分位数位置两侧数值的差值。

4、均值的计算
未分组数据均值的计算,先加总然后除以数据总个数:
=
分组数据均值的计算,假设原始数据分为N组,每组数据频数分别为f1,f2,f3,···,fN表示,各组的组中值分别为X1,X2,X3,···XN表示,计算公式为:
=
三、其他重点难点
1、中心趋势
也叫集中趋势,反映一组数据中各个数值向中心值集中的程度,是指一组数据向某一中心值靠拢的趋势。

中心趋势的测量就是找出代表数据水平的代表值或者中心值。

2、众数的特点
(1)众数简单易懂,适用范围广,可以用于各种类型数据中心趋势的测量。

(2)众数不受数据中极端值的影响,它是根据数值出现频数多少来确定的,因而不论极端值为多大或多小,众数都不会受其影响。

(3)众数也有其缺点:首先,众数不稳定,前面我们讲到,对于一组数据,可能存在一个、两个甚至多个众数,也可能不存在众数。

其次,众数只是一个很粗略的反映中心趋势的测量值,对于一些变化很多的数据组,众数并不能很好的反映数据的集中特征。

3、中位数和分位数的特点
中位数和分位数计算简单,而且都是位置代表值,可以用于定序变量中心趋势的测定,同时可以用于数值型变量中心趋势的测量,但是不可以用于测量定类变量中心趋势。

同众数一样,中位数和分位数由于是位置代表,因而不受极端值的影响。

但是由于在计算时不是所
有数据都参与运算,因此,它没有利用数据中的所有信息。

另外,对于已分组的数据资料确定中位数时,计算比较麻烦。

4、均值特征
(1)各数值之和等于均值的N倍(N是数据个数)。

(2)各变量值与均值之差的总和等于零,即∑(Xi—)=0。

(3)各变量值与其均值的离差的平方和最小,即∑[(Xi—)*(Xi—)]=最小
同时,由于均值是利用了所有数值的特点,因而,均值容易受极端值的影响,这会降低平均数均值对研究对象整体水平的代表性。

5、三者的特点与适用场合
众数、中位数、均值各自有自己的特点,在实际应用中也有不同的使用场合。

(1)众数是根据数据出现频数判断,是数据分布的峰值。

众数计算简单,可以用于定类数据、定序数据和数值型数据中心趋势的测量,但是主要用于定类数据中心趋势的测量。

众数是位置代表值,不受极端值的影响。

但是,如前面章节中讲到的,一组数据可以能一个、两个甚至多个数据,也可能没有众数存在,因而,众数具有不唯一性。

(2)中位数是根据数据的排列顺序判断,是一组数据中位于最中间位置的数值,将数据分为均等的两部分,可以适用于定序数据和数值型数据中心趋势的测量,但是主要适用于定序数据中心趋势测量,定序数据虽然也可以使用众数作为测量值,但以中位数为最优。

同众数一样,中位数也是位置代表,不受极端值的影响,而且众数和中位数都没有利用所有数值的信息,因而其代表性均不如均值。

其他四分位数、十分位数、百分位数等也是如此。

(3)均值是将所有数据加总后除以数据总个数求出,它利用所有数值的信息,而且具有很好的数学特征。

均值主要适用于数值型数据中心趋势的测量,尽管数值型数据也可以使
用众数和中位数,但是均值最佳。

但是,由于均值利用所有数值的信息,因而容易受极端值的影响,尤其是在偏态分布中,均值的代表性较差,这时可以考虑用众数或者中位数等不受极端值影响的位置代表值来代替均值。

6、众数、中位数和均值的关系
众数、中位数和均值都是中心趋势的测量度,众数是数据分布中的最高峰值,中位数始终是位于中间位置的数值,均值则是全部数据的算术平均值。

众数适用于所有类型数据,中位数适用于定序数据和数值型数据,而均值则只适用于数值型数据。

一般情况下,众数、中位数和均值三者具有以下关系:
(1)对于对称分布的数据,其众数、中位数、均值三者是相等的,即Mo=Me=
(2)对于左偏分布,由于存在极小值,均值受极小值影响向极小值一方靠近,而众数和中位数是位置代表值,不受极小值影响,因而三者关系变为:<Me<Mo
(3)对于右偏分布,由于存在极大值,均值受极大值影响向极大值一方靠近,而众数和中位数是位置代表值,不受极大值影响,因而三者关系变为:Mo<Me<。

相关文档
最新文档