应用统计2

合集下载

应用统计学试题(附答案)2

应用统计学试题(附答案)2

二、单项选择题(每题1分,共10分)1.重点调查中的重点单位是指( )A.处于较好状态的单位B.体现当前工作重点的单位C.规模较大的单位D.在所要调查的数量特征上占有较大比重的单位2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。

A.各组的权数必须相等B.各组的组中值必须相等C.各组数据在各组中均匀分布D.各组的组中值都能取整数值3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。

由此可知两个班考试成绩的离散程度()A.甲班较大B.乙班较大C.两班相同D.无法作比较4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为()A.520公斤B.530公斤C.540公斤D.550公斤5.时间序列若无季节变动,则其各月(季)季节指数应为()A.100%B.400%C.120%D.1200%6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是()A.上升趋势B.下降趋势C.水平态势D.不能确定7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。

A.10.71%B.21.95%C.12%D.13.64%8.置信概率表达了区间估计的()A.精确性B.可靠性C.显著性D.规范性9.H0:μ=μ0,选用Z统计量进行检验,接受原假设H0的标准是()A.|Z|≥ZαB.|Z|<Zα/2C.Z≥Zα/2D.Z>-Zα10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归方程可能是正确的?()A.y=125-10xB.y=-50+8xC.y=150-20xD.y=-15-6x三、多项选择题(每题2分,共10分)1.抽样调查的特点有()。

A.抽选调查单位时必须遵循随机原则B.抽选出的单位有典型意义C.抽选出的是重点单位D.使用部分单位的指标数值去推断和估计总体的指标数值E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是()A.单位成本计划完成程度为80%B. 单位成本计划完成程度为101.05%C.没完成单位成本计划D.完成了单位成本计划E.单位成本实际比计划少降低了1个百分点3.数据离散程度的测度值中,不受极端数值影响的是()A.极差B.异众比率C.四分位差D.标准差E.离散系数4.下列指标属于时点指标的是()A.增加人口数B.在校学生数C.利润额D.商品库存额E.银行储蓄存款余额5.两个变量x与y之间完全线性相关,以下结论中正确的是()A.相关系数r=1 B.相关系数r=0 C.估计标准误差S y=0D.估计标准误差S y=1E.判定系数r2=1F.判定系数r2=0单项选择题(每题1分,共10分)1.D 2.C 3.A 4.A 5.A 6.B 7.A 8.B 9.B 10.B一、多项选择题(每题2分,共10分)1.ADE 2.BCE 3.BC 4.BDE5.ACE(每题错1项扣1分,错2项及以上扣2分)五、简答题(5分)加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。

应用统计学第2章统计表统计图

应用统计学第2章统计表统计图

对数图可以直观反映时间序列的环比变化趋势
可以在Office图表类型中选择自定义类型中的“对数图” ,也可通过将一般折线图纵轴“坐标轴格式” 中的“刻度” 设为“对数刻度”来绘制对数图。
例:某公司总成本和劳动成本的增长
该公司总成本和劳动成本每年增加相同的数量 ,因而用绝对数据作图时两条线是平行的,不小心 可能会得出劳动成本占总成本固定比例的误解。实 际上第1年占40%,第6年占60%。使用对数图就可以 清晰反映劳动成本有更高的增长率。
“平滑线”复选框,就将折线图转换为曲线图。
⑵经济管理中几种常见的频数分布曲线
①正态分布曲线 ——这是客观事物数量特征上表现得最为普遍的一
类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强度
,某种农作物的产量等等。
正态分布曲线
②偏态曲线
——按其长尾拖向哪一方又可分为右偏(正偏)和 左偏(负偏)两类。
1.频数分布表
频数分布表列出了一系列分类数据的频率、总数 或百分比,可以看出不同类别数据间的区别。
表2-1 1 000美元用途的频数分布表
用钱做什么 购买奢侈品、旅游或礼物 向慈善机构捐款 还贷 储蓄 购买必需品 其他
百分比/% 20 2 24 31 16 7
2.条形图
3.圆饼图
4.帕累托图
L = [ 10 × log 10 n ] 茎叶图类似于横置的直方图,但又有区别
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息
未分组数据—茎叶图(茎叶图的制作)
树茎 树叶
数据个数
10 788
3
11 022347778889

应用统计学(第二版)第3章数据整理PPT课件

应用统计学(第二版)第3章数据整理PPT课件
第3章 数据整理
1
描述统计
统计数据 的收集
统计数据 的整理
数据分布特征 的测度
2
主要内容和学习目标
3.1 数据的整理(掌握) 3.2 数据整理结果的描述:
统计指标(掌握) 3.3 数据整理结果的描述:
统计表和统计图(掌握)
3
3.1 数据的整理
3.1.1 数据整理的步骤 3.1.2 数据分组 3.1.3 数据汇总
与处理
数据 录入
归集资料 并汇总
汇总后的 审核
16
2、次数分配
次数分配的概念与种类:
次数分配总体中的所有单位按一定标志分组整理,并 将各组按一定顺序排列,形成总体中各个单位在各组 间的分布.
由总体分组和各组相对应的分配次数两个要素构成。
按照分组标志的不同 次数分配:品质型分配数列
数量型分配数列
17
24

数值型数据的分组整理
312341212321 122242122132 124223332121 213211231224 142124122122
23
表3-3 饭店食物质量状况的频数分布
饭店食物质量 极好
非常好 良好 一般 较差 合计
频 数(人) 18 27 9 6 0 60
频率(%) 30 45 15 10 0 100
编制次数分配的步骤
第一步:对数据进行分组
第二步:计算各组的频数、频率、
c
累积频数和累积频率
第三步:编制频数分布表
18
统计分组的原则: 穷尽原则:使总体中的每一个单位都有组可归 互斥原则:使总体中的每一个单位只有一组可归
19
频数(Frequency,亦称为次数) 是指落入各组中的数据的个数或次数

应用统计学 练习题2

应用统计学  练习题2

应用统计学练习题二一、单项选择题1、在组距数列中,如果每组的组中值都增加10个单位,而各组次数都不变,则算术平均数A、不变B、上升C、增加10个单位D、无法判断2、各标志值与算术平均数的离差之和等于A、各标志值的平均数B、零C、最小值D、最大值3、不受极端变量值影响的平均指标是A、算术平均数B、调和平均数C、几何平均数D、众数和中位数4、组距数列各组的标志值不变,而每组的次数都增加20%,则加权算术平均数A、增加20%B、减少20%C、没有变化D、无法判断5、根据同一资料计算的算术平均数(E)、几何平均数(G)和调和平均数(H)之间的关系为A、G≦H≦EB、H≧E≧GC、E≧G≧HD、H≧G≧E6、设有八个工人的日产量(件)分别是4、6、6、8、9、12、14、15,则这个数列的中位数是A、4.5B、8和9C、8.5D、没有中位数7、反映分配数列中各变量值分布的离散趋势指标是A、总量指标B、相对指标C、平均指标D、标志变异指标8、标准差是指各变量值与其算术平均数的A、离差平方的平均数B、离差平方的平均数的平方根C、离差平均数的平方根D、离差平均数平方的平方根9、设某企业生产某种产品300吨,其中合格产品270吨,不合格品30吨,则交替标志的标准差是A.90 B.0.3 C.0.09 D.0.910、交替标志的方差的最大值是A.0.5 B.0.25 C.1 D.没有最大值11、两个总体的平均数不等,但标准差相等,则A.平均数小,代表性大B.平均数大,代表性小C.无法进行判断D.两个平均数代表性相等12、在分配数列中,当标志值较大而权数较小时,则算术平均数为A.偏向于标志值较大的一方 B.不受权数影响C.偏向于标志值较小的一方 D.仅受标志值影响13、平均差和标准差就其实质而言属于A.总量指标 B.相对指标 C.平均指标 D.计划指标14、序时平均数计算中,“首末折半法”运用于A、时期数列的资料B、间隔相等的时点数列资料C、间隔不等的时点数列资料D、由两个时点数列构成的相对数时间数列15、基期为某一固定时期水平的增长量是A、累计增长量B、逐期增长量C、平均增长量D、年距增长量16、累计增长量与逐期增长量之间的关系是A、累计增长量等于相应的各个逐期增长量之和B、累计增长量等于相应的各个逐期增长量之差B、累计增长量等于相应的各个逐期增长量之商D、累计增长量等于相应的各个逐期增长量之积17、最基本的时间数列是A、指数数列B、相对数时间数列C、平均数时间数列D、绝对数时间数列18、时间数列的分析指标主要包括两个类别A、发展水平和发展速度B、水平指标和速度指标C、平均发展水平和平均发展速度D、增长量和增长速度19、发展速度的计算方法可以表述为A、报告期水平与基期水平之差B、增长量与基期水平之差C、报告期水平与基期水平之比D、增长量与基期水平之比20、定基增长速度与环比增长速度的关系表现为A、定基增长速度等于各环比增长速度的连乘积B、定基增长速度等于各环比增长速度的连乘积的n次方根C、各环比增长速度连乘积加一等于定基增长速度加一D、定基增长速度等于各环比增长速度加一后的连乘积减一21. 已知各期环比增长速度为2%、5%、8%和7%,则相应的定基增长速度的计算方法为A.(102%×105%×108%×107%)-100%B. 102%×105%×108%×107%C. 2%×5%×8%×7%D.(2%×5%×8%×7%)-100%22、由反映总体各单位数量特征的标志值汇总得出的指标是A.总体单位总量B.总体标志总量C.质量指标D.相对指标二、判断题1、同一个总体,时期指标值的大小与时期长短成正比,时点指标值的大小与时点间隔成反比。

应用统计学(微课版 第2版)全书教案1-8章全

应用统计学(微课版 第2版)全书教案1-8章全

1.1.4 统计学的学科体系现代统计学是一门多分支的科学。

根据研究的侧重点不同将统计学科划分为理论统计学和应用统计学两个大类,统计学学科体系如图1.1所示。

图1.1 统计学学科体系1.2 统计研究的特点、方法和作用1.2.1 统计的含义所谓统计,顾名思义就是统而计之,即汇总分析。

具体指根据研究目的和要求,运用科学的方法,对客观事物或人类实践活动的数据资料进行调查、整理、分析的过程。

统计学则是研究如何对社会总体的数量特征和规律进行描述、推断、认识的一门学科。

1.统计活动统计活动也称为统计实践、统计工作,是指根据统计目的及要求,利用科学的方法,对所研究客观事物或者活动的数据资料进行调查、整理、分析的过程。

统计调查、统计整理和统计分析是基本的统计活动,所提供的统计资料包括原始统计资料、整理结果和分析结论。

统计活动一般按照统计设计、统计调查、统计整理、统计分析和统计资料的开发利用这几个阶段依次进行,如图1.2所示。

是非曲直的背后,引导学生如何做事、如何做人,培养他们正确的人生价值取向。

统计是静止的历史,历史是流动的统计。

统计虽然不能创造历史,但用数字真实记录了历史的发展。

作为一项社会实践,也是一部人类生活和斗争的历史,更是社会文明积累的结果。

统计学发展史中蕴含着大量做人的道理,统计学的发展和完善是众多统计学者和研究者孜孜不倦不断探索的结果,了2图1.3 统计方法体系图1.2.4 统计的作用与职能随着社会主义市场经济体制的逐步建立和完善,统计职能将越来越重要。

统计已由单纯的统计信息搜集整理职能转变为信息、咨询、监督三大职能。

统计部门已成为社会经济信息的主体部门和国民经济核算的中心,成为国家重要的咨询和监督机构。

统计的作用主要体现在信息、咨询、监督三大功能上。

具体表现为:①为党和政府各级领导机构决策和宏观调控提供资料;②为企业、事业单位经营管理提供依据;③为社会公众了解情况,参与社会经济活动提供资料;④为科学研究提供资料;⑤为国际交往提供资料。

16春天大应用统计学在线作业二

16春天大应用统计学在线作业二

《应用统计学》在线作业二一、单选题(共 40 道试题,共 100 分。

)1. 在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使()尽可能小。

. 总体层数. 层内方差. 层间方差. 总体方差正确答案:2. 双因素方差涉及(). 两个分类型自变量. 两个数值型自变量. 两个分类型因变量. 两个数值型因变量正确答案:3. 某百货公司今年与去年相比,所有商品的价格平均提高了10%,销售量平均下降了10%,则商品销售额()。

. 上升. 下降. 保持不变. 可能上升也可能下降正确答案:4. 对于小批量的数据,最适合于描述其分布的图形是(). 条形图. 茎叶图. 直方图. 饼图正确答案:5. "从服从正态分布的无限总体中分别抽取容量为4,16,,3的样本,当样本容量增大时样本均值的标准差()". 保持不变. 增加. 减小. 无法确定正确答案:6. 设X是参数为n=4和p=的二项随机变量,则P(X<2)=...正确答案:7. 统计指数划分为个体指数和总指数的依据是(). 反映的对象范围不同. 指标性质不同. 采用的基期不同. 编制指数的方法不同正确答案:8. 若两组数的平均值相等,则标准差大的其平均数代表性小。

(). 正确. 错误正确答案:9. 经验法则表明,当一组数据对称分布时,在平均数加减一个标准差的范围之内大约有(). 68%的数据. 95%的数据. 99%的数据. 100%的数据正确答案:10. 在假设检验中,原假设和备则假设(). 都有可能成立. 都有可能不成立. 只有一个成立而且必有一个成立. 原假设一定成立,备则假设不一定成立正确答案:11. 设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于(). N(100,25). N(100,50/n). N(100/n,25). N(100,25/n)正确答案:12. 下面的哪一个图型适合于比较研究两个或多个样本或总体的结构性问题(). 条形图. 饼图. 雷达图. 直方图正确答案:13. 双因素方差分析涉及一个数值型自变量。

大工14春《应用统计》在线作业2答案

大工14春《应用统计》在线作业2答案

大工14春《应用统计》在线作业2一,单选题1. 若随机变量X服从二项分布B(n,p),且E(X)=6,D(X)=3.6,则有A. p=0.4,n=15B. p=0.6,n=15C. p=0.4,n=10D. p=0.6,n=10正确答案:A2. 题目见图片A.B.C.D.正确答案:A3. 题面见图片A.B.C.D.正确答案:D4. 题面见图片A.B.C.D.正确答案:D5. 题目见图片A.B.C.D.正确答案:C6. 假设当随机变量X服从参数为3的泊松分布时,D(X)/E(X)=A. 1B. 1/3C. 9D. 3正确答案:A7. 如果D(X),D(Y)都存在,则下面命题中不一定成立的是A. D(X-Y)=D(X)+D(Y)-2Cov(X,Y)B. D(X+Y)=D(X)+D(Y)+2Cov(X,Y)C. X与Y相互独立时,D(XY)=D(X)D(Y)D. D(-5X)=25D(X)正确答案:C8. 题面见图片A.B.C.D.正确答案:D9. 题目见图片A.B.C.D.正确答案:D10. 题目见图片A.B.C.D.正确答案:B二,判断题1. 设X服从二项分布B(n,p),则D(X)-E(X)=-npA. 错误B. 正确正确答案:A2. 题面见图片A. 错误B. 正确正确答案:B3. 题面见图片A. 错误B. 正确正确答案:B4. 题面见图片A. 错误B. 正确正确答案:B5. 题面见图片A. 错误B. 正确正确答案:B6. 题目见图片A. 错误B. 正确正确答案:B7. 如果X与Y独立,D(X)=2,D(Y)=1,则D(X-2Y+3)=6。

A. 错误B. 正确正确答案:B8. 假设X服从参数为λ(λ>0)的泊松分布,且P{X=0}=1/2(P{X=2}),则λ=2。

A. 错误B. 正确正确答案:B9. 题面见图片A. 错误B. 正确正确答案:B10. 设随机变量X服从二项分布B(n,p),则D(X)/E(X)=P。

应用统计选择题(2)

应用统计选择题(2)

1、某种产品单位成本计划比上年降低5%,实际降低4%,则下列说法正确的是)A、单位成本计划完成程度为80%B、单位计划完成程度为101.05%C、没完成单位计划成本D、完成了单位计划成本E、单位成本实际比计划降低了1个百分点2、数据离散程度的测度值中,不受极端数值影响的是()A、极差B、异众比率C、四分位差D、标准差E、离散系数3、某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年购买()的商品。

A、10.71%B、21.95%C、12%D、13.64%4、甲乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分,乙班平均分为75分,标准差为7.5分。

由此可知两个班考试成绩的离散程度()A、甲班较大B、乙班较大C、两班相通同D、无法比较5.已知一个数列的各环比增长速度分别为5%、7%、8%,则该数列的定基增长速度为()。

A.5%*7%*8%B.105%*107%*108%C.(5%*7%*8%)+1D.(105%*107%*108%)-1解题思路:定基发展速度=(1+5%)*(1+7%)*(1+8%)定基增长速度=定基发展速度-1.。

6.在组距数列中,组中值是()A.上限和下限之间的中点数值B.用来代表各组标志值的平均水平C.在开放式分组中无法确定D.在开放式分组中,可以参照相邻组的组距来确定E.组平均数7.某次考试学生的考试成绩X近似服从正态分布,X~N(78,64),则可认为有大约68.26%的学生成绩分布的范围是()A.(70,80)B.(70,86)C.(62,94)D.(66,74)8.某企业计划产值比上年提高10%,实际比上年提高15%,则其计划完成程度为()A150% B.5% C. 4.56% D. 104.55%9.某企业生产三种产品,今年与去年相比,三种产品的出厂价格平均提高了5%,产品销售额增长了20%.则产品销售量增长了()A. 114.29%B. 14.29%C. 126%D. 26%10.抽样平均误差反应了样本指标与总体指标之间的()A. 实际误差B.实际误差的绝对值C.平均误差程度D. 可能误差范围11.甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41,平均数为7,则()A.甲数列平均数代表性高B.乙数列平均数代表性高C.两数列的平均数代表性相同D.甲数列离散程度大12.在物价上涨后,同样多的人民币少购买商品3%,则物价指数为()A.97%B.103.09%C.3%D.109.13%13、对两个变量进行回归分析时,()A、两变量的关系是对等的B、两变量的关系是不对等的C、两变量都是随机变量D、一个变量是自变量,另一个变量是因变量E、一变量是随机变量,另一变量是非随机变量14、某企业多种产品报告期单位成本为基期的105%,这一指数是()A、个体指数B、总指数C、动态指数D、数量指标指数E、质量指标指数15.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是()。

中国石油大学-应用统计方法作业2

中国石油大学-应用统计方法作业2

由散点图看出,以下四种曲线方程的曲线图都与散点图接近,因此都可以作为曲线回归的选择对象。

(1)(2)(3)(4)lyy=21.21051lx'y=13.93894b=1.194729a=106.3013故所求回归方程为——y=106.3013+1.1947检验假设H 01:β1=0S回^2=16.65325S总^2=21.2105110610710810911011111205101520x图3-1 散点图xb a y +=xb a y lg +=x b a y /+=x2bx a y +=S残^2=4.557255F=40.19652对于给定的α=0.01,查F(1,11)表得临界值lambda=9.64603由于F>λ,检验效果显著,所以拒绝H 01,即回归方程有意义。

2.选取曲线回归(2)求解。

令 ,应用EXCEL可算得数据,列入表3-2中:lyy=21.21051lx'y=4.715045b= 3.946578a=106.3147故所求回归方程为——y=106.3147+3.9466lg x检验假设H 01:β1=0S回^2=18.6083S总^2=21.21051S残^2= 2.602211F=78.66052对于给定的α=0.01,查F(1,11)表得临界值lambda=9.64603由于F>λ,检验效果显著,所以拒绝H 01,即回归方程有意义。

3.选取曲线回归(3)求解。

令 ,应用EXCEL可算得数据,列入表3-3中:x x lg '=x x /1'=lyy=21.21051lxy=-2.1011b=-9.83337a=111.4875故所求回归方程为——y=111.4875-9.8333/x检验假设H 01:β1=0S回^2=20.66092S总^2=21.21051S残^2=0.549586F=413.5295对于给定的α=0.01,查F(1,11)表得临界值lambda=9.64603由于F>λ,检验效果显著,所以拒绝H 01,即回归方程有意义。

应用统计学第2章--统计表统计图

应用统计学第2章--统计表统计图

图1.8 偏态曲线 例如收入和财富的频数分配曲线就是右偏的,大量财富 都集中在极少数富豪手中,而多数人则是低收入者。
此外,在产品质量管理中也普遍存在这种现象,如多数 次品都集中出在少数工人手中;次品也大都出在少数几道 工序上。这就要求在管理和控制上需要突出重点、抓住关 键因素。
33
③ J 形曲线
正J形
某企业职工工资的分组统计
月工资(分组)
1000 以下
1000~1500
1500~2000
2000~3000
3000~3500 3500~4000
4000 及以上


人数(频数) 150 185 256 262 120 54 8
1035
比率(频率%) 14.5 17.9 24.7 25.3 11.6 5.2 0.8 100
19
过分压缩了Y轴
4000 失
业 人
3000
数 :
2000
千 人 1000
0 1989
1990 1991 1992 1993
图1.2 失业人数统计图
1994
1995
20
过分压缩了X轴
4000
失 业 人 3000 数 : 千 2000 人
1000
图1.3 失业人数统计图
21
1989 1990 1991 1992 1993 1994 1995
35
120
30
100
25 20 15 10
80 60 40
5
20
0
0
储蓄 还贷 购买奢侈品、 旅游或礼 物 购买必需 品 其他 捐款
有钱要做什么 6
§2.2 数值数据的整理
当数据量很大时,首先可以将数值数据进行排序或用 茎叶图描述以获得初步信息。 (1) 排序

天津大学应用统计学在线作业二满分答案

天津大学应用统计学在线作业二满分答案

天津大学应用统计学在线作业二满分答案一、单选题(共 40 道试题,共 100 分。

)1. 在回归模型y=a+bx+ε中,ε反映的是()A. 由于x的变化引起的y的线性变化部分B. 由于y的变化引起的x的线性变化部分C. 除x和y的线性关系之外的随机因素对y的影响D. 由于x和y的线性关系对y的影响满分:2.5 分2. 在编制综合指数时,要求指数中分子和分母的权数必须是()A. 同一时期的B. 不同时期的C. 基期的D. 报告期的满分:2.5 分3. 对具有因果关系的现象进行回归分析时()A. 只能将原因作为自变量B. 只能将结果作为自变量C. 二者均可作为自变量D. 没有必要区分自变量满分:2.5 分4. 下面的假定中,哪个属于相关分析中的假定()A. 两个变量之间是非线性关系B. 两个变量都是随机变量C. 自变量是随机变量,因变量不是随机变量D. 一个变量的数值增大,另一个变量的数值也应增大满分:2.5 分5. 价格上涨后,同样多的人民币报告期所购买商品的数量比基期少5%,因此价格上涨了()A. 5%B. 5.26%C. 95%D. 105.26%满分:2.5 分6. 某百货公司今年与去年相比,所有商品的价格平均提高了10%,销售量平均下降了10%,则商品销售额()A. 上升B. 下降C. 保持不变D. 可能上升也可能下降满分:2.5 分7. 说明回归方程拟合优度的统计量是()A. 相关系数B. 回归系数C. 判定系数D. 估计标准误差满分:2.5 分8. 下面的关系中不是相关关系的是()A. 身高与体重之间的关系B. 工资水平与工龄之间的关系C. 农作物的单位面积产量与降雨量之间的关系D. 圆的面积与半径之间的关系满分:2.5 分9. 某商场今年与去年相比,销售量增长了15%,价格增长了10%,则销售额增长了()A. 4.8%B. 26.5%C. 1.5%D. 4.5%满分:2.5 分10. 双因素方差分析涉及()。

应用统计学第2阶段江南大学练习题答案 共三个阶段,这是其中一个阶段,答案在最后。

应用统计学第2阶段江南大学练习题答案  共三个阶段,这是其中一个阶段,答案在最后。

江南大学网络教育第二阶段江南大学练习题答案共三个阶段,这是其中一个阶段,答案在最后。

考试科目:《应用统计学》第章至第章(总分100分)__________学习中心(教学点)批次:层次:专业:学号:身份证号:姓名:得分:一单选题 (共20题,总分值40分,下列选项中有且仅有一个选项符合题目要求,请在答题卡上正确填涂。

)1. 假设检验中所犯的错误有两种类型,α错误,是指()(2 分)A. 弃真错误,即拒绝正确的原假设。

B. 取伪错误,即接受一个错误的原假设。

C. 弃真错误,即接受一个错误的原假设。

D. 取伪错误,即拒绝正确的原假设。

2. 若随机变量X~N(5,1),则X落入下列哪个区间的概率为95.45%()。

(2 分)A. [-1,1]B. [-2,2]C. [4,6]D. [3,7]3. 掷二枚骰子,事件A为出现的点数之和等于3的概率为()(2 分)A. 1/11B. 1/18C. 1/6D. 都不对4. 在抽样推断中,必须遵循( )抽取样本(2 分)A. 随意原则B. 随机原则C. 可比原则D. 对等原则5. 在成数估计中,样本容量的取得通常与总体成数有关,但总体成熟未知,通常(2 分)A. 取成数为0.5B. 取成数为0C. 取成数的标准差最小D. 取抽样误差最小6. 我们希望从n个观察的随机样本中估计总体均值,过去的经验显示σ=15。

如果希望估计µ正确的范围在1.5以内,概率为0.95,应抽取样本中包含的样品数位()。

(2 分)A. 376B. 380C. 385D. 3867. 在抽样调查中( ) (2 分)第1页/共11页。

应用数理统计第二章参数估计(3)区间估计

应用数理统计第二章参数估计(3)区间估计

例1 有一大批月饼,现从中随机地取16袋,称得重量(以克 计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 ,设袋装月饼的重量近似地服从正态 分布,试求总体均值的置信度为0.95的置信区间。 解: 2未知, 1-=0.95, /2=0.025,n-1=15, t0.975 (15) 2.1315 由已知的数据算得 x 503.75, S* 6.2022
n1 (n2 1) S12 12 n1 (n2 1) S12 P F (n 1, n1 1) 2 F (n 1, n1 1) 1 2 /2 2 2 1 / 2 2 2 n2 (n1 1) S2 n2 (n1 1) S2
10
得所求的标准差的置信区间为 (4.58, 9.60)
2.4.3 两个正态总体参数的区间估计
在实际中常遇到下面的问题:已知产品的某一质量指标 服从正态分布,但由于原料、设备条件、操作人员不同,或 工艺过程的改变等因素,引起总体均值、总体方差有所改变, 我们需要知道这些变化有多大,这就需要考虑两个正态总体 均值差或方差比的估计问题。
ˆ a ˆ b} {g(a) T ( X , X ,..., X ; ) g(b)} { 1 2 n
其中g ( x )为可逆的已知函数, T ( X 1 , X 2 ,..., X n ; 况
设总体X~N(,2),X1, X2, …,Xn是总体X的样本,求,2 /2 /2 的置信水平为(1)的置信区间.
求得 的置信水平为(1)的置信区间: ( 2未知)
S S* t1 2 (n 1) or X t1 2 (n 1) X n1 n

应用统计学试题及答案2

应用统计学试题及答案2

二、单项选择题(每题1分,共10分)1.重点调查中的重点单位是指( )A.处于较好状态的单位B.体现当前工作重点的单位C.规模较大的单位D.在所要调查的数量特征上占有较大比重的单位2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。

A.各组的权数必须相等B.各组的组中值必须相等C.各组数据在各组中均匀分布D.各组的组中值都能取整数值3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。

由此可知两个班考试成绩的离散程度()A.甲班较大B.乙班较大C.两班相同D.无法作比较4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为()A.520公斤B.530公斤C.540公斤D.550公斤5.时间序列若无季节变动,则其各月(季)季节指数应为()A.100%B.400%C.120%D.1200% 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是()A.上升趋势B.下降趋势C.水平态势D.不能确定7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。

A.10.71%B.21.95%C.12%D.13.64% 8.置信概率表达了区间估计的()A.精确性B.可靠性C.显著性D.规范性9.H0:μ=μ,选用Z统计量进行检验,接受原假设H的标准是()A.|Z|≥Zα B.|Z|<Zα/2 C.Z≥Zα/2 D.Z>-Zα10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归方程可能是正确的?()A.y=125-10xB.y=-50+8xC.y=150-20xD.y=-15-6x六、计算题(共60分)1.某茶叶制造商声称其生产的一种包装茶叶平均每包重量不低于150克,已知茶叶包装重量服从正态分布,现从一批包装茶叶中随机抽取(99)(2)以99%的概率估计该批茶叶平均每包重量的置信区间(t0.005≈2.626);(3)在α=0.01的显著性水平上检验该制造商的说法是否可信(t(99)≈2.364);0.01(4)以95%的概率对这批包装茶叶达到包重150克的比例作出区间估=1.96);计(Z0.025(写出公式、计算过程,标准差及置信上、下限保留3位小数)(24分)2.某商业企业商品销售额1月、2月、3月分别为216,156,180.4万元,月初职工人数1月、2月、3月、4月分别为80,80,76,88人,试计算该企业1月、2月、3月各月平均每人商品销售额和第一季度平均每月人均销售额。

应用统计学--第2章数据的图表展示

应用统计学--第2章数据的图表展示

例如:说明词
员工满意度问卷调查 尊敬的员工:每年我们都对员工进行调查以 有助于我们为您提供最好的工作环境。请花费一 点时间填写如下简短的调查表。对您的回答内容 我们会绝对保密。提前谢谢您对本研究的参与和 支持!
问卷编排顺序
时间顺序 内容顺序,先易后难 类别顺序:静态、行为、态度 先封闭后开放等
例如:
您家里安装了空调吗
安装了
没有安装
目前的工作给我一种成就感。
很同意
同意
很难说 不同意
您的年收入是多少?
2万元以下 2万-3万 3万-4万 4万元以上
非结构型问卷 ✓ 开放型提问
即指所提问题不列出备选答案,答题类型也不作出任何 具体规定,而由被调查者根据自己的想法用文字表达自 己的意见。
例如:
*问卷组织者的行为和态度,不能对被调查者产生引导作用 。
• 问句常用的方式
是否式:用是、否、能、不能表示; 例:这种学习方式是否帮助您解决了学习矛盾?
是( ) 否( ) 选择式:包括类别型、条件型、等距型等; 例:类别型
如:您最喜欢的面对面的教学方式是: 系统讲授( ) 总结归纳( ) 讨论( ) 答疑( ) 辅导( ) 其他( ) 例:等距型 如:学校提供的上网服务适合您的需要吗? 适合( ) 基本适合( ) 一般( ) 基本不适合( ) 不适合( )
列标题
2.2.1 分类数据的整理与图示 2.2.2 数值型数据的整理与图示
1. 要弄清所面对的数据类型
不同类型的数据,采取不同的处理方式和方法
2. 对分类数据和顺序数据主要是作分类整理
3. 对数值型数据则主要是作分组整理
4. 适合于低层次数据的整理和显示方法也适合 于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据

应用统计学试题及答案2

应用统计学试题及答案2

一、判断题(每题1分,共5分)1.若两组数据的平均数相等,则标准差大的其平均数代表性就小。

()2.当数据分布右偏时,则有:均值<中位数<众数;反之,当数据分布左偏时,则有:众数<中位数<均值。

()3.定基增长速度等于各相应的环比增长速度的连乘积。

()4.在由三个指数构成的总指数(加权指数)体系中,两个因素指数中的权数必须是相同时期的。

()5.随机抽样调查时产生的偶然的代表性误差是完全可以控制的,因此这是一种非常好的调查方式。

()二、单项选择题(每题1分,共10分)1.重点调查中的重点单位是指( )A.处于较好状态的单位B.体现当前工作重点的单位C.规模较大的单位D.在所要调查的数量特征上占有较大比重的单位2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。

A.各组的权数必须相等B.各组的组中值必须相等C.各组数据在各组中均匀分布D.各组的组中值都能取整数值3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。

由此可知两个班考试成绩的离散程度()A.甲班较大B.乙班较大C.两班相同D.无法作比较4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为()A.520公斤B.530公斤C.540公斤D.550公斤5.时间序列若无季节变动,则其各月(季)季节指数应为()A.100%B.400%C.120%D.1200%6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是()A.上升趋势 B.下降趋势 C.水平态势 D.不能确定7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。

A.10.71%B.21.95%C.12%D.13.64%8.置信概率表达了区间估计的()A.精确性B.可靠性C.显著性D.规范性9.H0:μ=μ0,选用Z统计量进行检验,接受原假设H0的标准是()A.|Z|≥ZαB.|Z|<Zα/2C.Z≥Zα/2D.Z>-Zα10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归方程可能是正确的?()A.y=125-10xB.y=-50+8xC.y=150-20xD.y=-15-6x三、多项选择题(每题2分,共10分)1.抽样调查的特点有()。

应用统计学第2章 数据的搜集与整理

应用统计学第2章 数据的搜集与整理
第2章
掌握数掌握数据的测量尺度及常用类型; 了解统计数据搜集的意义; 掌握统计分组、分配数列的编制方法; 掌握数据图表展示方法。
本章教学目的
第2章 数据的搜集与整理
第2章
统计分组、分配数列的编制方法数据图表展示方法
本章重点和难点
第2章 数据的搜集与整理
第2章
2.4 分配数列
第2章
1.列表法
2.4 分配数列
2.4.3 品质分配数列的表示方法
第2章
2.图示法(1)条形图。条形图是指用宽度相同、高度不同的条形来表示数据变化的图形。条形图可以横向展示,也可以纵向展示,纵向展示时又称柱形图。
2.4.3 品质分配数列的表示方法
2.4 分配数列
第2章
2.图示法(2)饼图。饼图是用圆形及圆形面积的大小来表示数据数值大小的图形。饼图通常用来表示研究总体中各个组成部分的比例分布,对于结构性的研究问题非常实用。
2.5.2 统计表的分类
2.5 统计表
第2章
2.分组表 统计表的主词按照某种标志进行分组后所形成的表称为分组表,利用分组表可以展示统计总体不同现象的特征,说明各个分组之间的内部结构和相互关系,如表2-13所示。
2.5.2 统计表的分类
2.5 统计表
第2章
3.复合表统计表的主词按照两个或两个以上的标志进行分组的表称为复合表,如表2-14所示。
2.1.1 数据的测量尺度
第2章
2.1 数据的测量尺度与常用类型
第2章
1.绝对数、相对数和平均数绝对数是数据最基本的表现形式,是其他数据指标形成的基础。相对数反映了研究对象的相对水平,由两个相互联系的绝对数的对比而得到。平均数反映了研究对象的总体表现水平,是一个抽象了的研究对象总体各单位在某一数量标志下的表现差异,表示研究对象的总体各单位的一般水平,而不是某个单位的具体水平。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.823是30个元件的平均电阻值,反映该组数据分布的中心位置。
若得到的数据是经过分组的频数分布资料, 总体均值
1 X= & N
∑X
i =1
k
i i
f
样本均值
1 k x = ∑ xi f i & n i =1
式中Xi , xi为第 i 组的组中值。(说明:公式以数据在各组中均匀分布为
假定条件,违背该假定,则误差较大)
例:
将班级的全体同学视为一统计总体。 按性别分组;按民族分组;按年龄分组。
理工科组 男同学组 全体 同学 女同学组 文科组 文科组 理工科组
如何更有效的运作

目的:交大学生的 消费结构
总体:交大全体学生 总体:
男学生
女学生
城镇男学生
城镇女学生
农村男学生
农村女学生
沿海城镇 男学生
内地城镇 男学生
M d = (3.8 + 3.8) / 2 = 3.8 M d = 3.5 + 0.5(15 8) / 9 = 3.89 &
中位数将所有数据分为两半,一半比中位数小,另一半比中位 数大;由位置决定,不受极端值的影响;此外,中位数与数据观察 值的绝对离差和最小。
四分位数 将所有数据四等分的三个数值。 例13 1, 2, 2, 4, 7, 9, 11, 12, 13 最小值 四分位数 中位数 四分位数 最大值
频数 分布
属性分布数列 (按品质标志分组) 变量分布数列 (按数量标志分组) 单项式:组内每一个体 的分组标志值相同 组距式:组内每一个体 的分组标志值有相同 的上下界限
(2)组距式频数分布表的编制 排序,确定最大值L与最小值 l,计算极差(全距)R:R = L – l 确定分组个数,计算组距
样本容量(n) 50以下 50~100 100~250 250以上
1 n x = ∑ xi f i = 116 / 30 = 3.87 & 30 i =1
均值是统计学中非常重要的内容,因为任何统计推断和分析几乎 都涉及均值。从统计思想上看,均值反映了一组数据集中程度,是数 据数量规律性的一个特征值。是数据的偶然性、随机性相互抵消后的 稳定数值,反映数据的必然性的测度值。其次,均值有很好的数学性 质,如数据观察值与均值的离差之和为零,数据观察值与均值的离差 平方和最小)。为此,常常对均值进行修改以减少这种极端值的影响。 调整方法:去掉若干最大及最小的极端值,再计算均值,得到 所谓按一定百分数调整的均值。 (2)中位数 中位数 中位数是将数据排序后,位置处于最中间的那个数值。
途径
直接观察:通过观察对象的活动进行记录获得资料。 优点:资料全面生动,避免由于理解偏差造成的 误差。 缺点:耗时、人力,对观察者素质要求高。 访问: 与被调查对象直接接触,获得资料 问卷调查: 设计并发放调查表。 优点:避免调查人对调查对象的直接影响, 缺点:返回率低,无法保证调查表的质量。 统计报表 普查 重点调查 抽样调查 典型调查
组序 1 2 3 4 5 合计 分组界限 [2.5, 3.0) [3.0, 3.5) [3.5, 4.0) [4.0, 4.5) [4.5, 5.0) 频数 3 5 9 8 5 30 频率 0.1 0.165 0.3 0.27 0.165 1 频率密度 0.2 0.33 0.6 0.54 0.33
三、数据的描述性指标
3.4 2.7 3.9
分组界限 [2.5, 3.0) [3.0, 3.5) [3.5, 4.0) [4.0, 4.5) [4.5, 5.0)
频率密度 0.2 0.33 0.6 0.54 0.33
0.165 0.3 0.27 0.165 1
1 30 x = ∑ xi = 114.7 / 30 = 3.823 30 i =1
分组个数(k) 5~6 6~10 7~12 10~20
确定组限 计算频数,频率,频率密度(频率/组距)
例10
4.3 3.7 3.5 4.6 3.2 4.4 4.7 4.1 3.6 3.7 2.6 3.2 3.8 4.6 4.0 3.2 4.9 3.8 4.0 4.1 3.5 4.4 3.4 4.2 2.8 3.8 4.6 3.4 2.7 3.9
频数分布给出了数据的大概分布形状,需要进一步描述与刻画 其分布的数量特征,包括:集中程度(位置的测度)、分散程度以 及偏倚程度 1、集中程度 、 (1)均值 均值 均值(算术平均值)是数据集中程度的最主要的测度值。 总体均值计算公式 样本均值计算公式
1 X= N
∑X
i =1
N
i
1 n x = ∑ xi n i =1
…. xxx xxx xxx
….. xxx xxx xxx
….. xxx xxx xxx
2、统计资料收集的方法与途径 、 根据统计研究的目的和要求收集统计资料。所收集的资料必 须满足准确性、及时性和完整性的要求。 间接引用 方法 直接收集 实验式:设计统计实验,控制某些因素以研究其 对变量的影响。例如确定产品的价格弹性 观察式:对变量的影响因素不加任何限制。
例11 计算例10所给30个元件电阻数据的均值
4.3 3.7 3.5
组序 1 2 3 4 5 合计
4.6 3.2 4.4
4.7 4.1 3.6
3.7 2.6 3.2
3.8 4.6 4.0
3.2 4.9 3.8
频数 3 5 9 8 5 30
4.0 4.1 3.5
4.4 3.4 4.2
频率 0.1
2.8 3.8 4.6
对于未经分组的数据,中位数
M d的位置 = N + 1) / 2 M d的位置 = n + 1) / 2 ( (
若N(n)为奇数个,则X(N+1)/2 (x(n+1)/2)为中位数数值。若N(n)为偶数个, 则取最中间的两个数据,xn/2与x(n/2)+1的平均值为中位数数值。
对于已经分组的数据,中位数的近似计算公式为
第二部分 数据的整理与抽样
一、统计学的基本概念
1、统计资料 、 定义:凡是可以推导出某项论断的事实或数字均称为统计资料。 统计资料是进行分析、推断、预测的基础。要根据研究的目的、 要求,有计划地收集统计资料。 统计 资料 原始资料(初级):未经过加工处理的第一手统计调查资料。 次级资料:经过加工处理的数据(有权威性的公开发表的:统 计年鉴、行业协会公布的报告等等)。 度量数据:用数量尺度测量的数据,如年龄、成绩。 品质数据:不用数量尺度测量的数据,如性别,企业类型。
注:总体与个体的概念具有相对性,随研究目的确定。
4、标志 、 (1)定义:说明个体属性和特征的名称叫做标志。标志在个体的不 同取值叫做标志值。 统计意义上的标志必须是所有个体都共同具有的属性和特征。 (2)标志的分类 按表现 形 式 品质标志:以文字作为标志值,说明个体质的规 定性的标志, 数量标志:以数值表示标志值,说明个体的量的 规定性的标志。 按变异 情 况 不变标志:所有个体的标志值 均相同的标志。 可变标志:所有个体的标志值 不全相同的标志。 总体同质 性的基础 总体差异 性的条件
排序,L = 4.9 , l = 2.6, R = 2.3 确定分组个数,选 k = 5 组距 h = R/k = 0.46 取h = 0.5. 确定组限 第一组下限值为2.5, 上限值为3.0, …., 第五组下限 值为4.5,上限值为5.0, 计算频数,频率,频率密度,列出频数频率分布表
5、样本 、 (1)定义:从统计总体中抽取出来进行调查并据以推断总体的那部 分个体。样本中包含个体的树木称为样本容量,用 n 表示。 n 大于 30为大样本,否则为小样本。样本容量 n 与总体容量N的比值成为抽 样比,用 f 表示。 (2)样本类型: 代表性样本:样本单位的频数(具有某种特征的样本占样本总数的 比例)与总体频数成正比。 有偏样本:受到研究者认识偏见的影响而选择的样本。(产生抽样 偏差的主要原因)。 随机样本:在抽样时,每一个体被选入样本的概率相同且相互独立, 取决于偶然性,不受个体性质或研究者的意见和判断的影响。 分层样本:在抽样时,先将总体按某一标志分组,然后在各组中按 照随机抽样的原则抽取样本。 整群样本:按组或群抽取样本,而非独立的个体。 系统抽样:按照某种规律在总体中抽取样本。
沿海城镇 女学生
内地城镇 女学生
沿海农村 男学生
内地农村 男学生
沿海农村 女学生
内地农村 女学生
2、频数分布 、 (1)定义:在分组的基础上,全部个体在各组的分布状况(各组包 含的个体数量)称为频数分布。 各组的频数与样本容量之比称为频率(比率)。 由分组标志、频数、频率构成的表格称为频数频率分布表。
根据研究目的和任务选择分组标志 选择反映事物本质特征的标志 结合不同的时空条件选择分组标志
正确确定分组界限
(3)统计分组体系 将总体按照一个标志进行分组,称为简单分组。按照若干个标志 对总体进行分组形成统计分组体系。包括: 平行分组体系:同一总体的几个简单分组按照某一规定排列起来 就构成一个平行分组体系。 复合分组体系:总体按照两个或两个以上标志层叠起来分组,称 为复合分组体系。
(2)统计分组的要求与基本原则 统计分组的三个要素: 母项:要进行分组的总体; 子项:划分后的组总体; 分组标志:分组的依据。 统计分组的技术基本要求: 周延性:分组后的子项之和等于母项。 互斥性:组之间不能相互重叠。 分组标志的同一性:每次分组只能以一个标志为划分依据。 统计分组的两个基本原则: 正确选择分组标志
(3)众数 众数是将数据排序后,出现次数最多或有明显集中趋势的 众数 点的数值。正态分布或一般偏态分布中,分布最高点所对应的数值即 众数。如分布没有明显的最高点,则众数不存在。也可以有两个众数。 对于已经分组的数据,众数的近似计算公式为
N S m 1 Md = L + 2 i & fm
相关文档
最新文档