统计学上机作业(1)
统计学作业 (1)
1 糖厂用自动打包机打包,每包标准重量是100千克。
每天开工后需要检验一次打包机工作是否正常。
某日开工后测得9包重量(单位:千克)如下: 99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常(a =0.05)?解:H:μ=100;μ≠10021221.192)^9.995.100(2)^9.991.102(2)^9.997.98(2)^9.993.99(=-+-++-+-=Λσ055.0921221.11009.99-=-=-=n s x t μ所以当α2α2 某种大量生产的袋装食品,按规定不得少于250克。
今从一批该食品中任意抽取50袋,发现有6袋低于250克。
若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a =0.05)?271.250)05.01(05.005.012.0)1(=--=--=n p p p P Z 当α=2αα,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂。
3 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。
劳动效率可以用平均装配时间反映。
现从不同的装配方法中各抽取12件产品,记录各自的装配时间(单位:分钟)如下:甲方法:31 34 29 32 35 38 34 30 29 32 31 26乙方法:26 24 28 29 30 29 32 26 31 29 32 28两总体为正态总体,且方差相同。
问两种方法的装配时间有无显着不同 (a =0.05)?解:假设H 0:μ1-μ2=D 0⇔H 1:μ1-μ2≠D 0总体正态,小样本抽样,方差未知,方差相等,检验统计量)2111(21n n s x x t +-=根据样本计算n1=12,n2=1246183.22,6667.282,19446.31,75.311====s x s x 1326.8212122^71067.0*)112(2^92216.0*)112(2212^2)12(2^1)11(2=-+-+-=-+-+-=∧n n s n s n s 648.2)2111()21(=+-=n n s x x t 当α 临界点为t 2α(n1+n2-2)=t 0.025 4 调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。
统计学原理作业答案(1).doc
宁大专科《统计学原理》作业第一次作业一、单项选择题1、社会经济统计学研究对象(C )。
A、社会经济现象总体B、社会经济现象个体C、社会经济现象总体的数量方面D、社会经济现象的数量方面2、统计研究在( B )阶段的方法属于大量观察法。
A、统计设计B、统计调查C、统计整理D、统计分析3、、研究某市工业企业生产设备使用状况,那么,统计总体为( A )。
A、该市全部工业企业B、该市每一个工业企业C、该市全部工业企业每一台生产设备D、该市全部工业企业所有生产设备4、下列标志属于品质标志的是( C )。
A、工人年龄B、工人工资C、工人性别D、工人体重5、下列变量中,属于连续变量的是( C )。
A、企业数B、职工人数C、利润额D、设备台数6、把一个工厂的工人组成总体,那么每一个工人就是( A )。
A、总体单位B、数量标志C、指标D、报告单位7、几位工人的工资分别为1500元、1800元和2500元,这几个数字是( C )。
A、指标B、变量C、变量值D、标志8、变异的涵义是( A )。
A、统计中标志的不同表现。
B、总体单位有许多不同的标志。
C、现象总体可能存在各种各样的指标。
D、品质标志的具体表现。
9、销售额和库存额两指标( D )。
A、均为时点指标B、均为时期指标C、前者是时点指标,后者是时期指标D、前者是时期指标,后者是时点指标10、下列指标中属于时期指标的有( B )。
A、机器台数B、产量C、企业数D、库存额11、不同时点的指标数值( B )。
A、具有可加性B、不具有可加性C、可加或可减D、以上都不对12、某企业计划规定劳动生产率比上年提高5%,实际提高8%,则该企业劳动生产率计划完成程度为( B )。
A、86%B、102.86%C、60%D、160%13、某市2004年重工业增加值为轻工业增加值的85%,该指标是( C )。
A、比较相对指标B、结构相对指标C、比例相对指标D、计划相对指标二、简答题1、什么是总体和单位,举例说明。
统计学上机作业
统计学第一次上机实验一、上机项目名称:EXCEL、SPSS绘制统计图表二、上机时间:2011年10月 13日,下午14:00—15:50上机地点:基础楼综合实验室三、上机目的、内容、步骤及结果目的:掌握EXCEL、SPSS统计图表的基本操作内容:教材29页4题EXCEL;30页6题SPSS步骤及结果:○1 29页4题EXCEL:1、打开Nielsen的excel表格,并在相应位置输入TV Show、Millionaire、Frasier、Charmed、Chicago Hope、total、 frequency、relative frequency、percent frequency。
2、在Millionaire后的frequency中输入——函数——COUNTIF——range(所有的数组)——CRITERIE(C2)——确定,单元格中显示Millionaire的频数,并以此用此法求出Frasier、Charmed、Chicago Hope的频数。
3、在Millionaire后的relative frequency中输入=Millionaire 的frequency数值/50,得到Millionaire的相对频数。
并依次据此求出Frasier,Charmed,Chicago Hope,total的相对频数。
4、在Millionaire后的umulative frequency中输入=Millionaire 的relative frequency数值*100,得到Millionaire的百分频数,并据此求出Frasier,Chicago Hope,Charmed的百分频率。
5、选中名称列及频数所在的列单击插入——图表,分别插入二维柱形图和饼形图。
EXCEL 表格如下:Bar graph如下:Pie chart 如下:○2 30页6题SPSS: 1、打开spss ,打开——数据,更改数据格式为xls ,打开数据找到book 文件并打开。
《统计学基础》(专)网上作业1
《统计学基础》(专)网上作业一一、单项选择题。
1.一个统计总体( )A.只能有一个标志B.只能有一个指标C.可以有多个标志D.可以有多个指标2.下列变量中,()属于离散变量A.一包谷物的重量B.一个轴承的直径C.职工的月均工资D.一个地区接受失业补助的人数3.某研究部门准备在全市200万个家庭中抽取2 000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的总体是()A.2000个家庭B. 200万个家庭C.2000个家庭的人均收入D. 200万个家庭的人均收入4.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体单位是()。
A.全工业企业B.800家工业企业C.每一件产品D.800家工业企业的全部工业产品5.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为()。
A.200家公司的全部职工B.200家公司C.200家公司职工的全部工资D.200家公司每个职工的工资6.某市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一半情况,则这种调查属于()。
A.统计报表B. 重点调查C.全面调查D. 抽样调查7.某连续变量分为五组:第一组40~50,第二组50~60,第三组60~70,第四组70~80,第五组80以上,以习惯规定()。
A.50在第一组,70在第四组B. 60在第二组,80在第五组C.70在第四组,80在第五组D. 80在第四组,50在第二组8.对职工的生活水平状况进行分组研究,正确地选择分组标志应当用()。
A.职工月工资总额B.职工人均收入额C.职工家庭成员平均收入额多少D.职工的人均月岗位津贴及奖金的多少9.分配数列有两个构成要素,它们是()。
A.一个是单位数,另一个是指标数B.一个是指标数,一个是分配次数C.一个是分组,另一个是次数D.一个是总体总量,另一个是标志总量10.为了解居民对小区物业服务的意见和看法,管理人员挑选了由代表性的5户居民,上门通过问卷进行调查。
统计学基础 第一次作业
一、填空题1、按照所采用的计量尺度不同,可以将统计数据分为_分类数据_、_顺序数据_和_数值型数据_。
2、按照数据的收集方法的不同,可将统计数据分为_观测数据_和__实验数据_。
3、按照被描述的对象与时间的关系,可将统计数据分为_截面数据__和_时间序列数4、体重的数据类型是:clear all。
5、民族的数据类型是:CHAR。
6、空调销量的数据类型是:电器。
7、支付方式(购买商品)的数据类型是:分类变量。
8、学生对教学改革的态度(赞同、中立、反对)的数据类型是:顺序数据。
9、从总体中抽出的一部分元素的集合,称为___样本_____。
10、参数是用来描述_总体特征_______的概括性数字度量;而用来描述样本特征的概括性数字度量,称为___统计量_____。
11、参数是用来描述_总体特征_的概括性数字度量;而用来描述样本特征的概括性数字度量,称为_统计量_。
12、统计数据有两种不同来源:一是_直接来源__,二是__间接来源___。
13、统计数据的误差有两种类型,即__抽样误差_和_非抽样误差。
14、统计表由_数据__、__表头__、___行标题_和__列标题__四个部分组成。
15、统计分组应遵循“不____重_____不__漏_______”、“___上限______不在组内”的原则。
16、按取值的不同,数值型变量可分为_离散型变量__和_连续型变量_。
17、在数据分组中,_离散型变量_______可以进行单变量值分组,也可以进行组距分组,而___连续型变量_____只能进行组距式分组。
18、组距分组中,向上累积频数是指某组_上限以下_的频数之和。
19、将某地区100个工厂按产值多少分组而编制的频数分布中,频数是_各组的工厂数__。
20、频数分布中,靠近中间的变量值分布的频数少,靠近两端的变量值分布频数多,这种分布的类型是_U型分布_。
21、一组数据向某一中心值靠拢的倾向反映了数据的_中心点_。
《统计学》上机实验报告(一)
《统计学》实验报告一姓名:王璐专业:财政学(税收方向)学号:2010128107日期:2012年10 月9 日地点:实验中心701实验项目一描述性统计、区间估计在EXCEL里的实现一、实验目的1、掌握利用EXCEL菜单进行数据的预处理;2、掌握利用EXCEL进行描述性统计;3、掌握利用EXCEL进行区间估计。
二、实验要求1、EXCEL环境与数据预处理的操作;2、描述性统计,包括统计图表的绘制;数据分组处理;集中趋势描述、离散程度描述、分布形状描述。
3、区间估计,包括总体均值、总体比例、总体方差的区间估计计算。
三、实验内容(一)分类数据的描述性统计实验数据:餐厅服务质量和价位评价.XLS顾客服务质量评价的频数表(按性别分)、条形图、饼图(二)数值性数据的描述性统计实验数据:城乡居民储蓄数据.XLS随着生活水平的逐渐提高,居民的储蓄存款也在日益增加,数据2.XLS是自1990年~2006年城乡居民人民币储蓄存款额,储蓄存款包括定期和活期(单位:元)。
利用EXCEL,对数据2.XLS作如下分析:1、城乡居民人民币活期存款的众数、中位数和均值是多少?2、城乡居民人民币定期存款的方差和标准差是多少?3、定期存款和活期存款相比,哪种数据的变动性更大?(三)总体参数的区间估计1、成绩分析。
实验数据:期末成绩.XLS1假设学生的各门期末考试成绩均服从正态分布,选定一门课程,并给出该门课程平均成绩的置信水平为95%的区间估计。
2、顾客满意度分析。
某超市为了了解顾客对其服务的满意度,随机抽取了其会员中的50个样品进行电话调查,如果有38个顾客对此超市的服务表示满意,试求对该超市服务满意的顾客比例的95%置信区间。
四、实验结果(一)分类数据的描述性统计A顾客服务质量评价频数表(按性别分)评价等级男女极好45 21很好98 52好49 35一般20 11差9 10B条形图C.饼状图2(二)数值性数据的描述性统计解答:1.众数:无中位数:11615.9 均值:18553.592.方差:887955495.60 标准差:29798.583.活期存款的离散系数=标准差/均值=0.963602定期存款的离散系数=标准差/均值=0.696094因为0.963602>0.696094 所以,活期存款的变动性更大(三)总体参数的区间估计解答:1.根据区间估计的计算公式:均值±半径由题可得,均值=71.89474,半径=1.312076,得出最终结果,置信区间为:(70.5827,73.2068)2.根据总体比例的区间估计公式:比例±半径由题可得,比例 p=38/50=0.76,半径=0.1184 ,得出最终结果,置信区间为:(0.6416,0.8784)五、实验心得我个人认为自己的动手能力比较差,所以在做上机实验前,心里略有担心。
统计学原理作业一
统计学原理作业⼀《统计学原理》作业(⼀)(第⼀~第三章)⼀、判断题(每⼩题0.5分,共5分)1、社会经济统计⼯作的研究对象是社会经济现象总体的数量⽅⾯。
(√)2、统计调查过程中采⽤的⼤量观察法,是指必须对研究对象的所有单位进⾏调查。
( × )3、全⾯调查包括普查和统计报表。
(× )4、统计分组的关键是确定组限和组距(×)5、在全国⼯业普查中,全国企业数是统计总体,每个⼯业企业是总体单位。
(×)6、我国的⼈⼝普查每⼗年进⾏⼀次,因此它是⼀种连续性调查⽅法。
(×)7、对全同各⼤型钢铁⽣产基地的⽣产情况进⾏调查,以掌握全国钢铁⽣产的基本情况。
这种调查属于⾮全⾯调查。
(√)8、对某市⼯程技术⼈员进⾏普查,该市⼯程技术⼈员的⼯资收⼊⽔平是数量标志。
(×)9、对我国主要粮⾷作物产区进⾏调查,以掌握全国主要粮⾷作物⽣长的基本情况,这种调查是重点调查。
(√)10、我国⼈⼝普查的总体单位和调查单位都是每⼀个⼈,⽽填报单位是户。
(√)⼆、单项选择题(每⼩题0.5,共4.5分)1、设某地区有670家⼯业企业,要研究这些企业的产品⽣产情况,总体单位是(C )A、每个⼯业企业;B、670家⼯业企业;C、每⼀件产品;D、全部⼯业产品2、某市⼯业企业2003年⽣产经营成果年报呈报时间规定在2004年1⽉31⽇,则调查期限为(B)。
A、⼀⽇B、⼀个⽉C、⼀年D、⼀年零⼀个⽉3、在全国⼈⼝普查中(B)。
A、男性是品质标志B、⼈的年龄是变量C、⼈⼝的平均寿命是数量标志D、全国⼈⼝是统计指标4、某机床⼚要统计该企业的⾃动机床的产量和产值,上述两个变量是(D)。
A、⼆者均为离散变量B、⼆者均为连续变量C、前者为连续变量,后者为离散变量D、前者为离散变量,后者为连续变量5、下列调查中,调查单位与填报单位⼀致的是( D )A、企业设备调查B、⼈⼝普查C、农村耕地调查D、⼯业企业现状调查6、抽样调查与重点调查的主要区别是(D)。
统计学上机题作业
统计学上机题作业第一题
(1)由散点图可以发现产量与生产费用大致呈线性分布
(2)由上面的图表分析,可以发现产量与生产费用的线性相关系数为0.921
2、设月租金为自变量,出租率为因变量,进行回归分析,并对结果进行解释和分析散点图:
在模型汇总中,可得出相关系数r=0.795,判定系数R2=0.632,然后查表检验。
另外,在方差分析表(见上图)中可以查到SST=352.986,SSE=129.845,SSR=223.140,有公式R2=SSR/SST可以算出判定系数R2值为0.632。
①F-检验:然后在上表中我们可以看到F值:F=30.933,查表检验。
②t-检验:在系数表中,我们可以得出t=12.961,查表检验。
③DW检验:在模型汇总表中我们可以得到DW=2.001,。
④标准离差检验:在模型汇总表可以读出标准离差(误差)S=2.68582;在残差统计表中(下表)得到因变量y的均值为70.215。
因此有公式课得出δ=S/y(均值)
=2.68582/70.215=0.038
观测数据可得小于10%-15%,因此检验可以通过。
由此可见,在系数表中,容易得出回归系数:截距β0=49.318,斜率β1=0.249,如上图所示。
统计学作业1(综合指标)
统计学作业1一、单选1、总量指标按其反映现象的时间状况不同可分为()。
A、时期指标和时点指标B、数量指标和质量指标C、总体总量指标和标志总指标D、价值指标和实物指标2、下列属于时点指标的是()。
A、出生率B、死亡人数C、人口总数D、销售额3、计划规定成本降低5%,实际提高了2%,则计划完成程度相对数等于()。
A、 107%B、107.4%C、93.1%D、110%4、某班全部学生中,男生占52%,女生占48%,这种指标属于()。
A、强度相对指标B、比较相对指标C、结构相对指标D、比例相对指标5、某车间3月份生产老产品的同时,新产品小批投产,出现了6件废品,全车间废品率为1.5%,4月份老产品下马,新产品大批投产,全部产成品为10000件,其中废品为13件,则4月份产品质量()。
A、下降B、不变C、不确定D、提高6、每平方公里铁路长度属于()。
A、比较相对指标B、比例相对指标C、动态相对指标D、强度相对指标7、在同质总体中计算总量指标,只能是()。
A、总体单位B、有限总体C、无限总体D、有限与无限总体8、某产品规定五年计划最后一年产量应达到45万吨,计划执行情况资料如下:则该产品完成五年计划任务提前()。
A、一个季度B、三个季度C、一年D、两个季度9计划完成相对数时,分子和分母的数值是()。
A、只能是绝对数B、只能是平均数C、只能是相能数D、以上几种情况均可10某企业生产某产品的单位成本较上期降低5%,实际较上期降低4%,则计划完成程度相对指标的计算是()。
A、4%/5%×100%B、(4%/5%×100%)-1C、(100%-4%)/(100%-5%)D、104%/105%-111.不同空间条件下同类指标进行对比所得的综合指标称为().A、动态相对数B、比较相对数C、结构相对数D、比例相对数12下列属于结构相对指标的是()A、产值资金占用率B、产值计划完成程度C、百元流动资金实现的利税额D、净产值占产值的比重13.算术平均数的基本公式是()。
统计学作业1
统计学第一次作业〔2012年3月15日〕注意:作业全部为课后习题,请将必要的推导过程写出,不能只写答案。
本次作业共包括前四章的14道题目,个别题目有删减:第一章统计学的性质1-3答:〔1〕对于简单随机抽样,置信度为95%的置信区间公式为:表:历年盖洛普对总统选举的调查结果〔n=1500〕年度共和党民主党民主党候选人P*(1-P)/n 95%置信度总体比例的置信区间〔%〕实际选举结果〔%〕1960 尼克松49% 肯尼迪51% 0.0001666 51±2.5298 肯尼迪50.11964 戈德沃特36% 约翰逊64% 0.0001536 ☆64±2.4291 约翰逊61.31968 尼克松57% 汉弗莱50% 0.0001634 50±2.5303 汉弗莱49.71972 尼克松62% 麦戈文38% 0.0001571 38±2.4564 麦戈文38.21976 福特49% 卡特51% 0.0001666 51±2.5298 卡特51.11980 里根52% 卡特48% 0.0001664 ☆48±2.5283 卡特44.7〔2〕注☆:实际选举结果证明错误的置信区间2-2、在中国台湾的一项《夫妻对电视传播媒介观念差距的研究》中,访问了30对夫妻,其中丈夫所受教育X(以年为单位)的数据如下:18 20 16 6 16 17 12 14 16 1814 14 16 9 20 18 12 15 13 1616 2l 2l 9 16 20 14 14 16 16第二章描述性统计学2-2答:1) 将数据分组,使组中值分别为6,9,12,15,18,21,作出X的频数分布表;解:〔1〕数据分组如下:表:丈夫所受教育年限X频数分布表〔n=30〕分组编号组下、上限组中值X值〔年〕频数〔f〕相对频率〔 f / n 〕累积频率〔%〕1 [4.5,7.5〕6 6 1 0.0333 3.332 [7.5,10.5〕9 9、9 2 0.0666 10.003 [10.5,13.5〕12 12、12、13 3 0.1000 20.004 [13.5,16.5〕15 14、14、14、14、14、15、16、16、16、16、16、16、16、16、16 15 0.5000 70.005 [16.5,19.5〕18 17、18、18、18 4 0.1333 83.006 [19.5,22.5〕21 20、20、20、21、21 5 0.1666 100.00总计463 30 1.00002) 作出频数分布的直方图;解:〔图〕丈夫所受教育年限X数据直方图〔单位:年;n=30〕3) 问10.5年的教育在第几百分位数上?13年呢?解:10.5年的教育,累积频率为10.00%,前面有10.00%个样本,所以在第10个百分位数上;13年的教育,累积频率为20.00%,前面有20.00%个样本,所以在第20个百分位数上。
统计学上机实验题目
A.1. 要求筛选出(1)统计学成绩等于75分的学生;(2)数学成绩高的前3名学生;(3)4门课程成绩都大于70分的学生。
2. 要求筛选出(1)数学成绩等于60分的学生;(2)经济学成绩高的前4名学生;(3)4门课3. 要求筛选出(1)英语成绩等于85分的学生;(2)统计学成绩高的前4名学生;(3)4门课4. 要求筛选出(1)统计学成绩等于90分的学生;(2)经济学成绩高的前3名学生;(3)4门5. 要求筛选出(1)数学成绩等于85分的学生;(2)英语成绩高的前3名学生;(3)4门课程B.1. 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.较差;E.差。
调查结果如下所示;B EC C AD C B AE D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C要求编制品质数列,列出频率、频数,并选用适当的统计图如:圆形图、条形图等形象地显示资料整理的结果。
(要求展现整理过程)2. 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为: A.好;B.较好;C.一般;D.较差;E.差。
调查结果如下所示;A E C DB DC B A ED B D B C DE C E D A D B C C A E D B B B A C D E A B D D B C B C E C B C B B C D A C A C D E C E B B E C C A D D B A E B A C D E A B D E C A D B C C A E D B B C B C E D B D C A B要求编制品质数列,列出频率、频数,并选用适当的统计图如:圆形图、条形图等形象地显示资料整理的结果。
统计学(1)(1)
1、依据统计数据的收集方法不同,可将其分为【观测数据】数据和【实验数据】数据。
2、收集的属于不同时间上的数据称为【时间序列】数据。
5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 1080,中位数为1080。
7、设总体X ~),(2σμN ,x为样本均值,S 为样本标准差。
当σ未知,且为小样本时,则n sx μ-服从自由度为n-1的___t__分布。
1、数据分析所用的方法分为 描述统计方法 和 推断统计方法 。
2、数据的基本类型有 分类数据 、 顺序数据 和 数值型数据 。
3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是 1153.3 ,中位数是 1020 。
4、设连续型随机变量X 在有限区间(a,b)内取值,且X 服从均匀分布,其概率密度函数0()1f x b a ⎧⎪=⎨⎪-⎩则X 的期望值为 2a b + ,方差为2()12b a - 。
1、收集数据的基本方法是 自填式 、 面访式 和 电话式 。
2、依据统计数据的收集方法不同,可将其分为 观测数据 和 实验数据 。
3、分类数据、顺序数据和数值型数据都可以用 饼图 、 条形图 等图形来显示。
5、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有 方差 、 离散系数 。
5、原假设0H 为真时却被我们拒绝,称为 弃真错误 。
7、对回归方程线性关系的检验,通常采用的是 F 检验。
2、如果我们要研究某班学生的学习状况,则总体是 ,总体单位是_ _ 。
4、利用估计的回归方程进行区间估计有两种类型,一是 置信区间估计 ,二是 预测区间估计 。
8、在参数估计时,评价估计量的主要有三个指标是无偏性、 、有效性、一致性。
统计学上机实验报告
福建工程学院实习报告专业国际经济与贸易班级国贸1002座号3100509209姓名蔡小强日期2012年4月20日《统计学》实验一一、实验名称:数据的图表处理二、实验日期:2012年03月27日三、实验地点:经济管理系实验室四、实验目的和要求目的:培养学生处理数据的基本能力。
通过本实验,熟练掌握利用Excel,完成对数据进行输入、定义、数据的分类与整理。
要求:就本专业相关问题收集一定数量的数据( 30),利用EXCEL进行如下操作:1.进行数据排序2.进行数据分组3.制作频数分布图、直方图和帕累托图,并进行简要解释4. 制作饼图和雷达图,并进行简要解释五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件六、实验过程(一)问题与数据下面是一种金属零件重量的误差数据单位:g27.3 67.9 74.1 55.6 32.5表1-1(二)实验步骤1、将上表数据复制到EXCEL中;2、将上述数据调整成一列的形式;3、选择“数据-排序“得到由小到大的一列数据。
4、选择“插入-函数(fx)-数学与三角函数-LOG10”图1-1计算lg50/lg2=5.64,从而确定组数为K=1+ lg100/lg2=6.64 这里为了方便取为10组;确定组距为:(max-min)/K=(87.8-19.1)/10=6.87 取为7;5、确定接受界限为 24.0 31.0 38.0 45.0 52.0 59.0 66.0 73.0 80.0 87.0 分别键入EXCEL 表格中,形成一列接受区域;6、选“工具——数据分析——直方图”得到如下频数分布和直方图金属零件重量误差的频数分布表1-2金属零件重量误差的直方图图1-27、将其他这行删除,将表格调整为:表1-38、选择“插入——图表——柱图——子图标类型1”,在数据区域选入接收与频率两列,在图表标题中输入频率。
做出的图形如下图所示:图1-39、双击上述直方图的任一根柱子,将分类间距改为0,得到新的图.图1-410、选择“插入——图表——饼图”,得到金属零件重量的误差饼图:图1-511、选择“插入——图表——雷达图”,得到金属零件重量的误差雷达图图1-6(三)实验结果分析:从以上直方图可以发现,金属零件的重量误差大致呈对称分布,其中54.0—60.0出现的频次最多,从饼图和雷达图也能够比较清晰地看出这样的结果。
《统计学》上机实验例题(一)
• •
2010年
生成频数分布表
(列联表—Excel)
不同类型饮料和顾客性别的频数分布
绿色 健康饮品
2010年
分类数据的图示—条形图
(bar Chart)
2010年
分类数据的图示—复式条形图
(bar Chart)
• 饮料类型和顾客性别的条形图
2010年
分类数据的图示—帕累托图
(pareto chart)
(a)向上累积
非常 不满意 一般 满意 不满意 (b)向下累积
甲城市家庭对住房状况评价的累积频数分布
环形图
(例题分析)
13% 10% 7% 8% 非常不满意
15%
21% 36% 33% 不满意
一般
31% 26% 甲乙两城市家庭对住房状况的评价 满意 非常满意
用Excel制作图形
2.3 数值型数据的整理与展示 2.3.1 2.3.2 数据分组 数值型数据的图示
温度 / 0C 6 8 降雨量 /mm 25 40 产量/ ( kg/hm2 ) 2250 3450
位面积产量与降雨量 和温度等有一定关系 。为了解它们之间的 关系形态,收集数据 如表。试绘制小麦产 量与降雨量的散点图 ,并分析它们之间的 关系。
10
13 14 16 21
58
68 110 98 120
一、数值型数据:用数据分析中的直方 图编制频数分布表;绘制直方图折线图
【 例 2.5】 (
见教材38~ 42页) 表中
是某电脑公 司 2002 年 前 四个月各天 的销售量数 据(单位:台) 。试对数据 进行分组
等距分组表
(上下组限重叠)
分组数据的图示
(直方图的绘制)
统计学上机实验一、二
数据的收集、整理与显示统计数据的收集、整理与显示是统计分析的基础和初步,其中涉及到抽样方法的选择,数据的筛选、排序,数据的分类和分组以及频数分布的制作等。
本章主要介绍如何使用Excel 进行相应处理,其中第一节统计数据的收集,介绍“抽样”工具的使用;第二节数据的预处理,介绍“筛选”、“排位和百分比排位”工具的使用;第三节品质数据的整理与显示,介绍如何使用“直方图”工具制作品质型数据的频数分布;第四节数值型数据的整理与显示,介绍如何使用“直方图”工具制作数值型数据的频数分布以及多变量数据的雷达图制作。
第一节统计数据的收集数据的处理是数据整理的先前步骤,是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序等。
本节主要介绍Excel中筛选和排序功能的使用。
一、数据筛选数据筛选包括两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除。
下面举例说明Excel进行数据筛选的过程。
表1-28名学生的考试成绩数据单位:分表1-2是八名学生四门课程的考试成绩数据,使用Excel“筛选”命令分别找出统计成绩等于75分的学生;英语成绩前三名的学生;数学成绩大于80小于90的学生;统计成绩和数学成绩大于80分,或者英语成绩大于90分的学生。
Excel提供了两种筛选命令:“自动筛选”(适用于简单的条件)和“高级筛选”(适用于复杂的条件)。
接下先来介绍“自动筛选”的使用。
首先,将表格中的数据区域选定或者只需确保活动单元格处于数据区域既可(如表1-2所示,活动单元格为B3)。
选择“数据”菜单,并选择“自动筛选”命令。
如图1.6所示。
图1.6从“数据”菜单中选择“筛选自动”这时会在第一行(列标题)出现下拉箭头,用鼠标点击箭头会出现如下结果,如图 1.7所示。
图1.7“自动筛选”命令图1.8统计成绩75分的学生图1.9英语成绩前三名的学生图1.10数学成绩大于80小于90的学生要筛选出统计学成绩为75分的学生,可选择75,得到图1.8的结果;要筛选出英语成绩最高的前三名学生,可在英语成绩下拉箭头选项中选择“前10个”,并在对话框中输入“3”,得到如图1.9所示结果。
西南大学《统计学》网上作业题答案
西南大学《统计学》网上作业题答案(0062)《统计学》网上作业题答案 1:第一次作业2:第二次作业3:第三次作业4:第四次作业5:第五次作业6:第六次作业 1:[论述题] 方法辨析题: 164组,每组被试分别解决一种算术问题:加、减、乘、除,各10道,记录下平均解题时间,问小学生解决四类问题的解题时间有否显著差异。
参考答案:该题是均值的显著性检验问题,由于总体方差未知,应使用t检验法。
2:[论述题] 欲考查自尊水平高低对于驾驶攻击行为的影响。
通常抽样筛选出两组高、低自尊的被试,分别测量其在驾驶攻击行为量表上的得分。
应如何进行统计检验?参考答案:该题有四个实验条件,考虑使用方差分析。
因为每组被试分别接受一种实验处理,故可直接使用单因素完全随机化设计的方差分析。
3:[论述题] 方法辨析题:参考答案:该题是一个均值的显著性检验问题,由于总体方差未知,可以使用t 检验法,但由于样本容量较大,也可以直接使用z检验法。
4:[论述题] 方法辨析题: 75,10,现欲选出40%高分者录用,问分数线应当定成多少?参考答案:该题是一个均值的显著性检验问题,由于总体方差未知,可以使用t 检验法,但由于样本容量较大,也可以直接使用z检验法。
5:[论述题] 方法辨析题(因出题系统无法提供该选项,故方法辨析题与计算题均作为论述题,下同):参考答案:前一问应用皮尔逊积差相关系数或一元线性回归法。
后一问应用非参数的相关法,如斯皮尔曼等级相关法。
6:[单选题]下列检验方法,属于非参数检验的是?A:F检验B:正态Z检验C:卡方独立性检验D:方差显著性的卡方检验参考答案:C前一问应用皮尔逊积差相关系数或一元线性回归法。
后一问应用非参数的相关法,如斯皮尔曼等级相关法。
7:[单选题]下列描述中,属于零假设的是?A:少年班大学生的智商高于同龄人B:母亲的耐心程度与儿童的问题行为数量呈负相关关系C:在高光照条件下的视觉简单反应时优于低光照条件下的视觉简单反应时D:听觉工作记忆容量不大于视觉工作记忆容量参考答案:D前一问应用皮尔逊积差相关系数或一元线性回归法。
电子科技大学14秋《统计学》在线作业1答案
统计学 14秋《统计学》在线作业1一,单选题1. 下面哪一种动态数列中的指标数值直接相加具有现实意义()。
A. 相对数动态数列B. 平均数动态数列C. 时期数列D. 时点数列?正确答案:C2. 某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程y=a+bx。
经计算,方程为y=200-0.8x,该方程参数的计算()。
A. a值是明显不对的B. b值是明显不对的C. a值和b值都是不对的D. a值和b值都是正确的?正确答案:D3. ()是对分布偏向方向及程度的测度。
A. 极差B. 内距C. 偏态D. 峰度?正确答案:C4. 在数据分组时,一定要遵守()原则。
A. 不偏不倚B. 不重不漏C. 不高不低D. 不多不少?正确答案:B5. 原假设不真时未拒绝原假设,这类错误为()。
A. 第一类错误B. 两类错误C. 第二类错误D. 无法判断?正确答案:B6. 要准确地反映异距数列的实际分布情况,必须采用()。
A. 次数B. 累计频率C. 频率次数D. 密度?正确答案:D7. 在()中,“0”表示某一个数值,不表示“没有”或“无”。
A. 顺序尺度B. 间隔尺度C. 列名尺度D. 比例尺度?正确答案:B8. 某地区各类粮食作物收获率都有一定程度的提高,而收获较高的粮食作物播种面积也相对扩大,为反映这两因素对粮食平均收获率的影响,应计算()。
A. 综合指数B. 固定构成指数C. 平均指数D. 可变构成指数?正确答案:D9. 中位数和众数是一种()。
A. 代表值B. 常见值C. 典型值D. 实际值?正确答案:A10. 从1000件产品中抽出10件,有4件次品,问这批产品能否出厂(=整批产品的次品率P 是否低于4% )?则原假设为()。
A. P<4%B. P=4%C. P>4%D. P<=4%?正确答案:D二,多选题1. 抽样误差是()。
A. 样本平均数与总体平均数之差B. 登记性误差C. 代表性误差D. 样本成数与总体成数之差?正确答案:ABCD2. 相关关系与函数关系各有不同的特点,主要体现在()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学上机作业(1)一、利用软件计算1、宾馆未露面者人数进行统计频数分析,分析结果对确定超员预定客房数有何帮助?(数据参见课件)因而得出结论该宾馆可以增加订房数,以使得宾馆的到充分运用。
2、文件名:DA TA11-02文件说明:1973年某市测量120名12岁男孩身高资料。
变量说明:height: 12岁男孩身高绘制身高分布的直方图,求出该市12岁男孩身高平均值95%和99%的置信区间,说明置信系数与区间宽度之间的关系。
(1)当平均值是95%时:(2)当平均值是99%时有置信区间的:当置信度为95%时,为(141.996,144.100),当置信度为99%时,为(141.657,144.439)说明置信度越大估计精度越差。
3、文件名:DA TA09-03文件说明:1969-1971年美国一家银行的474名雇员情况的调查数据,其中包括工资、受教育水平、工作经验、种族等数据。
变量说明:ID:Employee Code(雇员代码) GENDER:性别 BDATE:Date of Birth(出生日期)EDUC:Educational Level (years)(受教育年份) JOBCAT:Employment Category(工作地位)SALARY:Current Salary(当前工资) SALBEGIN:Beginning Salary(起始工资)JOBTIME:Months since Hire(雇佣月份) PREVEXP:Previous Experience (months)(以前工作经历) MINORITY:Minority Classification(特殊群体) AGE:年龄A、请分别求出该银行中男雇员、女雇员工资平均值的95%的置信区间。
Case Processing SummaryCasesValid Missing TotalGender N Percent N Percent N P ercentCurrentSalaryFemale 216 100.0% 0 .0% 216 100.0%Male 258 100.0% 0 .0% 258 100.0%DescriptivesGender Statistic S td. ErrorCurrentSalaryFemale Mean $26,031.92$514.2695% Confidenc e IntervalLowerBound$25,018.29for MeanUpper Bound $27,045.555% TrimmedMean $25,248.3Median $24,300.0Variance 57123688.268Std.Deviation$7,558.02Minimum $15,750M aximum $58,125Range $42,375Interquartile Range$7,012.50Skewness 1.863 .166Kurtosis 4.641 .330Male Mean $41,441.78$1,213.9795% Confidenc e Interval for MeanLowerBound$39,051.19Upper Bound$43,832.375% Trimmed Mean$39,445.87Median$32,850.00Variance380219336.303Std.Deviation$19,499.21Minimum$19,650M aximum$135,000Range$115,350Interquartil e Range$22,675.00Skewness1.639 .152Kurtosis2.780 .302所以得女职工工资均值的置信度为95%的置信区间为:(25,018.29,27,045.55) 男职工工资均值的置信度为95%的置信区间为:(39,051.19,43,832.37) B 、请计算出男女平均工资差异的95%的置信区间,并对差异程度做出解释。
Group StatisticsGenderNMeanStd. Deviation Std. Error MeanCurrent SalaryMale258 $41,441.78 $19,499.21 $1,213.97Female216 $26,031.92$7,558.02 $514.26Independent Samples TestLevene'sTest for Equality of Variancest-test for Equality ofMeansFSig.tdfSig.(2-tailed) Mean Difference Std. ErrorDifference 95% Confidenc e Intervalof the DifferenceLower U pperCurrent SalaryEqual variances assumed 119.669.00010.945472.000 $15,409.86$1,407.91 $12,643.32 $18,176.4Equal variancesnot assumed11.688344.262.000 $15,409.86$1,318.40 $12,816.73 $18,003.0由图的置信区间为: (12,643.32,12,816.73)C 、请求出雇员当前工资与起始工资平均值的95%的置信区间。
、Paired Samples StatisticsMeanNStd. Deviation Std. Error MeanPair 1Current Salary $34,419.57 474 $17,075.66 $784.31Beginning Salary$17,016.09 474 $7,870.64 $361.51Paired Samples CorrelationsN Correlation S ig.Pair 1Current474.880 .000Salary & BeginningSalaryPaired Samples TestPaired Differences t df S ig.(2-tailed)Mean Std.Deviation Std. ErrorMean95%Confidence Intervalof theDifferenceLower UpperPair 1Current Salary - BeginningSalary $17,403.48$10,814.62$496.73 $16,427.41$18,379.5635.036 473 .000由结果的置信区间为:(16,427.41,18,379.56)4、文件名:DA TA10-04文件说明:29名13岁男生的身高、体重、肺活量数据。
变量说明:no:编号;height: 身高; weight: 体重; vcp : 肺活量.请求出身高大于等于155cm(≥155cm)与身高小于155cm(<155cm)的两组男生体重与肺活量平均值的95%的置信区间。
由图的置信区间为:对于体重来说为(3.3231,10.1288)对于肺活量来说(0.07110,0.70534)5、文件名:DA TA11-03文件说明:10位高血压患者在施以体育疗法前后测定舒张压的数据。
变量说明:number:编号pretreat:治疗前舒张压(mmHg) posttreat:治疗后舒张压(mmHg) 请求出治疗前与治疗后患者血压平均值差异的95%的置信区间。
说明体育疗法对高血压有无治疗效果。
由t值为5.639不在区间(10.180,23.820)内,所以认为体育疗法对高血压有治疗效果。
6、文件名:DA TA11-04文件说明:经过严格挑选12名排球运动员用新训练方法进行训练,训练前后分别测试6项技术指标的数据。
变量说明:NUMBER:编号;BHAND:前手形控制;AHAND:后手形控制;BCFC1:前睁眼力控制;ACFC1:后睁眼力控制;BCFC2:前闭眼力控制;ACFC2:后闭眼力控制;BACUR:前准确性;AACUR:后准确性;BFOCL:前左用力感;AFOCL:后左用力感;BFOCR:前右用力感;ADOCR:后右用力感请计算出训练前后手形控制、睁眼力控制、闭眼力控制、准确性平均值差异95%的置信区间。
对新训练方法的效果做出说明。
(1)训练前后手形控制平均值差异95%的置信区间是(-1.5111,-0.7389)t=-6.413不在区间内所以认为新训练方法的有效果。
(2)训练前后睁眼力控制平均值差异95%的置信区间是(-4.412,-1.421)t=-4.293在区间内所以认为新训练方法的无效果。
(3)训练前后闭眼力控制平均值差异95%的置信区间是(-5.600,-3.400),t=-9.000不在区间内所以认为新训练方法的有效果。
(4)训练前后准确性平均值差异95%的置信区间是(-6.099,-3.567),t=-8.403不在区间内所以认为新训练方法的有效果。
7、文件名:DA TA18-27文件说明:150名三岁女童身高数据。
请计算出身高在85cm-100cm之间的三岁女童所占的比例,第10%,30%,70%分位数。
Statistics第10%,30%,70%分位数分别为:86.540,90.130,94.970。
Hight (cm)Hight (cm)Frequency Percent Valid Percent Cumulative PercentValid 80.1 1 .7 .7 .782.31 .7 .7 1.382.51 .7 .7 2.083.51 .7 .7 2.784.21 .7 .7 3.384.42 1.3 1.3 4.784.52 1.3 1.3 6.085.01 .7 .7 6.71 .7 .7 7.3 85.21 .7 .7 8.0 85.71 .7 .7 8.7 86.21 .7 .7 9.3 86.41 .7 .7 10.0 86.51 .7 .7 10.7 86.91 .7 .7 11.3 87.11 .7 .7 12.0 87.21 .7 .7 12.7 87.31 .7 .7 13.3 87.41 .7 .7 14.0 87.61 .7 .7 14.7 87.91 .7 .7 15.3 88.01 .7 .7 16.0 88.11 .7 .7 16.7 88.22 1.3 1.3 18.0 88.41 .7 .7 18.7 88.51 .7 .7 19.3 88.71 .7 .7 20.0 88.92 1.3 1.3 21.3 89.02 1.3 1.3 22.7 89.11 .7 .7 23.3 89.23 2.0 2.0 25.3 89.31 .7 .7 26.0 89.41 .7 .7 26.7 89.71 .7 .7 27.3 89.83 2.0 2.0 29.3 90.01 .7 .7 30.0 90.11 .7 .7 30.7 90.22 1.3 1.3 32.0 90.31 .7 .7 32.7 90.41 .7 .7 33.3 90.51 .7 .7 34.0 90.61 .7 .7 34.7 90.72 1.3 1.3 36.0 90.83 2.0 2.0 38.0 91.11 .7 .7 38.7 91.31 .7 .7 39.3 91.43 2.0 2.0 41.3 91.71 .7 .7 42.0 91.81 .7 .7 42.7 91.91 .7 .7 43.3 92.11 .7 .7 44.0 92.31 .7 .7 44.7 92.42 1.3 1.3 46.0 92.51 .7 .7 46.7 92.62 1.3 1.3 48.0 92.73 2.0 2.0 50.0 92.82 1.3 1.3 51.3 92.91 .7 .7 52.0 93.01 .7 .7 52.7 93.12 1.3 1.3 54.0 93.21 .7 .7 54.7 93.31 .7 .7 55.3 93.41 .7 .7 56.0 93.53 2.0 2.0 58.0 93.61 .7 .7 58.7 93.71 .7 .7 59.3 93.81 .7 .7 60.0 93.91 .7 .7 60.7 94.01 .7 .7 61.3 94.23 2.0 2.0 63.3 94.33 2.0 2.0 65.3 94.41 .7 .7 66.0 94.51 .7 .7 66.7 94.62 1.3 1.3 68.0 94.72 1.3 1.3 69.3 94.81 .7 .7 70.0 94.91 .7 .7 70.7 95.04 2.7 2.7 73.3 95.11 .7 .7 74.0 95.52 1.3 1.3 75.3 95.61 .7 .7 76.0 95.81 .7 .7 76.7 96.02 1.3 1.3 78.0 96.21 .7 .7 78.7 96.31 .7 .7 79.3 96.41 .7 .7 80.0 96.51 .7 .7 80.7 96.61 .7 .7 81.3 96.71 .7 .7 82.0 96.82 1.3 1.3 83.3 97.01 .7 .7 84.0 97.11 .7 .7 84.7 97.2由表格的85cm的累积百分比为6.7%,100cm的累积百分比94.7%,所以身高在85cm-100cm之间的三岁女童所占的比例为94.7%-6.7%=88%。