spss期末作业

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

吉林财经大学

《SPSS统计软件分析》作业(2010——2011学年第一学期)

学院信息学院

专业班级电子商务0806班

学生姓名王瑞霞

学号1403080616

1、对未分组资料频数分析

从中国统计局中获得从11月21日至30日国内50个城市主要食品平均价格变动情况,以该数据为例为例,进行频数分析。

首先输入数据:

选择Analyze中Descriptive Statistics——Frequencies,打开Frequencies对话框;将需处理的变量键入变量框中

单击Statistics…按钮统计量子对话框12指标,选中所需要计算的指标:

单击Charts …按钮,选择需绘制的统计图:

单击OK按钮开始运行,运行结果为:

从上图中可以看出数据中缺失值为0,花生油的平均价格104.84是最高的,而巴氏牛奶的平均价格1.81最低,全部食品平均价格的平均数为16.5327,标准差为22.4668,各种食品的平均价格差距较大。

条形图、饼形图以及直方图是用不同的图形表示方法来说明数据的指标,其实质是一样的,从图中可以看出平均价格在0—22元之间的食品是最多的,20—40元之间的食品数次之,接下来是40—60元之间的食品,不存在平均价格在60—100之间的食品。

2、以食品平均价格为依据对数据进行分组并对分组后的数据进行频数分析:

Transform —Recode—Into same V ariables ,将要分组的变量放入Numeric 栏中,单击Old and new V alues分组:

分组结果如下图所示:

回到数据编辑窗,定义变量的V alue labels :

再对食品平均价格进行频数分析,分析结果如下截图所示

Statistics

价格

a Calculated from grouped data.

b The lower bound of the first interval or the upper bound of the last interval is not known. Some percentiles are undefined.

c Percentiles are calculate

d from grouped data.

由表中可以看出数据中缺失值为0,最大值为3,最小值为1,总体均值为1.2308,标准差为0.58704.

价格

Frequency Percent Valid Percent Cumulative Percent

Valid 1-25 22 84.6 84.6 84.6

26-50 2 7.7 7.7 92.3

51- 2 7.7 7.7 100.0

Total 26 100.0 100.0

此图代表的含义是,原始数据中值在1到25之间的部分所占的个数为22个,所占的有效百分比为84.6%。后两行所代表意思同上,总体样本值为26。

上图为进行分组后的食品平均价格的直方分布图和正态分布曲线,由图可以看出分组后的数据食品平均价格在0.5至1.5之间的频率是最大的,而平均价格在1.5-2.5和2.5-3.5之间的频率是一样的。

3、将原始数据的价格按2操作中的分组标准找到每组的组中值及每组的次数,按次数进行加权后再进行频数分析。

应用数据菜单下的加权个案:

将次数作为权数后进行频数分析,结果如下图:

18.53461,方差为343.532,最小值为12.5,最大值为77.92.

为对上述几行的汇总。

由上图可以看出总体均值为19.4938,标准差为18.5346,组中值在10到这20之间的频数最多,30-40间的频数和70-80间的频数相同,都为2,20-30之间和40-70之间没有要分析的组中值。

4、Descriptives分析

由截图可以看出,对食品的平均价格进行Descriptives分析,可以看出总共的样本个数共26个,平均价格最大值为104.84,最小值为1.81,所有样本平均价格的总和为429.85。

5、Explore探索性数据分析

数据如图:

以性别为分组变量对总成绩进行分析,输出结果摘要图如下:

失值为0.

由图中可以看出是将原始数据分为男生和女生两组来分别进行分析的,结果中分别计算出了男生成绩和女生成绩的相关指标,男生总体平均成绩为84.286,女生总体平均成绩为83.219,相差不大;男生总体标准差为5.4657,女生总体标准差为5.5916,等其他的描述指标。

系统还进行数据的茎叶图形描述:

箱形图描述:

运行data—sort Cases

排序后:

7、“Compute Variable”命令,根据已存在的变量建立新变量,增加一列,表示每位同学总成绩与上学期成绩相比的提升或降低的幅度:

变量提升或降低幅度如果为负数,表示该同学今年的成绩与上学期相比降低了,数值表示降低了百分之几,如果是正数则表示该同学的成绩与上学期相比是提高的,数值相应表示提高了百分之几。

8、处理考试成绩的缺失值

原数据:

利用转换下的处理缺失值进行处理,采用该列的平均值进行替换。

替换后结果图:

9、进行文件的合并

准备工作,建立一张只包含学号、性别、年龄、平时成绩、考试成绩、总成绩和上学期成绩的文件。

原数据图:

要合并文件的数据:

再利用数据下的合并文件中的添加个案进行文件合并处理,合并后的数据图:

10、个案或变量转置(移位)

相关文档
最新文档