定型数据分析论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
评分表
题目:探讨大学生是否是党员对智育成绩高能入党的看法
学号:xxxx 姓名:xxxx
评分标准
项目要求分值得分
写作1.题目恰当
2.摘要书写合理、规范10
3.图表,公式规范
4.引用,注释规范
10 5.文章书写结构合理,语言流畅,
结构完整。
无错别字
30
内容6.观点合理10
7.分析方法,手段合理恰当。
30
8.结论可信10
合计100
定性数据分析期末论文
题目:探讨大学生是否是党员对智育成绩高能入党的看法班级:xxx级数学与应用数学xxx班
姓名: xxx
学号: xxx
探讨大学生是否是党员对智育成绩高能入党的看法
摘要
1、目的
为了更好的建立党员与群众之间的关系,党员与党员之间的关系,从而更科学更具体的发展我们系的党员。
我们通过调查2011级四个班的学生们对是否是党员与对智育成绩高能入党的看法。
通过这个调查了解同学们的心声,听听她们的意见。
2、方法
通过对2011级四个班的同学进行发问卷的形式进行调查,了解他们对智育成绩高能否入党的看法,并对这个数据进行收集整理分析,其中对数据进行分层与压缩处理,其中压缩包括层压缩,行压缩,列压缩,分别用Excel和spss软件,把数据表示成直观的图表表示和数据处理结果的直观显示。
3、结果
通过对2011级四个班的同学进行问卷调查,并对数据进行分析处理结果如下:
G=5986 H=3682
Kendall T系数T=0.1533 se(T)=0.4417 U=T/se(T)
=0.3471
P=P(N(0,1)
≥0.3471)≈0
Gamma系数r=0.2383 se(r)=0.6992 U=r/ se(r)
=0.3408
P=P(N(0,1)
≥0.3408)≈0
Somers 系数se(d B|C)=0.2417 U= d B|C/ se(d B|C) P=P(N(0,1)
d B|C =0.1453 =0.6011 ≥0.6011)≈0
Somers 系数d C|B=0.1616 se(d C|B)=0.7579 U= d C|B/ se(d C|B)
=0.2132
P=P(N(0,1)
≥0.2132)≈0
4、结论
通过对2011级学生进行问卷调查,并用excel和spss对数据进行汇总,整理分析计算得出的结论是性别、是否是党员、对智育成绩高能入党的看法三者之间正相合。
关键字
压缩、分层、假设检验、逻辑斯蒂回归模型、是否是党员、智育成绩高、大学生。
To investigate whether college students party members views on the academic achievement of high energy into the party.
Abstract
1, objective
In order to establish the relationship between the party and the masses better, the relationship between Party members and Party members, and more scientific and more specific members of our department. The students in grade 2011 four class on whether Party members and views on the academic achievement of high energy into the party. Understanding the students. Through this investigation, listen to their opinions.
2, methods
Through the 2011 grade four classes of students were sent in the form of a questionnaire survey, to understand their intellectual performance can join the high opinion, and the data were collected, which were stratified and compression of data compression, which include layer compression, row column compression, compression, respectively using Excel and SPSS software, the data is expressed as a visual representation and data processing results show.
3, the results
Through carries on the questionnaire survey to 2011 grade four classes of students, and analyze the data processing results are as follows:
G=5986 H=3682
Kendall T系数T=0.1533 se(T)=0.4417 U=T/se(T)
=0.3471
P=P(N(0,1)
≥0.3471)≈0
Gamma系数r=0.2383 se(r)=0.6992 U=r/ se(r)
=0.3408
P=P(N(0,1)
≥0.3408)≈0
Somers 系数d B|C =0.1453 se(d B|C)=0.2417 U= d B|C/ se(d B|C)
=0.6011
P=P(N(0,1)
≥0.6011)≈0
Somers 系数d C|B=0.1616 se(d C|B)=0.7579 U= d C|B/ se(d C|B)
=0.2132
P=P(N(0,1)
≥0.2132)≈0
4, the conclusion
Through a questionnaire survey of 2011 students, and the data were pooled using Excel and SPSS, finishing the analysis concluded that gender, whether or not, Party members and between the views of the academic achievement of high energy joined the party three.
Key words
contract 、hierarchy 、hypothesis testing 、logistic regression models、Whether the party members、The academic achievement of high、college students.
绪论…………………………………………………………
数据的收集与整理…………………………………………
数据分析……………………………………………………
建立模型………………………………………………………模型评价………………………………………………………参考文献………………………………………………………致谢……………………………………………………………
当代大学生是新时期党员队伍发展壮大的重要来源之一,把优秀大学生凝聚到党的队伍中来,是高校党建工作者义不容辞的责任。
在发展大学生入党工作中,如何坚持和把握入党标准,对高校党建工作和思想政治教育工作都具有举足轻重的作用。
应从坚持党章规定的党员基本标准入手,结合大学生群体的自身特点,突出新时期大学生入党标准的时代特征,探析大学生党员的具体标准和历史标准,确保大学生党员质量。
伴随着高校的不断扩张,大学生队伍的不断壮大,发展大学生党员成为各高校党建工作繁重而又迫切的任务。
大学生党员是我们党队伍的有机组成部分。
大学生思想活跃,站在时代的前列,正确引导好这支队伍对我们党和社会的稳定及发展,起到至关重要的作用。
尤其是近几年以来,大学生党员在校园文化建设、学风建设等方面发挥的作用日益凸显。
中共中央发出《关于进一步加强和改进大学生思想政治教育的意见》,对于吸收积极分子入党,发挥他们的带头作用和辐射作用,具有重要意义。
数据的收集与整理
本文的数据采用了抽样调查法,从数学系抽取了2011级四个班2013年的入党情况作为研究对象。
我们运用高维列联表来探讨性别、是否是党员和智育成绩高能入党三种属性之间的关系,我们小组内对所获得的数据进行了统计,综合后做出了相应的三维列联表如
下:
表格1
对智育成绩高能入党的看法
性别是否是
党员同意不同意不表态合计
女是16 11 2 29 否38 52 11 101
男是9 3 0 12 否17 52 11 80
合计80 118 24 222
数据的整理我们采用图示法进行表示:
数据的分析
对上述的三维2*3*2列联表进行降维。
具体方法有压缩和分层。
(一)、压缩
表格2,压缩列
性别
男女合计
同意26 54 80
不同意55 63 118
不表态11 13 24
合计92 130 222
图一
表格3,压缩行
是否是党员
是不是合计
女29 101 130
男12 80 92
合计41 181 222
图二
表格4,压缩层
对智育成绩高能入党的看法
同意不同意不表态合计是党员25 14 2 41
不是党员 55 104 22 181 合计
80 118 24 222
图三
通过观察图表我们无法正确判断是否是党员对智育成绩高能入党是否有影响。
因此,需要采用卡方和似然比检验列联表的独立性。
若列联表独立,则表明是否是党员对智育成绩高能入党是没有影响,反之则有影响。
∑∑
==++++-=r
i c
j j i j i ij n
n n n n n n 11
2
2
/)/(χ
)ln(
2ln 2-11
∑∑==++-=Λr i c
j ij
j i ij nn n n n
利用spss 软件计算表3有:
卡方检验
值 df
渐进 Sig. (双侧)
Pearson 卡方 13.735a 2 .001 似然比 13.323 2 .001 线性和线性组合 11.786 1
.001
有效案例中的 N
222
卡方检验
值df 渐进Sig. (双侧)
Pearson 卡方13.735a 2 .001
似然比13.323 2 .001
线性和线性组合11.786 1 .001
有效案例中的N 222
a. 1 单元格(16.7%) 的期望计数少于5。
最小期望计数为4.43。
方向度量
值渐进标准误差a近似值T b近似值Sig. 按顺序Somers 的 d 对称的.219 .059 3.479 .001
行党员因变量.167 .048 3.479 .001
列表态因变量.319 .085 3.479 .001
a. 不假定零假设。
b. 使用渐进标准误差假定零假设。
对称度量
值渐进标准误差a近似值T b近似值Sig.
按顺序Kendall's tau-b .231 .063 3.479 .001 Kendall's tau-c .192 .055 3.479 .001
γ.521 .127 3.479 .001
Spearman 相关性.240 .065 3.662 .000c
按区间Pearson 的R .231 .063 3.520 .001c 有效案例中的N 222
a. 不假定零假设。
b. 使用渐进标准误差假定零假设。
c. 基于正态近似值。
因为Pearson 卡方检验的p 值为0.001较小,因此拒绝原假设,认为是否是党员对智育成绩高能入党是有影响的。
(二)、分层
把把是否是党员对智育成绩高能入党的看法按性别分层,分开来看不同性别对是否是党员对智育成绩高能入党的看法的影响有无差别?分层后得到如下列联表:
对智育成绩高能入党的看法 性别 是否是
党员 同意 不同意 不表态 合计
女 是 16 11 2 29
否 38 52 11 101
男 是 9 3 0 12
否 17 52 11 80 合计 80 118 24 222
对该列联表进行卡方和似然比检验得到检验数据如下表:
∑∑∑∑∑∑<<+=+=-=-==⎪⎪⎭⎫ ⎝⎛=k i t
j kt
ij r i k c j t kt r i c j ij n n n n G 11111
1
kt k i t
j ij r i k j t kt r i c
j ij n n n n H ∑∑∑∑∑∑<>+=-=-===⎪⎪⎭⎫ ⎝⎛=1111
12
∑∑=++=+-=⎪⎪⎭⎫ ⎝⎛=r i i i r
i i A n n n T 1
12)1(2 ∑∑=++=+-=⎪⎪⎭⎫ ⎝⎛=c j j j c
j j B n n n T 1
12)
1(2 B
B A A A B T n n H
G d T n n H G d ---=
---=
2/)1(,2/)1(||
卡方检验
层性别 值 df
渐进 Sig. (双侧)
1
Pearson 卡方 2.884a 2 .236 似然比
2.856 2 .240 线性和线性组合
2.495
1
.114
有效案例中的N 130
2 Pearson 卡方15.110b 2 .001
似然比14.420 2 .001
线性和线性组合12.521 1 .000
有效案例中的N 92
a. 1 单元格(16.7%) 的期望计数少于5。
最小期望计数为2.90。
b. 2 单元格(33.3%) 的期望计数少于5。
最小期望计数为1.43。
方向度量
层性别值渐进标准误差a 1 按顺序Somers 的d 对称的.135 .081
行是否是党员因变量.108 .065
列同意与否因变量.181 .108 2 按顺序Somers 的d 对称的.335 .078
行是否是党员因变量.237 .071
列同意与否因变量.572 .118 a. 不假定零假设。
方向度量
层性别近似值T b近似值Sig.
1 按顺序Somers 的d 对称的 1.649 .099
行是否是党员因变量 1.649 .099
列同意与否因变量 1.649 .099 2 按顺序Somers 的d 对称的 3.242 .001
行是否是党员因变量 3.242 .001
列同意与否因变量 3.242 .001
b. 使用渐进标准误差假定零假设。
对称度量
层性别值渐进标准误差a近似值T b近似值Sig.
1 按顺序Kendall's tau-b .140 .084 1.649 .099
Kendall's tau-c .126 .076 1.649 .099
γ.307 .180 1.649 .099
Spearman 相关性.145 .087 1.657 .100c 按区间Pearson 的R .139 .085 1.589 .115c 有效案例中的N 130
2 按顺序Kendall's tau-b .368 .085 3.242 .001
Kendall's tau-c .259 .080 3.242 .001
γ.843 .099 3.242 .001
Spearman 相关性.382 .089 3.923 .000c 按区间Pearson 的R .371 .084 3.789 .000c 有效案例中的N 92
a. 不假定零假设。
b. 使用渐进标准误差假定零假设。
c. 基于正态近似值。
建立模型
讨论是否是党员对智育成绩高能入党的看法的关系,获得数据如下表:
对智育成绩高能入党的看法
同意不同意不表态合计
是党员25 14 2 41
不是党
员55 104 22 181
合计80 118 24 222
利用Minitab计算逻辑斯蒂线性回归模型步骤如下:
a)选择Stat下拉菜单,选择regression选项。
在regression的下
拉菜单中选择Binary Logistic regression子选项;在对话框Response方框内键入出C3,在对话框Frequency方框内键入C2,在对话框Model方框内键入C1;
b)选择Logit
c)选择模型、Ok,得到结果如下:
Exp 27.5 28.0 35.5
Total 39 57 126 222
Measures of Association:
(Between the Response Variable and Predicted Probabilities)
Pairs Number Percent Summary Measures
Concordant 7204 60.4 Somers' D 0.44 Discordant 1969 16.5 Goodman-Kruskal Gamma 0.57 Ties 2748 23.1 Kendall's Tau-a 0.21 Total 11921 100.0
设,智育成绩高的看法为T ,则得到逻辑斯蒂模型为:
T p
p *5.35285.27)-1ln(++=
模型评价
因为T 的系数为35.5为正,说明是党员的同意智育成绩高能入党的比例越高。
优点:
1、 本文从p 值分析入手,可以较直观的得到结果;
2、 运用excel 及spss 很直观的体现数据;
3、 最后改进了建立的模型后,达到了数据量小、计算量少、结果精
确程度高。
缺点:
数据量过少,计算很简单,但过于简单使人产生怀疑,而且误差
可能会更大,这是以后需要改进的地方。
参考文献
[1]王静龙编著.定性数据统计分析.中国统计出版社,2008.
致谢
本文是在尊敬的xx老师的悉心教导下完成的,从论文的选题至论文的形成,无不倾注着xx老师大量的心血和汗水。
她严谨的治学态度、无私奉献的敬业精神、勤劳刻苦的工作作风,以及对科学的献身精神都给我留下了极为深刻的印象。
一年来,xx老师无论在学习、工作还是生活上给予了无微不至的关怀和真诚的帮助,这种真挚的师生情谊令我倍感亲切和终身难忘。
论文完成之际,谨向辛勤培育我的xx老师致以诚挚的敬意和衷心的感谢。
感谢学数学学数学与应用数学专业所有老师在我求学期间给予的热心帮助和指导。
感谢所有帮助、关心和支持我舍友,同学,老乡,是你们让我的人生有了精彩的片段!
最后感谢我最亲爱的家人的支持和鼓励,正是他们对我的期望和鞭策,才让我更加努力和进步。