统计学基本知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Logistic回归模型的适用条件
• 1 因变量为二分类的分类变量或某事件的发生率,并且是数值型变量。但是需要注意,重复 计数现象指标不适用于Logistic回归。 • 2 残差和因变量都要服从二项分布。二项分布对应的是分类变量,所以不是正态分布,进而 不是用最小二乘法,而是最大似然法来解决方程估计和检验问题。 • 3 自变量和Logistic概率是线性关系 • 4 各观测对象间相互独立。
• 1、相互独立的各指标大小用直条图。 • 2、表示全体中各部分比重百分直条图或者圆形图。 • 3、表示连续性资料的发展变化或者一事物随另一事物变迁的情 况用线图。 • 4、比较事物发展的速度用半对数图。 • 5、表示连续性资料频数分布用直方图。 • 6、表示两事物的相关关系散点图。 • 7、表示某种现象的数量在地域上的分布用统计地图。
一般四格表卡方检验
• 卡方检验使用条件: • 两个独立样本比较可以分以下3种情况: • 1.所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。 • 2.如果理论数T<5但T≥1,并且n≥40,用连续性校正的卡方进行检 验。 • 3.如果有理论数T<1或n<40,则用Fisher’s检验。
3统计分析
4、分析-非参数检验-两相关样本(配对样本 )
Biblioteka Baidu
logistics回归
• logistics回归对反应变量为分类变量所进行多变量分析
• logistic回归是一种广义线性回归(generalized linear model),因此与多重线 性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘x+b, 其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接 将w‘x+b作为因变量,即y =w‘x+b,而logistic回归则通过函数L将w‘x+b对 应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如 果L是logistic函数,就是logistic回归,如果L是多项式函数就是多项式回归。 [1]
1、在菜单上执行:analyse-regression( 回归)-binary (双重) logistic
2、将患病率作为因变量,将其他三个作为自 变量,设置好这几个
3、点击OK,开始处理数据
4、结果。
统计图
• 常用的统计图有:直条图、圆形图、线图、 半对数图、直方图、散点图、统计地图。
统计图的选择
统计学基本方法
卡法检验(Chi-square test/Chi-Square Goodness-of-Fit Test)
• 卡方检验是用途非常广的一种假设检验方法,它在分类 资料统计推断中的应用,包括:两个率或两个构成比比 较的卡方检验;多个率或多个构成比比较的卡方检验以 及分类资料的相关分析等。
秩和检验的应用条件
• (1)总体分布形式未知或分布类型不明;
• (2)偏态分布的资料; • (3)等级资料:不能精确测定,只能以严重、优劣等级、次序先后等表示 • (4)不满足参数检验条件的资料:各组方差明显不齐; • (5)数据的一端或者两端是不确定数值,如“>50mg”
例题
1建立变量名
2、录入数值
卡方检验的SPSS操作步骤
1 打开软件,设置数据格式,四格表卡方检验固定数据为4行3列,前两列分 别表示行与列,最后一列表示每一种出现的频数。
2、分析前,要对数据进行频数变量,点击Data,依次找到 weight cases.
3、弹出对话框,选择weight case ,把频数变量f 送 入右边的框中,点击OK.
4、卡方检验,点击Analyze,依次找到 Descriptive Statistics-Crosstabs
5、弹出对话框中,分别把r和c送入对应的行和列的框中, 并点击Statistics,弹出框中选择Chi-square。
6、最后点击OK.
秩和检验(signed-rank test)
• 在实践中我们常常会遇到以下一些资料,如需比较患者和正常人 的血清铁蛋白、血铅值、不同药物的溶解时间、实验鼠发癌后的 生存日数、护理效果评分等,我们将非参数统计中一种常用的检 验方法--秩和检验,其中“秩”又称等级、即上述次序号的和称 “秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法。
直条图
事故发生率
60
50
40
30
20
10
0 小学 初中 高中 大学
饼状图
事故发生率
折线图
事故发生率
60
50
40
30
20
10
0 小学 初中 高中 大学
散点图
事故发生率
60
50
40
30
20
10
0 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5