stata画图和线性回归基础

合集下载

STATA软件操作相关与回归分析

STATA软件操作相关与回归分析

STATA软件操作相关与回归分析一、相关分析相关分析用于研究两个变量之间的相关性。

在STATA中,可以使用命令"correlate"进行相关分析。

语法:correlate 变量列表例子:我们以一个示例数据集"auto"为例,研究汽车价格与里程数和马力之间的相关性。

```sysuse autocorrelate price mpg turn```上述命令将计算汽车价格(price)与里程数(mpg)和轮胎转向(turn)之间的相关系数。

输出结果将显示相关系数矩阵,其中包括Pearson相关系数、Spearman相关系数和Kendall相关系数。

二、简单线性回归简单线性回归分析用于研究一个因变量和一个自变量之间的关系。

在STATA中,可以使用命令“regress”进行简单线性回归分析。

语法:regress 因变量自变量例子:我们继续使用上述示例数据集"auto",研究汽车价格与里程数之间的关系。

```sysuse autoregress price mpg```上述命令将进行汽车价格(price)与里程数(mpg)之间的简单线性回归分析。

输出结果将包括回归系数估计值、拟合优度、标准误差、t值、P值等。

另外,使用命令“predict”可以进行预测。

例子:我们可以使用上述回归模型,对新数据进行价格的预测。

```predict new_price, x```上述命令将对新数据集中的里程数进行预测,并将结果保存在新的变量new_price中。

三、多元回归分析多元回归分析用于研究一个因变量和多个自变量之间的关系。

在STATA中,可以使用命令“regress”进行多元回归分析。

语法:regress 因变量自变量1 自变量2 ...例子:我们使用示例数据集"auto",研究汽车价格与里程数、马力和重量之间的关系。

```sysuse autoregress price mpg displacement weight```上述命令将进行汽车价格(price)与里程数(mpg)、马力(displacement)和重量(weight)之间的多元线性回归分析。

stata软件基本操作和简单的一元线性回归

stata软件基本操作和简单的一元线性回归

16
回归结果的提供和分析
Page 17
回归结果提供的两种格式
ˆ 3.805 0.4845 X Y (1.79) (14.96) ˆ 3.805 0.4845 X Y
se: (2.12) (0.03)
R 2 0.9655 注:括号内数字为t检验值 R 2 0.9655 注:括号内数字为标准误(se)
(2)拟合优度检验、t检验和F检验
P值为0.000,在任何显著性水平下,斜率项和截距项显然不为 零,拒绝两系数为零的假设。另外,拟合优度R方表明,食品 支出的97.5%的变化也以由收入X的变化来解释,因此拟合情 况较好。 如果需要查看残差值e,输入scatter e即可,list e可以列出所 有ei值,scatter e X可以看ei残差图
Stata基本操作及 简单的线性回归 邬龙
一、 Stata软件介绍
Stata是世界著名的统计分析软件之一。 Stata 是一套提供其使用者数据分析、数据管理以 及绘制专业图表的完整及整合性统计软件。它提供 许许多多功能,包含线性混合模型、均衡重复反复 及多项式普罗比模式。用Stata绘制的统计图形相当 精美。 Stata的统计功能很强,除了传统的统计分析方法外, 还收集了近20 年发展起来的新方法,如 Cox 比例风 险回归,指数与Weibull回归,多类结果与有序结果 的logistic回归,Poisson回归,负二项回归及广义负 二项回归,随机效应模型等。
分析命令在这里输入
4
查看历史命令
数据读入和保存(从Excel)
1. 点击data editor(edit)图标进入数据编辑器 2. 复制数据(连同第一行表头),在数据编辑器里 粘贴 3. 弹出提示,询问第一行是否要当成变量名称(表 头),选左边为是,选第二个为否 4. 点击保存,存为xxx.dta文件,便于以后使用

STATA统计分析软件使用教程

STATA统计分析软件使用教程

STATA统计分析软件使用教程引言STATA统计分析软件是一款功能强大、使用广泛的统计分析软件,广泛应用于经济学、社会学、医学和其他社会科学领域的研究中。

本教程将介绍STATA的基本操作和常用功能,并提供实例演示,帮助读者快速上手使用。

第一章:STATA入门1.1 安装与启动首先,下载并安装STATA软件。

完成安装后,点击软件图标启动STATA。

1.2 界面介绍STATA的界面分为主窗口、命令窗口和结果窗口。

主窗口用于数据显示,命令窗口用于输入分析命令,结果窗口用于显示分析结果。

1.3 数据导入与保存使用命令`use filename`导入数据,使用命令`save filename`保存当前数据。

1.4 基本命令介绍常用的基本命令,如`describe`用于显示数据的基本信息、`summarize`用于计算变量的统计描述等。

第二章:数据处理与变量管理2.1 数据选择与筛选通过命令`keep`和`drop`选择和删除数据的特定变量和观察值。

2.2 数据排序与重编码使用命令`sort`对数据进行排序,使用命令`recode`对变量进行重编码。

2.3 缺失值处理介绍如何检测和处理数据中的缺失值,包括使用命令`missing`和`recode`等。

第三章:数据分析3.1 描述性统计介绍如何使用STATA计算和展示数据的描述性统计量,如均值、标准差、最大值等。

3.2 统计检验介绍如何进行常见的统计检验,如t检验、方差分析、卡方检验等。

3.3 回归分析介绍如何进行回归分析,包括一元线性回归、多元线性回归和逻辑回归等。

3.4 生存分析介绍如何进行生存分析,包括Kaplan-Meier生存曲线和Cox比例风险模型等。

第四章:图形绘制与结果解释4.1 图形绘制基础介绍如何使用STATA进行常见的数据可视化,如散点图、柱状图、折线图等。

4.2 图形选项与高级绘图介绍如何通过调整图形选项和使用高级绘图命令,进一步美化和定制图形。

stata操作介绍之基础部分(一)讲述

stata操作介绍之基础部分(一)讲述

3.1 变量与变量值
• Stata变量的命名原则:
. 变量名中字符的组成部分为A~Z,a~z、0~9与下划线“ _ ” ,这些字符以外的其他符号不能出现在变量名当中; . 变量名不能以数字作为开始符号; . 变量名区分大小写字母,而且不能识别汉字;
• 变量的取值类型: 1、字符型变量:由特定的字符串构成,用来分辨不同的类型; 2、数值型变量:数值变量的取值由数字构成,参与数字运算; 3、日期型变量:在Stata中,1960 年1 月1 日被认为是第0 天, 因此1959 年12 月31 日为第-1天,表示形式为:jan/10/2001或者 10jan2001; 4、缺失值:STATA 默认的缺失值用“.”来表示;
• 网络帮助: 如 . net from (连接stata官网)
二、Stata使用基础
2.1 Stata命令结构
• Stata的通用命令结构如下:
[ prefix : ] command [ varlist ] [= exp.] [ if exp. ] [ using filename ] [ in range ] [ weight = ] [ , options ]
术语 prefix command 含义 命令前缀 命令 术语 using filename in range 含义 使用的文件 观察个案范围
varlist
= exp.
变量串
表达式 条件表达式
weight
权重
选项
options
if exp.
• Stata常用命令及其缩写
命令或选项 list describe display summarize tabulate lable li des di, dis sum ta, tab lab 缩写 含义 列出变量 描述分析 展示变量 统计摘要 列表显示 标签 命令或选项 rename generate graph regress variable column ren gen, g gr reg var col 缩写 含义 重命名 新建变量 绘图 回归 变量 列

stata软件基本操作和简单的一元线性回归学习资料

stata软件基本操作和简单的一元线性回归学习资料
)经济意义检验
斜率 为边际消费倾向,表明人均可支配收入每增加1元时,食 品消费平均增加0.135元。从经济意义上是合理的。
(2)拟合优度检验、t检验和F检验
P值为0.000,在任何显著性水平下,斜率项和截距项显然不为 零,拒绝两系数为零的假设。另外,拟合优度R方表明,食品 支出的97.5%的变化也以由收入X的变化来解释,因此拟合情况 较好。
这两种方式都要自己查表找ta/2(n-2)临界值对比 当然,除了这些基本信息以外,一般还会列出样本区间、 DW值等重要信息。这会在后面的课程中说明。
16
• 思考:目前,无论时间序列还是截面数据, 我们导入的方式完全一样,做法也完全一样 ,是否有区别?
此课件下载可自行编辑修改,仅供参考! 感谢您的支持,我们努力做得更好!谢谢
stata软件基本操作和简单的一元线性回归pagestata软件的安装点setupstata14安装激活码在txt中一直下一步ic版本即可越高版本运行越慢开始菜单里找到图标运行程序第一次输入序列号不要online注册pagestata界面分析命令在这里输入查看历史命令所有的图表绘制都graphs里面简单的分析功能在statistics里面page二一元线性回归page第一节问题提出画出散点图描述统计检验page10第一步导入数据点击dataeditoredit图标进入数据编辑器复制时间序列工作表的消费和收入数据连同第一行表头不要第一列在数据编辑器里粘贴弹出提示询问第一行是否要当成变量名称表头选左边为是点击variablesmanager按钮更改变量名为英文消费收入为xpage11第二步描述统计画散点图描述统计按钮操作方法1
所有的图表绘制都 在graphs里面
分析命令在这里输入 查看历史命令
数据读入和保存(从Excel)

stata基础回归命令

stata基础回归命令

stata基础回归命令Stata基础回归命令回归分析是统计学中常用的一种分析方法,用于研究变量之间的关系。

Stata是一种流行的统计软件,提供了丰富的回归分析功能。

本文将介绍Stata中的基础回归命令,并以实例演示其使用方法。

一、简单线性回归命令简单线性回归是回归分析中最简单的一种形式,用于研究两个变量之间的线性关系。

在Stata中,可以使用regress命令进行简单线性回归分析。

例如,我们有一个数据集,包含了变量Y和变量X,我们想要研究Y和X之间的关系。

我们可以使用以下命令进行简单线性回归分析:regress Y X其中,Y是因变量,X是自变量。

执行该命令后,Stata会输出回归结果,包括回归系数、标准误差、t值、p值等信息。

二、多元线性回归命令多元线性回归是回归分析中常用的一种形式,用于研究多个自变量对因变量的影响。

在Stata中,可以使用regress命令进行多元线性回归分析。

例如,我们有一个数据集,包含了因变量Y和自变量X1、X2、X3,我们想要研究这些自变量对Y的影响。

我们可以使用以下命令进行多元线性回归分析:regress Y X1 X2 X3执行该命令后,Stata会输出回归结果,包括各个自变量的回归系数、标准误差、t值、p值等信息。

三、加入控制变量的回归命令在实际研究中,我们常常需要控制其他变量的影响,以准确评估自变量对因变量的影响。

在Stata中,可以使用regress命令加入控制变量。

例如,我们有一个数据集,包含了因变量Y、自变量X和控制变量Z,我们想要研究X对Y的影响,并控制Z的影响。

我们可以使用以下命令进行回归分析:regress Y X Z执行该命令后,Stata会输出回归结果,包括X的回归系数、标准误差、t值、p值等信息。

四、回归诊断命令回归分析不仅包括了回归系数的估计,还需要对回归模型进行诊断,以评估模型的拟合优度和假设的满足程度。

在Stata中,可以使用一系列命令进行回归诊断。

stata线性回归分析

stata线性回归分析
PU/DSS/OTR
Regression: what to look for
Robust standard errors (to control Adding the rest of predictor variables: for heteroskedasticity) regress csat expense percent income high college, robust
Linear Regression
(ver. 6.0)
Oscar Torres-Reyna
Data Consultant
otorres@
/training/
PU/DSS/OTR
Regression: a practical approach (overview) We use regression to estimate the unknown effect of changing one variable over another (Stock and Watson, 2003, ch. 4) When running a regression we are making two assumptions, 1) there is a linear relationship between two variables (i.e. X and Y) and 2) this relationship is additive (i.e. Y= x1 + x2 + …+xN). Technically, linear regression estimates how much Y changes when X changes one unit. In Stata use the command regress, type: regress [dependent variable] [independent variable(s)] regress y x In a multivariate setting we type: regress y x1 x2 x3 … Before running a regression it is recommended to have a clear idea of what you are trying to estimate (i.e. which are your outcome and predictor variables). A regression makes sense only if there is a sound theory behind it.

stata估计回归方程

stata估计回归方程

stata估计回归方程使用Stata软件进行回归分析引言:回归分析是一种常用的统计分析方法,用于研究两个或多个变量之间的关系。

在实际应用中,我们常常需要利用已知数据来建立回归方程,并利用该方程对未知数据进行预测或分析。

本文将介绍如何使用Stata软件进行回归分析,并通过一个实例来说明具体操作步骤。

数据收集和准备:我们需要收集相关数据,并将其整理成适合进行回归分析的格式。

在这个例子中,我们将使用一个虚构的数据集,其中包含了一个自变量X和一个因变量Y。

我们假设X对Y具有线性影响。

数据导入和描述性统计:在使用Stata进行回归分析之前,我们需要先导入数据并进行描述性统计。

首先,我们可以使用Stata的"import"命令将数据导入软件。

然后,我们可以使用Stata的"summarize"命令对数据进行描述性统计,包括均值、标准差等。

回归方程建立:在进行回归分析之前,我们需要先建立回归方程。

在Stata中,我们可以使用"regress"命令进行回归分析。

具体地,我们可以输入"regress Y X"来建立一个简单线性回归方程,其中Y是因变量,X 是自变量。

Stata将自动为我们计算回归系数、标准误差、t值和p 值等统计量。

回归结果解读:通过回归分析,我们可以得到回归方程的系数和显著性检验结果。

系数表示自变量对因变量的影响程度,显著性检验结果则用于判断该影响是否显著。

在Stata的回归结果中,我们可以查看系数的估计值、标准误差、t值和p值。

一般来说,如果p值小于0.05,则我们可以认为该系数是显著的。

回归诊断:在得到回归结果后,我们还需要对回归模型进行诊断,以确保模型的准确性和有效性。

在Stata中,我们可以使用多种方法进行回归诊断,如残差分析、异常值检测等。

通过这些诊断方法,我们可以判断回归模型是否满足线性关系、正态分布、同方差性等假设。

stata中回归知识点总结

stata中回归知识点总结

stata中回归知识点总结简单线性回归简单线性回归是回归分析中最基本的形式。

它用于研究一个自变量对一个因变量的影响。

在Stata中进行简单线性回归可以使用reg命令。

比如,我们有一个数据集包含了两个变量x和y,我们想知道x对y的影响,可以使用如下命令进行简单线性回归:```reg y x```这条命令将会输出回归方程的拟合结果,包括截距项和自变量系数。

多元线性回归多元线性回归是回归分析中更常见的形式。

它用于研究多个自变量对一个因变量的影响。

在Stata中进行多元线性回归同样可以使用reg命令。

比如,我们有一个数据集包含了三个变量x1、x2和y,我们想知道x1和x2对y的影响,可以使用如下命令进行多元线性回归:```reg y x1 x2```逻辑回归逻辑回归是用来处理因变量为二值变量的回归分析方法。

在Stata中进行逻辑回归可以使用logit命令。

比如,我们有一个数据集包含了两个变量x和y,其中y是一个二值变量(比如0和1),我们想知道x对y的影响,可以使用如下命令进行逻辑回归:```logit y x```高级回归技巧除了上述的基本回归分析方法,Stata还提供了许多高级的回归技巧,比如假设检验、多重共线性检验、残差分析等。

其中,假设检验是用来检验回归模型的显著性,通常使用命令test。

多重共线性检验是用来检验自变量之间的相关性,通常使用命令collin。

残差分析是用来检验模型的拟合情况,通常使用命令predict和rvfplot。

总结回归分析是统计学中常用的一种分析方法,它用于研究自变量和因变量之间的关系。

在Stata中,回归分析是一种非常常见的数据分析方法,包括简单线性回归、多元线性回归、逻辑回归和一些高级回归技巧。

希望本文对Stata用户们有所帮助。

stata入门中文讲义_经济学_高等教育_教育专区

stata入门中文讲义_经济学_高等教育_教育专区

Stata及数据处理目录第一章STATA基础 (3)1.1 命令格式 (4)1.2 缩写、关系式和错误信息 (6)1.3 do文件 (6)1.4 标量和矩阵 (7)1.5 使用Stata命令的结果 (8)1.6 宏 (10)1.7 循环语句 (11)1.8 用户写的程序 (15)1.9 参考文献 (15)1.10 练习 (15)第二章数据管理和画图 (18)2.1数据类型和格式 (18)2.2 数据输入 (19)2.3 画图 (21)第3章线性回归基础 (22)3.1 数据和数据描述 (22)3.1.1 变量描述 (23)3.1.2 简单统计 (23)3.1.3 二维表 (23)3.1.4 加统计信息的一维表 (26)3.1.5 统计检验 (26)3.1.6 数据画图 (27)3.2 回归分析 (28)3.2.1 相关分析 (28)3.2.2 线性回归 (29)3.2.3 假设检验 Wald test (30)3.2.4 估计结果呈现 (30)3.3 预测 (34)3.4 Stata 资源 (35)第4章数据处理的组织方法 (36)1、可执行程序的编写与执行 (36)方法1:do文件 (36)方法2:交互式-program-命令 (36)方法3:在do文件中使用program命令 (38)方法4:do文件合并 (39)方法5:ado 文件 (40)2、do文件的组织 (40)3、数据导入 (40)4、_n和_N的用法 (44)第一章STATA基础STATA的使用有两种方式,即菜单驱动和命令驱动。

菜单驱动比较适合于初学者,容易入学,而命令驱动更有效率,适合于高级用户。

我们主要着眼于经验分析,因而重点介绍命令驱动模式。

图1.1Stata12.1的基本界面关于STATA的使用,可以参考Stata手册,特别是[GS] Getting Started with Stata,尤其是第1章A sample session和第2章The Stata User Interface。

chap06stata基本回归分析

chap06stata基本回归分析

无自相关
误差项之间不存在自相关,即 误差项的过去值不应该影响当 前值。
线性关系
因变量和自变量之间存在线性 关系,即它们之间的关系可以 用直线来描述。
无异方差性
误差项的方差应该是一个常数, 以确保模型具有一致性。
无随机误差项
误差项应该是随机的,并且与 自变量无关。
04
Stata基本回归分析操作
Stata回归分析命令
考虑数据的非线性关系
线性回归假设自变量和因变量之间存在线性关系。如果实际关 系是非线性的,可以考虑使用其他模型或对自变量进行转换。
重视多元共线性问题
当多个自变量之间高度相关时,可能会导致多元共线性问题, 影响回归结果的稳定性。在实际应用中,应重视这一问题,并 采取相应措施解决或缓解。
THANKS
感谢观看
检查模型假设条件
回归分析需要满足一定的假设条件,如线性关系、 误差项独立同分布等,需要对这些假设条件进行 检查。
优化模型
根据评估结果,对模型进行优化,可以考虑增加 或删除自变量、改变模型形式等,以提高模型的 拟合优度和预测精度。
06
案例分析
数据来源与处理
总结词
数据清洗与整理
详细描述
在进行回归分析之前,需要确保数据的准确性和完整性。数据来源应可靠,避免出现异常值和缺失值。使用 Stata进行数据清洗和整理,包括数据排序、变量转换、缺失值处理等步骤,为后续分析做好准备。
解释回归系数的意

回归系数的大小和正负可以用来 解释自变量对因变量的影响程度 和方向,从而深入理解数据之间 的关系。
考虑其他因素的影

在解释回归结果时,需要综合考 虑其他潜在因素的影响,以避免 对结果的过度解读或误导。

第二讲stata画图和线性回归基础

第二讲stata画图和线性回归基础
条形图(bar)、饼图(pie)、函数曲线 (function)以及矩阵图(matrix)等。
同时,对时间序列数据有以ts 开头的一系列 特殊命令,如tsline。还有一类是对双变量 的回归拟合图(lfit、qfit 、lowess)等。
作图时命令方式比较复杂,建议多用菜单方式。 一起来做下列图形: 简单图形 打开wage1.dta 1。 男性和女性工资均值的条形图 2。 白人和其他人的工资的饼状图 3。 wage的直方图,并检验是否服从正态分布。 4。 wage的核密度分布图。
Predict 1。拟合值的获得: predict yhat, xb 或者 predict yhat 2。残差的获得 predict e , residuals 或者 predict e, res 3。 残差分布图 rvfplot yline(0)
回归结果的存放:e()
e(N)
number of observations
调整的R2
Root MSE=sqrt(RMS)
Coef:回归系数
Std.Err:系数的标准误差
t统计量 t的临界值
95%置信区间
自由度 R2=MSS/TSS p值
模型常用的其他形式:
对数 半对数 平方项 n次方 指数 交乘项
虽然对函数形式和自变量的选取有选择和检 验的方法,但最好还是从“经济意义”角度 确定。
例如:考察消费受收入影响的方程,即使参 数项不显著,也不能把它删除掉。
例题
例一:利用wage2的数据检验明瑟(mincer) 工资方程的简单形式: Ln(wage)=b0+b1*educ+b2*exper
+b3*exper^2+ u
例二:利用phillips的数据拟合预期增强的菲 利普斯曲线为

stata估计回归方程

stata估计回归方程

stata估计回归方程Stata是一种广泛使用的统计软件,可用于估计回归方程。

回归分析是一种数据分析技术,可用于确定两个或多个变量之间的关系。

回归模型旨在解释响应变量(也称为因变量)和自变量(也称为解释变量)之间的关系。

在Stata中,可以使用命令reg命令来估计简单线性回归模型和多元线性回归模型。

在本文中,我们将讨论如何使用Stata估计回归方程。

一、简单线性回归方程简单线性回归方程是一种使用单个自变量解释响应变量的回归模型。

下面是一个示例,其中Y是响应变量,X是解释变量。

Y = β0 + β1X + ε其中,Y:响应变量X: 解释变量β0和β1:回归系数ε:误差项在Stata中,可以使用以下代码估计简单线性回归方程:reg y x这将生成以下输出:------------------------------------------------------------------------------y | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------x | .4534248 .0153275 29.580.000 .4223481 .4845014_cons | 3.117376 .3083924 10.10 0.000 2.493708 3.741044------------------------------------------------------------------------------在这个输出中,.453424是解释变量X的回归系数,表明在解释变量每增加1个单位的情况下,响应变量Y预计增加0.453424个单位。

_cons给出截距,表示在解释变量为零时的响应变量。

stata绘图基本知识

stata绘图基本知识
3.散点的大小msize(markersizestylelist) 输入graph query markersizestyle可以查找完整的markersizestyles清单
4.散点的整体设定 默认情况下,Stata会为第一个散点图选定p1,为第二个散点图选定p2 scatter y1var y2var xvar scatter y1var y2var xvar, mstyle(p1 p2) 默认情况下,Stata会为第一个散点图选定p1,为第二个散点图选定p2
选项position(clockposstyle)和ring(ringposstyle)用于设定图例的 位置,默认情况下是位于作图区域的正下方;
position()依据十二点钟的方向设定图例在作图区域的方向;
选项ring()用于设定图例距作图区域的距离,ring(0)是内圈,ring(k) 是外圈。当ring(k)的取值为0时,文本位于作图区域内,当k大于0时, 文本在作图区域之外,k越大,距离作图区域越远。
注:命令lowess和graph twoway lowess可实现一种被称做 “lowess修匀”的非参数拟合图形,具有简洁的优点,并遵循graph twoway 这一族命令的习惯语法。
例9
绘制条形图
Stata可以绘制的条形图种类繁多,既显示了条形图的广泛用途,也说 明了Stata制图功能的强大。
mlabposition(clockposstyle) 设定一个常数应用到所有的点,比如设定mlabposition(3)就是所有的点的
标签都位于正右方(即三点钟方向);
mlabvposition(varname) 设定一个变量指示每个变量的标签的方向,这个变量的取值应当在0~12之
间;如果两个选项都没有设定,那么默认情况就是mlabposition(3);
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

编号
指标
1
2
3
4
5
6
7
8
9
10
11
12
体温 X 脉搏 Y
41.0 37.5 135 85
40.7 134
38.4 108
38.8 120
40.0 124
38.0 106
39.0 117
39.5 125
39.8 130
40.8 39.6 138 135
Stata 数据
x
y
1
41
135
2
37.5
85
3
40.7
式(10-2),可知,
Yˆ 26.62 0.178X
本例中, b 的统计学意义为:血清胆固醇含量每增加 1mg/dL,总体中舒张 压平均增加 0.178mmHg。
总体均数 Y X 的区间估计 给定 X=X0 时, Y 的总体均数的点估计,例 10
-1 中,当自变量 X 取值为 307 mg/dL 时。个体 Y 值的容许区间估计 给定 X=X0 值时,估计总体中个体 Y 值的波动范围,以例 10-1 中第一个样本点的数据 (307,80)为例。
编号
1
2
3
4
5
6
7
8
9
10
307 259 341 237 254 416 267 320 374 316
80 75 90 70 75 105 70 85 88 78
H0 :总体回归方程不成立( 0 )
H1:总体回归方程成立( 0 ) =0.05
Stata 数据:
x
y
1
307
80
2
HIE 临床分度 1 1 1 1 1 2 2 2 2 3 3 3 3
MDA(umol/L) 7.4 7.0 6.7 6.3 8.1 7.2 8.4 8.9 8.8 11.5 10.6 10.2 11.0 本例目的在于分析 HIE 临床分度与血浆 MDA 含量的关系,从数据特征上看,
HIE 临床分度是等级资料,血浆 MDA 含量是连续性变量,因此应计算 Spearman 等级相关系数 rs 。
100 110 60 70 80 90
250
300
350
400
450
x
95% CI y clp1/clp2
Fitted values clm1/clm2
例 10-2 某发热门诊医生根据患者就诊顺序随机抽取 12 名 20~40 岁发热
患者,试探讨体温与脉搏之间的伴随关系,数据见表 10-4。
表 10-4 12 名发热患者的体温(℃)与脉搏(次/分)
259
75
3
341
90
4
237
70
5
254
75
6
416
105
7
267
70
8
320
85
9
374
88
10
316
78
Stata 命令为:
reg y x
结果:
Source |
SS
df
MS
-------------+------------------------------
Model | 928.343132 1 928.343132
例 10-1 为了研究血清胆固醇含量与舒张压之间是否存在依存关系,2006
年在郑州某大学随机抽取 10 名成年男性,测得他们的血清胆固醇(mg/dL)含量和
舒张压(mmHg)如表 10-1,请作统计分析。
表 10-1 10 名成人的血清胆固醇(mg/dL)含量和舒张压(mmHg)
指标
胆固醇 X 舒张压 Y
第十章 直线回归和相关的 Stata 实现
本章使用的 Stata 命令为:
直线回归 残差计算 Pearson 相关 Spearman 相关
regress 应变量 自变量 在执行 regress 命令后,执行下列命令: predict 变量名,residual pwcorr 变量 1 … 变量 n, sig spearman 变量 1 变量 2
3.85 0.005
10.67163 42.57287
------------------------------------------------------------------------------
t=8.07 ,P值<0.001(Stata输出值0.000),构建直线回归方程 将 a 和b 代入
Stata 命令:
predict yhat predict stdp, stdp predict stdf, stdf generate clm1 = yhat - invttail(7,0.025)*stdp generate clm2 = yhat + invttail(7,0.025)*stdp generate clp1 = yhat - invttail(7,0.025)*stdf generate clp2 = yhat + invttail(7,0.025)*stdf
Spearman 相关关系。
10
3
11.5
11
3
10.6
12
3
10.2
13
3
11
Stata 命令如下:
spearman y x
结果:
Number of obs = Spearman's rho =
13 0.8910
Test of Ho: y and x are independent
Prob > |t| =
0.0000
P<0.0001,HIE 临床分度(1 轻度,2 中度,3 重度)与血浆 MDA 含量存在
同样地,rs 是样本相关系数,仅为总体相关系数 s 的一个点估计,还应做总 体相关系数 s 是否为 0 的假设检验,其无效假设与备择假设分别为:
H0: s 0
H1: s ≠0
Stata 数据如下:
i
x
y
1
1
7.4
2
1
7
3
1
6.7
4
1
6.3
5
1
8.1
6
2
7.2
7
2
8.4
8
2
8.9
9
2
8.8
Residual | 114.056868 8 14.2571086
-------------+------------------------------
Total |
1042.4 9 115.822222
Number of obs =
F( 1, 8) =
Prob > F
=
Red =
134
4
38.4
108
5
38.8
120
6
40
124
7
38
106
8
39
117
9
39.5
125
10
39.8
130
11
40.8
138
12
39.6
135
H0: =0 H1: ≠0 0.05 Stata 命令:
pwcorr y x,sig
结果:
|
y
x
-------------+------------------
-------------+----------------------------------------------------------------
x | .177864 .0220419 8.07 0.000 .1270352 .2286927
_cons | 26.62225 6.916995
y | 1.0000
|
|
x | 0.9173 1.0000
| 0.0000
P<0.0001,体温与脉搏存在线性相关关系。
例 10 - 3 某 医 生 研 究 新 生 儿 缺 氧 缺 血 性 脑 病 ( hypoxic-ischemic encephalopathy,HIE)临床分度与其血浆 MDA 含量(出生后第 7 天)的关系, 获得了如下资料,试分析 HIE 临床分度(1 轻度,2 中度,3 重度)与血浆 MDA 含量的相关方向及相关程度。
twoway (lfitci y x, level(95)) (scatter y x) (line clm1 clm2 clp1 clp2 x, pstyle(p2 p2 p3 p3) sort)
结果:
x y yhat stdp stdf clm1 clm2 clp1 clp2 307 80 81.23 1.19 3.96 78.4 84.05 71.86 90.59 259 75 72.69 1.63 4.11 68.84 76.53 62.97 82.41 341 90 87.27 1.39 4.02 84 90.55 77.76 96.78 237 70 68.78 1.99 4.27 64.08 73.48 58.69 78.87 254 75 71.8 1.7 4.14 67.77 75.83 62 81.59 416 105 100.61 2.64 4.61 94.37 106.86 89.72 111.51 267 70 74.11 1.51 4.07 70.54 77.69 64.49 83.73 320 85 83.54 1.22 3.97 80.66 86.42 74.16 92.92 374 88 93.14 1.86 4.21 88.74 97.55 83.19 103.1 316 78 82.83 1.2 3.96 79.98 85.67 73.46 92.2
相关文档
最新文档