样本选择模型及其估计方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
见报道 。
可 能性越大 。如果 = , 0 则个 体是 否被选 人样 本是 随 机的, 仅受样 本含 量 的影 响 。如果 c 一o 无 论 值 取 o, 多大, 所有个 体都会 被 选 人样 本 ; 如果 c +∞ , 取 无论 值 多小 , 有个 体都 会被 剔 出样 本 。然 而 , 基于 则所 仅
( i) d 和真正住 院 医疗 费用 ( ) 比较 来决定 。而每个 " c的
确诊病人 的承 受费 用 ( ) d 与该 病 人 的 自身状 况 ( ) Z 也可建立 回归 方程 , 选 择 等式 。 由于 仅 能观 察到 确 即 诊 病人是 否住 院 ( 而 无 法获 得 承 受 费用 ( ) d) d 的信 ‘ 息 , 以可以将二 分类 变 量 ( 作 为 选择 等 式 的 因变 所 d)
Y= i f f Yd
() 4
() 1 是理 论上存 在 的结果 等式 ,2 是 因变 量无 法 () 观测 到的选 择 等式 。( ) ( ) 别 反 映 了 d 和 , 3和 4分
以及 Y 和 ) 的对 应关 系 。当 d f , ≥c时 , 则 Y = d =1 Y ; 否则 , 0则 Y = 。样 本 选 择模 型要 求 和 1 ‘ d= 0 ,
的五 、 年间 , ek n对该 模 型的估计方 法做 出 了进 六 H cma
一
了个 体被选人 可观测 样本 ( ) d :1 的概 率 。 值 越大 , 则 个体 被选人样 本 ( ) d =1 的机会越 大 , 医疗费用被 观
测 到 的( Y ) Y = i 可能 性越 大 。 而 c值越 大 , 体被 剔 * 个 出样本 ( 0 的机 会越 大 , d= ) 医疗 费 用 缺失 ( 0 的 Y= )
量构 造 出 Po i或 L gt 型 。那 么在 给定 Z rbt o i模 后 , 选 择等 式的 回归系 数 y和 误 差 项 v 以及 界值 C都决 定
( hd w Pie, re Wae,n ao upy 一 Sao r sMakt gsadL brSpl) c 文中通过对妇 女 劳动力供 给与 市场工 资关 系 的研究提 出样 本选择模 型及其 似然估 计 , 因其估计 方 法复杂 、 但 计算 量大 等原 因使 得该 模 型 并 未 得 到 重 视 … 。稍 后
上述 可观测 到的有偏 样本 ( ) 估 计 结果 等式 是 d :1 来 存 在偏倚 的 。这样 就 可 以构 建 出样本选 择模 型的基本 结构 : Y Xf f i , n i I = + =1 …,
d Zi +v i , n i  ̄ "= ' f =1 …, y d =1 d ≥C d = ( i ) f (i ) f 0 d " "<c
理论 上 假 设 的 完 全 随 机 缺 失 ( A m sn o MC R, is gcm— i pe l a rno 。每个 确诊 病人 都 会根 据 自身 状况 le tadm) ty
相 关且 E I ] 。 由于结 果 等式 中 X [ ≠0 y 和 相 关 且 s 和 1也相关 , , 应用 最小二 乘估 计无 法获取一致 的
步发展 , 于在 17 终 9 9年首创样本 选择模 型 的两步估
计 , 著 名 的 “ ek n c r c o ” 即 h cma or t n 。此 后 的 二 十 年 ei
间, 样本选 择模 型在劳 动力供 给 、 消费 、 教育 、 出生率 和
种族 、 性别 歧 视 等 诸 多 方 面研 究 得 到 了极 大 的应 用 。 自2 0 0 0年始 , 国外 医学领域 已逐步将 样本选 择模 型用 于解决 医学 问题如 医疗费 用 、 生存质 量评 价 和 H V 检 I 验方法 评价等 , 而该 模 型在 国内 医学 领域 的应用 尚未
样本 选择模 型 的主要价值 在于 它可 以有 效校正 抽
样 设计无 法消 除的样本选 择性偏 倚 。例 如在慢 性疾 病 医疗费用 的研究 中 , 常将 医疗 费 用 作 为 因变 量 ( ) Y , 而家庭收入 等影 响 因 素 ( ) 为 自变 量 建 立研 究 所 X 作 需 的 回归方 程 , 即结果等式 。事实 上 , 我们 仅 能收集到 确实 去就诊 患者 的 医疗 费用 ( , 法 获得 确诊 但 不 Y) 无
・
62・ 6
中 国卫 生 统 计 2 1 00年 1 第 2 2月 7卷 第 6期
・
综述 ・
样 本 选 择 模 型 及 其 估 计 方 法
张 磊 王 彤
样 本选择 模 型 ( a l sl t nmo e) 于芝 加 smpe e c o d 1 源 ei 哥大学 的 Jme . ek n教授在 2 a s H cma J 0世 纪 7 O年代 中 期所从事 的关 于劳动 供给 的大 量研 究 。17 9 4年 , 他在
( ( z ) 如家庭收人、 婚否和知识程度等) 来拟定 出一个
“ 承受 费用 ” 。确诊病 人 只有 在发现 住 院费用 ( ) c 不高
于 承受 费用 ( ) d 时才 会 选 择住 院 治疗 ; 否则 , 选 择 不
参数估计量 , 故衍生出有关该模型估计方法的大量
() 1
() 2 () 3
选择住 院或其 他治疗 的这 部 分病 人 的 医疗 费用 , 样 这
就发生 了样本选 择 偏 倚 。是 否住 院治 疗 是 一种 选 择 , 每一个人 都会很 谨 慎地 评估 它的成 本 和 效益 , 而不 太 可能 以丢硬币这 样完 全随机 的方式来 决定是 否住 院治 疗, 故而 缺失 的那 部 分应 该 发生 的 医疗 费 用通 常 不是
可 能性越大 。如果 = , 0 则个 体是 否被选 人样 本是 随 机的, 仅受样 本含 量 的影 响 。如果 c 一o 无 论 值 取 o, 多大, 所有个 体都会 被 选 人样 本 ; 如果 c +∞ , 取 无论 值 多小 , 有个 体都 会被 剔 出样 本 。然 而 , 基于 则所 仅
( i) d 和真正住 院 医疗 费用 ( ) 比较 来决定 。而每个 " c的
确诊病人 的承 受费 用 ( ) d 与该 病 人 的 自身状 况 ( ) Z 也可建立 回归 方程 , 选 择 等式 。 由于 仅 能观 察到 确 即 诊 病人是 否住 院 ( 而 无 法获 得 承 受 费用 ( ) d) d 的信 ‘ 息 , 以可以将二 分类 变 量 ( 作 为 选择 等 式 的 因变 所 d)
Y= i f f Yd
() 4
() 1 是理 论上存 在 的结果 等式 ,2 是 因变 量无 法 () 观测 到的选 择 等式 。( ) ( ) 别 反 映 了 d 和 , 3和 4分
以及 Y 和 ) 的对 应关 系 。当 d f , ≥c时 , 则 Y = d =1 Y ; 否则 , 0则 Y = 。样 本 选 择模 型要 求 和 1 ‘ d= 0 ,
的五 、 年间 , ek n对该 模 型的估计方 法做 出 了进 六 H cma
一
了个 体被选人 可观测 样本 ( ) d :1 的概 率 。 值 越大 , 则 个体 被选人样 本 ( ) d =1 的机会越 大 , 医疗费用被 观
测 到 的( Y ) Y = i 可能 性越 大 。 而 c值越 大 , 体被 剔 * 个 出样本 ( 0 的机 会越 大 , d= ) 医疗 费 用 缺失 ( 0 的 Y= )
量构 造 出 Po i或 L gt 型 。那 么在 给定 Z rbt o i模 后 , 选 择等 式的 回归系 数 y和 误 差 项 v 以及 界值 C都决 定
( hd w Pie, re Wae,n ao upy 一 Sao r sMakt gsadL brSpl) c 文中通过对妇 女 劳动力供 给与 市场工 资关 系 的研究提 出样 本选择模 型及其 似然估 计 , 因其估计 方 法复杂 、 但 计算 量大 等原 因使 得该 模 型 并 未 得 到 重 视 … 。稍 后
上述 可观测 到的有偏 样本 ( ) 估 计 结果 等式 是 d :1 来 存 在偏倚 的 。这样 就 可 以构 建 出样本选 择模 型的基本 结构 : Y Xf f i , n i I = + =1 …,
d Zi +v i , n i  ̄ "= ' f =1 …, y d =1 d ≥C d = ( i ) f (i ) f 0 d " "<c
理论 上 假 设 的 完 全 随 机 缺 失 ( A m sn o MC R, is gcm— i pe l a rno 。每个 确诊 病人 都 会根 据 自身 状况 le tadm) ty
相 关且 E I ] 。 由于结 果 等式 中 X [ ≠0 y 和 相 关 且 s 和 1也相关 , , 应用 最小二 乘估 计无 法获取一致 的
步发展 , 于在 17 终 9 9年首创样本 选择模 型 的两步估
计 , 著 名 的 “ ek n c r c o ” 即 h cma or t n 。此 后 的 二 十 年 ei
间, 样本选 择模 型在劳 动力供 给 、 消费 、 教育 、 出生率 和
种族 、 性别 歧 视 等 诸 多 方 面研 究 得 到 了极 大 的应 用 。 自2 0 0 0年始 , 国外 医学领域 已逐步将 样本选 择模 型用 于解决 医学 问题如 医疗费 用 、 生存质 量评 价 和 H V 检 I 验方法 评价等 , 而该 模 型在 国内 医学 领域 的应用 尚未
样本 选择模 型 的主要价值 在于 它可 以有 效校正 抽
样 设计无 法消 除的样本选 择性偏 倚 。例 如在慢 性疾 病 医疗费用 的研究 中 , 常将 医疗 费 用 作 为 因变 量 ( ) Y , 而家庭收入 等影 响 因 素 ( ) 为 自变 量 建 立研 究 所 X 作 需 的 回归方 程 , 即结果等式 。事实 上 , 我们 仅 能收集到 确实 去就诊 患者 的 医疗 费用 ( , 法 获得 确诊 但 不 Y) 无
・
62・ 6
中 国卫 生 统 计 2 1 00年 1 第 2 2月 7卷 第 6期
・
综述 ・
样 本 选 择 模 型 及 其 估 计 方 法
张 磊 王 彤
样 本选择 模 型 ( a l sl t nmo e) 于芝 加 smpe e c o d 1 源 ei 哥大学 的 Jme . ek n教授在 2 a s H cma J 0世 纪 7 O年代 中 期所从事 的关 于劳动 供给 的大 量研 究 。17 9 4年 , 他在
( ( z ) 如家庭收人、 婚否和知识程度等) 来拟定 出一个
“ 承受 费用 ” 。确诊病 人 只有 在发现 住 院费用 ( ) c 不高
于 承受 费用 ( ) d 时才 会 选 择住 院 治疗 ; 否则 , 选 择 不
参数估计量 , 故衍生出有关该模型估计方法的大量
() 1
() 2 () 3
选择住 院或其 他治疗 的这 部 分病 人 的 医疗 费用 , 样 这
就发生 了样本选 择 偏 倚 。是 否住 院治 疗 是 一种 选 择 , 每一个人 都会很 谨 慎地 评估 它的成 本 和 效益 , 而不 太 可能 以丢硬币这 样完 全随机 的方式来 决定是 否住 院治 疗, 故而 缺失 的那 部 分应 该 发生 的 医疗 费 用通 常 不是