医学属性特征敏感性问题的调查设计方案与分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学属性特征敏感性问题的调查设计与分析
作者:王春平郭继志翟强
关键词】调查设计与分析
【摘要】目的阐述属性特征敏感性问题的设计与分析方法。

方法针对不同类型的敏感性问题给出相应的设计与分析方法,包括委婉提问法、沃纳模型、西蒙斯模型、多项分类模型,给予举例说明。

结论对于属性特征的医学敏感性问题可以使用委婉询问法和随机化应答模型去敏感化。

关键词属性特征敏感性问题委婉提问法随机应答模型调查设计与分析
The design and analysis on qualitative sensitive problem
Wang Chunping,Guo Jizhi,Zhai Qiang
Weifang Medical College,Shandong261041.
【Abstract】Objective To research the design and analysis on qualitative sensitive problem.Methods Aim-ing at different types of qualitative sensitive problem,the author brings forward corresponding the
design and analysis methods,including tactful question,Warner model,Simmons model,multinomial sort model,which are given
examples.Conclusion We can using above methods for medical qualitative sensitive problem.
Key words attribute character sensitive problem tactful query random corresponding model survey de-sign and analysis
所谓敏感性问题是指与个人或单位的隐私或私人利益有关而不便
向外界透露的问题。

敏感性问题按总体特征可分为两类,属性特征的敏感性问题和数量特征的敏感性问题。

关于数量特征的敏感性问题在其他文章中讨论,本文着重讨论属性特征的敏感性问题的调查设计与分析。

属性特征的敏感性问题(例如考生是否作弊、是否有吸毒行为等)是指被调查者是否具有敏感性问题的特征,一般是估计具有敏感性特征的人在总体中所占的比例,因此又称为敏感性比例问题。

可分为二项属性特征的敏感性问题和多项属性特征的敏感性问题。

医学领域中存在大量的属性特征的敏感性问题,如婚前性行为、青少年妊娠、性病、艾滋病等。

对于这些敏感性问题,如果采用直接回答的形式,被调查者难免产生抵触情绪,不愿据实回答,这样导致调查数据失真、调查结果无效,失去调查意义。

因此,在进行这一类敏感性问题调查时,需采取特殊的
调查方法,如委婉询问法、随机应答技术等。

下面就这两类方法做一介绍。

1 委婉询问法
即注意敏感性问题的提问方式,在问卷中经常采用的有文字游戏法提问方式。

这种方法采用不直截了当的文字语句进行询问,通过旁敲侧击来引出被访问者的实话,同时不给访问对象有泄露隐私的感觉。

常用的方法有释疑法、人称代换法、数值归档法等[1]。

例1. [2]询问被访问者对饮酒的态度“有些医生认为饮酒有害而有些医生认为有益,你认为如何?”……运用了无假定规范性意见的策略。

(释疑法)
例2.询问被访问者是否有过犯罪冲动“多数人承认他们有过犯罪的冲动,你有过么?” …指出该想法或该行为即使可能有违规范,但也是比较正常的现象。

(人称代换法)
例3.询问家庭积蓄情况
Q1.你认为你的生活水平在本地区属于哪一个层次
01 富裕02 较好03 一般04 偏低05 困难
Q2.你认为每月支出在何种水平上才称得上是以下几种情况?
01 富裕元/月02 较好元/月03 一般元/月04 偏低元/月05 困难元/月
Q3.如果从现在开始你家不再有任何收入,以你家现在的生活水平和积蓄情况,估计能维持多长时间的基本生活呢?
01 1个月以下02 3个月03 6个月04 1年05 2年06 3年07 4年08 5年09 6年10 7年11 8年12 9年13 10~15年14 15年以上例3中采取将一个敏感的大问题分解成若干个不敏感且容易回答的小问题来暗中测量。

(数值归档法)。

2 随机化回答模型
当调查的主要目的在于估计某种行为(如婚外性关系、青少年妊娠)的概率时,随机化回答模型是比较理想的方法。

所谓随机化回答模型就是采用一种既能保护被调查者个人秘密,又能使其讲实话,并在敏感性问题调查中获得某类人数所占比例或某敏感指标均值的估计量的方法[3]。

2.1 二项属性特征的敏感性问题随机化回答模型常用的有沃纳模型和西蒙斯模型。

2.1.1 沃纳模型是1965年由Warner提出的,其设计原则是根据敏感性特征设计两个相互对立的问题,让被调查者按预定的概率从中选择一个回答,调查者无权过问被调查者究竟回答的是哪一个问题,从而起到了为被调查者保密的效果。

沃纳模型的设计及参数估计设总体具有互不相容的两类,具有敏感性特征的一类A,和不具有敏感性特征的一类A,即总体中的每一个个体
或者具有敏感性特征A(属于A),或者不具有敏感性特征A(属于A)。

我们的目的是估计具有敏感性特征(属于A)的人在总体中所占的比例π A 。

从总体中随机抽取n个观察单位,然后对这n个观察单位进行随机化回答调查,所使用的随机化装置描述如下:外形相同的卡片上写有问题:“你属于A吗?”与“你属于A吗?如(“你在考试中作弊了吗?”“你在考试中没有作弊吗?”)以预定的比例混合后放入以盒子中,调查时,被调查者从盒中任拿一张卡片,根据卡片上的问题进行回答。

回答完后,仍将卡片放回盒子,供其他被调查者使用。

设P A是具有敏感性特征的人所占的比例,p是写有问题“你属于A 吗?”的卡片所占的比例,若调查结果中有n 1 人回答“是”,有n-n 1 人回答“否”。

则P A =[n1/ n-(1-p)]/(2p-1)
var(P A) = [n1/n(1-n 1 n)]/[n(2p-1)2]
p的取值不能为0.5,一般介于0.7~0.8之间比较适宜。

应用举例: 例4. [4]欲研究大学生酗酒情况,估计大学生的酗酒率。

如果一个学生在调查前的1个月饮酒超过1250ml,则认为他是酗酒。

根据该定义,现从某大学中随机抽取100名大学生,目的是估计该校大学生的酗酒率。

首先设置一装有60张卡片的盒子,其中有45张写有“上1个月你是否至少饮酒1250ml”,占全部卡片的75%,15张写有“上1个月你是否饮酒少于1250ml?”在调查时,在没有调查员的情况下,被调查者把盒中的卡片摇匀,从中随机抽出一张,而后根据卡片上的内容如实回到“是”或“不是”,调查结果是28人回答“是”,72人回答“不是”。

本例n=100 n 1 =28 p=45/60=75%
P A =[n1 -(1-p)]/(2p-1)=[28/100-(1-0.75)]/(2×0.75-1)=0.06 Var(P A) = [n1/ n(1-n1 /n)]/( n(2p-1)2)= [28/100(1-28/100)]/[100(2×0.75-1)2]=0.008
2.1.2 西蒙斯模型是1967年由Simmons提出的。

其设计思想仍是基于沃纳的随机化回答思想,只是在设计中,用无关的问题Y代替了沃纳模型中的敏感性问题A的对立问题。

比如敏感性问题为“你在考试中作弊了吗?”沃纳模型中的对立问题是“你在考试中没有作弊吗?”在西蒙斯模型中用一个与敏感性问题无关的问题来代替这一问题,比如“你是四月份出生的吗?”
模型的基本设计为:制作一个能产生两种实验结果的随机化装置,如两套外形一致的卡片,一套卡片上写有敏感性问题“你属于A吗?”(比如“你考试作弊了吗?”)不妨称为一号卡片,另一套卡片上写有无关问题“你属于Y吗?”其中Y是与A无关的非敏感型问题,比如“你是四月份出生的吗?”称此卡片为2号卡片,将1号卡片和2号卡片混合后按预定比例混合后,放入一盒子中,调查时,被调查者只需从盒子中任意抽取一张卡片,根据卡片上的问题做出真实回答,而调查者不知道被调查者回答的是哪一个问题。

设抽样方式是简单随机有放回的,样本容量为n,P A是具有敏感性
在总体中所占的比例π 1 、π 2 、π 3 Λπ K ,抽取一个样本含量为n的有放回的简单随机样本,可以构造下列理论化的随机化回答模型:可制作m张质地、大小相同的卡片,上面分别标上0、1、2……,k,其个数分别为m 0 、m 1 、m 2 、Λm k ,∑ k i=1 m i =m。

把卡片放入一盒子中,让被调查者从盒子中随机抽取一张卡片,读取卡片上号码,若抽到的卡片号码为0,他须按真实情况回答自己属于A 1 、A 2 、A 3 ΛA K 中哪一类,若他抽中的号码为i,i=1、2、Λk,不论他属于哪一类,都简单的回答i。

从上述操作可以看出:一个属于类别Ai的被调查者抽到号码为0的概率p 0 =m 0 m
抽到号码为i的卡片的概率p i =m i m i=1、2、Λk,因此被调查者回答i的概率为p 0 +p i ,回答敏感问题为i的被调查者的概率及标准误为π⌒ i =(n i n-p i )/p 0 S PAi = 1 (n-1)p 20 λ⌒ 2i
(1-λ⌒ i )
例6 [6]对一个地区开展性病调查,将人群分为三类:(1)无性病。

(2)有性病,并去正规医疗机构诊治过。

(3)有性病,但未去正规医疗机构诊治过。

在广泛进行调查目的和随机化调查方法保护隐私作用宣传的基础上,抽取一个样本容量为3000的一个随机样本,用问卷进行调查。

要求被调查在回答问题时,使用一个骰子,如果出现一点,直接回答1,出现2点,直接回答2,出现3点,直接回答3,出现4、5、6点时则按实际
情况回答属于哪一类。

在3000个回答中,回答1的有1986份,回答2的有504份,回答3的有510份,此时p 0 =36=0.5,p i =p 2 =p 3 =1/6 λ ⌒ =1986/3000 λ
⌒ 2 =504/3000 λ⌒ 3 =510/3000
得三类所占比例π 1 、π 2 、π 3 的估计值及标准误分别为π⌒ 1 =(λ 1 -p 1 )/p 0 =(1986 3000-16)/0.5=0.99067 π⌒ 2 =(λ 2 -p 2 )/p 0 =(5043000-16)/0.5=0.00267 π⌒ 3 =(λ 3 -p 3 )/p 0 =(5103000-16)/0.5=0.00667
S PA1 =0.0173 S PA2 =0.0136 S PA3 =0.0137
参考文献
1 杜金柱.敏感性问题调查的几种方法与比较.中国统计,2002,(012):42-43.
2 石艳芬.敏感性问题调查的基本方法与比较.统计与信息论坛,2002,017(005):17-22.
3 孙山泽.二项选择敏感性问题调查的基本方法.数理统计与管理,2002,19(1):58-64.
4 孔圣元.敏感性问题“随机变量”和“回答模型”.数理统计与管理,1998,017(002):35-39.
5 方积乾.卫生统计学.第五版.北京:人民卫生出版社,2003,(5),100.
6 郑俊池.敏感性问题调查方法探讨.数理统计与管理,1991,000(002):40-42.
作者单位:261041山东潍坊医学院
(收稿日期:2004-09-23)(编辑八月)。

相关文档
最新文档