基于分位数回归建立tPSA、fPSA、fPSAtPSA的年龄特异性参考区间
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
DOI:10.13602/j.cnki.jcls.2021.01.15·调查研究·
基于分位数回归建立tPSA、fPSA、fPSA/tPSA的年龄特异性参考区间
刘凤玲a,张桐硕a,祝峰a,汤元杰b(武警江苏省总队医院a.检验科,b.泌尿外科,江苏扬州225003)
摘要:目的 观察江苏扬州地区健康男性总前列腺抗原(tPSA)、游离前列腺抗原(fPSA)以及二者比值(fPSA/tPSA)随年龄的变化趋势,建立实验室的特异性参考区间。
方法 收集2018年武警江苏总队医院健康体检男性3402例,最终纳入分位数回归分析1369例,收集tPSA、fPSA、fPSA/tPSA检测结果;利用R语言程序包分别拟合tPSA、fPSA、fPSA/tPSA的5%和95%分位点的回归模型,探索年龄因素对参考区间分布的影响,以10年为1个亚组建立不同年龄段的参考区间。
结果 tPSA、fPSA、
fPSA/tPSA结果呈明显的偏态分布,并存在年龄依赖性。
tPSA和fPSA的参考区间上限值(95%分位点)在30~40岁最低,随后升高,呈“U”型分布;fPSA/tPSA的参考区间下限值(5%分位点)整体呈降低趋势。
结论 分位数回归模型对于建立PSA等
非正态分布检验指标的参考区间有良好的适用性,可通过分位数回归模型修正或完善试剂说明书所给的参考区间,按年龄等影响因素建立所在实验室的特异性参考区间。
关键词:前列腺特异抗原;参考区间;分位数回归;年龄
中图分类号:R446 文献标志码:A
Age specificreferencerangesoftPSA,fPSAandfPSA/tPSAestablishedbasedonquantileregression
LIUFengling,ZHANGTongshuo,ZHUFeng,TANGYuanjie(DepartmentofClinicalLaboratory,JiangsuProvincialCorpsHospital,ChinesePeple′sArmedPoliceForces,Yangzhou225003,Jiangsu,China)
Abstract:Objective Toobservetheage relatedchangetrendoftotalprostateantigen(tPSA),freeprostateantigen(fPSA)andtheirratio(fPSA/tPSA)ofhealthymeninYangzhou,Jiangsuprovince,andestablishaspecificreferencerangeforourlaboratory.Methods Atotalof3402healthmaleexamineeswereselectedinJiangsuArmedPoliceCorpsHospitalin2018,and1369sampleswerefinallyinvolvedinthequantileregressionanalysis.TheresultsoftPSA,fPSAandfPSA/tPSAwereextractedfromelectronicmed icalrecordminingsystem.The5%and95%quantileregressionmodelsoftPSA,fPSAandfPSA/tPSAwerefittedbyRlanguagepack age,andtheinfluenceofageonthedistributionofreferenceintervalwasexplored.Thereferenceintervalsfordifferentagegroupswereestablishedwith10yearsasasubgroup.Results TheresultsoftPSA,fPSA,fPSA/tPSAshowedsignificantskewnessdistributionandagedependence.Theupperlimit(95%quantile)ofthereferencerangeoftPSAandfPSAduring30to40yearsoldwasthelowest,andthenincreased,showingthedistributionashapeof"U",whilethelowerlimit(5%quantile)ofthereferencerangeoffPSA/tPSAshowedadecreasingtrendoverall.Conclusion ThequantileregressionmodelshouldbesuitableforestablishingthereferencerangeofPSAandothernon normaldistributiontestparemeters.Thereferencerangegivenbyreagentspecificationcouldberevisedorimprovedbyquantileregressionmodel,andthespecificreferencerangeoflaboratorymaybeestablishedbyageandotherinfluencefactors.Keywords:prostatespecificantigen;referenceinterval;quantileregression;age
前列腺癌是威胁男性健康的主要疾病之一。
前列腺特异抗原(proststespecificantigen,PSA)于
1987年由Hornszew等[1]在前列腺癌细胞系LNCaP的细胞膜上发现。
PSA作为针对前列腺癌的血清
肿瘤标志物,在男性健康体检中已得到普遍应用[2]。
参考区间(referenceintervals,RI)又称临床参考值区间或正常参考值区间,是临床医生用于鉴别诊断、筛选患者、评价疗效与预后评估的重要依据[3],目前各实验室PSA的参考区间主要依据试剂厂商推荐的范围,不一定适用于不同地区不同年龄段人群[4]。
因此,各个实验室建立覆盖当地人群特征的PSA参考区间至关重要[5]。
传统的年龄特异性参考区间的建立方法(线性回归模型等),仅考虑的只是检验指标的均值受年龄的影响。
但各指标在不同年龄段所受影响程度
基金项目:扬州市医学领军人才(创新团队)培养项目。
作者简介:刘凤玲,1981年生,女,主管技师,大学本科,主要从事生化检验和实验室质量控制工作。
通信作者:祝峰,副主任技师,E mail:zfwjjszd@163.com;汤元杰,主任医师,E mail:tyj0701@aliyun.com.cn。
往往不同,尤其对于非正态分布的检验指标,以均值和标准差建立参考区间会偏离实际情况[6]。
分位数回归(quantileregression)作为一种被广泛应用于经济学和环境科学等领域的统计学方法,则能充分考虑因变量的每个“节段”受自变量的影响程度,用分位函数来估计整体分布,适用于数据边缘分布的情况[7 9]。
本文拟分析2018年于武警江苏总队医院健康体检的男性总前列腺抗原(tPSA)、游离前列腺抗原(fPSA)以及二者比值(fPSA/tPSA)数据,分别建立分位数回归模型,并建立本地区男性tPSA以及
fPSA的参考区间,为本地区前列腺疾病的早期发现、诊断、治疗、预后提供实验依据。
1 对象与方法
1.1 研究对象 选取2018年于我院进行健康体检时行PSA检查的成年男性共3402人。
明确记录
无相关既往病史的2987人,通过B超提示未见前列腺异常1523人,数据明显偏离正常1465人,最终纳入分位数回归分析1369人,见图1。
图1 样本筛选标准流程图1.2 标本采集与处理 清晨采集空腹静脉血3~5
mL,立即分离血清检测相关指标,采集标本前避免肛指检查、插导管及前列腺穿刺等。
1.3 仪器和试剂 RocheE170电化学发光仪及其配套试剂和定标液均为Roche公司产品,实验过程
中按要求严格做好质量控制,精密度和正确度符合要求。
1.4 统计学分析 运用R语言程序包进行统计学分析。
tPSA、fPSA、fPSA/tPSA的正态性检验均采用
Shapiro Wilk法。
以95%分位点为tPSA、fPSA上限,以5%分位点为fPSA/tPSA下限,建立以上指标
基于年龄的分位数回归模型。
考虑到每次对照回归方程计算出连续性的参考区间不便于临床应用,以10年为1个年龄段,将每种指标的参考区间划分为7个亚组。
以Tukey四分位间距判定离群值,以bootstrap自动抽样法估算各个年龄段临界值的95%置信区间。
2 结果
2.1 数据分布的正态性检验 Shapiro Wilk法正态性检验分析结果显示,tPSA偏度为1.73,峰度为
4.52;fPSA偏度为2.85,峰度为11.09;fPSA/tPSA偏度为0.83,峰度为0.391;tPSA、fPSA和fPSA/
tPSA均不符合正态分布(P<0.05),分布呈右偏态。
2.2 年龄特异性参考区间 分别以年龄为自变量拟合PSA相关指标连续性变化的回归方程。
模型
建立过程中,探索性地考虑了年龄的一阶、二阶和三阶效应,最终选择拟合优度最佳的四阶模型。
tPSA参考区间上限的方程是:
PtRSA
95
=3.01-1.33×10-4×年龄-4.44×1034×年龄2+1.18×10-3×年龄3-7.36×10-7×年龄4
fPSA参考区间上限的方程是:
PfPSA
95
=0.856-2.54×10-5×年龄-9.08×10-5×年龄2+2.27×10-5×年龄3-1.39×10-7×年龄4
fPSA/tPSA参考区间下限的方程是:
PfPSA/tPSA
5
=0.62-8.35×10-6×年龄+2.87×10-4×年龄2-8.43×10-6×年龄3-6.00×10-9×年龄4
现行参考区间,即试剂说明书(tPSA<4.0
ng/mL,fPSA<0.8ng/mL,fPSA/tPSA>0.16),不能展示丰富的年龄特异性信息。
PSA相关指标呈现
较强的年龄依赖性,见图2。
每隔10岁为1个年龄段,以该年龄段内拟合曲线的最高点与最低点的平均值为参考区间的临界值,tPSA和fPSA的参考区间上限值从成年起开始降低,到30~40岁最低,而后随着年龄大幅度的升高,形成1个近似“U”型曲线;fPSA/tPSA的参考区间下限呈小幅度的降低趋势。
不同年龄段PSA相关指标参考区间的临界值见表2。
注:A,tPSA;B,fPSA;C,fPSA/tPSA;每个灰色圆点代表1个样本。
图2 PSA相关指标的百分位点随年龄的变化图
表2 不同年龄段PSA相关指标参考区间的临界值
年龄(岁)
n
参考区间上限(95%CI)tPSA(ng/mL)fPSA(ng/mL)参考区间下限(
95%CI)fPSA/tPSA
18~301181.89(1.76~1.97)0.61(0.58~0.63)0.17(0.17~0.18)>30~402241.56(1.54~1.57)0.52(0.51~0.52)0.17(0.16~0.17)>40~504431.86(1.74~1.93)0.53(0.52~0.54)0.15(0.15~0.16)>50~603232.61(2.42~2.77)0.63(0.61~0.65)0.14(0.14~0.14)>60~701643.67(3.47~3.86)0.79(0.76~0.82)0.12(0.12~0.13)>70~80504.67(4.54~4.85)0.94(0.93~0.97)0.12(0.12~0.12)>80475.13(5.12~5.18)0.99(0.99~1.01)0.12(0.12~0.12)注:n,各年龄段的样本数量;95%CI,95%置信区间(2.5th~97.5th),由bootstrap自动抽样法(1000次)估算。
3 讨论
国内外普遍认同tPSA在4~10ng/mL时是前
列腺癌诊断价值的“灰区”[10
],
在此情况下,补充分析fPSA/tPSA能提高前列腺癌检出率[11]。
血清PSA的影响因素众多,包括年龄、种族和前列腺体积等方面。
本研究从PSA这一最具诊断价值的前列腺癌特异性标志物入手,利用江苏扬州地区近年
来的PSA检测数据,
探索建立适合本实验室的参考区间的方案,以期将经验推广至其他检验指标。
随着电子化病历的普及,加之统计理论的推陈出新,特异性参考区间迎来了发展机会[12
]。
由于许多检验指标在健康人群中的分布形式并不是正态分布,而常用的参考区间制定方法(如Z检验、方差分析、线性回归等)大都是基于对数据集中趋势
的统计分析,无法反映出医学参考值边缘分布的状
况[13
],美国临床和实验室标准协会(CLSI)[14
]和国
际临床化学和检验医学联合会(IFCC)
[15
]均推荐使用非参数统计方法计算参考区间。
分位数回归作为一种非参数统计方法,逐渐在医学领域受到重视[16 17
]。
分位数回归的原理是将数据按因变量拆分成多个分位数点,研究不同分位点情况下时的回归影响关系,弥补了普通线性回归要求因变量为正态分布、对异常值较为敏感和共线性等问题导致的回归结果出现偏差。
对本地3402名不同年龄段健康男性的tPSA、fPSA及fPSA/tPSA进行相关性分析,发现数据不符合正态分布,于是放弃以近似正态分布计算公式制定参考区间的方案;同时,PSA相关指标呈现出比较典型的年龄依赖性,而试剂说明书并未提供不
同亚组的参考区间,促使本实验室根据年龄阶段分别制定参考区间。
本研究表明,江苏扬州地区人群的tPSA、fPSA与年龄整体呈正相关,而fPSA/tPSA与年龄呈明显的负相关,符合Chia等[18]和Lim等[19]对多种亚裔人口研究后得出不同年龄的PSA水平基线各不相同的结果。
本研究中,tPSA和fPSA的参考区间上限值并未呈单调增长趋势,而是到30~40岁下降至最低,随后才明显升高。
Yang等[20]从河南省招募了
1862名健康汉族男性,年龄涵盖21~94岁,该群体中的tPSA和fPSA在40岁前后出现微小降低,50
岁之后明显升高,与本研究中的变化曲线类似,但稍晚于江苏扬州的人群;其原因我们推测为PSA的表达受到雄激素的影响,与睾酮水平有直接对应关系。
处在青春后期的男性,雄激素分泌最旺盛,但在30岁以后,男性身体内的雄性激素逐步下降,而这阶段前列腺上皮细胞增生速度未构成PSA水平的主导因素,导致在青春期后期和80岁以后,PSA呈现出双峰的特性。
当然,由于年轻人患前列腺癌的概率极低,40岁之前PSA水平的筛查意义不大,医学界重点关注的是老年人PSA高峰期,因此本研究所使用的分位数回归方程对40岁之后PSA的变化趋势更有借鉴意义。
4 参考文献
[1]HoroszewiczJS,KawinskiE,MurphyGP.Monoclonalantibodiestoanewantigenicmarkerinepithelialprostaticcellsandserumofprostaticcancerpatients[J].AnticancerRes,1987,7(5B):927
935.
[2]SiegelRL,MillerKD,JemalA.Cancerstatistics,2020[J].CA
CancerJClin,2020,70(1):7 30.
[3]SolbergHE,Gr sbeckR.Referencevalues[J].AdvClinChem,
1989,27:1 79.
[4]靳晓亮,杨波,关方霞,等.肿瘤与肿瘤标志物研究中证据的思考[J].医学与哲学(临床决策论坛版),2009,30(2):48 50.[5]尚红,陈文祥,潘柏申,等.建立基于中国人群的临床常用检验项目参考区间[J].中国卫生标准管理,2013,4(1):17 21.[6]杜茂林,王福彦.医学统计学[M].北京:人民军医出版社,
2015:18.
[7]WeiY,PereA,KoenkerR,etal.Quantileregressionmethodsfor
referencegrowthcharts[J].StatMed,2006,25(8):1369 1382.[8]WilsonLB,PryceR,HiscockR,etal.Quantileregressionofto
baccotaxpass throughintheUK2013 2019.Howhavemanufactur erspassedthroughtaxchangesfordifferenttobaccoproducts[J].TobControl,2020TobControl,2020:tobaccocontrol 2020
055931.
[9]LinliZ,ChenY,TianG,etal.IdentifyingandquantifyingrobustriskfactorsformortalityincriticallyillpatientswithCOVID 19u
singquantileregression[J].AmJEmergMed,2020:S0735 6757(20)30784 1.
[10]武建国.前列腺特异抗原的几个临床应用问题[J].临床检验杂志,2006,24(1):1 3.
[11]夏吉荣,朱丹,严立,等.血清f PSA/t PSA临床诊断值的确定及应用[J].临床检验杂志,2010,28(3):194 195.
[12]李小佩,王惠民,王建新,等.应用医院存储数据建立血清
Cyfra21 1、SCCA、CEA参考区间[J].临床检验杂志,2015,33(12):946 949.
[13]KaritaE,KetterN,PriceMA,etal.CLSI derivedhematologyandbiochemistryreferenceintervalsforhealthyadultsineasternand
southernAfrica[J].PLoSOne,2009,4(2):e4401.
[14]CLSIC28 A3.Defining,establishing,andverifyingreferencein
tervalsintheclinicallaboratory;proposedguideline thirdedition[S].CLSI,2008.
[15]SolbergHE.Approvedrecommendation(1986)onthetheoryofreferencevalues.Part1.Theconceptofreferencevalues[J].Clin
ChemClinBiochem,1987,25(5):337 342.
[16]McCuddenCR,BrooksJ,FiguradoP,etal.Cerebrospinalfluidtotalproteinreferenceintervalsderivedfrom20yearsofpatientda
ta[J].ClinChem,2017,63(12):1856 1865.
[17]云科,赵敏,穆润清,等.非参数分位数回归模型在医学参考区间建立中的应用[J].中国卫生统计,2014,31(3):431 433.[18]ChiaSE,LauWK,ChengC,etal.Prostate specificantigenlevelsamongChinese,MalaysandIndiansinSingaporefromacommuni ty basedstudy[J].AsianPacJCancerPrev,2007,8(3):375
378.
[19]LimJ,Bhoo PathyN,SothilingamS,etal.Ethnicityisaninde pendentdeterminantofage specificPSAlevel:findingsfroma
multiethnicAsiansetting[J].PLoSOne,2014,9(8):e104917.[20]YangJ,TangA,ZhangS,etal.Theage specificreferenceinter
valsfortPSA,fPSA,and%fPSAinhealthyHanethnicmale[J].JClinLabAnal,2017,31(4):e22062.
(收稿日期:2020 11 14)
(本文编辑:王海燕)。