临床科研基本方法第四讲 临床医学科研常用的研究方法(一)董 卫中国医科大学第一临床学院临床流行病学教研室
临床医学研究同样由经验层次和理论层次构成,二者紧密相连共同完成对医学的认识。经验层次即感性认识阶段,是在临床实践收集患者各种临床信息的阶段。为得到科学的结论,收集的临床信息应具有代表性、客观性、准确性和可重复性(精确性)。收集临床信息可按有无假设和干预分为观察性研究、实验性研究和工作性研究(见表1)。
观察性研究又分为描述性研究和分析性研究,均不能人为控制试验条件。描述性研究既无假设又无干预,如病例报告等;分析性研究有假设但无干预,如病例对照研究等。
实验性研究和工作性研究既有假设又有干预,可人为的控制研究条件,直接探讨某个或某些研究因素与结果间的联系,如临床药物试验研究等。
理论层次即理性认识阶段,是研究者深入到事物内部的联系,对感性认识阶段的思考,通过逻辑分析和综合进而对某个或某些临床现象上升到理性的认识并通过对其归纳,概括出一般原理以指导临床实践。
本讲重点介绍队列研究
队列研究(CohortStudy)主要用于检验病因假设。该研究可直接观察到人群暴露于病因的情况及其结局,从而确定危险因素与疾病的关系,其设计原理及整理列表如下,见图1。
队列研究为观察法,是由因到果的研究,其暴露因素是客观存在的,对照群组可来自同一人群或不同人群。观察开始前两个群组必须是未患某研究结局疾病的人群。两个群组除了暴露条件有差别外,其余方面条件应基本相似,对两个群组所有的观察对象同样追踪一个时期。观察期间,记录两个群组的发病或死亡情况,即观察结局,分别计算两个群组在观察期间研究疾病的发病率或死亡率,并进行比较,若有差异,则该暴露因素与疾病的发生或死亡之间存在关联,直接计算相对危险度(RR)值。
观察队列分固定队列(指某特定事件发生时的所有人员作为一个队列。有时指一个相对稳定的人群或相对大的人群)和动态队列(指随时可以增加新的成员的观察人群)。
队列研究有3个类型,见图2。
前瞻性队列研究要有明确的检验假设,所研究疾病的发病率(病死率)一般不应5%,要有确定结局的简便可靠的手段并能获得观察人群的暴露资料和完整的随访资料,还要有充足的长期追踪观察的经费、人力和物力。该研究结果偏倚小,但所需的时间和经费大。
历史性队列研究除以上条件外,还要有足够量的完整的记录或档案资料,出结果快、节省时间及经费等,但结果的可靠性差。
双向性队列具有上述两类队列的优点,在一定程度上互补了他们的不足。
队列研究的因素包括致病因素(危险因素),即导致疾病事件增加的暴露因素和保护因素,即导致疾病事件减少的暴露因素。如吸烟是肺癌的危险因素,胡萝卜素是肺癌的保护因素等。
队列研究要确定结局,结局是指研究者预期的结果事件,即研究对象个体出现的结果。一般结局为发病、死亡或某项化验指标等。需要注意的是若研究对象存活,判断其是否发病(复发)等,要有严格的诊断标准;若研究对象的结局为死亡,要有死亡证据。
队列研究对每个研究对象开始随访的时间和随访时间的长短直接关系到队列研究的功效,因此要明确随访的开始日和终止日。随访时间的长短,取决于暴露与疾病的联系强度及疾病潜伏期的长短。随访时间的确定以既能观察到病变的发生又能节省开支为好。
为确定随访期,要了解研究疾病的诱导期和潜伏期。疾病的诱导期指病因开始作用到疾病发生的一段时间;疾病的潜伏期指疾病发生到临床上被发现的时间间隔。
随访的方法有调查问卷、医学检查、从有关记录中获得及对环境的调查与检测等。
队列研究的观察对象一定是未患有某研究结局疾病并在观察期间有可能发生所研究结局疾病的人群。暴露组要有暴露因素值得研究,可选择特殊暴露人群(如研究肺癌可选择石棉厂工人)、一般人群(如在某社区冠心病)和有组织的人群团体(如关于全英男性医生肺癌发病的研究)。非暴露组(对照人群)可在选择人群内、外进行对照,也可同时设内外对照。
队列研究估计样本含量时,只有当暴露数目少的情况下观察整个人群,通常是抽取一定量的样本,但样本量要足够以保证在规定的显著性水平和把握度水平上检出暴露组与非暴露组的发病率(病死率)的差异。显著性水平即检验假设时的假阳性错误值(α值),该值越小,所需的样本量越大。通常取α=0.05或0.01。把握度水平即假设检验的假阴性错误的概率(β值),把握度即1-β,把握度要求越高,所需样本量越大。通常取β=0.10,有时取β=0.20。样本量的大小也受一般人群中所研究疾病的发病率(P0)的影响,P0越接近0.50,所需样本量越大;样本量还取决于暴露人群中所研究疾病的发病率(P1),P1不易获得,可设法得到RR值,P1=RR-P0。一般人群和暴露人群发病率的差值(d)也影响样本量的大小,d=P1-P0,d值越大,所需样本量越小。
在队列研究开始前要确定暴露组与非暴露组的比例,一般来说,暴露组非暴露组,通常,暴露组=非暴露组。两组样本量的确定有计算法和查表法。计算法的公式为:n=2pq(Uα+Uβ)2/(p1-p0)2
例如:队列研究放射线与白血病的关系。已知一般人群的发病率为0.,有放射线暴露的人的发病率为0.,如果研究者将α定为0.05(双侧检验),β=0.1,则Uα=1.96,Uβ=1.,代入公式:n=2(0.×0.)×(1.96+1.)2/0.-0.)2=.8≈,即两组各需人。
由于队列研究易发生失访,为有90%的把握,应再增加些样本量,人/0.9(把握度)≈人,实际两组各需人。
查表法是根据α、β、P0、RR值四个基本数据可查表得n。(请参考:流行病学研究方法王天根主编.P)。
队列研究资料分析常用的率有累积发病率和发病密度等。
累积发病率(CI)指一定期间内固定人群中发生疾病的概率。
公式为:CI=I/P×%(I=观察期内新发病例数P=开始观察时人口数)累积发病率常用于观察人数足够多、观察人口固定、资料整齐时。该指标无时间单位(是概率),应用时应考虑、注意观察时间。
例如:年美国Georgia州、Evans县、Cassel等对40~70岁白人男性、无冠心病者人进行了血液中儿茶酚胺水平与冠心病关系的研究,根据血液中儿茶酚胺水平分为暴露组名,非暴露组名,追踪观察(随访)7年,结果见表2。
发病密度(ID)指人群中发生的新病例数与该人群中所观察对象的观察时间总和之比。表示单位时间内新病例数的变化。公式为:ID=I/ΣTi(I=观察时间内发生的新病例ΣTi=每个观察对象的观察时间之和。发病密度适用于观察人数足够多、观察人口不固定、资料不整齐(含终检人资料)。该指标有时间单位:人时数(人日、人周、人月、人年),通常用人年。发病密度随单位时间的改变,其值发生变化,但意义不变(0/世纪=10/人年=0.83/人月=0./人周=0./人日)。如:观察人,观察时间3年。若3年内人均未发生失访,那么,暴露人年为人×3年=人年;若3年内,观察1年时,1例发病,观察2年时,2例发病,那么,余98人观察了3年,共观察
1人×1年+2人×2年+98人×3年=人年,则ID=3/人年≈0.01/人年。
人时的计算有三种方法,采用那种方法取决于样本量。(1)小样本时的计算原则是以个人为单位计算暴露人时(年);(2)大样本时的计算原则是观察初期人口数与观察末期人口数之和/2;(3)寿命表法用于观察人数多、避免以个人计算的繁复时。次法将观察当年进入队列的个人、终检人(失访或随访有不满整年部分的人)和出现终点结局者均计1/2人年。
队列研究中有关暴露与疾病关联强度的指标有相对危险度(RR)、归因危险度(AR)、归因危险度百分比(AR%)、人群归因危险度(PAR)和人群归因危险度百分比(PAR%)。
RR指暴露人群发病(病死)率是非暴露人群发病(病死)率的倍数,公式=I1/I0=P1/P0=CI1/CI0=ID1/ID0。RR=1说明暴露与疾病无联系;RR1说明暴露为有害因素;RR1说明暴露为保护因素。应强调的是RR值的95%可信区间,有害因素应强调其下限1,保护因素应强调其上限1。RR值95%可信区间=LnRR±1.96√var(LnRR)的反自然对数。如上题:CI1=22%,CI0=9%,则RR=22%÷9%=2.44,其RR值的95%可信区间=Ln2.44±1.96√1/27+1/95+1/44+1/=0.36~1.42。0.36~1.42的反自然对数为1.43~4.14。说明血液中儿茶酚胺水平是冠心病的有害因素(RR值95%可信区间为1.43~4.14)。
AR指暴露人群与非暴露人群发病(死亡)危险相差的绝对值,即发病(死亡)危险特意地归因于暴露因素的程度=ID1-ID0=ID0(RR-1)。
AR%指暴露人群中由于暴露因素而导致的发病(死亡)占暴露者的发病(死亡)的百分比,即暴露人群中,疾病真正归因于暴露的比例,说明在暴露人群中,有百分之多少病例可通过阻止或减少暴露于该因素来预防此疾病的发生。AR%=(ID1-ID0)/ID1×%=(CI1-CI0)/CI1×%=(RR-1)/RR×%。
PAR指测量在人群中暴露于某因素所致的发病率(病死率)=IDt-ID0
IDt=全人群某病发病(病死)率;ID0=非暴露组发病(病死)率
PAR%表示人群中由于暴露于某因素所致疾病(死亡)占人群发病(死亡)的百分比。PAR%=(IDt-ID0)×%=〔P1(RR-1)〕/〔P1(RR1)+1〕×%
队列研究常见选择性偏倚、测量性偏倚和混杂性偏倚,其控制方法如前所述。
《辽宁医学杂志》年第14卷第4期
预览时标签不可点收录于话题#个上一篇下一篇