暴露组应已处在某种暴露因素中或已有某种特殊暴露史,并能提供可靠的暴露因素的历史,且便于追踪与观察。

概说

特殊暴露的人群

大多数慢性病都是历时多年的一个过程所形成。在此期间发生的许多事件都可能起致病作用。对一群人在某种病尚未明显发生前,对某个可能起病因作用或保护作用的事件的后果进行随访监测,是一种从“困”观“果”的研究方法。

选择由于职业关系或其他原因暴露于某危险因素特别严重的人作为定群研究对象,不但所需要的人数较少,而且较易发现暴露与患病之间是否存在联系。如研究放射线与白血病的关系时,选用接受放射线治疗的患者;研究联苯胺与膀胱癌的关系时,选用染料工人;研究肺癌的危险因素时,选用石棉工人。

队列研究就是这样研究病因的一种流行病学方法。研究对象是加入研究时未患所研究疾病的一群人,根据是否暴露于所研究的病因或暴露程度而划分为不同组别,然后在一定期间内随访观察不同组别的该病的发病率或死亡率。如果暴露组的率显著高于未暴露组的率,则可认为这种暴露与疾病存在联系,并在符合一些条件时有可能是因果联系。

一个地区的全部人口或其样本

图4-2 队列研究示意图

有时可在一地区人群中进行定群研究。选择条件首先是便于研究。例如,在美国马萨诸塞州的Framingham镇已进行多年的心脏病定群研究,在1948年开始时以当时30~59岁人口的2/3的一个随机样本作为研究对象。因为当地人口流动性小,居民配合,有一所高水平的医院等,便于随访,能得到完整的资料。

各组除了暴露有无或程度不同之外,其他可能影响患病或死亡的重要因素应具有可比性。但并不要求除暴露状况外一切方面都可比,这在观察性研究中实际上是做不到的。有些因素可在数据分析中得到控制。

一个可疑病历必须有较高的人群暴露率,并且所研究的病又有较高的发病率或死亡率才适合于用全人群作定群研究。

队列研究所观察的结局是可疑病因引起的效应,除了所研究的一种病,还可能与其他多种疾病也有联系,这样就可观察一个因素的多种效应,而这正是队列法不可取代的用途。

便于随访的人群

根据作为观察终点的事件在研究开始时是否已经发生,可把队列研究分为前瞻性与回顾性两类。

为了便于随访,往往选择一个团体,或以医疗就诊和随访观察结果方面特别方便的人群作为研究对象,可以节省人力、物力,并可提高随访质量和结果判断的可靠程度。例如Doll和Hill选择了所有登记注册的开业医生。选择属于团体的人群,样本代表全人群的可能性稍差,但是能降低失访率,同时提高调查结果的可靠性。

另有一种双向型的队列研究,适于研究对人体兼有短期与长期效应的因素,可用回顾性队列法研究前者而用前瞻性队列法研究后者。

二、对照组的选择

还有一种把病例对照法与前瞻法结合起来的设计。其特点是用队列法建起队列并随访发现其中发生的病例,然后用病例对照法调查病例及队列中适于作对照的一部分人的暴露史。这里,病例与对照都来自一个界定明确、有基线资料记录的队列,暴露史的质量较高,还可以有病例尚未发病时的实验室检验记录,而且可以省去对占绝对多数的未发病成员的暴露史调查。

对照组的设立是为了与暴露组比较。对照组与暴露组应具有可比性,即对照组人群除暴露因素的影响外,其他各种因素的影响或人群的特征,如年龄、性别、职业、民族等,都应尽可能与暴露组相似。同时在资料收集完毕,进行分析时,还应作一次均衡检验,以考核两组资料的可比性。

队列研究从方法上来说并不比病例对照法复杂,但实际进行起来却问题较多,因为观察人数多、期限长,组织工作复杂,开支庞大。但是,队列法是一种重要的医学观察方法,已经为解决现代医学的一些迫切问题做出重要贡献,所以作为临床医生也应该对其原理有所了解,而且这对于科学思维能力和批判地阅读能力的培养,也是大有裨益的。

美高梅线上平台游戏,对照组常用以下几种形式:

前瞻性队列研究

内对照

前瞻性队列研究首先根据研究对象在加入研究时的暴露情况分组,以后通过直接观察或其他信息渠道确定其中在某段时间内发生的病例或死亡,最后比较各组的发病率或死亡率。

若调查对象是一个整体人群,人群内部暴露于某因素的便为暴露组,而非暴露或以暴露级别最低的一组便为对照组;不需另外设对照组或非暴露组。例如,调查人群中血脂水平,可以水平最低的组列为对照。

1.研究队列的选择

人群对照

特别暴露组:因为队列研究通常用于验证经过病例对照研究建立起来的假设,已有关于可疑病因的足够知识供选择暴露组之用。可选择超额暴露于可疑病因或生活习惯或职业可能与所研究疾病有关的人,建立暴露组。另外设一个未暴露组,用于估计暴露组倘未暴露于该因素时可能的发病或死亡水平。有时可不设对照组,而是把暴露组的率与全人群的率作比较,因为对特殊暴露而言,暴露者在人群内总是少数或极少数,所以可把全人群的率视作未暴露者的率。

不另设对照,而是以人群为对照。在职业流行病学研究中,常以某职业人群为暴露组,与该地区整个人群的发病率进行比较分析。以人群为对照,应注意对照组与暴露组人群在地理与时间的一致性。

某人群的一个样本:某个人群内的成员对可疑病因的暴露状况不同时,可分作不同的组并互相比较。

特殊暴露人群人数一般不多,不能得到可靠的分年龄、性别和原因的专率供直接比较,一般须采用标化死亡比或标化发病比作间接比较,两者均须计算标准误并作显著性检验。

不论哪种队列,都应选择暴露情况易查明,便于随访又较稳定的人群。如果从全人群抽取样本建立队列,应限于从暴露者比例高的范围内或严重暴露者之中抽样,这样可使所需样本较小,随访期较短。

另设对照组

样本含量的估计见附录五。

选择一个与暴露组在年龄、性别、民族、居住地区等方面相似的非暴露组作为对照组进行随访,作为与暴露组比较的基准。例如研究放射线对放射科医师死亡率的影响时,可以在同地区医院内眼科医师作对照组。

2.基线资料的收集
首先,暴露必须有明确定义。其次,根据资料或特别检查结果,评定队列成员的暴露状况,剔除其中已患或疑似已患所研究疾病的人和对之不易感的人。原则是只能以受危者,即有可能患这种病但并未患这种病的人,作为观察对象。除所研究的暴露之外,还要收集与患病危险度有关系的其他暴露的资料。资料来源有医疗记录、劳动记录、劳保资料、访问、医疗检查、环境测定等。

多种对照

职业暴露的测定是个复杂问题。最好有实测个人暴露量数据。如没有,可以工种作为暴露指标,再加暴露时间,作为暴露剂量的间接粗略估计。暴露剂量的测定为研究剂量反应关系所必需。剂量反应关系在此是指暴露剂量和一个人群中发生某一标准反应的人数的关系。

为了增强判断依据,可将上述方法综合起来,设立多种对照,进行多重比较。如内对照、人群对照、非暴露组对照等。这样可以增加判断的依据。

有的因子除职业环境暴露外,还有来自家庭环境、局部环境和区域环境的暴露,评价个人或人群暴露量时都应包括在内。

三、样本大小的估计

与个人生活习惯或性格有关的因子,如吸烟、膳食、体力活动等,须通过访问调查和填表加以定量测定。

定群研究样本大小的估计应根据:

研究因子属于生理、生化指标的,须检查测定。

1.暴露组的事件发生率的估计值;

3.随访
应进行尽可能完全的随访,以确定各成员的结局。所谓结局是预定的观察终点,通常是死亡或发病。如以其他健康效应作为终点,则其确定更复杂。

2.非暴露组的事件发生率的估计值;

随访的方法有直接的,如函调、面谈、定期体检,有间接的如医院病历,死亡登记、疾病报告卡、人事档案、劳保资料、保险档案等,须根据结局的性质选用。

3.第一类错误概率α;

随访的目的主要有二:①确定哪些人尚在观察之中,哪些已死亡,哪些已无法追踪,即弄清楚率的分母的信息;②确定终点事件的发生,即确定关于率的分子的信息。关于分子的信息,必须尽可能地正确;关于分母的信息,如果无法掌握每一成员的动态,则不得已时也可用抽样、用寿命表法计算预期数等方法估计。

4.第二类错误概率β。

失访及其处理:由于随访对象多、时间长,不可避免会有中途不知下落的成员,也可能有拒绝继续受观察的人,这就产生了失访。如果暴露组与未暴露组的失访率相似,失访者与未失访者的结局发生率也相似,则失访将不会产生偏倚。所以应尽可能取得失访者结局的信息,或从失访者中抽取样本调查其结局。如果有健全的生命统计制度和完善的的社会福利制度,要检索队列中某一成员的死亡日期和死因,可以利用多种便利的信息来源,所以即使对失访者也有可能知道其结局。比较现实可行的方法是把失访者与未失访者的基线资料中的一些特征加以比较,如差别不大,则可假定结局发生率的差别可能也不大。否则,对选择偏倚可能产生的影响应有充分估计。因为失访产生的问题不易圆满解决,所以一方面要尽可能减少失访,另一方面要认识可能由此产生的偏倚并设法估计其影响。随访率可作为衡量研究质量的一个标准。如无把握保持近于完全的随访率,则不应贸然进行队列研究。失访问题主要是在封闭队列发生的问题。

在该4个数值确定后,可用下式估计暴露组与非暴露组需观察的人数。

4.偏倚
队列一般是全人群的一个有高度选择性的亚群,所以队列研究的结论不能无条件地推及全人群,但这并不影响其真实性。如果随访工作做得好,一般不会发生选择偏倚。疾病或死亡信息的收集,要保证各组间信息质量的可比性,而且不受研究对象暴露状态的影响,以免发生信息偏倚。回忆导致的信息偏倚是影响病例对照研究真实性的一大问题,但对队列研究影响不大。混淆因素最普通的是年龄与吸烟,其他混淆因素视暴露种类而异,应收集资料,以便在分析时控制其作用。

公式中N为每一组所需调查人数。

5.结果分析
队列研究是发生率的研究,包括疾病发生率与死亡发生率。以死亡作终点的队列研究比以发病作终点的为多,这是因为死亡的确定比发病的确定容易。

Q1=1-P1,Q0=1-P0

队列研究的结果,可以用来计算所研究疾病在随访期间的发病率或死亡率及各种专率。通过对暴露组与非暴露组的率或不同剂量的暴露组的率的比较,或暴露组的率与全人群的率比较,便可检验病因假设;对可疑病因的暴露与疾病是否存在联系;联系强度如何;是否是因果联系。

P=/2,Q=1-P

率的计算

Kα与Kβ分别为α及β值的正态分布分位数,该数可从正态分布的分位数表中查出。

1)累积发病率:某一固定人群在一定时期内某病新发生例数与时期开始总人数之比。也就是一般所说的发病率。随访期越长,则病例发生越多,所以CI表示发病率的累积影响。CI又是平均危险度的一个指标,也就是一个人在特定时期内发生该病的概率。

非暴露组的发病率P0可以根据人群一般发病水平来代替。而暴露组的发病率P1难以估计,若能够估计相对危险度,则P1=RR×P0,RR可从预调查或文献资料中估计,也可用OR来代替,P1=OR×P0,OR可从病例对照研究中得来。

CI=C/N


拟用定群研究方法研究孕妇暴露于某种药物与婴儿先天性心脏病之间的联系。假定已知非暴露组的发病概率P0=0.08,估计RR=2,当α=0.05,β=0.10时,估计需要的样本含量。

2)发病密度:当队列是一个动态人群时,观察人数变动较大,应该用发病密度来测量发病情况。发病密度是一定时期内的平均发病率。其分子仍是一个人群在期内新发生的例数,分母则是该人群的每一成员所提供的人时的总和。所谓人时是观察人数乘以随访单位时间的积。发病密度即说明了该人群发生的新病例数,又说明该人群的大小和发生这些例数所经历的时间。时间单位常用年,故又称人年数。一定的人时数可来自不同的人数与不同的观察时间,例如100人年可来自100人观察一年,或50人观察2年,或200人观察0.5年。

Kα=1.960,Kβ=1.282

表4-7 累积发病率的计算

P0=0.008,RR=2,P1=2×0.008=0.016

级别发病数未发病数发病率暴露组αbα/非暴露组cdc/ c+d)合计α+cD/

P=(0.008+0.016) /2=0.012

表4-8 发病密度的计算

Q=0.988,Q1=0.984,Q2=0.992

组别发病数人年数发病密度暴露组αPT1α/PT1非暴露组cPT0c/PT0合计a+cPTD/PT

代入公式:

ID=D/PT

即每组需要样本含量为3892人。

人年数的算法:①固定人群,即封闭人群,人年数是每一个成员的具体观察年数的总和。每一成员的观察年数是从观察开始算起到终点事件出现或研究结束时经过的年数;②动态人群,如果不知道每一成员进入与退出的具体时间,就不能直接计算人年数。但如随访期间人数与年龄基本保持稳定,则可用平均人数采以观察年数得到总人年数。平均人数取得相邻两时段人数之平均数或年中人数,例如表4-9。

四、资料的来源与收集

表4-9 人年数的计算实例

确定暴露组与非暴露组后,需收集对疾病的发生或死亡频率可能有影响的一般资料,如年龄、性别、婚姻、文化程度、经济收入、家庭人口、人口迁移等。

年龄观察人数人年数1951.11.011952.11.011953.11.011954.11.011955.11.011956.04.0135~8886914992879414971097964121145~7117725773817351721571913215655~6440494212437546015057524319909合计20097206182104321366219822223093276

从查阅现有的记录收集

例如,表4-9中“35~”岁组的人年数=÷2+÷2+÷2+÷2+÷2×5/12=41211;③各人随访年数不同,可先算出各人随访人年数,再计算总人年数;而且因为随访期内各人的年龄在增长,到一定日期年龄超过原属年龄组上限时,应计入下一年龄组的人数。所以可以算出各年龄组的总人年数以及不同年份的总人年数,结合同年龄组或同年份发生的病例数,即可算出各年龄组或年份的发病率。确切算法要根据每一成员的出生年、月、日和开始与终止观察日期而动态地计算,可借助计算机。实际上还可用近似法:开始与终止观察年份各算0.5年,同一年开始与终止的算0.25年,开始与终止年份之间,每年算1年。

特殊暴露人群的职业史或医疗记录常有暴露水平或个体暴露剂量的的资料,这是暴露史的唯一可靠来源。查阅现有记录不仅可了解研究对象本人暴露的性质和剂量,同时其主要优点是具有较高的客观性。

人时率的标准误、显著性检验和分层分析方法,与通常以人数为分母的率所用的不同,本书从略。

调查询问收集

联系的测量:研究某种暴露与疾病或死亡的联系的基本方法是比较暴露组与未暴露组的发病率或死亡率,也就是计算出这些率的差或比。

有时被研究对象的有些研究因素无现成记录,例如烟、酒、饮食等生活习惯、体力活动等,必须向被研究对象本人了解。通常采用调查表方式由调查员询问时填写或通信调查。

1)率差:暴露组的发病率或死亡率与未暴露组同种率之差。说明由于暴露增加或降低的发病率或死亡率。有人称率差为归因危险度也有人认为称为超额危险度比较合适,因其不含因果联系的暗示。

通过医学检查或检验收集

2)人群归因危险度率差与相对危险度都说明暴露的生物学效应,但不能说明其对一个人群的危险程度或消除这种因素后可能使发病率或死亡率降低的程度,或即暴露的社会效应。说明这种效应的一个指标是人群归因危险度,它说明某一人群的某病发病率中可归因于该暴露的部分,用所占比例或分数表示,如下式:

有些研究因素属于被研究对象对生理特征或生化指标,必须通过检查或检验才能获得数据,例如血压、身高、体重、血脂、血糖等。

式中It=全人群的发病率,I0=未暴露组的发病率。PAR又称病因分数,也可用百分比表示,称为人群归因危险度百分比。

从环境资料收集

①病例对照研究的PAR计算:从暴露的相对危险度和人群对某因子的暴露率,可算出PAR。如果病例对照研究中对照组的暴露率可以代表人群暴露率,则可用下式:

环境资料包括家庭环境、居住环境、工作环境、区域环境等。根据不同的研究假设,可作不同暴露的测定。

如以百分比表示,也称为人群归因危险度百分比。

追踪结局收集

②队列研究用人时数据时的指标计算:

追踪确定各成员的结局,采用随访的方法进行。随访的方法有直接方法,即通过函件调查、访问调查、定期调查等。间接方法就是利用医院病历、死亡登记、疾病报告、劳保资料等,根据结局的性质选用。判断结局的标准必须在随访开始时规定,应保持稳定,以便前后比较。随访时间的长短,根据不同疾病的潜隐期、疾病的自然史及已暴露时间来确定。

暴露非暴露合计病例数αbm人年数cdPT

五、定群研究资料分析

人群归因危险度的大小取决于危险因子的相对危险度和人群暴露比例。例如,据Doll与Peto研究,1978年美国癌症死亡中的25%~40%可归因于吸烟,而同年归因于职业因素的癌症死亡只占2%~8%。两者相差这么悬殊是因为人群的吸烟率很高而暴露于职业性致癌因素的人相对很少。

定群研究资料分析主要是计算各组发病率、发病密度或死亡率,其次对组间率的差异进行统计学检查,差异有统计学意义则进一步确定因素与疾病联系的强度。定群研究资料归纳见表30-2。

表4-10 人群归因危险度百分比与相对危

表30-2 定群研究资料归纳表

险度和人群暴露率的关系

组别病例非病例合计发病率暴露组aba+b=N1a/N1非暴露组cdc+d=N0c/N0
a+c=m1b+d=m0

PeRR1.525100.010.51480.052517310.105929470.25112050690.5203367820.931477889

定群研究所比较的是发病率或死亡率即a/N1,与c/N0,如a/N1>c/N0,则某因素与发病有联系,甚至是因果联系。

计算实例:表4-11是一项关于血清胆固醇水平与发生冠心病的危险度的6年随访研究结果。这是从1948年开始的著名的美国Framingham心脏病队列研究的一部分。

率的计算

表4-11 40~59岁男子按初始血清胆固醇水平分组的冠心病6年发生情况

1.累积发病率观察期间人群比较固定,且能稳定地维持在一个较长的观察期,可用累积发病率。计算公式为:

血清胆固醇人数病倒数危险度平均年发病率相对危险度率差<210454160.03520.00591.000.0000210~455290.06370.01061.810.0285≥245424510.12030.02003.390.0851合计1333960.07200.0120--

2.发病密度若暴露人口不固定,人群产生了较大的变动,例如由于工作调动、死于其他疾病、中途加入等,应将变动着的人群转变为人时数代替人数业计算,此种发病率称发病密度。人时就是将人与时间因素结合起来作为率分母的单位,常用的单位是人年,是一个观察对象被观察满一年计为一人年。分子为观察期间发病或死亡人数。

转引自Feinleib与Detels,1985

暴露人年计算

表中,危险度系用式4-7计算,也就是累积发病率,说明6年随访期间发生CHD的危险度,除以6得年平均发病率。胆固醇的浓度以观察开始时检查的结果为准,相对危险度的计算以210mg/dl组的危险度为1。率差或超额危险度系0.0352与其他两组危险度之差,表示不同程度的暴露所增加的危险度。如以210mg/dl组的发病率作为未暴露组的发病率,即Io=0.0059,以≥245mg/dl组为暴露组,则Io=0.0200,用式4-9算出PAR=/0.0120=0.51。这可解释为如所有40~59岁男子的血清胆固醇浓度都能控制在210mg/dl以下时,该人群的CHD发病率将可降低51%。

定群研究观察时间较长,其间人口有动态变化,应采取一定方法计算“暴露人年数”,才能计算发病率;否则,两组成员由于进入开始观察的时间不同,或因死亡、迁出及其他原因或早或晚地退出该组,而造成观察时间的不同,即各组成员的暴露时间不同,可使发病率出现误差。

3)率比与相对危险度:队列研究中暴露组的发病率与非暴露组的发病率之比,称为率比。率比、危险度比和比数比在危险度不高时三者的值几乎相等,都可称为相对危险度。

1.大样本中暴露人年的计算计算原则为:从观察对象中剔除死亡、迁移及失去联系的人数,补充新加入的人数来折算人年。

如以死亡率为终点,则式中以死亡率代替发病率。如果按暴露水平分组,以其中某一组的发病率为基准,其他各组的发病率与它的比值也称为相对危险度,例如表4-12中的相对危险度。

可以年末12月31日的人数为终点及起点计算。上年12月31日观察人数减去次年内所有死亡、迁移、失去联系及新加入人数的总和,得到次年末12月31日的观察人数。两个人数之和除以2,即得到该年内暴露人年数。表30-3为例说明不同年龄9年的合计暴露人年数。

相对危险度无单位,比值范围在0至∞之间。RR=1,表明暴露与疾病无联系;RR1,表明其间存在负联系;反之RR1时,表明两者存在正联系。比值越大,联系越强。实际上,0与∞只是理论上存在的值,恰恰等于1也不多见。极强的联系既无须用流行病学研究去检测,极弱的联系也不大可能用非实验性的流行病学观察法检测出来。RR与OR的数值所表示的联系强度的解释可参考表4-12。

网站地图xml地图