失访偏倚

暴露组应已处在某种暴露因素中或已有某种特殊暴露史,并能提供可靠的暴露因素的历史,且便于追踪与观察。

研究对象由于在一个较长的追踪期内总会有移居外地、死亡于其他疾病或意外死亡、或拒绝参加实验、外出、或不合作等种种原因而未能追踪观察到,以致在研究中丢失。失访偏倚影响研究真实性,其影响研究真实性的程度取决于两方面,一是失访人群的质,即失访人群与未失访人群在所研究的主要方面如果区别不大,无显着性差异,则偏倚影响不大;二是失访人群的量,如果失访量小于观察人群总数的5%,可认为所产生的偏倚不大,如果失访率大于5%,则结果的推论应慎重考虑。

特殊暴露的人群

选择偏倚

选择由于职业关系或其他原因暴露于某危险因素特别严重的人作为定群研究对象,不但所需要的人数较少,而且较易发现暴露与患病之间是否存在联系。如研究放射线与白血病的关系时,选用接受放射线治疗的患者;研究联苯胺与膀胱癌的关系时,选用染料工人;研究肺癌的危险因素时,选用石棉工人。

任何非研究因素在研究人群中与一般人群中的分布不一致,均可引起选择偏倚,如年龄、种族等。暴露人群错划入非暴露人群或非暴露人群错划入暴露人群,均可造成选择偏倚。选择偏倚的出现,往往高估或低估了联系的强度。

一个地区的全部人口或其样本

测量偏倚

有时可在一地区人群中进行定群研究。选择条件首先是便于研究。例如,在美国马萨诸塞州的Framingham镇已进行多年的心脏病定群研究,在1948年开始时以当时30~59岁人口的2/3的一个随机样本作为研究对象。因为当地人口流动性小,居民配合,有一所高水平的医院等,便于随访,能得到完整的资料。

随访时对疾病的诊断缺乏严格、客观的标准,或缺乏特异性诊断指标,或测量仪器精确性差或人为的测量偏倚等,均可造成漏诊或误诊,而导致测量的系统误差。

一个可疑病历必须有较高的人群暴露率,并且所研究的病又有较高的发病率或死亡率才适合于用全人群作定群研究。

混杂偏倚

便于随访的人群

在定群研究中亦可存在混杂偏倚,一般性别、年龄等因素常为混杂因素,研究分析时应注意。

为了便于随访,往往选择一个团体,或以医疗就诊和随访观察结果方面特别方便的人群作为研究对象,可以节省人力、物力,并可提高随访质量和结果判断的可靠程度。例如Doll和Hill选择了所有登记注册的开业医生。选择属于团体的人群,样本代表全人群的可能性稍差,但是能降低失访率,同时提高调查结果的可靠性。

二、定群研究中偏倚的控制

二、对照组的选择

控制定群研究中的偏倚,首先加强对调查员的选择和培养,强调进行该项研究工作的意义,要求调查员对调查工作增强责任心,并注意调查工作方法和调查技巧等。根据不同的偏倚具体控制办法如下:

对照组的设立是为了与暴露组比较。对照组与暴露组应具有可比性,即对照组人群除暴露因素的影响外,其他各种因素的影响或人群的特征,如年龄、性别、职业、民族等,都应尽可能与暴露组相似。同时在资料收集完毕,进行分析时,还应作一次均衡检验,以考核两组资料的可比性。

失访偏倚的控制

对照组常用以下几种形式:

加强随访调查,尽量减少失访的人数。应建立制度来保证减少失访人数,最好失访率小于5%。

美高梅线上平台游戏,内对照

选择偏倚的控制

若调查对象是一个整体人群,人群内部暴露于某因素的便为暴露组,而非暴露或以暴露级别最低的一组便为对照组;不需另外设对照组或非暴露组。例如,调查人群中血脂水平,可以水平最低的组列为对照。

在选择研究对象时应缩小其特征范围,严格细致按规定的标准选择适宜对象。

人群对照

测量标准的控制

不另设对照,而是以人群为对照。在职业流行病学研究中,常以某职业人群为暴露组,与该地区整个人群的发病率进行比较分析。以人群为对照,应注意对照组与暴露组人群在地理与时间的一致性。

改进测理手段,选用精确性强的仪器,加强特诊断和客观的标准,来控制测量偏倚。

特殊暴露人群人数一般不多,不能得到可靠的分年龄、性别和原因的专率供直接比较,一般须采用标化死亡比或标化发病比作间接比较,两者均须计算标准误并作显著性检验。

混杂偏倚的控制

另设对照组

采用标准化计算发病率及死亡率,按混杂因素进行分层分析及多元分析等控制混杂偏倚。

选择一个与暴露组在年龄、性别、民族、居住地区等方面相似的非暴露组作为对照组进行随访,作为与暴露组比较的基准。例如研究放射线对放射科医师死亡率的影响时,可以在同地区医院内眼科医师作对照组。

多种对照

为了增强判断依据,可将上述方法综合起来,设立多种对照,进行多重比较。如内对照、人群对照、非暴露组对照等。这样可以增加判断的依据。

三、样本大小的估计

定群研究样本大小的估计应根据:

1.暴露组的事件发生率的估计值;

2.非暴露组的事件发生率的估计值;

3.第一类错误概率α;

4.第二类错误概率β。

在该4个数值确定后,可用下式估计暴露组与非暴露组需观察的人数。

公式中N为每一组所需调查人数。

Q1=1-P1,Q0=1-P0

P=/2,Q=1-P

Kα与Kβ分别为α及β值的正态分布分位数,该数可从正态分布的分位数表中查出。

非暴露组的发病率P0可以根据人群一般发病水平来代替。而暴露组的发病率P1难以估计,若能够估计相对危险度,则P1=RR×P0,RR可从预调查或文献资料中估计,也可用OR来代替,P1=OR×P0,OR可从病例对照研究中得来。


拟用定群研究方法研究孕妇暴露于某种药物与婴儿先天性心脏病之间的联系。假定已知非暴露组的发病概率P0=0.08,估计RR=2,当α=0.05,β=0.10时,估计需要的样本含量。

Kα=1.960,Kβ=1.282

P0=0.008,RR=2,P1=2×0.008=0.016

P=(0.008+0.016) /2=0.012

Q=0.988,Q1=0.984,Q2=0.992

代入公式:

即每组需要样本含量为3892人。

四、资料的来源与收集

确定暴露组与非暴露组后,需收集对疾病的发生或死亡频率可能有影响的一般资料,如年龄、性别、婚姻、文化程度、经济收入、家庭人口、人口迁移等。

从查阅现有的记录收集

特殊暴露人群的职业史或医疗记录常有暴露水平或个体暴露剂量的的资料,这是暴露史的唯一可靠来源。查阅现有记录不仅可了解研究对象本人暴露的性质和剂量,同时其主要优点是具有较高的客观性。

调查询问收集

有时被研究对象的有些研究因素无现成记录,例如烟、酒、饮食等生活习惯、体力活动等,必须向被研究对象本人了解。通常采用调查表方式由调查员询问时填写或通信调查。

通过医学检查或检验收集

有些研究因素属于被研究对象对生理特征或生化指标,必须通过检查或检验才能获得数据,例如血压、身高、体重、血脂、血糖等。

从环境资料收集

环境资料包括家庭环境、居住环境、工作环境、区域环境等。根据不同的研究假设,可作不同暴露的测定。

追踪结局收集

追踪确定各成员的结局,采用随访的方法进行。随访的方法有直接方法,即通过函件调查、访问调查、定期调查等。间接方法就是利用医院病历、死亡登记、疾病报告、劳保资料等,根据结局的性质选用。判断结局的标准必须在随访开始时规定,应保持稳定,以便前后比较。随访时间的长短,根据不同疾病的潜隐期、疾病的自然史及已暴露时间来确定。

五、定群研究资料分析

定群研究资料分析主要是计算各组发病率、发病密度或死亡率,其次对组间率的差异进行统计学检查,差异有统计学意义则进一步确定因素与疾病联系的强度。定群研究资料归纳见表30-2。

表30-2 定群研究资料归纳表

组别病例非病例合计发病率暴露组aba+b=N1a/N1非暴露组cdc+d=N0c/N0
a+c=m1b+d=m0

定群研究所比较的是发病率或死亡率即a/N1,与c/N0,如a/N1>c/N0,则某因素与发病有联系,甚至是因果联系。

率的计算

1.累积发病率观察期间人群比较固定,且能稳定地维持在一个较长的观察期,可用累积发病率。计算公式为:

2.发病密度若暴露人口不固定,人群产生了较大的变动,例如由于工作调动、死于其他疾病、中途加入等,应将变动着的人群转变为人时数代替人数业计算,此种发病率称发病密度。人时就是将人与时间因素结合起来作为率分母的单位,常用的单位是人年,是一个观察对象被观察满一年计为一人年。分子为观察期间发病或死亡人数。

暴露人年计算

定群研究观察时间较长,其间人口有动态变化,应采取一定方法计算“暴露人年数”,才能计算发病率;否则,两组成员由于进入开始观察的时间不同,或因死亡、迁出及其他原因或早或晚地退出该组,而造成观察时间的不同,即各组成员的暴露时间不同,可使发病率出现误差。

1.大样本中暴露人年的计算计算原则为:从观察对象中剔除死亡、迁移及失去联系的人数,补充新加入的人数来折算人年。

可以年末12月31日的人数为终点及起点计算。上年12月31日观察人数减去次年内所有死亡、迁移、失去联系及新加入人数的总和,得到次年末12月31日的观察人数。两个人数之和除以2,即得到该年内暴露人年数。表30-3为例说明不同年龄9年的合计暴露人年数。

网站地图xml地图