1.2 研究方法 年龄-时期队列模型(APC模型)将流行病学统计研究中影响因变量的时间层面因素分为三类:年龄、队列和时期,评估三种因素各自对目标变量的影响效应。年龄、队列和时期效应分别为由年龄、出生队列以及调查时期的不同造成的目标变量的变异程度。本研究的主要目标为实证检验中国肺结核报告发病率的年龄、时期和队列效应,表示第k个出生队列的队列发病效应,k=1,2...19。为模型的随机扰动性,且满足零均值假设。然而,由于年龄、时期和队列三个变量间存在完全的多重共线性关系:年龄+队列=时期,导致模型系数最小二乘估计值的不唯一解问题。为此本研究使用Fu[4]和Yang[5]等人提出的内生因子法(Intrinsic Estimator, IE)估计式子的APC模型系数。IE算法能够克服APC模型的多重共线性问题,获得稳定的模型系数估计结果[6]。
1.3 统计分析
本研究使用stata15软件构建对数线性APC模型。由于研究方法的需要,将年龄、时期和队列变量进行间隔相同的分组处理。具体而言,将年龄从0岁开始,每5年分为一个年龄组,共得到[0,4],[5,9]...[80,84]17个年龄组,将17个年龄组依次编码为0,5...80。时期同样按照5年为间隔分为2004-2008,2009-2013,2014-2018三个时期组,将三个时期组依次编码为2004,2009,2014。出生队列根据队列=时期-年龄计算,共得到17+3-1=19个队列组,队列编码依次为:1924,1929...2014。