内容提要:本文以我国大陆地区1974年至2006年的地震灾害数据为例,建立起以死亡人数为响应变量的贝叶斯半参数空间回归模型。由于死亡人数中同时包含了大比例的零计数和部分极值观测,借鉴极值理论的一般做法,本文建立起双分栏模型以合理刻画数据中的极端异质性和超散度特征。具体的,在回归建模中,分别采用了基于经、纬度坐标的二维曲面光滑拟合和空间条件自回归部分以反映大尺度的空间变化趋势和小范围的区域特征,在此基础上,建立起了完整的贝叶斯层次结构和模型选择标准。实例分析表明,本文的方法能够显著改进建模效果,对于我国巨灾防控工作具有重要的参考价值和指导意义。
关键词:分栏模型;条件自回归先验;二维曲面光滑拟合;基函数;贝叶斯分析
一、引言
中国地处世界上两个最大地震集中发生地带——环太平洋地震带与欧亚地震带之间,受
太平洋板块、印度板块和菲律宾海板块的挤压,在我国发生的地震又多又强,且其绝大多数发生在大陆的浅源地震,震源深度大都在20公里以内。据统计,20世纪有1/3的陆上破坏
性地震发生在我国,其死亡人数占全世界同期因地震死亡人数的一半左右。总的说来,中国地震活动频度高、强度大、震源浅,分布广,是一个震灾严重的国家,地震及其他自然灾害的严重性构成中国的基本国情之一。
本文搜集了我国大陆地区1974年至2006年间发生的地震灾害数据,该数据集总共包含175个观测,涉及到死亡人数、震级、震中位置(经、纬度坐标)以及参考地点(发生地点所属的行政区划)等多项指标。由于地震分级的标准通常是按照死亡人数的多少进行划分,尤其是对于那些发生在人口密集地区且造成相当死亡人数的重大地震,一直以来都是相关部门防控工作的重点。因此,本文以死亡人数为响应变量,建立起死亡人数与震级、震中位置以及参考地点相关的贝叶斯空间回归模型,深入分析响应变量随指标的时空变化趋势。值得注意的是,由于响应变量中不仅包含了大比例的零计数,还包含了部分极值观测,呈现出极端的异质性和超散度特征。此时,若继续采用传统的计数数据分布如泊松分布、零点膨胀泊松分布以及零点膨胀负二项分布等[1,2,3,4]均不再合适。最近,Balderama等人[5]提出了一类新的双分栏模型,其基本思想是采用三类独立的数据产生过程即零计数过程、负二项分布过程以及厚尾的广义帕累托分布过程分别对计数数据中的零观测、“一般”非零观测和“极端”非零观测进行合理的刻画。受该工作的启发,本文建立起了双分栏模型下的贝叶斯空间光滑回归模型拟合上述数据。
作者:付英姿 任德鑫