3.1 Mnd-Knox时空分布特征检验模型
频发型犯罪的发展规律通常被视为连续变量在时间轴上的横移运动,与传染病的流行态势极为相似[8]。而Knox算法作为一种经典的传染病聚集性检验方法,将其理论应用于对犯罪数据预处理过程进行优化,能够实现案件间自相关性分析,从而得到犯罪近重复性信息。然而,传统的Knox检验方法需要人工确定阈值,在缺乏相关先验知识的情况下,主观人为确定的阈值会存在一定的随意性。如,文献[9]介绍了在研究神宗和征出血热疾病时,人为指定空间阈值为500km和800km;文献[10]将Knox算法应用于垃圾处理及占道经营事件研究,人为选取空间阈值为500m,时间阈值为3h;文献[11]中逐一选取900km、1000km…2000km作为空间阈值,构建了12组权重矩阵,实验表明在不同阈值下事件呈现出的时空交互性差异较大,不能精准反映出事件真实的自相关性。
因此,本文对传统Knox算法进行了改进,以案件对平均最邻近距离(Mean Nearest Distance,MND)作为Knox检验阈值,并将改进的Knox算法命名为Mnd-Knox,该算法能够体现出邻近案件点比疏远案件点存在更为紧密的关系,解决了传统Knox算法人工确定阈值的随意性问题。