异常点与噪声或新生值进行区分
更新日期:2022-03-26     浏览次数:174
核心提示:2 异常数据的定义及分类异常数据指的是非正常的、与数据集内大部分数据的特征不匹配的数据, 但是噪声、偏差、新生值除外[17]。异常数据也称为奇异值

2 异常数据的定义及分类
异常数据指的是非正常的、与数据集内大部分数据的特征不匹配的数据,
但是噪声、偏差、新生值除外[17]。异常数据也称为奇异值或异常点,在实际应
中,具体的异常数据定义需要根据所在环境背景进行定义。一般地,异常数
据分为三类[21]:点异常、上下文异常、集合异常。
点异常,或全局异常,指得是某个点或数据与全局大多数点都不相同,如
某车站内出现一名体温为 39 摄氏度的旅客。点异常是异常数据中最简单的一种
异常数据,但点异常数据由于异常数据较少,往往在进行检测时需要考虑特定
环境或背景,从而将异常点与噪声或新生值进行区分。
上下文异常,或条件异常,指的是该数据值与相同情况的上下文(或时间
前后)数据值不相同,如智能手环监测到佩戴者某日 20时心跳为每分钟 90次,
而前后时间心跳均在每分钟 70 次左右。若佩戴者 20 时正在进行慢跑,则此数
据不为异常数据;若佩戴者此时为正常活动状态,则此数据反映佩戴者心率出
现紊乱。因此,上下文异常在进行检测时,不仅仅要判断数据值的变化,更要
结合被检测对象当时所处的环境或背景[21]