数据整理时发现有缺失值和异常值
更新日期:2022-01-07     浏览次数:137
核心提示:1.1资料来源资料来源于国家人口健康科学数据中心数据仓储PHDA(https://www.ncmi.cn)的新冠肺炎爆发初期美国民众对新冠肺炎风险感知横断面调查数据集。

1.1资料来源

资料来源于国家人口健康科学数据中心数据仓储PHDA(https://www.ncmi.cn)的“新冠肺炎爆发初期美国民众对新冠肺炎风险感知横断面调查数据集”。本调查数据集从2020年3月29日至2020年4月20日,24547名美国民众对新冠肺炎威胁感知的问卷调查结果,问卷包括一般人口统计学信息(性别、年龄等)、环境因素(接触人数、房间居住人数等)、行为因素(吸烟情况、饮酒量等)、政府因素(国家政府认真对待COVID-19态度等)和健康因素(有无哮喘、有无慢性肾癌等)五个方面。数据整理时发现有缺失值和异常值,对于条目缺失值和异常值数目大于10%则剔除,其他用众数进行填充。剔除不完整的问卷后,有效问卷23785份,有效率为96.90%。