1 高质量多源数据采集汇聚
数据汇聚是开展多源数据融合的第一步,为多源数据融合和分析应用奠定高质量数据来源基础。目前,深圳市生态环境大数据中心实现了内外部、横向、纵向数据交换共享,完成局内外252亿条数据汇聚,达到295T的存储容量。共开发了生态环境物联网数据采集接口、生态环境业务数据在线采集接口、生态环境离线文件采集接口、互联网生态环境数据采集接口、人工数据填报数据采集接口等5个数据采集接口。完成物联网数据统一接入平台和视频统一联网平台建设。接入物联感知设备4000多套,视频6000多路。完成建设数据主题库37个,为48个业务系统建设提供了全面的数据支撑。但是在数据采集汇聚层面,仍然存在数据不规范、不完整、不准确等问题,数据质量有待提高,针对数据采集汇聚存在的问题,提出以下解决方案。