首页 » 职称论文 » 教育 » 正文
半结构化以及非结构化数据
更新日期:2022-01-25     浏览次数:116
核心提示:一、 什么是小数据,它与大数据有何区别小数据具备精确性和个性化优势在大数据时代是一个不可忽视的要素。那么什么是小数据?它与大数据有何区别呢?

一、 什么是小数据,它与大数据有何区别

小数据具备精确性和个性化优势在大数据时代是一个不可忽视的要素。那么什么是小数据?它与大数据有何区别呢?

现在学界对“小数据”还没有一个精准的被大家认可的概念,为了研究的方便,我们可以把小数据与大数据在规模、类型和价值三个方面的特征进行对比,弄清楚我们讨论的“小数据”是什么。与大数据相比小数据在规模上有限,主要体现在对象和体量上。一方面小数据的采集对象主要为个体,以“样本数据”为主;另一方面“大数据”“小数据”的体量衡量也是相对的,小数据并非简单的体量小,而是与海量大数据相比,小数据的容量是相对有限的。第二,小数据在类型上也呈现出多样性特征。从数据来源看,对典型个体的观察、访谈、实验或问卷调查等都可以产生小数据。从数据种类看,它包括各种结构化、半结构化以及非结构化数据。第三,小数据具有独特的价值且价值密度高。小数据主要收集单一用户的个性化信息,样本信息可视化程度高,而且小数据中的价值信息容易被还原和理解,小数据比大数据的价值密度更高。这好比检查一滴血就可以筛查患者多种生理病理数据,很多时候一个典型个案提取的小数据反映出的是一个较为普遍的事实。