首页 » 职称论文 » 教育 » 正文
通过数据采集工具采集数据,主要采集科普视频信息、创作者信息和视频评论信息
更新日期:2020-10-27     来源:现代传播(中国传媒大学学报)   作者:李根强  浏览次数:215
核心提示:2.方法2.1数据来源与方法本研究采用了数据定向采集方法,采集Bilibili网站在2020年1月20日至2020年3与1日期间上线的新冠肺炎科普视频。通过数据采集

2.方法

2.1数据来源与方法

本研究采用了数据定向采集方法,采集Bilibili网站在2020年1月20日至2020年3与1日期间上线的新冠肺炎科普视频。通过数据采集工具采集数据,主要采集科普视频信息、创作者信息和视频评论信息。第一,采集Bilibili网站新冠肺炎1729个科普视频信息。利用新冠、冠状病毒、2019-NCOV、COVID-19、NCP等关键词搜索科普视频,采集视频标题、创建日期、评论数、点赞数、播放数等信息。第二,采集Bilibili网站新冠肺炎科普视频的1130位创建者信息。视频创建者信息包括关注数、粉丝数、获赞数等。由于部分创建者创建了多个视频,因此通过程序实现视频与创建者信息的匹配。第三,采集Bilibili网站新冠肺炎科普视频的11674条评论。选择点赞数最高的视频,采集自创建以来用户对其发表的所有评论信息,包括评论人、评论时间、评论内容、评论获赞数等数据。

由于研究数据包括数字和文本两种类型,因此本研究采取了统计分析、文本分析和网络可视化相结合的方法。第一,通过统计分析方法,对视频数据、创建者数据、评论数据进行描述分析。第二,文本分析方法。借助ROST CM软件实现对科普视频标题、关键词、评论的分词,以及高频词统计、高频词共现,并对视频评论情感进行分析。第三,网络可视化方法。在高频词共现矩阵的基础上,借助Gephi软件绘制视频关键词和用户评论的语义网络。

2.2数据描述

Bilibili网站将用户设置为0-6个级别,由于0级最低且本样本中该级别创建者数量较少,因此通过创建者1-6级对样本进行分组描述(表1)。从创建者指标来看,大部分创建者网络级别较低,主要集中在2-4级。级别越高通常关注数也较高,随着级别增加粉丝数明显增长;粉丝数的标准差很大,表明创建者的粉丝数具有很大差异。从视频指标来看,视频平均上线天数差别不大,高级别创建者创建视频点赞数量与播放次数明显高于低级别创建者。视频点赞数和播放数均具有很高的标准差,表明新冠肺炎科普视频被用户点赞和播放的次数存在很大差异。