用户评论构建实验数据集合
更新日期:2021-10-21     浏览次数:139
核心提示:2 实验验证 为验证领域知识对于用户评论分类的作用,我们从华为应用市场中选取社交、教育以及游 戏3 个类别的 app 产品作为实验对象。对于每个类别,

2 实验验证 为验证领域知识对于用户评论分类的作用,我们从华为应用市场中选取“社交”、“教育”以及“游 戏”3 个类别的 app 产品作为实验对象。对于每个类别,我们分别选取其中 top-20 产品的介绍文本以及 1000 条用户评论构建实验数据集合,并我们邀请三名人员手工分别对评论数据进行标注,标签分为“错 误报告”“特性需求(Feature request)”“用户体验”以及“其他”四类。对于任意一条用户评论,若 标记人员给出的标签一致,则将其确定为该评论的最终标签;若标记人员所给标签存在不一致的情况, 则他们共同再次对该评论进行分析讨论,如果最终取得一致结论,则确定该评论标签,否则,将该评论 从数据集中去除。经过该过程,得到供机器学习训练以及结果验证的数据真集。