对数据集进行情感分类和预测
更新日期:2021-08-26     浏览次数:231
核心提示:3.1 实验数据 本 文 采用 的数 据集 来自 开源 数 据集 网 站 Kaggle 的酒店评价数据集,数据对象类型有用户对 酒店的评论,用户对酒店评论的时间,用

3.1 实验数据 本 文 采用 的数 据集 来自 开源 数 据集 网 站 Kaggle 的酒店评价数据集,数据对象类型有用户对 酒店的评论,用户对酒店评论的时间,用户评论的 情感标签,情感标签为二类,消极为 0,积极为 1, 用户对酒店的评分为最差 0 分至最好 5 分,本文将 0~2 分为消极,2~5 分为积极。共 25000 条数据, 其中正向评论 12500 条,负向评论 12500 条。实验 数据的训练集与测试集比例设置为 8:2。 3.2 实验参数 实验环境:操作系统 Windows 10、GPU 为 Nvidia GTX1660Ti、16GB 内存。本实验通过深度学 习框架 Keras 开发,TensorFlow 作为底层支持。实验训练是批量训练,对数据集进行情感分类和预测。 本文所用的嵌入矩阵是 Glove 已经训练好的词向量 Glove.6B.100d,词向量维度设置为 100,嵌入索引 中找不到的单词全部设为零。相关实验参数。