对数据集进行情感分类和预测

3.1 实验数据本文采用的数据集来自开源数据集网站 Kaggle 的酒店评价数据集，数据对象类型有用户对酒店的评论，用户对酒店评论的时间，用户评论的情感标签，情感标签为二类，消极为 0，积极为 1，用户对酒店的评分为最差 0 分至最好 5 分，本文将 0~2 分为消极，2~5 分为积极。共 25000 条数据，其中正向评论 12500 条，负向评论 12500 条。实验数据的训练集与测试集比例设置为 8:2。 3.2 实验参数实验环境：操作系统 Windows 10、GPU 为 Nvidia GTX1660Ti、16GB 内存。本实验通过深度学习框架 Keras 开发，TensorFlow 作为底层支持。实验训练是批量训练，对数据集进行情感分类和预测。本文所用的嵌入矩阵是 Glove 已经训练好的词向量 Glove.6B.100d，词向量维度设置为 100，嵌入索引中找不到的单词全部设为零。相关实验参数。