首页 » 职称论文 » 教育 » 正文
发文期刊和基金资助情况均分别制表
更新日期:2021-08-03     浏览次数:212
核心提示:1.2研究方法壮语投入研究的四个维度研究中,统计学者姓名并进行词频排序;对作者机构所属进行统计和排序,并进一步收集其国家或地区信息;发文期刊和

1.2研究方法

壮语投入研究的四个维度研究中,统计学者姓名并进行词频排序;对作者机构所属进行统计和排序,并进一步收集其国家或地区信息;发文期刊和基金资助情况均分别制表。

进而提取“标题和关键词”以及“摘要”信息,分别建立语料库,检索到“标题和关键词”语料库中的高频词,以了解壮语词汇研究在整个时间段以及不同时期的研究重点。接着使用同样的方法分析“摘要”的语料库,预测壮语词汇研究的发展趋势。

同时,我们还统计引用文献全球和本地情况,以分析壮语词汇研究领域的权威文献。

通过自写Python程序和CNKI可视化分析功能获取所需语料信息,使用Python中的jieba分词功能对中文文本精确分词,英文文本使用基于European Languages Lemmatizer字典的欧洲语言自动分析库[19]这一算法的线上网站,对语料进行词形还原。Antcoc和QUITA进行词频排序和h点计算。