在语料库语言学研究中,主题词指的是“目标语料与参照语料对比后自动产生的频率显著性高(或显著性低)的单词形关键词(keywords),或称主题词。”(何安平、郭桂杭,2020:18)主题词绝非词汇清单的简单罗列,而是基于词频,自下而上地探析语篇本质、内容和话语轨迹,凸显语篇的关键性信息。本文利用主题词分析,旨在发现《经济学人》在中国新冠肺炎疫情报道中的话语主题特征,为后续的搭配网络、索引行分析提供指向性路径参考,并揭示该媒体话语表征背后所反映的意识形态特征。
本研究将共计四百万词的BNC baby语料库作为参照语料库,通过语料库分析工具比照、并自动提取出目标语料库主题词关键信息列表,梳理出《经济学人》针对中国疫情报道的指向性内容。下图显示的是利用Lancsbox 4.5版words中的keywords功能生成的前50个主题词,主题性由高到低排列