在语料库的构建及分析环节,本研究使用的主要工具是基于Python 3.7的自然语言处理工具包NLTK模块(Natural Language Toolkit)。NLTK是自然语言处理领域的常用工具之一,功能十分强大,可应用于自然语言的词性标注、词干提取、语义分析、机器翻译等方面。本研究主要使用NLTK工具包内的AlignedSent工具对汉语原文和四个英语译文分别构建句级平行语料库,并使用IBM模型进行词汇对齐。IBM模型是20世纪90年代由IBM公司提出的统计机器翻译模型(Brown et al.,1993;Koehn, 2009),是基于统计方法的机器翻译中的经典模型,也是基于词汇的统计机器翻译系统的基础,实际包含5个复杂度依次递增的统计翻译模型。