核心提示:一种通过语料过滤来提高维汉词对齐性能的方法为李钦钦最新的研究成果,本论文的主要观点为词对齐是统计机器翻译系统中最重要的一个环节,统计机器翻译
一种通过语料过滤来提高维汉词对齐性能的方法为李钦钦最新的研究成果,本论文的主要观点为词对齐是统计机器翻译系统中最重要的一个环节,统计机器翻译中的翻译模型和调序模型都是在词对齐结果的基础上构造的,词对齐阶段出现的错误,会延续到这些模型中,甚至会因为词对齐的错误而在这些模型中引发更大的错误。词对齐技术的研究在自然语言处理领域中对语料库的建设、语音识别、双语词典的编撰、信息检索等提供基础性建设。本文的主要工作就是研究基于句子一级的维汉词对齐,把基于对齐困惑度的双语语料过滤方法应用到维汉词对齐中。实验结果表明该方法可行,达到了初级阶段所预期的效果,对后续维汉词对齐技术研究提供了一定的基础。现欲投微电子学与计算机,不知是否符合录用要求,望您批评与指正。