为了分析外国游客对中国景区的看法和态度,了解外国游客眼中的中国景区形象,以更好地吸引外国游客来华旅游。本文选取了全球最大的旅游在线平台trip advisor,获取其中中国总评论数大于500条的景区的英文评论文本。由于不同类型景区有各自的旅游资源特点,分类进行评论文本提取更有利于不同景区的主题聚类,因此按照景区类型分为圣地与宗教、剧院、购物、纪念碑与雕像、动物园和水族馆、主题公园、古迹徒步、自然与公园、博物馆、地标和名胜古迹,共计11大类。将收集来的评论文本对应不同的旅游资源进行归类集合。运用LDA主题模型对文本进行数据处理,提取景点维度及维度数目。