1 国内外研究进展
知识图谱(knowledge Graph, KG)作为一种结构化的语义知识库,以其灵活的组成结构和丰富的语义表示能力,已成为人工智能应用的重要基础。知识图谱根据覆盖范围一般分为通用型知识图谱和领域知识图谱,根据存储方式一般又分为基于RDF数据结构的语义知识图谱和基于属性图数据结构的广义知识图谱[3]。近年来,国内外学者在知识图谱构建与应用领域开展了广泛研究与实践,如侧重通用性知识的百科知识图谱[4, 5],以及面向细分领域或服务场景的领域知识图谱建设应用实践。
目前学者研究主要聚焦于对非结构化数据的知识抽取。面向海量的非结构化文本,基于词典和规则匹配的传统抽取方法具有较高的准确性,但是人工成本较大。随着深度学习技术不断发展,学术界逐渐倾向利用小样本标注结合深度学习技术实现自动化知识抽取,研究成果注重对模型算法的优化与提升,尤其是随着自然语言处理领域预训练模型的提出,促进对领域非结构化文本的知识抽取,在金融、医学、电商等领域都取得了显著的实际应用成果[6-8]