(1)模型能够自动进行三元组抽取,而不依赖预定的关系类型;(2)对于非同源语料,模型具有较强的通用性;(3)模型不需要针对个别领域进行训练,从而节省了数据标注和训练计算的成本,在大数据背景下具有较高的效率。在得到关系三元组后,考虑到从原文中直接抽取出的实体和关系比较分散,仍需调用三元组的表示模型为其生成嵌入向量,并基于此对关系三元组进行聚类和归并。
在得到关系三元组后,已有的研究通常利用基于Protégé软件内部功能来实现对领域知识图谱的展示和查询等操作。然而,Protégé软件过于专业,对于一般用户而言不具有易用性。在大数据背景下,研究人员常利用可视化技术,帮助用户快速获取所需要的信息[9,10],有效降低Protégé软件的使用门槛,有助于用户进行决策。