知识图谱(KG,Knowledge Graph)是一种关键的知识组织形式,其以图结构将事实知识呈现为(头实体、关系、尾实体)的三元组(triple)形式。
这种结构化的知识表达方式在众多领域发挥着基础性的支撑作用,并广泛应用于推荐系统、问答系统和情感分析等下游应用中。
然而,尽管主流知识图谱如 Freebase 和 Wordnet 包含了丰富的知识,但仍然存在严重的不完整问题。这意味着在这些知识图谱中,实体之间缺少大量的关系连接,导致知识图谱无法全面、准确地反映真实世界的知识。
例如,在描述人物关系时,可能存在某些人物之间的关联关系未被记录;在描述事件时,可能缺少关键的参与实体或事件发生的背景信息等。这种不完整性严重限制了知识图谱在上述下游应用中的性能和效果,凸显了知识图谱补全(KGC,Knowledge Graph Completion)任务的重要性。
已有的解决方案大多通过预设的几何空间假设学习实体和关系的低维嵌入,并通过定义好的打分函数进行补全。这类方案仅依赖知识图谱中的三元组,忽略了支持这些三元组的上下文语义,容易得出与事实不符的结论,且在处理长尾实体时表现不佳。
近年来基于文本的方法,利用预训练语言模型将实体和关系与其标签和描述进行编码。由于结构化的三元组与自然语言句子之间存在较大语义差距,其性能仍无法超越最新的基于嵌入的方法。
最近两年的研究表明,大语言模型较强的语义理解能力和上下文学习能力可以被利用于解决较为复杂的推理问题。
香港中文大学博士生李木之和香港科技大学(广州)博士生杨策皓认为,通过提供相关的知识和恰当监督,可以激发大语言模型的推理能力,更好地解决知识图谱补全问题。
图 | 香港中文大学博士生李木之(来源:李木之)
图 | 香港科技大学(广州)博士生杨策皓(来源:杨策皓)
基于此,他们研发出一种名为 KGR³ 的 KGC 框架,具体包括如下三个模块。
检索模块:负责收集与待补全三元组相关的语义和结构化知识。这包括:
1)三元组检索:从知识图谱中获取与查询三元组具有相同关系和相似实体的一些三元组);
2)文本上下文检索,从知识库中提取查询三元组及支持三元组中实体的相关上下文,如标签、描述、别名等);
3)候选答案检索(利用先前的 KGC 模型对知识图谱中的实体进行初步评分和排名,选取排名靠前的实体作为候选答案)。
推理模块:利用大语言模型的上下文感知推理能力,为具体的不完整三元组生成一些可能的答案。为了引导大语言模型更好地完成任务,他们利用演示提取出的相似三元组帮助大语言模型理解任务,并提供了实体的描述来防止幻觉现象的产生。考虑到大语言模型输出的噪声问题,他们会对生成的答案做对齐,确保输出的实体在知识图谱中真实存在。
重排序模块:整合并重排上述两个模块的候选答案,使满足不完整三元组的最佳实体排在较前位置。在这个模块中,他们通过对训练集中的三元组头尾实体进行负采样来候选答案集,并引入监督微调机制,使大语言模型拥有能够根据实体描述和已知实体的邻接三元组从答案集中选择最佳实体的能力。
实验结果表明,在文本语义信息、图谱结构化知识、以及监督微调的多重指导下,即使是参数量较小(1.5B 和 7B)的开源大模型,都有能力很好地解决知识图谱的补全问题。
(来源:arXiv)
据介绍,KGR³ 可被用于推荐系统、信息检索等领域。例如,KGR³ 通过补全知识图谱中的用户和物品关系,推荐系统可以发现用户潜在的兴趣点,提供更个性化、符合用户需求的推荐内容。
在电商平台上,能根据知识图谱中的 KGR³ 补全的相关实体关系(如品牌关联、产品功能互补等)推荐搭配产品或相关服务,基于用户购买历史推荐相似产品,提升推荐的质量和效果。
在社交网络平台的好友推荐或内容推荐中,利用 KGR³ 补全后的知识图谱挖掘用户之间更深层次的联系,以及用户可能感兴趣的话题或群组,增强用户在平台上的互动和参与度。
据了解,李木之在粤港澳大湾区数字经济研究院(IDEA,International Digital Economy Academy)访问期间,在郭健教授和徐铖晋博士的指导下,他与博士生杨策皓组成团队,将语境知识图谱作为研究课题。
团队察觉到现有 KGC 方法的不足,尤其是嵌入法和文本法在处理语义理解和长尾实体时的局限,而大语言模型虽有潜力但应用受限。
因此,他们决定尝试探索一种新的解决方案,把图谱中可以获取到的知识整合起来,看是否可以大语言模型学会做这样的任务。经过初步尝试,他们开发出了 KGR³ 框架的雏形,包含检索、推理和重排序三个模块,并初步验证了可行性。
在验证方案可行之后,他们快速进行了实验,并首次提交了论文。然而结果不尽人意,评审分数未达预期。审稿人指出,尽管框架的设计有一定创新性,但在性能表现上仍有明显不足,使用了参数量更多,能力更大的大语言模型,却未能显著超过传统方法,缺乏足够的说服力。
这一挫折让他们意识到,研究仍需深入,必须找到提升框架性能的有效途径。
他们仔细查看了审稿意见,分析实验数据,发现原本的重排序方案是整个框架的瓶颈。在前序方案中,他们尝试让大语言模型去生成候选实体的完整排序。然而,在知识图谱中并没有具体排序的监督数据。
于是,他们选择利用已有 KGC 模型输出的排序来微调大语言模型,这无益于解决已有方案的缺陷。在阅读关于大语言模型的其他文献后,他们认为输出完整排序实质上增加了任务难度。
相较于在实体间“比大小”,大语言模型更擅长做“选择题”,因此他们转换到了现在的方案。同时,他们意识到需要在写作方面强化研究目的。
在新一版论文中,他们更清晰地阐述 KGR³ 框架如何有效利用实体上下文和大语言模型的能力,以及各模块间的协同工作原理。
此外,他们补充了更多对比实验,以全面展示 KGR³ 在不同数据集、不同基准 KGC 模型、以及不同规模和种类的大语言模型下的优势,增强研究的说服力。
再次提交论文之后,这一次论文得到了审稿人的一致性高度认可,评审分数大幅提升。审稿人对 KGR³ 框架在性能上的显著提升给予了充分肯定,尤其赞赏其在处理复杂知识图谱补全任务时的有效性和创新性。
日前,相关论文以《检索、推理、重新排序:知识图谱补全的语境增强框架》(Retrieval, Reasoning, Re-ranking: A Context-Enriched Framework for Knowledge Graph Completion)在预印本网站arXiv发表[1],并已被自然语言处理顶会 NAACL 2025 主会收录。
图 | 相关论文(来源:arXiv)
未来,团队计划将 KGR³ 范式延伸至其他知识图谱推理任务,如归纳式知识图谱补全和基于知识的问答。
在当前研究中,KGR³ 框架已在传统的知识图谱补全任务中展现出显著优势,但对于未在训练集中出现的实体(即归纳式设置下的情况),该框架尚无法有效处理。后续,团队将着力解决这一问题,使 KGR³ 能够应对更复杂、更具挑战性的实际场景。
例如,在实际应用中,新的实体和关系不断涌现,能够处理归纳式 KGC 任务将大大提升知识图谱的完整性和实用性。
此外,研究人员还计划将 KGR³ 框架应用于知识图谱问答,从问题理解、知识检索、答案生成和优化等多个环节入手,充分发挥其在处理知识图谱和文本信息方面的优势,为用户提供准确、有用的答案,进而将语境知识图谱概念进一步延伸。
参考资料:
1.https://arxiv.org/pdf/2411.08165
排版:刘雅坤