大数据知识融合基础及研究进展综述
doi: 10.11887/j.issn.1001-2486.25100044
赵翔1 , 曾维新1 , 彭鐄1 , 张时琪2 , 肖冠辰1 , 赵润豪1 , 周明君1
1. 国防科技大学大数据与决策国家级重点实验室, 湖南 长沙 410072
2. 国防科技大学信息系统工程全国重点实验室, 湖南 长沙 410072
基金项目: 国家自然科学基金资助项目(U25B2047,U23A20296,62272469,62302513) ; 湖南省科技创新计划资助项目(2023RC1007)
Survey on foundations and research progress of big data knowledge fusion
ZHAO Xiang1 , ZENG Weixin1 , PENG Huang1 , ZHANG Shiqi2 , XIAO Guanchen1 , ZHAO Runhao1 , ZHOU Mingjun1
1. National Key Laboratory of Big Data and Decision, National University of Defense Technology, Changsha 410072 , China
2. National Key Laboratory of Information Systems Engineering, National University of Defense Technology, Changsha 410072 , China
摘要
在大数据智能化时代,知识已成为驱动技术发展的根源动力。大数据知识融合通过关联多源碎片化数据构建统一知识体系,是增强知识完备性、提升认知智能水平的关键支撑。立足于基本范式与经典方法,系统归纳了知识表示学习、知识对齐匹配及知识冲突消解三大关键环节的研究现状。同时,深入探讨了大数据背景下的新进展,涵盖时序知识融合、跨模态知识融合及大模型知识融合等前沿方向。在此基础上,展望未来发展趋势,重点分析了符号化与参数化知识融合、跨模态时序知识融合等潜在研究问题。全景式梳理基础环节与新兴范式,旨在为大数据知识融合领域的理论扩展与技术演进提供重要借鉴与指导。
Abstract
In the era of big data intelligence, knowledge has become the fundamental driving force for technological development. Big data knowledge fusion, which constructs a unified knowledge system by associating multi-source fragmented data, serves as a key support for enhancing knowledge completeness and improving cognitive intelligence. Based on basic paradigms and classic methods, the research status of three key links, knowledge representation learning, knowledge alignment matching, and knowledge conflict resolution, was systematically summarized. Meanwhile, new progress in the context of big data was deeply explored, covering frontier directions such as temporal knowledge fusion, cross-modal knowledge fusion, and large model knowledge fusion. Furthermore, future development trends were prospected, and potential research issues, including the fusion of symbolic and parametric knowledge as well as cross-modal temporal knowledge fusion, were highlighted. Through a panoramic review of basic links and emerging paradigms, important reference and guidance are provided for theoretical expansion and technological evolution in the field of big data knowledge fusion.
知识是对客观世界规律的认知与总结,是指导实践的根本。20世纪70年代,专家系统之父、斯坦福大学爱德华·费根鲍姆教授首创知识工程这一概念,其目的是将人类专家的知识输入到计算机中并建立推理机制,让机器也拥有知识并能进行计算和推理,从而解决实际问题[1]。传统知识工程中的知识获取来源主要是领域专家,且知识多以本体、规则、逻辑表达式等形式存在。传统知识工程在各领域都发挥了显著作用,但在知识规模不断增长的大数据时代,这种知识管理方式不仅人工成本高,且受制于专家经验,难以有效应对复杂多变的动态环境[2]
为解决上述问题,大数据知识工程应运而生,其旨在从跨模态、跨域的大数据中挖掘碎片知识,并融合成结构化知识,实现知识生产自动化,建立结果可溯因、证据可解释的智能推理机制[3]。与自上而下、专家先验知识驱动的传统知识工程不同,大数据知识工程的知识获取和融合过程以机器为主、人工为辅,采用知识与数据驱动相结合的方式自下而上地构建知识体系。最具代表性的知识图谱(knowledge graph,KG)技术,便是从海量半结构化、非结构化数据以及存量结构化数据中抽取得到结构化知识[4]。大数据知识工程的研究范畴一般包含数据知识化、知识体系化和知识可推理三个部分[3],其中,知识体系化主要借助大数据知识融合技术,将跨域的碎片知识融合成知识体系,为求解特定工程问题的知识推理提供支撑。
大数据知识融合旨在将不同来源的各类知识进行对齐、合并,从而形成全局统一的知识体系。现有相关研究主要集中在知识图谱间的融合,一般先通过表示学习技术将符号化的知识转换成向量表示,随后在向量空间中进行知识对齐匹配以建立多源知识之间的关联[5],最后借助冲突消解等技术消除不同知识之间的冲突,实现知识的合并[6],形成准确一致的知识体系。近年来,大数据知识融合的研究范畴也进一步扩展:一方面,时序知识、多模态知识等多样化知识形态的涌现,对知识融合能力提出了更高要求[7];另一方面,大语言模型(large language model,LLM)等生成式人工智能技术的出现,引入了“参数化知识”这一全新的知识类型[8],催生了对参数化知识与传统符号化知识间融合方式的新探索[9]
本文旨在在大数据知识工程的背景下,系统性地阐述大数据知识融合的一般流程和技术,概述代表性工作,同时进一步扩展综述的范围,介绍时序知识融合、跨模态知识融合,以及涉及大模型的知识融合等方向的最新进展,以期为读者们提供前沿和全面的介绍。表1总结了传统知识工程、大数据知识工程与大数据知识融合的技术演进脉络。
1知识工程与知识融合技术演进脉络
Tab.1Evolutionary lineage of knowledge engineering and knowledge fusion technology
尽管目前已有部分知识融合相关的综述性研究,但尚缺乏对大数据知识融合相关技术较全面的综述。具体地,文献[710-11]综述了本体、数据库等形式的知识融合框架及算法,而忽视了知识图谱融合的相关工作;文献[12]对多源环境下的知识图谱融合技术进行了综述,但未涉及冲突消解相关工作,且综述的文献均发表于2020年之前;文献[13-16]则对知识融合中的表示学习及实体对齐方法进行了综述,同样没有涉及冲突消解相关工作;文献[17]综述了知识融合的支撑理论,不涉及具体方法和技术的介绍;文献[18]综述了知识图谱融合中的表示学习和冲突消解技术,但未涉及对齐匹配方法的相关工作;此外,目前尚未有将近年来涌现的新类型知识纳入综述范围的相关文献。
总结而言:①针对现有相关综述覆盖范围不够全面,特别是普遍忽视了知识融合的冲突消解环节的情况,按照“表示学习—对齐匹配—冲突消解”三个环节进行了更全面的梳理;②突破了局限于一般知识图谱融合的传统视角,纳入近年新兴的时序知识、多模态知识和参数化知识的融合等内容,拓展了大数据知识融合的范畴;③在综述现有工作基础上,进一步展望了大数据知识融合未来研究方向,凝练了相关研究问题的未来挑战。
1 大数据知识融合基础
传统知识工程中,知识大多为人工提取,以逻辑表达式、语义网络等形式表示和存储,而知识融合则通常通过专家编写的规则实现[19]。例如,Garner等将求解特定问题的知识表示为“问题地图”(problem maps),其中包含了特定问题的求解路径[20],通过在统一的目标空间中整合不同专家的求解路径,实现了专家知识的融合。Thöne等将知识建模为概念之间的关联,以一个值在0到1之间的小数表示每条知识的不确定性,并提出了一系列逻辑规则以融合这种不确定知识[21]。后续研究逐渐使用本体来建模知识,而知识融合也随之发展为一项旨在发现不同知识本体中等价的类、属性及关系,以实现模式层对齐的任务[22]。早期的本体对齐方法主要以基于规则的匹配技术为主,后来逐步发展出融合语言学特征、结构特征与外部资源等多种策略。例如,V-Doc(virtual document)模型结合字符级相似度以及向量空间表示,实现属性映射,进而识别相似属性[23];Anchor-PROMPT[24]与Similarity Flooding[25]分别从路径结构和节点相似性传播的角度提升了本体对齐效果。此外,一些研究还引入了跨语言本体对齐、演化模型、概率建模和深度匹配等新兴手段,以增强本体对齐的鲁棒性与可扩展性[26-27]
进入大数据时代后,知识图谱成为组织和表示知识的主流形式,而大数据知识融合的研究重心也落在面向知识图谱的融合。知识图谱融合相关研究通常包含三个核心环节:知识表示学习、知识对齐匹配和知识冲突消解。知识表示学习将符号化的实体和关系映射到低维连续的向量空间中,为衡量不同知识源之间的关联提供基础。知识对齐匹配旨在识别多个知识源中语义等价或相近的实体与关系。知识冲突消解则评估并处理融合过程中出现的矛盾和不一致(例如,同一实体的属性值冲突),以保证最终融合后的知识体系的逻辑一致性与事实准确性。上述三个环节协同作用,构成了大数据知识融合的基础框架。本节将围绕这三个关键环节,对相关技术及其最新进展进行概述,其中一些具有代表性的基础方法及时间轴示意图详见表2[28-56]图1[28-465053-5456-58]
2大数据知识融合基础方法
Tab.2Basic methods for big data knowledge fusion
1.1 知识表示学习
知识表示学习旨在将不同知识图谱中原本异构且离散的符号信息转化为统一的向量表示,同时保留其语义和结构等关键信息,为后续对齐匹配与冲突消解提供基础[59]。与当前主流的知识表示学习方法类似,面向知识融合的表示学习方法主要也分为基于平移与基于图神经网络(graph neural network,GNN)两大类。
基于平移的方法将关系看作是知识图谱向量空间中从头实体到尾实体的一种平移,代表性方法为TransE[60]。在面向知识融合的知识表示学习中,MTransE首先提出利用TransE系列模型学习实体表示进而用于实体对齐[28],其在TransE思想的基础上,将不同知识图谱分别映射到单独的向量空间中,再通过轴校准、平移向量或线性变换等方式建立不同向量空间之间的映射关联,使得不同空间中的向量变得可比,如图2所示。其中,线性转换策略采用如下的损失函数:
1大数据知识图谱融合部分代表性方法时间轴
Fig.1Timeline of partial representative methods for big data knowledge graph fusion
L=Σtr1,tr2S1Mijeh1-h2+MijTr1-r2+Mijet1-t2
(1)
其中:MijeMijr分别是可学习的实体和关系线性变换矩阵;St是两个知识图谱间预先已对齐的关系三元组的集合;tr1=h1r1t1tr2=h2r2t2分别代表源和目标知识图谱中的三元组且h1h2t1t2分别为同一实体,r1r2为同一关系,而加粗符号则代表三元组中实体和关系对应的向量表示,为L1或L2范数。通过最小化损失函数,该策略能够使得转换后的源知识图谱与目标图谱中已对齐的实体和关系向量尽可能接近,进而辅助推理出其他对等的实体或关系。
2MTransE方法框架图[28]
Fig.2Framework of MTransE[28]
相比之下,IPTransE不再为不同知识图谱分别构建独立的向量空间,而是通过设计跨图谱的嵌入策略(如参数共享),直接将多个知识图谱映射到同一向量空间中[29];TransEdge则针对TransE中关系表示与实体表示相互独立的局限,提出以关系为中心的建模方式,将头尾实体信息融入关系表示,有效增强了模型对复杂关系的表示能力[30];BootEA利用初始训练集对实体进行联合表示学习,并采用数据增强与自举策略迭代式地扩展训练集,在DBP15K[61]、DWY100K[31]等基准上,相较早期平移类方法,其在Hits@1核心指标上表现出更明显的提升,最高分别提升17.47%和18.24%[31];近年来,仍有一系列研究继续扩展与优化面向知识图谱融合的知识表示方法[3262-63]
基于图神经网络的方法为进一步挖掘知识图谱中实体间的邻接特征与多跳关联,研究者引入了图神经网络框架,通过聚合实体邻接节点与边的特征进行知识表示学习。典型方法包括图卷积网络[64](graph convolutional network,GCN)、关系图卷积网络[65](relational graph convolutional network,R-GCN)、图注意力网络[66](graph attention network,GAT)等,它们通过图卷积操作及注意力机制,有效增强了模型对结构复杂知识图谱的表示能力。GCN-Align首次将图神经网络模型引入知识图谱融合任务[33],模型框架如图3所示。该方法基于一个核心假设:不同知识图谱中相同的实体具有相似的邻接结构和属性特征。为此,GCN-Align利用GCN聚合邻域信息以学习实体表示,并设计了一个对齐损失函数,促使两个知识图谱中相同实体的向量表示尽可能接近,进而通过训练,使得不同知识图谱实体表示具有可比性。为缓解知识图谱间结构差异大的问题,多通道图神经网络(multi-channel graph neural network,MuGNN)从不同的邻域层次和关系维度对实体进行多视角编码,更充分地捕捉异构知识图谱中的语义和结构信息,从而提升跨图谱融合的性能[34]。Mao等指出现有方法通常假设不同知识图谱中的实体表示分布具有相似性,但这些方法在神经网络中引入的非线性映射操作往往会破坏这种分布相似性,从而削弱表示学习的效果[35]。为此,其提出的一种关系反射实体对齐方法(relational reflection entity alignment,RREA)设计了能保留这种相似性的关系映射转换操作以学习更准确的知识表示。近几年的工作主要通过添加约束和改进损失函数等方式提升表示学习的效果[36],或是探索采用其他模型如预训练语言模型进行知识表示学习[57-58]
3GCN-Align框架图[33]
Fig.3Framework of GCN-Align[33]
1.2 知识对齐匹配
知识对齐匹配旨在统一的特征空间中,找到不同知识图谱中指向同一现实世界对象的元素,是知识融合的核心环节。由于大数据时代下实体数量井喷,当前知识对齐匹配主要集中在实体间的对齐[5]。现有方法通常基于知识表示学习所得到的向量表示,计算不同知识图谱中实体表示的相似度,进而判断实体间的对应关系[67]。这一过程通常分为两个主要步骤:首先,计算源知识图谱与目标知识图谱中实体对的相似度,现有方法通常采用余弦相似度[31]、曼哈顿距离[33]等指标;其次,依据这些相似度,推理得到实体间的匹配关系,现有方法多采用最近邻或贪心策略,为每个源实体选择相似度最高的目标实体作为匹配结果[68]。然而,这些方法往往只关注单个实体的局部最优匹配,忽略了知识图谱整体匹配的约束和影响[37]
针对上述局限,近年来研究者提出了两类改进思路:一类是基于得分优化的方法,通过改进相似度的计算方式,生成更准确、可反映整体情况的相似度矩阵[38-41];另一类是基于全局对齐推理的方法,在匹配阶段通过显式施加全局约束或设置联合优化目标,使整体匹配结果在全局范围内得到优化,从而避免局部贪心选择带来的局限[43-44]。下面分别介绍这两类优化方法的代表性研究。
基于得分优化的方法侧重改进实体相似度的计算方式,以更好地刻画不同知识图谱间实体的相关程度。例如,传统的相似度度量方法往往受到向量空间中实体表示分布不均的影响而产生匹配偏差。为缓解这一问题,Sun等提出的OpenEA[38]在实体对齐推理中首次引入跨域相似局部标度(cross-domain similarity local scaling,CSLS)方法[69]。该方法旨在同时缓解向量空间中的“枢纽现象”(Hubness)与“孤立现象”(Isolation):前者指部分向量在众多实体的最近邻中频繁出现,形成过度集中的“枢纽点”;后者则表现为部分实体在匹配过程中长期处于孤立状态,难以找到对应对象。CSLS通过对相似度计算进行局部密度标准化,有效削弱了枢纽点带来的干扰,并提升了孤立实体的匹配机会,从而减少了向量空间中邻域密度不均带来的相似度偏差;Fey等利用Sinkhorn算法引入全局约束,通过行列归一化迭代将相似度矩阵转化为双随机矩阵,从而隐式引入一对一匹配约束(即每个源实体仅与一个目标实体匹配),改进相似度计算[42];Zeng等则将实体对齐建模为互惠推荐过程,通过双向偏好聚合来更准确地建模实体间的互惠偏好,优化实体相似度计算方式,并提出无排序整合和渐进式分块两种方法来提升推理过程的效率[37]
部分研究者提出了基于全局对齐的方法,通过在对齐推理过程中施加全局对齐约束,提升对齐匹配的效果。一种典型方法是引入基于线性匹配的Hungarian算法[4370]及其Jonker-Volgenant改进版本[71],在一对一匹配约束下最大化全局相似度总和,联合优化所有实体的配对决策,从而求解整体相似度最高的全局匹配方案[43]。Doerner等提出的SMat方法[4572]则在相似度得分的基础上生成偏好排序,引入Gale-Shapley算法[73]实现稳定匹配,以兼顾整体最优与匹配稳定性[45]。考虑到上述方法通常依赖固定的优化目标,难以适应复杂动态的对齐场景,Zeng等提出了基于强化学习的实体对齐框架(CEAFF),首次将实体对齐建模为序列决策问题,引入如图4所示的强化学习框架进行对齐推理[46]。在该框架下,实体匹配过程被建模成智能体与环境交互的过程:环境由待对齐的实体集合、邻接矩阵和相似度矩阵构成;状态包括当前实体的特征、上下文关系以及与其他实体的相似度等;行动则是从候选实体中选择一个目标实体;奖励是根据选择的合理性给予反馈,考虑相似度得分最大化等影响。同时设计Critic网络负责评估状态和行动的价值,指导Actor不断改进决策。通过这种方式,CEAFF能在复杂的搜索空间中不断试错和学习,逐渐找到更优的匹配策略。
4CEAFF框架图[46]
Fig.4Framework of CEAFF[46]
1.3 知识冲突消解
知识冲突消解旨在从多个知识源中推断出正确知识,消除知识冗余和矛盾,有效整合不同来源的知识,形成一致、可靠的知识体系[275674],主要方法包括基于规则与概率的方法和基于表示学习的方法。
基于规则与概率的方法通常利用逻辑推理方法和统计概率模型,在符号特征层面进行知识冲突消解。早期研究通过构建本体显式表示冲突个体及其冲突类型(如基数冲突、不相容冲突),并结合元数据信息辅助冲突判定与消解[47-48]。为实现更大规模和自动化的知识冲突消解,Bryl等提出自动规则选择策略,通过从维基百科修订历史中抽取代表性元数据以优化规则适用性,并采用相应规则进行冲突消解,从而减少人工干预并提升规则驱动方法的泛化能力[49]。Belth等则提出通过候选规则的生成、排序、筛选和细化以挖掘多源知识间的潜在不一致性,以此辅助冲突的检测与消解[50]。此外,还有部分研究将冲突消解任务形式化为概率推理问题,通过统计学习与推理确定正确知识,摆脱对人工规则和预定义权重的依赖,具备更高的灵活性[51]。然而,这些方法整体上仍主要依赖符号层面的信息,在知识图谱更新频繁、表达多样化的开放环境中表现不佳。
近年来,部分知识冲突消解研究也开始利用表示学习技术挖掘知识图谱的语义与结构信息,以辅助对知识冲突的识别与消解。早期的代表性工作Knowledge Vault尝试将冲突消解任务与表示学习相结合,为每个抽取的三元组构建特征向量并进行打分,同时引入高质量知识图谱作为先验信息,用以估计三元组的正确概率[52]。在此基础上,后续研究进一步优化置信度建模,如Jia等提出一种知识图谱三元组置信度度量模型(knowledge graph triple trustworthiness measurement model,KGTtm),从实体、关系和知识图谱整体三个层次分别设计评估器以衡量三元组置信度,并通过基于多层感知机(multi-layer perceptron,MLP)的融合模型对不同层次的置信度进行整合,从而生成更准确的知识置信度[53]。Huang等提出的可信图谱补全模型(trustworthy knowledge graph completion,TKGC)则关注到实际场景中属性值类型的多样性,针对数值型(如长度)和字符串型(如名称)等不同类型属性分别设计特定的处理策略与评分函数,更加细粒度地评估知识置信度[54]。然而,上述方法缺乏对不同知识来源可信度的有效建模。为此,Peng等提出如图5所示的Nari框架,通过负样本感知学习与多源可靠性推断(negative-aware representation learning and multi-source reliability inference),在融合多源知识的同时动态评估知识来源的可信度,从而更好地实现冲突消解[55]。其中负样本感知学习通过识别形式上合理但语义上错误的负样本,结合对比学习策略增强模型对错误知识的判别能力;多源可靠性推断则基于“可靠来源提供的知识更可信”与“提供可信知识反映来源的可靠性”这两个核心假设,迭代动态评估并更新来源的可靠性,从而更准确地辨别多源知识中的正确知识。
5Nari框架图[55]
Fig.5Framework of Nari[55]
2 大数据知识融合新进展
近年来,随着时序、多模态等复杂类型数据的不断涌现,多源知识间的碎片化和异构程度进一步加剧,这些知识难以形成统一、连贯的知识体系,因而催生了有效融合这些新类型知识的迫切需求[75-76]。与此同时,以大语言模型为代表的生成式人工智能的崛起,促使学术界和工业界开始关注其内部所蕴含的“参数化知识”(parametric knowledge),也引发了对知识融合的新探索[77]。本节旨在梳理大数据知识融合的前沿进展,重点介绍时序知识融合、跨模态知识融合以及大模型知识融合三个新兴方向的代表性研究。
2.1 时序知识融合
传统知识融合研究多聚焦于静态知识,然而现实世界中的知识往往会带有时间属性,并处于动态演变之中[7578]。因此,这种能更真实反映现实世界的时序知识,逐渐成为新兴的研究热点[79-81]。时序知识融合旨在将带有时间属性的知识进行关联与整合。由于现有时序知识大多以时序知识图谱(temporal knowledge graph,TKG)的形式存储,相关研究主要集中于时序知识图谱的融合,特别是时序实体的对齐,即识别不同时序知识图谱中指向现实世界同一对象的实体节点[82]。如前文所述,在静态知识图谱中,常通过建模实体邻接结构特征以进行实体对齐;而在时序知识图谱中,实体间的关系和结构会随时间变化,若仅依靠结构相似性,容易将在不同时刻具有相似邻接关系的实体误判为同一对象。为此,现有时序知识融合方法主要通过对时间信息的有效建模,实现更准确的时序知识融合[82-85]。根据时序信息建模方式的不同,现有方法可分为基于时序符号特征建模与基于时序向量空间建模两大类。
基于时序符号特征建模的方法直接利用时序知识图谱中的符号化时序信息以辅助实体对齐。具体来说,该类方法通常将时间信息建模为离散的、可枚举的符号特征(如时间戳、时间间隔等),并通过度量时序特征的相似性,实现时序知识融合。如STEA(simple temporal entity alignment)方法直接利用实体的时间戳信息计算实体间的时序特征相似度[86];而TS-align(temporal similarity-aware entity alignment)方法进一步引入时间间隔作为补充,不仅保留了时间戳的精确定位,还能建模“实体之间的时间距离”和事件的持续性,从而更精细地捕捉实体间的时序关联模式[87]。实验结果表明,这些方法在基于综合危机早期预警系统(integrated crisis early warning system,ICEWS)构建的ICEWS14、ICEWS05-15[88]等主流时序知识图谱对齐数据集上,相较仅利用静态结构特征的方法,在对齐准确率指标上取得了稳定提升。
基于时序向量空间建模的方法主要通过对时间特征进行编码得到时间的向量表示,从而将时间信息融入知识表示学习过程中以提高融合效果。如Tem-EA(temporal knowledge graph entity alignment)模型采用长短期记忆网络学习知识间的时序关系,并将其与图结构嵌入结合,增强对结构化时序知识的理解能力,进而提升时序融合效果[89]。进一步地,部分方法提出采用注意力机制,分别提取并聚合关系与时间特征,以实现有效的时序融合[90-91]。DualMatch方法则引入跨图注意力机制,在无监督条件下,融合多视角信息以捕获图谱间的时序演化模式,进一步提升了时序对齐的准确性[92-93]。近年来,融合大语言模型的时序实体对齐方法逐渐兴起,如ChatEA方法在时序编码基础上引入微调后的大语言模型,以提升对时序知识的语义理解能力,进而增强时序知识融合效果。在多个时序实体对齐数据集上的实验表明,引入大语言模型后,模型在语义歧义消解和复杂时间关系建模方面具有更强的鲁棒性,从而带来了整体对齐性能的进一步提升[94-95]
进一步地,考虑到真实场景中的时间信息往往具有多粒度特性(如“年”“月”“日”等不同粒度的时间表达),HyDra框架(hypergraph-driven decomposable retrieval-augmented framework)框架采用多尺度超图检索增强生成的时序知识融合框架[96]。具体流程如图6所示,首先,HyDra通过自适应解耦机制处理多粒度时序知识的复杂关系,构建尺度对齐的多尺度时序超图,用以捕捉跨尺度的时序依赖并对齐不同粒度的时间特征;随后,将多尺度时序信息映射至统一的向量空间,并通过检索增强生成的方式,检索最相关的时序信息以提升时序知识融合的整体效果。实验结果显示,该方法在包含多粒度时间表达的BETA、WildBETA[96]数据集上,相较单一时间粒度建模方法,在整体性能上表现更加稳定,尤其在复杂时间依赖场景下优势更为明显。
6HyDra框架图[96]
Fig.6Framework of HyDra[96]
2.2 跨模态知识融合
大数据时代下,单一模态数据中包含的信息和知识往往难以满足复杂场景的需求,因此跨模态知识融合相关研究逐渐兴起,旨在整合文本、图片、视频等多种模态数据,进一步提升知识的完备程度[7697-98]。部分研究者提出将多模态信息纳入知识图谱,形成多模态知识图谱[99]。这些多模态知识图谱大多将多模态数据视为图谱中实体的属性,常称作属性多模态知识图谱(attribute multi-modal knowledge graph,AMMKG),且多模态数据以图片数据为主[100]。现有多模态知识图谱融合方法主要可分为三个步骤:首先用不同的编码器对不同模态知识进行特征表示学习,然后将多模态特征进行融合得到实体特征表示,最后利用融合后的实体特征表示进行对齐推理。
针对多模态表示学习,现有研究主要通过消除视觉噪声或补全图像缺失等方法提升表示学习的质量。其中,Masked-MMEA(masked multi-modal entity alignment)模型采用图像分类技术有效消除视觉噪声[101];面向模态缺失场景的多模态实体对齐模型(UMAEA)则通过引入多尺度模态混合和缺失模态预测网络以缓解视觉模态缺失的问题[102]。针对多模态特征融合,现有方法主要通过对模态间的层级结构与互补关系进行建模来优化融合效果,如MCLEA(multi-modal contrastive representation learning for entity alignment)模型借助对比学习强化模态内一致性建模[103]。在此基础上,MEAformer(multi-modal entity alignment transformer)模型创新性地引入元学习机制,实现了实体层级的模态融合[104];LoginMEA(local-to-global interaction network for multi-modal entity alignment)模型则进一步提出两阶段融合框架,先进行局部多模态交互获取实体嵌入,再通过全局关系交互实现细粒度融合[105];PMF(progressively modality freezing)方法则设计了渐进式模态冻结策略,通过过滤无关特征显著提升了跨模态交互效果[106]。针对跨图谱对齐推理,GEEA(generative embedding-based entity alignment)模型通过变分自编码器和分步对齐将对齐结果向前反馈,从而不断优化用于对齐推理的特征表示学习的质量[58];DFMKE(dual fusion multi-modal knowledge graph embedding)框架则是对模态特征分别进行早期融合和晚期融合,并对两种融合结果分别计算损失函数以进行对齐推理[107]
现有多模态知识图谱融合相关研究将多模态数据视为实体的属性特征,如一张图片与其对应的实体通过“是······的图片”关系连接,却忽略了图片数据本身与常见的文本实体存在丰富的语义关联,如图7所示的美国国旗图片和美国这个文本实体存在“是······的旗帜”的语义关联[108]。因此,部分研究提出将多模态数据建模为知识图谱中的实体节点,即节点多模态知识图谱(node multi-modal knowledge graph,NMMKG),进而更充分地建模多模态知识间的关联[100]。由于节点多模态知识图谱中节点的模态是不同的,节点间的关系具有模态异构性,无法直接采用现有方法学习复杂的图结构特征表示;此外,对齐推理过程中需比较不同模态实体间的相似程度,且实体间可能存在多对多的关系。上述问题给节点多模态知识图谱融合带来了更大的挑战。
节点多模态知识图谱融合的相关研究还处于起步阶段,一项代表性工作CrossEA通过设计模态元路径的邻居聚合机制和符号反转策略,尝试解决上述挑战[108],其思路如图8所示。CrossEA在表示学习阶段构建模态元路径,并通过单跳邻居聚合、多跳衰减聚合以及多路径融合学习图结构特征,有效地解决了多模态实体关系类型复杂的问题。在对齐推理阶段,其利用符号反转策略,将视觉实体的特征表示向量取负,文本实体取正,进而在计算相似度时可以根据正负号对不同模态匹配相似度分开排序,有效解决了跨模态实体对齐推理过程中的挑战。
7NMMKG融合任务示例[108]
Fig.7Example of NMMKG fusion task[108]
8NMMKG融合任务挑战及解决思路示意[108]
Fig.8Schematic diagram of challenges in the NMMKG fusion task and solution approach[108]
跨模态知识融合并不局限于多模态知识图谱融合这一种形式,对于文本、图像、音频等原始数据中所包含的知识的融合也属于跨模态知识融合的范畴[109]。这些方法通过在数据层面、特征层面或决策层面将多模态数据进行融合,形成更完整的多模态知识,支撑服务特定的下游任务。例如,FedEPA框架通过无监督模态对齐将多模态特征分解为对齐特征与上下文特征,并借助对比学习和动态门控实现多模态融合[110];在特征对齐基础上,GFD-MF(group-level feature-driven multimodal fusion)方法通过分组视觉特征提取并与文本实体动态匹配,构建跨模态注意力机制以捕捉隐含关联[111];OGF2Net(orthogonalization-guided feature fusion network)利用正交损失和双流网络提取并解耦2D与3D特征,再通过矩阵正交化实现多模态特征互补融合[112]
2.3 大模型知识融合
近年来,随着大语言模型技术的快速发展,大模型中隐含的参数化知识引起了广泛的关注。一般而言,参数化知识是指模型通过深度学习从训练数据中学得的知识,以模型参数权重的形式存在于模型中[77]。与显式的符号化知识不同,模型中的参数化知识无法直接被人类理解。现有部分大模型相关的研究工作中,涉及大模型参数化知识和符号化知识之间的融合,因此本综述也将这些工作纳入大数据知识融合范畴,以期为后续研究提供一定的借鉴。
围绕知识图谱融合,最近的工作提出利用大模型进一步提升融合的效果。如图9所示,ChatEA设计“知识图谱-代码”转换模块,通过类初始化和函数将知识图谱结构转换为大模型可以理解的代码格式。其设计了两阶段实体对齐策略,借助大模型的多步推理能力,在对话中进行迭代推理,综合名称、结构、实体描述和时间信息来评估实体间的对齐概率,进而利用大模型中丰富的参数化知识提高实体对齐准确度[95]。EasyEA则将大模型运用于实体对齐全流程,先结合图谱中的关系属性等信息,令大模型生成实体的文本描述,随后使用大模型生成实体的表示并得到初步的候选对齐实体对,最后利用大模型对候选对齐实体对进行筛选[113]。LLM4EA(large language model for entity alignment)框架则利用大模型生成的伪标签训练对齐模型,并通过基于概率推理的方法动态选择可靠的伪标签[114]。针对结构、规模和重叠率差异显著的异构时序知识图谱融合,Zhao等提出首个基于多智能体协作的无监督知识融合方法,通过整合大、小模型的优势,有效地解决了实体结构和语义关联问题[115]。CRDL则将大模型运用于知识冲突消解任务,利用大模型丰富的参数化知识辅助判断冲突知识[116]。Zhang等提出了一种结合大模型的知识图谱准确性评估框架,利用大模型辅助知识图谱的正确性检验[117]
9ChatEA框架图[95]
Fig.9Framework of ChatEA[95]
为解决大语言模型存在的幻觉问题,检索增强生成(retrieval-augmented generation,RAG)技术从外部知识源中检索与给定问题相关的信息,然后将这些信息作为上下文输入给大模型,进而辅助进行更准确的推理[118]。在大模型的推理过程中,这些以外部输入形式存在的符号化知识,会与大模型内部的参数化知识进行隐式的融合,从而引导大模型生成更为准确、可靠的回复。大多数RAG方法将外部知识与问题查询拼接后一同输入给大模型,由大模型将输入文本转换为向量表示并在大模型内部进行融合[118]。部分工作探索了不同的融合方式,如:DyPRAG(dynamic parametric retrieval-augmented generation)框架训练了一个轻量级的网络,将检索到的外部符号化知识转换为向量嵌入,再与大模型内部参数直接融合,共同参与生成过程[119];DecoupledRAG框架则将外部符号化知识与问题查询分别转换为向量嵌入,之后采用交叉注意力的方式融合外部知识的向量与大模型内部参数[120]。为了能够利用符号化知识中的关联关系,GraphRAG框架通过引入外部结构化知识图谱,为生成高质量的回答提供更丰富、更具关联性的符号化知识[121]
上述在大模型内部完成符号化和参数化知识融合的方式,由于大模型的内部机制复杂且不透明,难以直观呈现其具体的运行逻辑,缺乏可解释性。因此有少数工作提出将该过程转移到符号空间下进行,如Zhang等提出的COMBO(compatibility-oriented knowledge merging for better open-domain question answering)框架,首先使大模型生成输入问题的相关段落,将大模型的参数化知识通过其所生成的符号化文本来表示,然后通过预训练的判别器评估大模型生成的知识与检索到的知识之间的兼容性,通过语义匹配和逻辑验证,为内外知识源的合并找到锚点,建立统一的知识关联结构[122]。这种在符号空间对齐符号化和参数化知识的融合模式使得COMBO能够生成更加可靠的回复。
尽管检索增强生成有效地提高了大模型的输出质量,但这种形式的知识融合是临时性的,且依赖于上下文的质量,并未从实质上修正大模型中过时的参数化知识。为此,知识模型编辑(knowledge-based model editing,KME)通过直接修改大模型参数,精准地将特定的知识注入大模型,同时确保在其他无关知识上的表现不受影响[123]。该过程可认为是直接将符号化知识融入大模型的参数化知识中。例如,Knowledge Neuron通过归因分析识别出与特定知识最相关的“知识神经元”,并对这些神经元进行操作,注入外部知识以更新其存储的特定事实表征,进而实现知识模型编辑[124]。ROME(rank-one model editing)和MEMIT则将隐藏状态层视为知识融合的关键位置,通过因果追踪定位到存储特定知识的权重,并以最小化优化的方式将新知识融入其中[125-126]。此外,也有研究开始探索在大模型其他部分进行知识注入的可能性,如PMET(precise model editing in transformer)便尝试在注意力头中进行知识融合,拓宽了知识编辑的潜在路径[127]
3 总结及展望
大数据时代下,知识融合通过关联不同来源、不同形式的知识,构建形成更完备的知识体系,有效支撑下游任务。融合过程一般可分为三个核心步骤:知识表示学习为异构知识提供统一的向量化表示;知识对齐匹配旨在识别并关联不同来源的等价实体;知识冲突消解通过解决知识矛盾与不一致性,确保最终生成知识体系的质量。近年来,随着知识类型的日益丰富,知识融合的研究也呈现新的发展趋势,本文着重综述了时序知识融合、跨模态知识融合以及大模型知识融合三个方向的最新进展。未来的大数据知识融合将呈现更加多维度、多层次的发展态势。其中,符号化知识与参数化知识的深度融合以及跨模态时序知识融合两个方向尤为值得关注。
从检索增强生成技术的广泛应用可以看出,符号化知识与参数化知识的融合能够为下游任务提供更完备的知识支撑。然而,这一过程中多源知识的并存不可避免地引入了冲突问题,包括不同外部符号化知识之间的不一致、外部符号化知识与大模型固有的参数化知识之间的冲突,以及大模型自身的参数化知识内部存在的冲突等多种形式[128]。因此,需要建立一套完备的知识冲突消解框架,有效进行冲突检测、知识源可信度评估以及最终的知识冲突消解。具体地,一种可行的未来研究方向是自适应的冲突消解方法,更灵活地对不同类型、不同领域的知识冲突进行消解;另一种可行的方向是将符号推理与大语言模型技术结合,增强大语言模型推理能力,提高冲突消解准确性与可解释性。评测基准与指标方面,当前工作普遍通过下游问答任务的准确性来评估消解效果,但大多使用现有数据集构造含噪数据,难以反映真实世界的应用场景。因此,未来的研究亟须构建更真实、含噪的冲突评测数据集,并设计在复杂开放式问答场景下的新评估指标,以更全面地衡量冲突消解技术在实际应用中的表现。
当前带有时序特征的跨模态数据(如视频、音频、时序事件文本)日益增多,融合这些跨模态时序数据已成为知识融合领域的重要方向。跨模态时序知识融合旨在关联和整合来自不同时间段的视觉、听觉、语言等多源信息[129]。其核心难点在于多模态数据的时间异步性,即不同模态在时间维度上采用异质的表征方式。例如,视频以帧率采样(如30 fps),其本质是由静态图片(帧)按序列连续呈现,通过离散帧序列记录连续信息;音频以采样率记录(如44.1 kHz),本质是连续的波形,采样率决定每秒记录多少个声音数值点,通过密集采样点捕捉声波变化;时序事件文本以事件时间标记(如“2025年9月20日”),通过时间戳描述离散事件。这种不同模态采用的异构时序表征形式,造成了模态间的时间维度不一致。基于上述分析,跨模态时序知识融合仍有必要进一步明确其核心研究问题。未来研究可重点围绕以下几个方面展开:①跨模态时间对齐问题,即在不同采样率和时序表征机制下,如何建立统一且灵活的时间映射关系;②跨时间尺度语义一致性问题,如何在短时信号与长时事件之间实现语义层面的有效关联;③时序噪声与异步偏移的鲁棒性问题,如何适应时间标注不完备和不精确的真实场景。与此同时,跨模态时序知识融合仍急需系统化的评测基准与评价指标支持。未来可构建显式包含时间异步性与多时间尺度语义的数据集,并在下游任务性能之外引入反映时间对齐质量与跨模态事件一致性的评价指标,从而为相关方法的有效性提供更全面、可复现的验证依据。
1大数据知识图谱融合部分代表性方法时间轴
Fig.1Timeline of partial representative methods for big data knowledge graph fusion
2MTransE方法框架图[28]
Fig.2Framework of MTransE[28]
3GCN-Align框架图[33]
Fig.3Framework of GCN-Align[33]
4CEAFF框架图[46]
Fig.4Framework of CEAFF[46]
5Nari框架图[55]
Fig.5Framework of Nari[55]
6HyDra框架图[96]
Fig.6Framework of HyDra[96]
7NMMKG融合任务示例[108]
Fig.7Example of NMMKG fusion task[108]
8NMMKG融合任务挑战及解决思路示意[108]
Fig.8Schematic diagram of challenges in the NMMKG fusion task and solution approach[108]
9ChatEA框架图[95]
Fig.9Framework of ChatEA[95]
1知识工程与知识融合技术演进脉络
Tab.1Evolutionary lineage of knowledge engineering and knowledge fusion technology
2大数据知识融合基础方法
Tab.2Basic methods for big data knowledge fusion
SCHREIBER G T, AKKERMANS H. Knowledge engineering and management:the common KADS methodology[M]. Cambridge: MIT Press,2000.
郑庆华, 张玲玲, 龚铁梁, 等. 大数据知识工程[M]. 北京: 科学出版社,2023.ZHENG Q H, ZHANG L L, GONG T L,et al. Big data knowledge engineering[M]. Beijing: Science Press,2023.(in Chinese)
郑庆华, 刘欢, 龚铁梁, 等. 大数据知识工程发展现状及展望[J]. 中国工程科学,2023,25(2):208-220.ZHENG Q H, LIU H, GONG T L,et al. Development and prospect of big data knowledge engineering[J]. Strategic Study of CAE,2023,25(2):208-220.(in Chinese)
漆桂林, 高桓, 吴天星. 知识图谱研究进展[J]. 情报工程,2017,3(1):4-25.QI G L, GAO H, WU T X. The research advances of knowledge graph[J]. Technology Intelligence Engineering,2017,3(1):4-25.(in Chinese)
ZHAO X, ZENG W X, TANG J Y. Entity alignment:concepts,recent advances and novel approaches[M]. Singapore: Springer Nature,2023.
马忠贵, 倪润宇, 余开航. 知识图谱的最新进展、关键技术和挑战[J]. 工程科学学报,2020,42(10):1254-1266.MA Z G, NI R Y, YU K H. Recent advances,key techniques and future challenges of knowledge graph[J]. Chinese Journal of Engineering,2020,42(10):1254-1266.(in Chinese)
王萌, 王昊奋, 李博涵, 等. 新一代知识图谱关键技术综述[J]. 计算机研究与发展,2022,59(9):1947-1965.WANG M, WANG H F, LI B H,et al. Survey on key technologies of new generation knowledge graph[J]. Journal of Computer Research and Development,2022,59(9):1947-1965.(in Chinese)
PETRONI F, ROCKTSCHEL T, RIEDEL S,et al. Language models as knowledge bases?[C]//Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing(EMNLP-IJCNLP),2019:2463-2473.
ZHANG H, ZHANG Y Y, LI X G,et al. Evaluating the external and parametric knowledge fusion of large language models[EB/OL].(2024-05-29)[2025-07-01].https://arxiv.org/abs/2405.19010.
林硕, 赵震. 知识融合研究方法[J]. 计算机技术与发展,2022,32(8):7-14.LIN S, ZHAO Z. Review of knowledge fusion research methods[J]. Computer Technology and Development,2022,32(8):7-14.(in Chinese)
陈沫, 李广建. 大数据环境下知识融合技术体系研究[J]. 图书情报工作,2022,66(20):20-31.CHEN M, LI G J. Research on the knowledge fusion technology taxonomy in big data environment[J]. Library and Information Service,2022,66(20):20-31.(in Chinese)
赵晓娟, 贾焰, 李爱平, 等. 多源知识融合技术研究综述[J]. 云南大学学报(自然科学版),2020,42(3):459-473.ZHAO X J, JIA Y, LI A P,et al. A survey of the research on multi-source knowledge fusion technology[J]. Journal of Yunnan University(Natural Sciences Edition),2020,42(3):459-473.(in Chinese)
庄严, 李国良, 冯建华. 知识库实体对齐技术综述[J]. 计算机研究与发展,2016,53(1):165-192.ZHUANG Y, LI G L, FENG J H. A survey on entity alignment of knowledge base[J]. Journal of Computer Research and Development,2016,53(1):165-192.(in Chinese)
张富, 杨琳艳, 李健伟, 等. 实体对齐研究综述[J]. 计算机学报,2022,45(6):1195-1225.ZHANG F, YANG L Y, LI J W,et al. An overview of entity alignment methods[J]. Chinese Journal of Computers,2022,45(6):1195-1225.(in Chinese)
ZENG K S, LI C J, HOU L,et al. A comprehensive survey of entity alignment for knowledge graphs[J]. AI Open,2021,2:1-13.
ZHANG R, TRISEDYA B D, LI M,et al. A benchmark and comprehensive survey on knowledge graph entity alignment via representation learning[J]. The VLDB Journal,2022,31(5):1143-1168.
于梦月, 申静. 大数据时代知识融合的支撑理论架构[J]. 信息资源管理学报,2020,10(3):18-26.YU M Y, SHEN J. Supporting theory framework for knowledge fusion in the era of big data[J]. Journal of Information Resources Management,2020,10(3):18-26.(in Chinese)
高云君, 葛丛丛, 郭宇翔, 等. 面向关系型数据与知识图谱的数据集成技术综述[J]. 软件学报,2023,34(5):2365-2391.GAO Y J, GE C C, GUO Y X,et al. Survey on data integration technologies for relational data and knowledge graph[J]. Journal of Software,2023,34(5):2365-2391.(in Chinese)
刘晓娟, 李广建, 化柏林. 知识融合: 概念辨析与界说[J]. 图书情报工作,2016,60(13):13-19,32.LIU X J, LI G J, HUA B L. Knowledge fusion:from the conceptual understanding to the system construction[J]. Library and Information Service,2016,60(13):13-19,32.(in Chinese)
GARNER B J, LUKOSE D. Knowledge fusion[C]//Proceedings of the 7th Annual Workshop on Conceptual Structures: Theory and Implementation,1992:158-167.
THÖNE H, GÜNTZER U, KIELING W. Modeling,chaining and fusion of uncertain knowledge[C]//Proceedings of the 4th International Conference on Database Systems for Advanced Applications(DASFAA),1995:197-205.
肖仰华. 知识图谱: 概念与技术[M]. 北京: 电子工业出版社,2020.XIAO Y H. Knowledge graph:concepts and techniques[M]. Beijing: Publishing House of Electronics Industry,2020.(in Chinese)
QU Y Z, HU W, CHENG G. Constructing virtual documents for ontology matching[C]//Proceedings of the 15th International Conference on World Wide Web,2006:23-31.
NOY N F, MUSEN M A. Anchor-PROMPT:using non-local context for semantic matching[C]//Proceedings of the Workshop on Ontologies and Information Sharing at the Seventeenth International Joint Conference on Artificial Intelligence(IJCAI-2001),2001:63-70.
MELNIK S, GARCIA-MOLINA H, RAHM E. Similarity Flooding:a versatile graph matching algorithm and its application to schema matching[C]//Proceedings of the 18th International Conference on Data Engineering,2002:117-128.
ZHANG Y, PARADIS T, HOU L,et al. Cross-lingual infobox alignment in Wikipedia using entity-attribute factor graph[C]//Proceedings of the 16th International Semantic Web Conference,2017:745-760.
孟小峰, 杜治娟. 大数据融合研究: 问题与挑战[J]. 计算机研究与发展,2016,53(2):229-246.MENG X F, DU Z J. Research on the big data fusion:issues and challenges[J]. Journal of Computer Research and Development,2016,53(2):229-246.(in Chinese)
CHEN M H, TIAN Y T, YANG M H,et al. Multilingual knowledge graph embeddings for cross-lingual knowledge alignment[C]//Proceedings of the 26th International Joint Conference on Artificial Intelligence,2017:1511-1517.
ZHU H, XIE R B, LIU Z Y,et al. Iterative entity alignmentvia joint knowledge embeddings[C]//Proceedings of the 26th International Joint Conference on Artificial Intelligence,2017:4258-4264.
SUN Z Q, HUANG J C, HU W,et al. TransEdge:translating relation-contextualized embeddings for knowledge graphs[C]//Proceedings of the 18th International Semantic Web Conference,2019:612-629.
SUN Z Q, HU W, ZHANG Q H,et al. Bootstrapping entity alignment with knowledge graph embedding[C]//Proceedings of the 27th International Joint Conference on Artificial Intelligence,2018:4396-4402.
ZHU Q N, ZHOU X F, WU J,et al. Neighborhood-aware attentional representation for multilingual knowledge graphs[C]//Proceedings of the 28th International Joint Conference on Artificial Intelligence,2019:1943-1949.
WANG Z C, LV Q S, LAN X H,et al. Cross-lingual knowledge graph alignment via graph convolutional networks[C]//Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing,2018,349-357.
CAO Y X, LIU Z Y, LI C J,et al. Multi-channel graph neural network for entity alignment[C]//Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics,2019:1452-1461.
MAO X, WANG W T, XU H M,et al. Relational reflection entity alignment[C]//Proceedings of the 29th ACM International Conference on Information & Knowledge Management,2020:1095-1104.
GUO L B, ZHANG Q, SUN Z Q,et al. Understanding and improving knowledge graph embedding for entity alignment[C]//Proceedings of the 39th International Conference on Machine Learning,2022.
ZENG W X, ZHAO X, LI X Y,et al. On entity alignment at scale[J]. The VLDB Journal,2022,31(5):1009-1033.
SUN Z Q, ZHANG Q H, HU W,et al. A benchmarking study of embedding-based entity alignment for knowledge graphs[J]. Proceedings of the VLDB Endowment,2020,13(12):2326-2340.
MAO X, WANG W T, WU Y B,et al. Boosting the speed of entity alignment 10×:dual attention matching network with normalized hard sample mining[C]//Proceedings of the Web Conference,2021:821-832.
GE C C, LIU X Z, CHEN L,et al. Make it easy:an effective end-to-end entity alignment framework[C]//Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval,2021:777-786.
TANG J H, ZHAO K F, LI J. A fused Gromov-Wasserstein framework for unsupervised knowledge graph entity alignment[C]//Proceedings of the Findings of the Association for Computational Linguistics: ACL 2023,2023:3320-3334.
FEY M, LENSSEN J E, MORRIS C,et al. Deep graph matching consensus[C]//Proceedings of the 8th International Conference on Learning Representations(ICLR),2020.
MAO X, WANG W T, WU Y B,et al. From alignment to assignment:frustratingly simple unsupervised entity alignment[C]//Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing,2021:2843-2853.
XU K, SONG L F, FENG Y S,et al. Coordinated reasoning for cross-lingual knowledge graph alignment[J]. Proceedings of the AAAI Conference on Artificial Intelligence,2020,34(5):9354-9361.
ZENG W X, ZHAO X, TANG J Y,et al. Collective entity alignment via adaptive features[C]//Proceedings of the IEEE 36th International Conference on Data Engineering(ICDE),2020:1870-1873.
ZENG W X, ZHAO X, TANG J Y,et al. Reinforcement learning-based collective entity alignment with adaptive features[J]. ACM Transactions on Information Systems,2021,39(3):1-31.
胡晓, 胡洁, 彭颖红, 等. 语义级知识融合中的冲突消解方法[J]. 上海交通大学学报,2009,43(11):1730-1733.HU X, HU J, PENG Y H,et al. Research of conflicts resolution in semantic level knowledge fusion[J]. Journal of Shanghai Jiaotong University,2009,43(11):1730-1733.(in Chinese)
NIKOLOV A, UREN V, MOTTA E. Towards data fusion in a multi-ontology environment[C]//Proceedings of the 18th International World Wide Web Conference(WWW 2009),2009:20-24.
BRYL V, BIZER C. Learning conflict resolution strategies for cross-language Wikipedia data fusion[C]//Proceedings of the 23rd International Conference on World Wide Web,2014:1129-1134.
BELTH C, ZHENG X Y, VREEKEN J,et al. What is normal,what is strange,and what is missing in a knowledge graph:unified characterization via inductive summarization[C]//Proceedings of the Web Conference,2020:1115-1126.
DUTTA A, MEILICKE C, PONZETTO S P. A probabilistic approach for integrating heterogeneous knowledge sources[C]//Proceedings of the European Semantic Web Conference,2014:286-301.
DONG X, GABRILOVICH E, HEITZ G,et al. Knowledge vault:a web-scale approach to probabilistic knowledge fusion[C]//Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2014:601-610.
JIA S B, XIANG Y, CHEN X J,et al. Triple trustworthiness measurement for knowledge graph[C]//Proceedings of the World Wide Web Conference,2019:2865-2871.
HUANG J C, ZHAO Y, HU W,et al. Trustworthy knowledge graph completion based on multi-sourced noisy data[C]//Proceedings of the ACM Web Conference,2022:956-965.
PENG H, ZENG W X, TANG J Y,et al. Open knowledge graph completion with negative-aware representation learning and multi-source reliability inference[J]. Information Fusion,2025,115:102729.
韩婷婷. 多域知识图谱冲突检测与消解技术研究[D]. 西安: 西安电子科技大学,2022.HAN T T. Research on conflict detection and resolution from multi-domain knowledge graph[D]. Xi′an: Xidian University,2022.(in Chinese)
ZHONG Z Y, ZHANG M H, FAN J,et al. Semantics driven embedding learning for effective entity alignment[C]//Proceedings of the IEEE 38th International Conference on Data Engineering(ICDE),2022:2127-2140.
LI G Y, SUN Z Q, HU W,et al. Position-aware relational transformer for knowledge graph embedding[J]. IEEE Transactions on Neural Networks and Learning Systems,2023,35(8):11580-11594.
陈晓雨. 基于图神经网络的知识表示学习方法研究[D]. 济南: 齐鲁工业大学,2024.CHEN X Y. Research on knowledge representation learning method based on graph neural network[D]. Jinan: Qilu University of Technology,2024.(in Chinese)
BORDES A, USUNIER N, GARCIA-DURÁN A,et al. Translating embeddings for modeling multi-relational data[C]//Proceedings of the 27th International Conference on Neural Information Processing Systems,2013:2787-2795.
WU Y T, LIU X, FENG Y S,et al. Relation-aware entity alignment for heterogeneous knowledge graphs[C]//Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence,2019:5278-5284.
SUN Z Q, CHEN M H, HU W,et al. Knowledge association with hyperbolic knowledge graph embeddings[C]//Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing(EMNLP),2020:5704-5716.
GUO L B, CHEN Z, CHEN J Y,et al. Revisit and outstrip entity alignment:a perspective of generative models[C]//Proceedings of the Twelfth International Conference on Learning Representations(ICLR),2024.
KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[C]//Proceedings of the 5th International Conference on Learning Representations(ICLR),2017.
SCHLICHTKRULL M, KIPF T N, BLOEM P,et al. Modeling relational data with graph convolutional networks[C]//Proceedings of the 15th International Conference, ESWC 2018,2018:593-607.
VELICˇ KOVIC' P, CUCURULL G, CASANOVA A,et al. Graph attention networks[C]//Proceedings of the 6th International Conference on Learning Representations,2018.
张清恒. 基于多视图知识图谱嵌入的实体对齐技术研究[D]. 南京: 南京大学,2020.ZHANG Q H. Multi-view knowledge graph embedding for entity alignment[D]. Nanjing: Nanjing University,2020.(in Chinese)
ZHANG Q H, SUN Z Q, HU W,et al. Multi-view knowledge graph embedding for entity alignment[C]//Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence,2019:5429-5435.
LAMPLE G, CONNEAU A, RANZATO M,et al. Word translation without parallel data[C]//Proceedings of the 6th International Conference on Learning Representations,2018.
KUHN H W. The Hungarian method for the assignment problem[J]. Naval Research Logistics Quarterly,1955,2(1/2):83-97.
JONKER R, VOLGENANT A. A shortest augmenting path algorithm for dense and sparse linear assignment problems[J]. Computing,1987,38(4):325-340.
DOERNER J, EVANS D, SHELAT A. Secure stable matching at scale[C]//Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security,2016:1602-1613.
ROTH A E. Deferred acceptance algorithms:history,theory,practice,and open questions[J]. International Journal of Game Theory,2008,36:537-569.
ZHAO X J, JIA Y, LI A P,et al. Multi-source knowledge fusion:a survey[J]. World Wide Web,2020,23:2567-2592.
MIRTAHERI M, ROSTAMI M, GALSTYAN A. History repeats:overcoming catastrophic forgetting for event-centric temporal knowledge graph completion[C]//Proceedings of the Findings of the Association for Computational Linguistics: ACL 2023,2023:7740-7755.
LU Y H, YU W J, JING X,et al. HyperFM:fact-centric multimodal fusion for link prediction over hyper-relational knowledge graphs[C]//Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics,2025:2818-2830.
李兴明, 胡庆拥. 大语言模型的知识冲突: 成因、根源与展望[J]. 中国人工智能学会通讯,2024,14(5):2-9.LI X M, HU Q Y. Knowledge conflicts in large language models:causes,sources,and prospects[J]. CAAI Communications,2024,14(5):2-9.(in Chinese)
SAXENA A, CHAKRABARTI S, TALUKDAR P. Question answering over temporal knowledge graphs[C]//Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing,2021:6663-6676.
PARK N, LIU F C, MEHTA P,et al. EvoKG:jointly modeling event time and network structure for reasoning over temporal knowledge graphs[C]//Proceedings of the Fifteenth ACM International Conference on Web Search and Data Mining,2022:794-803.
LI Z X, JIN X L, GUAN S P,et al. Search from history and reason for future:two-stage reasoning on temporal knowledge graphs[C]//Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing,2021:4732-4743.
TRIVEDI R, DAI H J, WANG Y C,et al. Know-evolve:deep temporal reasoning for dynamic knowledge graphs[C]//Proceedings of the 34th International Conference on Machine Learning,2017:3462-3471.
ZENG W X, ZHOU J, ZHAO X. Benchmarking challenges for temporal knowledge graph alignment[C]//Proceedings of the 33rd ACM International Conference on Information and Knowledge Management,2024:3103-3112.
LI J Y, HUA W, JIN F M,et al. HTEA:heterogeneity-aware embedding learning for temporal entity alignment[C]//Proceedings of the Eighteenth ACM International Conference on Web Search and Data Mining,2025:982-990.
BAI L Y, LI N, LI G S,et al. Embedding-based entity alignment of cross-lingual temporal knowledge graphs[J]. Neural Networks,2024,172:106143.
WANG Z J, YOU X D, LV X Q. A relation enhanced model for temporal knowledge graph alignment[J]. The Journal of Supercomputing,2024,80(5):5733-5755.
CAI L, MAO X, MA M R,et al. A simple temporal information matching mechanism for entity alignment between temporal knowledge graphs[C]//Proceedings of the 29th International Conference on Computational Linguistics,2022:2075-2086.
ZHANG Z Y, BAI L Y, ZHU L. TS-align:a temporal similarity-aware entity alignment model for temporal knowledge graphs[J]. Information Fusion,2024,112:102581.
GARCÍA-DURÁN A, DUMAN Č IĆ S, NIEPERT M. Learning sequence encoders for temporal knowledge graph completion[C]//Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing,2018:4816-4821.
SONG X T, BAI L Y, LIU R K,et al. Temporal knowledge graph entity alignment via representation learning[C]//Proceedings of the International Conference on Database Systems for Advanced Applications,2022:391-406.
XU C J, SU F L, LEHMANN J. Time-aware graph neural network for entity alignment between temporal knowledge graphs[C]//Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing,2021:8999-9010.
XU C J, SU F L, XIONG B,et al. Time-aware entity alignment using temporal relational attention[C]//Proceedings of the ACM Web Conference,2022:788-797.
LIU X Z, WU J Y, LI T Y,et al. Unsupervised entity alignment for temporal knowledge graphs[C]//Proceedings of the ACM Web Conference,2023:2528-2538.
CAI L, MAO X, XIAO Y S,et al. An effective and efficient time-aware entity alignment framework via two-aspect three-view label propagation[C]//Proceedings of the Thirty-Second International Joint Conference on Artificial Intelligence,2023:5021-5029.
JIANG X H, XU C J, SHEN Y H,et al. Toward practical entity alignment method design:insights from new highly heterogeneous knowledge graph datasets[C]//Proceedings of the ACM Web Conference,2024:2325-2336.
JIANG X H, SHEN Y H, SHI Z C,et al. Unlocking the power of large language models for entity alignment[C]//Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics,2024:7566-7583.
ZHAO R H, ZENG W X, ZHANG W T,et al. Towards temporal knowledge graph alignment in the wild[EB/OL].(2025-07-19)[2025-08-01].https://arxiv.org/abs/2507.14475.
SHANG B, ZHAO Y L, LIU J,et al. LAFA:multimodal knowledge graph completion with link aware fusion and aggregation[J]. Proceedings of the AAAI Conference on Artificial Intelligence,2024,38(8):8957-8965.
WANG Z H, ZHANG Z, CHENG X Z,et al. FreeBind:free lunch in unified multimodal space via knowledge fusion[C]//Proceedings of the 41st International Conference on Machine Learning,2024:52233-52246.
LIU Y, LI H, GARCIA-DURAN A,et al. MMKG:multi-modal knowledge graphs[C]//Proceedings of the European Semantic Web Conference,2019:459-474.
ZHU X R, LI Z X, WANG X D,et al. Multi-modal knowledge graph construction and application:a survey[J]. IEEE Transactions on Knowledge and Data Engineering,2024,36(2):715-735.
WANG M, SHI Y H, YANG H,et al. Probing the impacts of visual context in multimodal entity alignment[J]. Data Science and Engineering,2023,8(2):124-134.
CHEN Z, GUO L B, FANG Y,et al. Rethinking uncertainly missing and ambiguous visual modality in multi-modal entity alignment[C]//Proceedings of the 22nd International Semantic Web Conference,2023:121-139.
LIN Z X, ZHANG Z H, WANG M,et al. Multi-modal contrastive representation learning for entity alignment[C]//Proceedings of the 29th International Conference on Computational Linguistics,2022:2572-2584.
CHEN Z, CHEN J Y, ZHANG W,et al. MEAformer:multi-modal entity alignment transformer for meta modality hybrid[C]//Proceedings of the 31st ACM International Conference on Multimedia,2023:3317-3327.
SU T Y, ZHANG X H, SHENG J W,et al. LoginMEA:local-to-global interaction network for multi-modal entity alignment[C]//Proceedings of the 27th European Conference on Artificial Intelligence,2024:1173-1180.
HUANG Y N, ZHANG X F, ZHANG R C,et al. Progressively modality freezing for multi-modal entity alignment[C]//Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics,2024:3477-3489.
ZHU J, HUANG C Q, DE MEO P. DFMKE:a dual fusion multi-modal knowledge graph embedding framework for entity alignment[J]. Information Fusion,2023,90:111-119.
XIAO G C, ZENG W X, ZHANG S Q,et al. Multi-modal entities matter:benchmarking multi-modal entity alignment[C]//Proceedings of the 31st International Conference on Computational Linguistics,2025:8714-8724.
ATREY P K, HOSSAIN M A, EL SADDIK A,et al. Multimodal fusion for multimedia analysis:a survey[J]. Multimedia Systems,2010,16(6):345-379.
ZHANG Y, DU Q F, LV J Q. FedEPA:enhancing personalization and modality alignment in multimodal federated learning[C]//Proceeding of the Advanced Intelligent Computing Technology and Applications:the 21st International Conference,2025:115-124.
LV Y N, TAO J Q, DU X L. Beyond isolated features:group-level feature-driven multimodal fusion for entity relationship extraction[J]. Electronics,2025,14(8):1682.
LIN S S, BAI M C, LIU F,et al. Orthogonalization-guided feature fusion network for multimodal 2D+3D facial expression recognition[J]. IEEE Transactions on Multimedia,2021,23:1581-1591.
CHENG J W, LU C L, YANG L Y,et al. EasyEA:large language model is all you need in entity alignment between knowledge graphs[C]//Proceedings of the Findings of the Association for Computational Linguistics: ACL,2025:20981-20995.
CHEN S Y, ZHANG Q G, DONG J N,et al. Entity alignment with noisy annotations from large language models[C]//Proceedings of the 38th Conference on Neural Information Processing Systems(NeurIPS 2024),2024.
ZHAO R H, ZENG W X, TANG J Y,et al. Towards unsupervised entity alignment for highly heterogeneous knowledge graphs[C]//Proceedings of the IEEE 41st International Conference on Data Engineering(ICDE),2025:3792-3806.
PENG H, ZHANG P F, TANG J Y,et al. Detect-then-resolve:enhancing knowledge graph conflict resolution with large language model[J]. Mathematics,2024,12(15):2318.
ZHANG M T, YANG G L, LIU Y,et al. Knowledge graph accuracy evaluation:an LLM-enhanced embedding approach[J]. International Journal of Data Science and Analytics,2025,20:3021-3035.
GAO Y F, XIONG Y, GAO X Y,et al. Retrieval-augmented generation for large language models:a survey[EB/OL].(2024-03-27)[2025-08-10].https://arxiv.org/abs/2312.10997.
TAN Y Q, HE S Z, LIAO H X,et al. Better wit than wealth:dynamic parametric retrieval augmented generation for test-time knowledge enhancement[EB/OL].(2025-03-31)[2025-08-10].https://arxiv.org/html/2503.23895v1.
DONG Q, AI Q Y, WANG H N,et al. Decoupling knowledge and context:an efficient and effective retrieval augmented generation framework via cross attention[C]//Proceedings of the ACM on Web Conference,2025:4386-4395.
PENG B C, ZHU Y, LIU Y C,et al. Graph retrieval-augmented generation:a survey[J]. ACM Transactions on Information Systems,2025,44(2):1-52.
ZHANG Y X, KHALIFA M, LOGESWARAN L,et al. Merging generated and retrieved knowledge for open-domain QA[C]//Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing,2023:4710-4728.
WANG S, ZHU Y C, LIU H C,et al. Knowledge editing for large language models:a survey[J]. ACM Computing Surveys,2024,57(3):1-37.
DAI D M, DONG L, HAO Y R,et al. Knowledge neurons in pretrained transformers[C]//Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics,2022:8493-8502.
MENG K, BAU D, ANDONIAN A,et al. Locating and editing factual associations in GPT[C]//Proceedings of the 36th International Conference on Neural Information Processing Systems,2022:17359-17372.
MENG K, SHARMA A S, ANDONIAN A J,et al. Mass-editing memory in a transformer[C]//Proceedings of the Eleventh International Conference on Learning Representations(ICLR),2023.
LI X P, LI S S, SONG S Z,et al. PMET:precise model editing in a transformer[C]//Proceedings of the 38th AAAI Conference on Artificial Intelligence,2024:18564-18572.
WANG H, PRASAD A, STENGEL-ESKIN E,et al. AdaCAD:adaptively decoding to balance conflicts between contextual and parametric knowledge[C]//Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies,2025:11636-11652.
EGAMI S, UGAI T, FUKUDA K. Compressing multi-modal temporal knowledge graphs of videos[C]//Proceedings of the ISWC 2024 Posters, Demos,and Industry Tracks:from Novel Ideas to Industrial Practice co-located with the 23rd International Semantic Web Conference(ISWC 2024),2024.