SDM2023|基于超图对比学习的异常事件检测

admin 2023年3月24日09:59:12评论67 views字数 4268阅读14分13秒阅读模式

SDM2023|基于超图对比学习的异常事件检测

题目:Abnormal Event Detection via Hypergraph Contrastive Learning

会议:SDM 2023

摘要:异常事件检测是指挖掘相关实体之间的异常交互,在许多实际应用中发挥着重要作用。尽管许多异常事件检测以不同的形式被探索,但现实世界中的事件可能包含多类型的属性实体以及它们之间的复杂交互,从而形成属性异构信息网络。随着社交媒体的蓬勃发展,属性异构信息网络中的异常事件检测已经成为一项重要但很少被探索的任务。本文研究了属性异构信息网络中的无监督异常事件检测问题,提出了一种新的超图对比学习方法AEHCL来捕获异常事件模式。基于属性异构信息网络中由事件构造的超图,AEHCL设计了事件内和事件间对比模块,以充分捕捉不同的异常事件交互。事件内对比模块捕获事件内的成对和多元交互异常,事件间对比模块捕获事件之间的上下文异常。不同的模块协同提高彼此的性能,改善最终的检测结果。在测试阶段,进一步设计了基于对比学习的异常事件评分函数来衡量事件的异常程度。在三个不同场景的数据集上进行的大量实验证明了AEHCL的有效性,并与基线模型进行了比较,获得了最先进的结果。

1 引言

社交媒体由多个实体和它们之间的复杂交互组成,事件广泛存在于社交媒体中。异常事件检测的目的是在观察到的事件样本中识别异常或很少发生的事件。迄今为止,异常事件检测已成为欺诈检测、物联网安全、计算机网络监控和其他实际应用中的一项重要任务。此外,异常事件的稀缺性和多样性使这项任务具有挑战性,因此近年来越来越受到学术界的关注。

尽管异常事件的检测已经引起了人们的广泛关注,但现有的方法主要关注于对单个事件中实体之间的简单交互进行建模。然而,现实世界中的事件可能包含具有丰富属性的多种类型的实体,以及它们之间的复杂交互,从而形成一个属性异构信息网络(AHIN)。随着社会网络的蓬勃发展,无处不在的复杂交互系统构成了众多的AHIN,如引用网络和电子商务网络。在社交媒体分析和异常检测中,检测AHIN中的异常事件在许多实际应用中发挥着重要作用,但很少被人研究。例如,检测引文网络中的异常合作模式可以更好地了解研究兴趣的趋势,促进电子商务网络中的跨学科合作;检测用户罕见的购买行为可以更好地进行多样性推荐。虽然之前有的工作已经意识到了它的重要性,但它只检测事件中简单的成对节点交互,这远远不能挖掘AHIN中复杂的异常事件模式。

在本文中,我们研究了AHIN中异常事件检测的问题,并提出了一种新的异常事件检测框架AEHCL,即基于超图对比学习的异常事件检测模型。具体来说,AHIN中的事件被定义为星型模式实例,我们进一步使用超图中的超边概念来模拟事件中的复杂交互。我们提出了一种新的超图对比学习方法,以充分捕捉复杂多样的异常模式。我们从事件内和事件间两个层面设计了两种对比策略。事件内对比模块侧重于挖掘事件中的异常模式,该模块由两个子模块组成。成对对比模块捕获成对交互异常模式,而多元对比模块捕获多元高阶交互异常模式。我们还提出了事件间对比模块来建模事件之间的异常模式,即异常事件与其上下文事件不一致的情况。所有这些模块都以端到端的方式同时优化,并相互促进。在测试阶段,我们提出了一种基于对比的异常事件评分函数来度量异常程度,该函数综合了上述模块的检测结果。

2 方法

本节详细介绍我们提出的模型AEHCL,用于超图中的异常检测,整体架构如下图所示。更具体地说,我们首先介绍特定类型的节点转换操作,该操作将异构节点特征表示转换到共享的潜在空间。然后,为了捕捉事件内的异常模式,我们提出了成对对比模块和多元对比模块,分别对事件内的成对和多元异常交互进行建模。为了进一步考虑事件间异常模式,我们提出了事件间对比模块,以捕获多个事件之间的不一致异常模式。最后,提出了异常事件评分函数来度量异常程度。

SDM2023|基于超图对比学习的异常事件检测

不同类型节点转换

由于事件包含多种类型的节点,直接将原始节点表示用于下游任务会降低性能。简单的解决方案是执行图卷积。然而,聚合操作可能会损害原始特征交互模式,导致检测结果下降。因此,我们通过一个简单的特定类型转换层将每个节点表示直接转换到共享的潜在空间:

SDM2023|基于超图对比学习的异常事件检测

事件内对比模块

事件内对比模块旨在捕捉事件中的异常模式。这些模式由相关节点之间的复杂交互呈现,可分为两种类型:成对交互模式和多元交互模式。

成对对比模块. 作为捕获事件内节点对匹配关系的基本模块,成对相似性也用于许多超图表示学习方法中。它们的基本思想是,超边(事件)中的成对节点匹配度应该高于其他节点,这也启发了我们发现具有不兼容节点对的异常。首先是对节点对的正常匹配模式进行建模,然后认为不符合该模式的节点对是可疑的。现有方法直接融合事件中的所有成对交互,以获得事件异常分数。然而,我们认为这种操作可能会削弱异常节点对异常程度。此外,在成对对比模块中,我们关注节点对异常,而不是整个事件。实验还表明,这种融合操作与我们的其他模块不兼容。因此,我们将每个节点的匹配模式与其他节点分别建模,而不是将它们融合。具体而言,我们优化如下对比损失:

SDM2023|基于超图对比学习的异常事件检测

最后,我们将一个事件中所有节点的对比损失和所有事件中的平均损失相加,得到最终的成对对比损失:

SDM2023|基于超图对比学习的异常事件检测

多元交互模块. 成对对比模块只能捕获简单的异常模式,例如合著者异常。然而,还有许多其他复杂的异常交互。在这些情况下,事件中的成对交互都是正常的,但当考虑与两个以上节点的交互时,事件是异常的。我们用多元对比模块对这类异常事件进行建模。该模块通过建模标识符节点和上下文节点之间的兼容性来捕获事件中的多元交互模式。基本思想是,在正常情况下,这种兼容性很高。例如,一篇论文的内容与发表会议的类型和作者的兴趣高度相关。具体来说,我们将每个节点的表示都添加一个类型嵌入,以获得类型感知的节点表示。类型嵌入可以使模型意识到异质节点间的交互,从而捕获更有意义的模式。对于事件中的多变量交互建模,我们应用注意力机制和最大池化层。之后用双线性评分函数建模中心节点和上下文节点的兼容性:

SDM2023|基于超图对比学习的异常事件检测

我们希望正常事件的分数接近1,异常事件的分数接近0。我们采用标准的交叉熵损失作为多元对比损失:

SDM2023|基于超图对比学习的异常事件检测

事件间对比模块

异常事件模式可能不仅限于事件内的实体异常交互,还出现在事件之间。与局部节点之间的不匹配异常一样,我们认为局部事件之间也存在不匹配异常。从直觉上看,正常事件更有可能与相邻事件具有相似的语义,而异常事件则没有。基于这个假设,我们使用事件-事件对比学习来建模相邻事件之间的兼容性。具体来说,我们首先使用注意力层来获得上下文节点表示:

SDM2023|基于超图对比学习的异常事件检测

SDM2023|基于超图对比学习的异常事件检测

事件的表示通过拼接上下文节点表示和中心节点表示得到:

SDM2023|基于超图对比学习的异常事件检测

接下来,我们定义事件的正负样本,如果两个事件被更多的元路径实例相连接,则他们之间的语义越相似。于是正样本集合定义为:

SDM2023|基于超图对比学习的异常事件检测

即,当两个事件间的元路径实例数量超过一定阈值,则互为正样本,否则为负样本。然后我们用双线性的粉函数得到事件间的兼容性得分:

SDM2023|基于超图对比学习的异常事件检测

和多元对比损失类似,我们使用交叉熵损失函数作为事件间的对比损失:

SDM2023|基于超图对比学习的异常事件检测

优化和预测

在训练阶段,我们共同优化了上述三个模块。整体优化函数是:

SDM2023|基于超图对比学习的异常事件检测

训练完成后,我们使用如下异常得分函数衡量一个事件的异常程度:

SDM2023|基于超图对比学习的异常事件检测

3 实验

主实验结果

SDM2023|基于超图对比学习的异常事件检测


仿照之前的工作,我们使用了常见的评估指标,包括平均精度(AP)和曲线下面积(AUC)。一般来说,AP可以反映召回能力,即检测更多异常事件的能力,AUC反映模型的精度。整体结果如表所示。可以看出,所提出的AEHCL模型在AP和AUC方面的表现都大大优于所有基线,这证明了我们模型的有效性。

消融实验

我们进行了消融研究,以进一步证明AEHCL不同模块的有效性。我们设计了AEHCL的六种模型变体:intra表示只保留事件内对比模块,即设置𝛾 在训练和测试阶段均为0。类似地,表示只保留成对对比模块。对于每个变量,我们都会调整参数并报告最佳结果。从表中可以看出,单独使用这些模块会产生较差的结果,尤其是在AP度量中,而成对组合可以获得更多的增益,并且组合所有模块可以在AP度量中获得最佳结果。尽管事件间对比模块似乎会略微损害IMDB和Meituan数据集中的AUC指标(只有使用事件内对比模块才能获得更高的AUC分数),但应该注意的是,事件间对比模块大大提高了AP分数。这是AP和AUC分数之间的折衷,我们可以在不同条件下灵活调整模块之间的权重。总之,消融研究表明,不同的模块是互补的。它们专注于捕捉不同模式的异常事件,并总体上提升彼此的检测性能。

模型分析

SDM2023|基于超图对比学习的异常事件检测


不同的异常得分函数效果.结果表明,在所有数据集中,取最小值操作虽然不是最好的(在Meituan数据集中,的性能稍差),却是最稳健的选择。与其他情况相比,标准差异常评分在不同的数据集中表现不稳定,这表明该评分设置在某些情况下的区分性较差。

SDM2023|基于超图对比学习的异常事件检测

AEHCL_的表现显著下降,表明负样本得分在正常和异常事件之间几乎没有差异。这是有意义的,因为负样本都是以相同的方式采样的。合并两个分数也会损害整体表现。我们认为,增加负对比分数可能会干扰事件异常的真实程度。

参数分析

SDM2023|基于超图对比学习的异常事件检测

我们研究了三个关键超参数()在AEHCL中的影响。AP评分如图所示(AUC评分也有类似的趋势)。有以下观察结果:(1)成对对比模块对异常事件检测具有重要意义。(2) 多元对比模块在不同的数据集上具有不同的效果。(3) 事件间对比模块在检测异常事件方面起着补充作用。

我们还分析了负样本数n在成对对比模块中的显著性。IMDB和Meituan数据集上的性能相对稳定。然而,当Aminer数据集上n较大(n>80)时,模型的性能会衰减。由于我们对负样本的采样策略几乎没有限制,当n太大时,可能会涉及一些特征与目标实体相似的实体。因此,我们为所有数据集设置n=10。更多的抽样策略预计将在进一步的工作中进行研究。

4 总结

在本文中,我们探讨了AHIN中异常事件检测的挑战性问题。与以前专注于用简单的成对模式检测异常事件的工作不同,我们将事件建模为超边,并提出了一种超图对比学习方法,称为AEHCL,该方法包括三个对比模块来捕获成对、多元和事件间的异常模式。此外,还提出了一种异常事件评分函数来衡量异常程度。在三个真实世界数据集上进行的大量实验证明了AEHCL的有效性。


本期责任编辑:杨成
本期编辑:刘佳玮

北邮 GAMMA Lab 公众号
主编:石川
责任编辑:王啸、杨成
编辑:刘佳玮

长按下图并点击“识别图中二维码

即可关注北邮 GAMMA Lab 公众号

SDM2023|基于超图对比学习的异常事件检测

原文始发于微信公众号(北邮 GAMMA Lab):SDM2023|基于超图对比学习的异常事件检测

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2023年3月24日09:59:12
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   SDM2023|基于超图对比学习的异常事件检测https://cn-sec.com/archives/1621976.html

发表评论

匿名网友 填写信息