面向缺失多元时间序列的图神经网络异常检测算法
doi: 10.11887/j.cn.202503004
高杨1 , 王新宇1 , 贺达2 , 宋明黎1 , 周春燕3
1. 浙江大学 计算机科学与技术学院, 浙江 杭州 310027
2. 浙江大学 软件学院,浙江 宁波 315048
3. 浙江省平安建设大数据重点实验室, 浙江 杭州 310016
基金项目: 浙江省“领雁”研发攻关计划资助项目(2024C01114) ; 国家自然科学基金联合基金重点资助项目(U20B2066)
Anomaly detection algorithm based on graph neural network for missing multivariate time series
GAO Yang1 , WANG Xinyu1 , HE Da2 , SONG Mingli1 , ZHOU Chunyan3
1. College of Computer Science and Technology, Zhejiang University, Hangzhou 310027 , China
2. School of Software Technology, Zhejiang University, Ningbo 315048 , China
3. Zhejiang Provincial Key Laboratory of Social Security Governance Big Data, Hangzhou 310016 , China
摘要
针对真实物联网环境中的缺失多元时间序列异常检测难题,提出一种融合缺失信息图嵌入的多元时间序列异常检测算法;基于预插值与异常检测任务融合的联合学习框架,设计一个基于时序高斯核函数的图神经网络(graph neural network, GNN)预插值模块,实现了预插值与异常检测任务的共同优化;提出一种时间序列数据缺失信息嵌入的图结构学习方法,采用图注意力机制融合缺失信息掩蔽矩阵和时空特征向量,有效建模多元时间序列缺失数据分布的潜在联系。在真实物联网传感器数据集上验证了提出算法的性能,实验结果表明,该方法在缺失多元时间序列异常检测任务上显著优于主流两阶段方法,预插值模块对比实验部分充分证明了基于高斯核函数的GNN预插值层的有效性。
Abstract
Addressing the issue of anomaly detection on missing multivariate time series data in real IoT(Internet of things) environments, a novel method on multivariate time series anomaly detection algorithm intergrated with graph embedding of missing information was proposed. Using a joint learning framework of pre-interpolation and anomaly detection task fusion, a GNN(graph neural network) pre-interpolation module based on time series Gaussian kernel function was designed to realize the joint optimization of pre-interpolation and anomaly detection task. A graph structure learning method for embedding missing information in time series data was proposed, using graph attention mechanism to fuse missing information masking matrix and spatiotemporal feature vectors, effectively modeling the potential connections of missing data distribution in multivariate time series. The performance of the algorithm was verified on real IoT sensor datasets. Experimental results prove that the proposed method significantly outperform the mainstream two-stage methods on the task of missing multivariate time series anomaly detection. The comparative experiment of the pre-interpolation module fully prove the effectiveness of the GNN pre-interpolation layer based on the Gaussian kernel function.
时间序列异常检测是数据挖掘领域的重要研究方向,在传感器故障检测[1]、临床诊断[2]、网络入侵检测[3]和企业财务预测[4]等场景有着广泛的应用。随着物联网、大数据与人工智能技术的快速发展,车联网、工业物联网和数据中心也逐渐推广开来,具有复杂耦合关系的传感器设备产生了大量多元时间序列数据,这些时间序列数据之间普遍存在联系,对时间序列异常检测任务带来了新的挑战。除此以外,在真实物联网环境中,传感器缺陷和网络通信故障情况普遍存在,时常会导致数据在采集、传输过程中出现缺失[5],如何在部分数据缺失的情况下进行多元时间序列异常检测是非常值得研究的问题。
在早期的科研工作中,因为异常样本标记数据的缺乏,研究者普遍采用无监督的统计学习方法来进行异常检测,比如高斯混合模型[6]、基于距离的聚类方法[7]和单分类支持向量机[8](one-class support vector machine,one-class SVM)等。这类方法通常基于整体的数据分布来识别异常,并没有充分考虑时间序列的上下文关联性和传感器数据的高维特性,极大地影响了异常检测任务的性能[9]。伴随着深度学习技术的快速发展,许多深度模型被提出并应用到了时间序列异常检测问题上,这些方法通常可以被分为两大类:基于重构误差的方法和基于预测的方法[10]。前者的典型方法是自动编码器(autoencoder,AE)[11],它使用重构误差来度量样本间的异常程度;后者的典型方法是长短期记忆(long short-term memory,LSTM)网络[12],它采用独特的门设计,可以有效建模时间序列中的上下文信息。但是这些方法都是为单一时间序列设计的,忽视了多元时间序列之间的空间联系,无法有效建模不同时间序列间的关联关系,在复杂耦合传感器互联网络中的应用受到了限制。
为了解决这些问题,Yan等[13]提出了图神经网络(graph neural network,GNN),它是一种可以利用深度学习方法直接对图结构数据学习的框架,对于多元关系的建模表现出了优异的性能。鉴于GNN的成功,研究者基于GNN提出了一系列新的算法,比如引入卷积层设计的图卷积神经网络[14](graph convolution neural networks,GCNs)、加入注意力机制的图注意力神经网络(graph attention neural networks,GATs)等[15,9]。然而这类方法也存在不足,由于在建模过程中没有考虑到真实物联网环境中广泛存在的数据缺失问题,在实际应用时通常会采用先进行缺失值插值再异常检测的两阶段方法[16]。因为插值阶段和异常检测阶段的优化目标并不相同,插值结果会极大地影响异常检测的最终效果。除此以外,先插值再异常检测的两阶段方法对于深度学习模型的训练、部署和决策等运维过程也带来了更多的成本开销。
综上所述,现有算法在部分数据缺失情况下进行多元时间序列异常检测时,会出现时空信息建模不充分、插值过程影响异常检测任务性能等问题。针对这些不足,本文提出一种融合缺失信息图嵌入的多元时间序列异常检测算法:基于预插值与异常检测任务融合的联合学习框架,在补全缺失时间序列信息的同时,保证预插值与异常检测任务共同优化;采用时间序列数据缺失信息嵌入的图结构学习方法,充分建模邻域传感器缺失数据分布的潜在关联;最后,模型基于学习到的多元时间序列时空嵌入向量进行预测,基于预测偏差值进行异常检测。
1 融合缺失信息图嵌入的多元时间序列异常检测
1.1 问题背景
在工业物联网环境中,为了高效地运维管理各类生产设施,通常部署着许多传感器设备。这些传感器设备按照预设的采样频率持续监控采集各种系统环境数据,会产出多组按照时间排序的随机变量,即多元时间序列[5]。这些传感器在物理空间或者信息空间可能存在着某种复杂、非线性的关联关系,例如温度变化会导致气压变化,多元时间序列也存在着内部潜在关联。由于真实物联网环境的复杂性,传感器缺陷和网络通信故障不可避免,产生的多元时间序列往往存在数据缺失现象,这给面向多元时间序列的异常检测任务带来了巨大的挑战。
1.1.1 多元时间序列异常检测
通过对多元时间序列进行异常检测,可以有效地识别异常数据背后隐含的设备故障问题,帮助运维人员尽快诊断和排除风险。传统的传感器监测系统通常由系统专家为每个监控信号设定正常响应的阈值区间,如果信号响应超过了专家定义的阈值,就会被系统判定为异常。
典型的多元时间序列异常检测场景如图1所示,3个位移传感器位于相邻区域,所产生的时间序列也表现出相似的数据分布,并没有发生数据缺失。图中红色虚线表示系统专家为传感器3设定的正常响应区间。传感器3在2 s时的信号响应超出了该区间,红色圆圈表示的异常点可以被有效识别。
1多元时间序列异常检测
Fig.1Anomaly detection of multivariate time series
1.1.2 缺失多元时间序列异常检测
在真实物联网环境中,考虑到网络通信故障、传感器缺陷等原因,多元时间序列在采集、传输、加载过程中不可避免会出现数据缺失问题,传统方法通常会基于缺失时间序列的数据分布信息进行插值填补缺失数据,再进行异常检测。
图2所示,传感器3在2 s时的异常数据出现了缺失,传统方法会基于传感器3自身的单一时间序列信息插值填补再检测异常,但由于填补数据处于正常响应区间内,缺失的异常点并不能被有效识别,潜在风险会被忽视。
2基于时序信息插值的异常检测
Fig.2Anomaly detection based on temporal information interpolation
传感器3与传感器1、2在空间区域中距离接近,因此其信号响应在时间轴上会表现出相似的数据分布。如图3所示,3个传感器在2 s时的响应值都偏高,融合多元时间序列的时序信息和空间信息进行插值,能够极大提高填补数据的精准度,有效缓解数据缺失对最终异常检测任务的影响,识别出潜在风险。
3基于时空信息插值的异常检测
Fig.3Anomaly detection based on spatio-temporal information interpolation
针对上述问题,研究了部分数据缺失情况下的多元时间序列异常检测问题,本文提出一种融合缺失信息图嵌入的图神经网络算法。该算法采用预插值与异常检测任务融合的联合学习框架,融合多元时间序列数据缺失信息进行图结构学习,与当前两阶段的图异常检测方法相比,能够充分建模缺失多元时间序列的时空关联信息,减少插值过程对异常检测任务的负面影响。
1.2 数学模型
融合缺失信息图嵌入的多元时间序列异常检测算法能够利用多元时间序列的时空信息和缺失信息,检测出多元时间序列中潜在的异常值。对该算法的输入、输出定义如下:
定义1   X1:n为一个长度为n的多元时间序列,表示为:
X1:n=X1,,Xt,,XnRl×n
(1)
式中,Xt=xt1xtlRl为时刻t的时间序列特征向量,xtiXt的第i个变量,l是变量的个数。
定义2   m1:n为多元时间序列缺失情况的掩蔽矩阵,表示为:
m1:n=m1,,mt,,mn{0,1}l×n
(2)
式中,mt=mt1mtl{0,1}l是表示时刻t的数据点是否可观测的掩蔽向量,其中mit=1表示xit可以被观测到,反之mit=0表示xit缺失。
定义3   a1:n为多元时间序列的异常结果,表示为:
a1:n=a1,,at,,an{0,1}l×n
(3)
式中,at=at1atl{0,1}l表示时刻t数据点的异常分数,其中ait=1表示xit为异常值。任务目标为检测出多元时间序列中的异常值。
1.3 预插值与异常检测任务融合的联合学习框架
预插值与异常检测任务融合的联合学习框架如图4所示,包含预插值层、图结构学习层和异常检测模块3个主要组件,将多元时间序列间的关系建模成图,学习缺失多元时间序列的时间、空间关联,补全缺失数据,有效识别异常值。各主要组件作用如下:
1)基于高斯核函数的GNN预插值:采用图神经网络建模多元时间序列间的空间关系,嵌入高斯核函数所表征的时序特征对缺失时间序列预插值。
2)缺失信息融合的图结构学习:输入预插值后的多元时间序列嵌入向量和多元时间序列缺失信息,利用图注意力机制融合缺失时间序列的时空信息预测未来的时间序列。
3)基于预测的异常检测:输入预测值,计算和真实值的偏差,通过归一化偏差值识别出异常值。
4一种预插值与异常检测任务融合的联合学习框架
Fig.4A joint learning framework for pre-interpolation and anomaly detection
1.3.1 基于高斯核函数的GNN预插值
基于高斯核函数的预插值层输入为多元时间序列X1:n和缺失信息掩蔽矩阵m1:n。与Shukla[17]类似,对于t*时刻第i个时序变量,采用高斯核函数kt*t; αi=e-αit*-t2来度量时刻t(1≤tn)对时刻t*的时序影响,定义时刻t*的观测密度函数为λt*mi; αi=i=1n miikt*t; αimiixti,其中αi是可学习的参数。根据上述定义,可以推导出时序预测值x¯t*i的表达式为:
x¯t*i=1λt*,mi;αit=1n kt*,t;αimiixii
(4)
考虑到不同时序变量存在的潜在空间关联,采用图神经网络在预插值层中嵌入时空信息。输入为每个时序变量预测值,为了获得输入特征的高维空间有效表达,定义权重矩阵HRl×l进行自注意力变换到每个时序变量上:
hij=attentionWx¯t*i,Wx¯t*j
(5)
βij=softmaxjhij
(6)
其中,attention(·)表示注意力函数[15]W表示对每个节点进行共享线性交换的可训练权重矩阵,βij是时序预测值的注意力系数。根据计算好的注意力系数将特征加权求和,扩展到多头注意力机制[18]进行加强,如式(7)所示,其中K为多头注意力机制的超参数,x^t*i为输入图结构学习层的预插值嵌入向量。
x^t*i=σ1Kk=1K j=1l βijkWkx^t*j
(7)
其中,σ(·)表示LeakyReLU非线性激活函数。
基于高斯核函数的GNN预插值层如图5所示,包括高斯核函数时序插值和图神经网络空域插值等2个主要模块,分别建模缺失多元时间序列的时空信息,为图结构学习层提供预插值嵌入向量。其中,αiβij在后续的图结构学习层中会参与联合训练,将插值任务和异常检测任务的优化目标进行对齐。
1.3.2 缺失信息融合的图结构学习
图结构学习层的目标是从图结构视角建模缺失多元时间序列间的关联关系。以物联网场景为例,传感器之间具有复杂耦合关系,空间距离、传感器类型、网络拓扑都有可能影响传感器之间的联系,很难获得充分的先验知识来定义传感器间的图结构[9]。针对该问题,定义邻接矩阵D来表示多元时间序列间的关系,其中Dij度量了时间序列i和时间序列j间的潜在联系。
5基于高斯核函数的GNN预插值架构
Fig.5Architecture of GNN pre-interpolation layer based on Gaussian kernel function
考虑到在真实场景中先验知识对多元时间序列关系建模的有效性,定义与时间序列i潜在联系的集合Ei如式(8)所示,如果没有先验知识,集合Ei包含除时间序列i以外的所有时间序列。
Ei{1,2,,l}{i}
(8)
为了计算出与时间序列i联系的时间序列,如式(9)、式(10)所示,先计算出多元时间序列嵌入向量ui间的相似度,再选择前p个时间序列作为存在关系序列。其中,p为超参数,可以用来调整邻接矩阵D的稀疏性;ui是门控循环单元(gated recurrent unit,GRU)基本单元所抽取的多元时间序列嵌入向量。
eji=uiTujuiuj,jEi
(9)
Dji=1jTopPeji:pEi
(10)
其中:TopP(·)函数输出时间序列相似度排前P的时间序列索引,P为超参数;1{·}表示如果时间序列j满足TopP(·)函数,则将邻接矩阵对应的元素Dij设置为1。
为了学习缺失多元时间序列间的潜在联系,设计了缺失信息融合的图注意力特征提取模块。与传统的图注意力机制不同,该方法先采用GRU基本单元抽取了多元时间序列的时序特征,再对多元时间序列间的空间联系和数据缺失关联进行建模,如式(11)~(14)所示。
zi(t)=ReLUγi,iQx^t*i+jΨ(i) γi,jQx^t*j
(11)
gt*i=uiQx^t*imt*i
(12)
π(i,j)=ReLU attention gt*igt*j
(13)
γi,j=softmaxj(π(i,j))
(14)
其中,预插值嵌入向量x^t*iRn是时间序列i的输入特征,ψi)={j/Dji>0}是时间序列i根据邻接矩阵D得到的关联序列集合,QRl×n是可学习的权重矩阵对每一个时间序列节点进行共享参数的线性变换;gt*i连接多元时间序列嵌入向量ui和预插值变换特征Qx^t*i,并融合了缺失信息掩蔽矩阵m1:nγij是通过图注意力机制学习的关联系数;zti是最终输入异常检测层的多元时间序列变量的聚合表征。
缺失信息融合的图结构学习架构如图6所示,基于先验知识定义多元时间序列间的邻接矩阵,采用图注意力机制融合多元时间序列数据缺失的关联性,学习多元时间序列的时空特征对多元时间序列进行预测。
6缺失信息融合的图结构学习架构
Fig.6Architecture of graph structure learning with missing information fusion
1.3.3 基于预测的异常检测
在异常检测模块,采用全连接层设计,基于多元时间序列聚合表征zti和多元时间序列嵌入向量ui计算出多元时间序列预测值yt*i,如式(15)所示:
yt*i=fθu1zt*1,,ulzt*l
(15)
式中,“”是向量连接运算。使用均方根误差来度量多元时间序列观测值和预测值之间的偏差并作为损失函数进行优化,如式(16)所示。
LMSE=1Ttrain -ωt*=ω+1Ttrain y^t*-yt*22
(16)
式中,Ttrain表示输入训练数据的最终时刻,ω表示批式训练中时间窗口的大小。
在异常检测阶段中,首先计算出时刻t的多元时间序列i的预测值yt*i,然后度量预测值和观测值间的偏差并进行归一化,如式(17)~(18)所示:
Erri(t)=y^ti-yti
(17)
bi(t)=Erri(t)-μ~iσ~i
(18)
其中,μ~iσ~i是偏差值的期望和标准差。最后将标准化后偏差值最大变量标记为异常,如式(19)所示。
B(t)=maxi bi(t)
(19)
在真实物联网场景中,可以结合设置固定阈值的方式来降低异常值的报警率[19],在后续实验部分将验证集中的最大偏差设置为了阈值。
2 实验结果与分析
实验采用了安全水处理(secure water treatment,SWaT[20])和水分配(water distribution,WADI[21])数据集,二者都是从水处理物理试验台系统中采集的传感器多元时间序列数据,科研人员模拟了真实世界中的攻击场景,构造了数据集中的异常样本。
2.1 实验数据
SWaT数据集与WADI数据集是从新加坡公共事业局运行的水处理物理试验台系统中采集构建的,后者在前者水处理系统的基础上添加了水分配系统,形成了一个完整而现实的水处理、储存和分配网络,二者分别包含51个传感器11 d内的连续监测信号和127个传感器16 d内的连续监测信号。研究人员模拟了真实世界中的攻击模式,包括通过通信网络传输的网络攻击和对水泵、水箱等硬件设备的物理攻击,以不同的时间间隔对单个或者多个设备进行单次或者多轮次的受控攻击,这些攻击对应于测试集中的异常标记。图7是水处理物理试验台系统传感器设备拓扑关系图,上述数据集因为传感器关联复杂,攻击模式多样,被研究者们广泛用于多元时间序列异常检测算法的效果评估。因为水处理物理试验台系统首次启动需要5~6 h才能达到稳定[21],两个数据集中的前2 160个样本被剔除了。考虑训练效率的原因,对原始数据以10 s为时间窗口进行下采样,生成的标签是该时间窗口中数量最多的标签。此外,由于SWaT和WADI数据集缺失数据较少,基于缺失数据的原始分布随机扩充了占比为10%的缺失数据,模拟了真实场景下数据缺失的情况。如表1所示,SWaT的训练集包含采样后前6 d的47 515条数据,都是正常样本,测试集包含后5 d的44 986条数据,存在异常样本,占比为11.97%;WADI的训练集包含采样后前14 d的118 795条数据,都是正常样本,测试集包含后2 d的17 257条数据,存在异常样本,占比为5.99%。
7水处理物理试验台系统传感器设备拓扑结构
Fig.7Topological structure of sensors device in water treatment physical test bench system
1实验数据集统计指标
Tab.1 Statistics index of experimental dataset
2.2 评价指标
这一部分的评价指标测试了融合缺失信息图嵌入的多元时间序列异常检测算法和其他基准方法的性能。使用在异常检测任务中常用的指标对相关算法进行评估:准确率(Precision)、召回率(Recall)和F1分数(F1-Score),其定义如式(20)~(22)所示。
Precision =TPTP+FP
(20)
Recall =TPTP+FN
(21)
F1-Score =2× Precision × Recall Precision + Recall
(22)
在实验过程中,正例表示识别为异常样本,而负例表示识别为正常样本;真正例(true positive,TP)表示被正确检测为异常的异常样本;假正例(false positive,FP)表示错误地将正常样本标记为异常;假负例(false negative,FN)表示错误地将异常样本标记为正常。
2.3 实验设置
实验环境是一台PC服务器,其CPU为11th Gen Intel(R)Core(TM)i7-1165G7 @ 2.80 GHz,GPU是 NVIDIA GeForce RTX 3070,以PyTorch和PyTorch Geometric库为基本框架,在Python3.8.3中搭建深度神经网络进行训练。模型的参数设置如下:滑动时间窗口大小为 8;drop out参数为 0.2;优化器选择Adam;初始学习率为 0.01;训练轮数上限为 40。
为了证明融合缺失信息图嵌入的多元时间序列异常检测算法的总体性能,实验过程将其与6种无监督方法进行了比较。这些方法包括:主成分分析(principal component analysis,PCA)、AE、基于长短期记忆网络的差分自编码器[22](long short-term memory networks-variational auto-encoder,LSTM-VAE)、基于生成对抗网络的多元时间序列异常检测[23](multivariate anomaly detection for time series data with generative adversarial networks,MAD-GAN)、深度自编码高斯混合模型[24](deep autoencoding Gaussian mixture model,DAGMM)和图差分网络[5](graph deviation network,GDN)。因为并非所有用于比较的基准方法都提供了选择异常阈值的机制,在计算评价指标时测试了每个算法的可能异常阈值,并登记了与最高F1分数相关的结果。
2.4 结果分析
2.4.1 SWaT数据集实验结果
SWaT 数据集的实验结果如表2所示,可以看到,相较于基准方法,本文提出的方法能达到更好的效果,其中 F1 分数达到了 0.79,准确率和召回率分别达到了95.31%和67.59%,均显著领先于基准方法。图8展示了融合缺失信息图嵌入的多元时间序列异常检测算法在SWaT数据集上的训练损失函数收敛曲线。因为GNN预插值层的网络结构比较复杂,传播过程的计算复杂度更高,可以明显发现采用期望预插值层收敛速度会更快,但两者最终都会收敛到接近的合理区间。
2SWaT数据集上的实验结果
Tab.2 Experimental result on SWaT dataset
8SWaT数据集上损失函数收敛曲线
Fig.8Convergence curve of loss function on SWaT dataset
2.4.2 WADI数据集实验结果
WADI 数据集的实验结果如表3所示,由于 WADI 数据集的复杂度高于SWaT数据集,相关方法异常检测效果均有所下降,尤其是在召回率指标上。由于传感器间的关联关系复杂度上升,多元时间序列间的空间特征信息抽取更加重要,基于图神经网络的方法明显好于传统方法。尽管如此,与基准方法相比,本文提出的融合缺失信息图嵌入的多元时间序列异常检测算法效果依旧领先,其中准确率达到了 92.38%,召回率达到了41.81%,F1分数达到了0.57。图9展示了融合缺失信息图嵌入的多元时间序列异常检测算法在WADI数据集上的训练损失函数收敛曲线,整体趋势和SWaT数据集上的情况基本一致。考虑到WADI数据集包含更多的传感器多元时间序列特征和更少的异常样本,损失函数收敛速度要快于SWaT数据集。
3WADI数据集上的实验结果
Tab.3 Experimental result on WADI dataset
9WADI数据集上损失函数收敛曲线
Fig.9Convergence curve of loss function on WADI dataset
2.4.3 预插值模块对比实验
为了验证基于高斯核函数的GNN预插值模块的有效性,设计了预插值模块对比实验,将GNN预插值层替换为期望平滑,算法框架和其他实验环境参数保持不变,在 WADI 数据集下进行了验证,最终的实验结果如表4所示。
4预插值模块对比实验结果
Tab.4 Comparative experimental result of pre-interpolation module
从实验结果可以看出,基于高斯核函数的GNN预插值模块对最终的异常检测效果有着非常大的提升,当将预插值模块替换为期望平滑后,准确率、召回率出现了明显的下降。
3 结论
提出了融合缺失信息图嵌入的多元时间序列异常检测算法,设计预插值与异常检测任务融合的联合学习框架,克服了传统两阶段方法的不足,能够有效缓解缺失数据对多元时间序列异常检测任务的影响;设计了缺失信息融合的图结构学习模块,采用图注意力机制融合缺失信息掩蔽矩阵和时空特征向量,兼顾了多元时间序列的时空特征和缺失数据的潜在联系。在真实物联网传感器数据集对提出算法进行了实验,与基准方法相比,提出算法在缺失多元时间序列异常检测任务上更有优势,预插值模块对比实验结果证明了基于高斯核函数的GNN预插值层设计的有效性。
1多元时间序列异常检测
Fig.1Anomaly detection of multivariate time series
2基于时序信息插值的异常检测
Fig.2Anomaly detection based on temporal information interpolation
3基于时空信息插值的异常检测
Fig.3Anomaly detection based on spatio-temporal information interpolation
4一种预插值与异常检测任务融合的联合学习框架
Fig.4A joint learning framework for pre-interpolation and anomaly detection
5基于高斯核函数的GNN预插值架构
Fig.5Architecture of GNN pre-interpolation layer based on Gaussian kernel function
6缺失信息融合的图结构学习架构
Fig.6Architecture of graph structure learning with missing information fusion
7水处理物理试验台系统传感器设备拓扑结构
Fig.7Topological structure of sensors device in water treatment physical test bench system
8SWaT数据集上损失函数收敛曲线
Fig.8Convergence curve of loss function on SWaT dataset
9WADI数据集上损失函数收敛曲线
Fig.9Convergence curve of loss function on WADI dataset
1实验数据集统计指标
2SWaT数据集上的实验结果
3WADI数据集上的实验结果
4预插值模块对比实验结果
刘学, 孙翱, 李冬. 参照化流形空间融合学习的敏感特征提取与异常检测方法[J]. 国防科技大学学报,2020,42(6):47-55. LIU X, SUN A, LI D. Sensitive feature extraction and anomaly detection method based on referenced manifold spatial fusion learning[J]. Journal of National University of Defense Technology,2020,42(6):47-55.(in Chinese)
SUNNY J S, PATRO C P K, KARNANI K,et al. Anomaly detection framework for wearables data:a perspective review on data concepts,data analysis algorithms and prospects[J]. Sensors,2022,22(3):756.
王意洁, 程力, 马行空. 运用警报关联的威胁行为检测技术综述[J]. 国防科技大学学报,2017,39(5):128-138. WANG Y J, CHENG L, MA X K. Survey of alert-correlation based on network threat detection techniques[J]. Journal of National University of Defense Technology,2017,39(5):128-138.(in Chinese)
CRÉPEY S, LEHDILI N, MADHAR N,et al. Anomaly detection in financial time series by principal component analysis and neural networks[J]. Algorithms,2022,15(10):385.
SHI X, HAO K R, CHEN L,et al. Multivariate time series prediction of complex systems based on graph neural networks with location embedding graph structure learning[J]. Advanced Engineering Informatics,2022,54:101810.
HANSEN L K, SIGURDSSON S, KOLENDA T,et al. Modeling text with generalizable Gaussian mixtures[C]//Proceedings of the IEEE International Conference on Acoustics, Speech,and Signal Processing,2020:3494-3497.
ANGIULLI F, PIZZUTI C. Fast outlier detection in high dimensional spaces[C]//Principles of Data Mining and Knowledge Discovery. Berlin, Heidelberg: Springer Berlin Heidelberg,2002:15-27.
SCHÖLKOPF B, PLATT J C, SHAWE-TAYLOR J,et al. Estimating the support of a high-dimensional distribution[J]. Neural Computation,2001,13(7):1443-1471.
DENG A L, HOOI B. Graph neural network-based anomaly detection in multivariate time series[J]. Proceedings of the AAAI Conference on Artificial Intelligence,2021,35(5):4027-4035.
LI T Y, COMER M L, DELP E J,et al. Anomaly scoring for prediction-based anomaly detection in time series[C]//Proceedings of the IEEE Aerospace Conference,2020:1-7.
SOUIDEN I, OMRI M N, BRAHMI Z. A survey of outlier detection in high dimensional data streams[J]. Computer Science Review,2022,44:100463.
FAN J, ZHANG K, HUANG Y P,et al. Parallel spatio-temporal attention-based TCN for multivariate time series prediction[J]. Neural Computing and Applications,2023,35(18):13109-13118.
YAN Y J, HASHEMI M, SWERSKY K,et al. Two sides of the same coin:heterophily and oversmoothing in graph convolutional neural networks[C]//Proceedings of the IEEE International Conference on Data Mining(ICDM),2022:1287-1292.
KIPF T, WELLING M. Semi-supervised classification with graph convolutional networks[C]//Proceedings of the International Conference on Learning Representations,2017.
VELIČKOVIĆ P, CUCURULL G, CASANOVA A,et al. Graph attention networks[C]//Proceedings of the International Conference on Learning Representations,2018.
KREINDLER D M, LUMSDEN C J. The effects of the irregular sample and missing data in time series analysis[J]. Nonlinear Dynamics, Psychology,and Life Sciences,2006,10(2):187-214.
CHALLU C, OLIVARES K G, ORESHKIN B N,et al. NHITS:neural hierarchical interpolation for time series forecasting[J]. Proceedings of the AAAI Conference on Artificial Intelligence,2023,37(6):6989-6997.
HOSHEN Y. VAIN:attentional multi-agent predictive modeling[C]//Proceedings of the Thirty-First Annual Conference on Neural Information Processing Systems,2017.
SIFFER A, FOUQUE P A, TERMIER A,et al. Anomaly detection in streams with extreme value theory[C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2017:1067-1075.
MATHUR A P, TIPPENHAUER N O. SWaT:a water treatment testbed for research and training on ICS security[C]//Proceedings of the International Workshop on Cyber-Physical Systems for Smart Water Networks(CySWater),2016:31-36.
AHMED C M, PALLETI V R, MATHUR A P. WADI:a water distribution testbed for research in the design of secure cyber physical systems[C]//Proceedings of the 3rd International Workshop on Cyber-Physical Systems for Smart Water Networks,2017:25-28.
PARK D, HOSHI Y, KEMP C C. A multimodal anomaly detector for robot-assisted feeding using an LSTM-based variational autoencoder[J]. IEEE Robotics and Automation Letters,2018,3(3):1544-1551.
LI D, CHEN D C, JIN B H,et al. MAD-GAN:multivariate anomaly detection for time series data with generative adversarial networks[C]//Proceedings of the Internet Corporation for Assigned Names and Numbers,2019:703-716.
ZONG B, SONG Q, MIN M R,et al. Deep autoencoding Gaussian mixture model for unsupervised anomaly detection[C]//Proceedings of the International Conference on Learning Representations,2018.