数据与知识双驱动的备件需求模糊预测模型
doi: 10.11887/j.cn.202402021
王小巍1,2 , 陈砚桥1 , 金家善1 , 魏曙寰1
1. 海军工程大学 动力工程学院,湖北 武汉 430033
2. 陆军工程大学 军械士官学校,湖北 武汉 430075
基金项目: 国家部委基金资助项目(LJ20191A020110)
Spare parts demand fuzzy prediction model driven by data and knowledge
WANG Xiaowei1,2 , CHEN Yanqiao1 , JIN Jiashan1 , WEI Shuhuan1
1. College of Power Engineering, Naval University of Engineering, Wuhan 430033 , China
2. Ordnance NCO Academy, Army Engineering University, Wuhan 430075 , China
摘要
针对知识驱动型需求预测模型所需的专家知识稀缺、数据驱动型需求预测模型可解释性不足的问题,提出了数据与知识双驱动的备件需求模糊预测模型。该模型基于模糊聚类算法将数值型数据聚类为结构简单、可解释性强的规则库,运用模糊逻辑将领域专家知识表示为Mamdani型规则库。在此基础上,引入了一种新型智能计算理论——模糊网络理论对两类规则库进行合并运算,形成初始预测模型。采用遗传算法优化模型规则库的模糊集参数来提高模型预测准确性。通过与模糊聚类算法进行对比,提出的模型在可解释性以及准确性指标上均具有优势。
Abstract
Aiming at the problem of scarcity of expert knowledge required by knowledge-driven demand forecasting model and insufficient interpretability of data-driven demand forecasting model, a fuzzy prediction model of spare parts demand driven by data and knowledge was proposed. Based on the fuzzy clustering algorithm, the numerical data was clustered into a rule base with simple structure and strong interpretability. The domain expert knowledge was represented as a Mamdani-type rule base by utilizing fuzzy logic. On this basis, a new type of intelligent computing theory—fuzzy network theory was introduced, the two types of rule bases were merged into an initial prediction model. A genetic algorithm was employed to optimize the fuzzy set parameters of the model′s rule base to enhance the model′s predictive accuracy. Compared with the fuzzy clustering algorithm, the proposed model has advantages in interpretability and accuracy.
备件需求预测是备件筹措、储存供应等备件管理工作的基础。需求的不确定性是未来事件的基本特征,也是客观世界的普遍特征。需求的不确定性分两类:随机不确定性和认知不确定性[1]
与备件需求预测直接关联的备件消耗量同时具备随机性、多样性、时变性、信息不充分性,预测过程中很难精确地描述备件消耗与影响因素之间的复杂关系。模糊数学可以用来研究这类概念外延的不确定。人工智能对模糊性的研究,主要是通过将原有的精确知识处理方法以各种方式模糊化[2],如模糊谓词、模糊规则、模糊框架、模糊语言网、模糊逻辑和模糊神经网络(neural network,NN)等,可以实现在没有明确数学模型的情况下对备件需求模糊信息进行逻辑推理和智能计算。具体来说,主要采用基于专家知识或基于数据设计一组if-then规则来进行需求预测。虽然模糊模型独立于精确的数学模型,但它能进行逻辑推理、数值计算和非线性函数逼近。
部分学者融合专家知识建立了备件需求的模糊预测模型。Bacon[3]以一种失效率估计装置为例,阐述了备件预测领域中基于知识的系统中存在的不确定性问题;李晓燕等[4]利用模糊综合评判法来处理专家知识,形成层级式的决策结构预测战损备件消耗量;刘喜春等[5]通过专家知识描述作战意图,基于模糊推理预测战时备件需求。
基于数据的模型采用人工智能方法开展备件需求预测。Rohaan等[6]采用自然语言处理(natural language processing,NLP)技术来预测备件需求;杨帆等[7]采用支持向量机(support vector machine,SVM)对器材备件非稳态需求展开预测;Jiang等[8]采用SVM建立了间断型需求预测模型;杨超等[9]基于犹豫模糊粗糙集,为预计备件需求建立了备件分类模型;陈顶等[10]建立了灰色生灭预测模型来预测可修排队系统的备件需求;贺拥亮[11]基于改进NN模型预测军械备件需求;Babai等[12]采用新NN方法预测间断型需求;Aktepe等[13]对比研究了多元线性回归、多元非线性回归、人工神经网络(artificial neural network, ANN)与SVM四种备件需求预测方法。
以上研究中,知识驱动型模型完全基于领域专家定义的规则,局限于数据逻辑推理等确定型推理方法,受限于领域专家知识的稀缺导致的备件需求预测这类复杂问题描述能力不清。数据驱动型模型,具有大数据处理优势和较为准确的分类与预测能力,不足之处在于可解释性较低,安全性与稳定性不可预计。
为克服单一预测算法的不足,人工智能组合算法成为研究热点[14]。张云景等[15]综合利用模糊理论和证据理论实现对战时备件需求的预测;李浩等[16]组合多种预测方法基于历史数据进行需求预测;郎祎平等[17]构建多输出支持向量回归模型实现备件需求联合预测;Chandriah等[18]集成循环神经网络/长短期记忆网络与改进Adam优化器来预测备件需求。以上几类组合算法仍然属于纯数据驱动型模型。Dombi等[19]通过结合隐含知识与基于数据的时间序列聚类分析提升了备件预测的准确性;Li等[20]基于知识归纳出了战斗影响因素并输入给改进支持向量机(ε-SVM),提升了战时备件需求预测的准确性。以上两项研究中知识分析只是为后继的数据处理做准备,没有形成知识与数据双驱动的并行结构。
采用数据与知识双驱动备件需求模糊预测模型能够同时利用专家知识和数值数据[21-22],能有效融合两种方法各自的优点,提升预测准确性[23]
备件的历史数据提供了以往备件供应保障中各类备件其内部与外部质量属性的定量值,专家利用他们的经验提供“模糊”信息,或其质量属性之间相关性的定性描述[24]。模型的可解释性可提高预测模型的实用性,因为模型具备良好的可解释性便于相关人员使用语言术语(linguistic terms,LT)对预测模型中的各输入变量值做出自己的判断,而各类黑盒预测模型(例如,基于ANN的模型)的结构难以识别及纳入专家的判断。
本文提出了一种基于模糊聚类算法(fuzzy-clustering method,FCM)与模糊网络(fuzzy network,FN)方法的备件需求模糊预测模型,实现了数据与知识双驱动。该模型由FCM及专家知识生成Mamdani型规则,并由FN方法将两种方法产生的规则进行合并运算,并采用遗传算法(genetic algorithm,GA)来优化模糊集的参数。通过案例验证了该模型在可解释性与准确性两类指标上均具有优势。
1 理论
FN是由Gegov等提出的一种新概念[25],将规则库完全网络化,所有的输入通过链接关系映射到输出,具备完全的“白盒”特性。该理论还未见到中文文献的阐述,因此本节对FN相关理论的核心思想进行介绍。
1.1 FN的理论基础
标准模糊系统(standard fuzzy system,SFS),是一种应用最广的模糊系统,只带一个规则库,SFS是一种典型的黑盒模型,输入直接映射到输出,不考虑任何内部关联。SFS因将所有输入同时作用于输出而具有较高的准确度。但是,随着规则数的增加,SFS的透明度迅速减小,模型的输入如何影响输出变得非常不清晰。
链式模糊系统[26](chained fuzzy system,CFS),将规则库中的规则分解成层级结构,是一种典型的白盒模型,输入通过内部变量之间的链接映射到输出变量,子系统及这些链接之间的层级结构是不受约束的。CFS通常能表述SFS子系统及链接关系的细节,因而提升了模型的透明度。因为输入变量被划分到各个独自的规则库,模型的执行效率也得到了提升。然而,由于存在多重模糊化-推理-解模糊化序列,误差累积可能会造成准确性上的损失。递阶模糊系统[27](hierarchical fuzzy system,HFS)是一种特殊的CFS,因为HFS的每个子系统只有两个输入及一个输出。
在这里,FN可以看作是SFS与HFS的结合体。一方面,FN具备与HFS相似的结构,确切地表达了子系统以及相互之间的关系;另一方面,FN具备与SFS相似的运算,因为FN可以将各子系统的规则库经运算简化为单一规则库。简化运算主要是通过语言值合成的方法,将类似于HFS的多规则库系统进行垂直合并及水平合并运算,形成FN,具有类似于SFS的单规则库系统。
FN方法能够将来自知识和数据的规则结合起来。作为一种HFS或CFS,FN通过链接将输入映射到输出。FN中的规则总数是输入数量和每个输入的语言术语数量的线性函数。与SFS相比,FN中的规则得到了简化,结构更加透明和可解释。FN既具有SFS的准确性,又具有CFS/HFS的透明度。结构的透明度与预测模型的可解释性直接相关。可以说,FN天然具备良好的可解释性。近年来的研究[28]表明,对于复杂系统建模而言,预测模型的可解释性的重要性不亚于准确性和效率,这也是采用FN构建预测模型的核心原因。
1.2 FN的基本运算
FN模型的输入和输出均采用语言术语集。在这里,FN模型为多输入单输出系统,只有一个输出,采用式(1)所示的if-then规则。为了表述上的简洁性,式(1)中的输入A1jAnj与输出{Bj}的语言术语集均采用整数来表示。例如,采用{1,2,3}来表示术语集{small,average,big}。
(1)
式中,j=1,2,···,Mxii=1,2,···,n)是模糊系统的输入变量,z是输出变量,AjiBj是语言变量xiz各自在论域UR中的语言术语。
图1给出一个简单FN模型的例子来说明FN的基本操作。该模型具有3个节点N1,1N1,2I2,1
1FN的层级式结构示例
Fig.1An example of hierarchical structure in FN
1.2.1 垂直合并运算
FN的垂直合并运算是一种二进制操作,可应用于一对并行节点,即位于FN同一层的节点。例如,图1中的节点N1,1I2,1位于同一层。垂直合并操作采用布尔矩阵Kronecker乘积运算。此操作将两个运算节点合并为单个乘积节点。在这种情况下,乘积节点的输入是运算节点输入的并集,乘积节点的输出则为运算节点输出的并集。由于能够串联任意两个并行节点的输入和输出,因此垂直合并操作的运算次序较为灵活。垂直合并操作用“+”表示。
垂直合并运算的框图示例如图2所示,含有子节点N1,1I2,1的FN可以由方框图和用式(2)所示的拓扑表达式来表示。节点N1,1I2,1经垂直合并运算后生成一个乘积节点N1,1+2,1,用式(3)中的拓扑表达式来描述。
N1,1x1,x2z1+I2,1x3x3
(2)
N1,1+2,1x1,x2,x2z1,x3
(3)
2垂直合并运算的框图示例
Fig.2Block diagram example of vertical merge operation
1.2.2 水平合并运算
FN的水平合并也是一种二进制操作,可合并FN相同级别中两个连续的节点。此操作将两个运算节点合并为单个乘积节点。乘积节点的输入与第一个运算节点的输入相同,输出与第二个运算节点的输出相同,而乘积节点中不显示两个节点之间的链接。水平合并操作用“*”表示。
水平合并运算的框图示例如图3所示,包含两个节点的FN可以由式(4)表示。运算节点N1,1+2,1N1,2水平合并后会产生一个乘积节点N(1,1+2,1)*1,2,由式(5)表示。
N1,1+2,1x1,x2,x3z1,x3*N1,2z1,x3z2
(4)
N(1,1+2,1)*1,2x1,x2,x3z2
(5)
1.3 三个重要定理
下面三个定理是FCM-FN模型的重要理论基础[25]
3水平合并运算的框图示例
Fig.3Block diagram example of horizontal merge operation
定理1   垂直合并等价运算。由符号“+”表示的垂直合并操作可根据式(6)完成结点关联。
(A+B)+C=A+(B+C)
(6)
式中,ABC三个节点的从上至下的垂直合并运算与从下到上的垂直合并运算的结果相同。
定理2   水平合并等价运算。由符号“*”表示的水平合并操作可根据式(7)完成结点关联。
(A*B)*C=A*(B*C)
(7)
式中,ABC三个节点的从左至右的水平合并运算与从右到左的水平合并运算的结果相同。
定理3  FN框图示例如图4所示,一个HFS有m个输入{x1x2,···,xm}、m-1个网络节点{N1,1N1,2,···,N1,m-1}、m-2个链接{z1z2,···,zm-2},单输出y,记为拓扑表达式(8)。
N1,1x1,x2z1*N1,2z1,x3z2**N1,m-1zm-2,xmy
(8)
4FN框图示例
Fig.4An example of block-scheme in FN
该FN可以表示成一个SFS,其具有相同的m个输入、单一网络节点N、无链接以及相同的单一输出y,记为拓扑表达式(9)。
j=1m-1 N1,j+k=j+1m-1 Ik,jx1,x2,,xmy
(9)
式中,N=j=1m-1 N1j+k=j+1m-1 Ikj,恒等节点Ikj位于第k层第j级。
2 双驱动预测模型构建
确立数据与知识双驱动的备件需求模糊预测模型的主要工作是模型结构确立和参数估计。变量的数量及规则数决定模型的结构,模糊集参数估计影响非线性拟合系统的准确性。
传统的基于专家知识的模糊模型具有优秀的可解释性。可解释性是本预测模型所追求的主要特征。因为Mamdani型比T-S型规则更具可解释性,所以采用Mamdani型if-then规则。
FCM是一种强大的无监督学习算法,可以生成结构简单且可解释的规则。各种FCM优化模型与元启发式优化算法相结合来提高准确性,如GA[29-30]和粒子群优化算法[31-32](particle swarm optimization, PSO)。GA和PSO的目标都是在避免陷入局部极小值的情况下求全局优化解。GA作为一种以结果为导向的算法,广泛应用于解决非线性、不连续的问题,且容易实现并行计算。因此,采用GA来优化模型中的参数。
该FCM-FN模型,是一种数据与知识双驱动的Mamdani结构模型,其构建过程主要分为四步,流程图如图5所示。第一步,由专家知识生成知识规则库;第二步,采用FCM从数据中模糊聚类生成数据规则库;第三步,通过FN方法合并知识规则库与数据规则库,得到FCM-FN模型的结构;第四步,利用GA对由FCM初始化以及由专家系统初始化的模糊集参数进行优化,在保持可解释结构的同时力图提升准确性。经过以上四个步骤,如图6所示的FCM-FN模型被转换为SFS形式,可用于备件需求预测。
2.1 选择对备件需求影响大的因素
影响备件需求的因素(指标)多种多样。为了降低预测模型的复杂性,只选择对备件需求有较大影响的因素。可以用皮尔逊(Pearson)相关系数与斯皮尔曼(Spearman)等级相关系数来统计变量的相关性,选择数值型输入变量。
图6所示,输入变量xii = 1,2,···,m+n)分两类。数值型输入变量xii=1,2,···,m)为第一类(SET1);语言型输入变量xii=m+1,m+2,···,m+n)为第二类(SET2)。输出变量y为备件需求量。
2.2 生成备件需求预测知识库
知识库包括规则库与数据库两部分,数据库定义规则库中的隶属函数。
设有如式(10)所示的输入输出数据对,进行数据清洗与去重、最大-最小归一化等数据预处理。
5FCM-FN模型流程图
Fig.5Flow chart of FCM-FN model
6FN模型的结构
Fig.6Structure of FN model
x(p);y(p),p=1,2,,N
(10)
式中,xpRmypR
接下来的目标是从式(10)所述的数据对中提取规则来描述SET1中的m个输入变量x=(x1,···,xmTRm对输出变量yR的影响。FCM作为一种强大的无监督学习技术,可用于提取如式(1)所示的Mamdani结构的规则。如图6中的节点N1,1所示,FCM根据SET1样本数据的相似性聚成K类(K为正奇数),并生成K条Mamdani规则。此时,N1,1在这里称为FCM模型,其规则库由这K条规则组成。
SET2中的语言输入和输出值为主观产品评估量(subjective product appraisals,SPA)。为了规则的简洁和可解释性,这些输入输出变量的语言术语集也包含K个元素。SET2的规则源自装备保障专家对备件供应保障的知识储备。
知识库中的数据库与成员函数的类型相关。可以基于算法或专家直觉来指定成员函数的类型。根据已有的研究和作者对概率密度函数的判断,节点N1,1输入变量为高斯隶属函数,其参数θ为高斯曲线的峰值,σ为标准差。这两个参数可由FCM基于样本数据来形成初始值。为了与FCM-FN模型进行对比,经过GA调参后的FCM模型记为FCM-GA模型。
语言型输入变量采用对称三角形隶属函数,因为此类隶属函数易于设计,且其语义上完整[33]。采用aα这两个参数来确定对称三角形隶属函数,a为三角形顶点的横坐标值,2α为三角形底边长。由专家知识初始设置这两类参数的值。
2.3 基于FN的知识库合并
语言型输入变量被组织成如图6所示的HFS结构。首先,将两个输入变量(xm+1xm+2)组织成节点N2,1,其他输入变量通过恒等节点转换后依次加入HFS结构中。最后,到节点N2,n-1时所有n个语言型输入变量已全部并入。恒等节点I1,jj=2,···,n-1)用于组合N2,n-1N1,1N1,n结合数值型输入变量与语言型输入变量。
为了将这些FN节点合并成一个SFS结构,所有节点的规则库依次进行垂直合并与水平合并运算。首先合并节点N1,1N2,1I3,1,···,In,1的规则库,合并的结果命名为V1;采用相同的方法,I1,2N2,2,···,In,2的合并结果为V2;最后一次垂直合并I1,n-1N2,n-1的结果为Vn-1。接下来,所有垂直合并的结果Vi(0< in-1)从前至后依次水平合并。合并后FCM-FN模型的规则库为单一规则库RB,拓扑表达式如式(11)所示。
N1,1+N2,1+I3,1++In,1*I1,2+N2,2++In-1,2+In,2**I1,n-2+N2,n-2+In,n-2*I1,n-1+N2,n-1*N1,nx1,,xm+ny
(11)
将FCM-FN模型中的各规则库合并为等价的单一规则库后,FCM-FN模型被转换为含有m+n个输入、一个输出和一个知识库RB的SFS模型。
2.4 基于GA的调参
为了在不影响模型可解释性的前提下提高准确性,优化过程不改变模型结构,只优化FCM-FN模型中的高斯隶属函数参数(θσ)与对称三角形隶属函数参数(aα)。
三角形成员函数的调参针对图6N2,j j=1,···,n-1)节点,对专家指定的aα的初始值进行调整。为了实现此类调参,需要将N2,j的SPA转换为数值型数据。可采用式(12)完成此项转换。每个语言型输入变量的SPA值来源于专家知识。
DSPAi=i-1K-1,1iK
(12)
式中,i为语言术语集中的以1为起始值的序号。
xm+1xm+nDSPAi值与数据对(x1xm,以及y)组合成新的数据对,两种不同类型的值都被组合进新的数据对中,据此对FCM-FN模型中的参数进行GA优化运算。对模型中的高斯隶属函数参数与对称三角形隶属函数参数初始值进行遗传编码,设置代数g=1并初始种群,判断是否达到终止条件,如果为“否”,则设置g=g+1并进行选择、交叉、变异等遗传操作,将新的参数带入隶属函数,重新计算并判断是否达到优化终止条件,如果仍然为“否”,继续进行遗传操作,如果为“是”,则将优化值赋给知识库中的隶属函数。
通过GA算法完成对参数优化后,知识库RB被更新并为下一步的预测做好了准备。
2.5 生成备件需求预测值
FCM-FN模型是一种SFS形式的多输入单输出系统,主要有四个模块:模糊化、推理机、知识库和解模糊化。模糊化模块将自变量的精确输入转换为语言术语;基于FN的推理机在模糊域中对这些术语及语言术语进行合并运算;知识库由规则库和数据库组成,规则库通过一组规则表征控制目标和控制策略,数据库包含定义其语言的术语集和隶属函数;最后,解模糊模块将输出值从模糊域(语言术语)转换为精确域(数字)[23]
将一组由m个数值型输入变量和n个语言型输入变量所组成的输入向量的值输入FCM-FN模型中,即可得出备件需求预测值。
2.6 性能指标
大多数模型以提高准确性为重点,而FCM-FN模型通过反映各子系统的模块化规则库来保持模型的可解释性和准确性。模型的性能用可解释性指数(explanatory index,EI)和准确性指数(accuracy index,AI)进行衡量。
第一个性能指标EI反映模型的可解释性。Gegov等在文献[25]中提出了一种算法来计算模型透明性TI,如式(13)所示。
TI=t+up+q
(13)
式中,t是输入变量总数,u是输出变量总数,p是非恒等节点的数量,q是非恒等链接数。
显然,模型的透明性是可解释性的基础,模型的参数越多则可解释性越低。在式(13)的基础上提出式(14)来反映模型的可解释性。
EI=t+1p+q×lg(r+s+10)
(14)
式中,1是指此FCM-FN模型只有1个输出变量,r为参数总数,s为被优化参数的总数。EI值越小表示模型的可解释性越高,模型性能越好。
第二个性能指标AI反映模型的准确性,通过对称平均绝对百分比误差(symmetric mean absolute percent error,SMAPE)来衡量,如式(15)所示。
SMAPE=100%ni=1n pi-ripi+ri/2
(15)
式中,n为参与比较的观测值的总数,ri为测试数据集实际值向量上第i个值,pi为模型输出值向量上第i个值。AI值越小表示模型的准确性越高,模型的性能越好。
3 算例分析
为了阐明FCM-FN模型在可解释性和准确性上的优势,建立如图7所示的FCM-FN模型,仅有4个数值型输入变量、3个语言输入型变量、1个输出变量。图7中红色虚线框内的部分即为FCM模型结构。
7算例分析所用的简单FCM-FN模型
Fig.7Simple FCM-FN model for the example analysis
此FCM-FN模型的规则数为K4条。为避免规则数指数级的增加和模型可解释性的恶化,合理设定语言术语集元素的个数很重要。本案例设定每个变量有3个(K=3)语言术语。
3.1 对比可解释性
当模型结构确定后,即可根据式(14)得到FCM、FCM-GA与FCM-FN三类模型的EI值,各模型结构变量值与EI值如表1所示。
1三种模型的可解释性对比
Tab.1 Interpretability comparison of three models
FCM模型中:t=4(4个输入变量),p=1(有1个非恒等节点N1,1),q=0(非恒等链接数为0),r=30(输入输出变量共5个,每个变量有3个语言值,每个语言值由2个参数确定,共30个参数),s=0(无优化的参数)。
FCM-GA模型的EI值计算公式与FCM模型类似,只改变ss=30(所有FCM模型中的30个参数均参与GA算法的优化过程)。
FCM-FN模型中:t=7(7个输入变量),p=4(4个非恒等节点:N1,1N2,1N2,2N1,3),q=3(3个非恒等链接:z1z2z3),r=66(输入输出变量共8个,加上3个非恒等链接数,11个变量一共有参数66个),s=48(8个输入输出变量参与优化,涉及参数48个)。
FCM-GA模型与FCM模型结构相同,但是优化了30个参数降低了可解释性,这也是“黑盒”类模型普遍存在的不足。FCM-FN的EI值显著优于其他两类模型,可解释性明显占优。接下来通过一个算例来比较三类模型的准确性。
3.2 选择因素
选取一器材仓库中一种连续消耗型备件作为算例数据,取样时间区间为2011年1月至2020年12月,采样周期为月,每月消耗数据作为1个样本。备件指标体系由专家知识结合相关系数分析来确定。受篇幅所限省略分析过程,结果为:选取出动次数x1(次)、运行时间x2h)、异常环境温度x3(%)、异常环境湿度x4(%)、操控人员熟练程度x5、维修人员技术水平x6、保障机构成熟度x7 7个备件需求量影响因素作为FCM-FN模型的输入变量,前4个变量的取值来源于数据记录,后3个变量的取值基于专家评判;选取备件发出量y(件)为输出变量。
对120条记录进行数据清洗与去重、最大-最小归一化等数据预处理后,得到如表2所示的118条输入输出数据对。
2归一化后的数据库
Tab.2 The normalized dataset
3.3 生成知识库
节点N2,1N2,2N1,3各含有9(K2)条规则。z2z3有准确的内涵时,这种FN层级结构才容易被理解。这里,z2为人员能力评估,z3为保障能力评估。N2,1N2,2N1,3规则库源于领域专家知识。
对于节点N1,1,输入和输出变量的隶属函数由FCM依表2中的数据集样本训练生成。采用MATLAB-Fuzzy Logic Toolbox(genfis)来生成FCM的模糊推理系统。当目标函数的最小改进(MinImprovement)的变化小于或等于10-8时,FCM算法迭代终止。
3.4 合并知识库
依照2.3节所述的方法,按照FN的理论将图7所示的FN结构进行规则库合并。合并后的FN模型为含有7个输入、1个输出和1个知识库RB(含81条规则)的SFS模型。
3.5 调参
采用MATLAB函数“tunefis”并选择“ga”优化方法来调参。GA算法迭代终止条件为:当最优目标函数值(MinImprovement)的变化小于或等于10-8(使用“tunefis”函数时的ConstraintTolerance值),或达到最大迭代次数(MaxGenerations)时,迭代终止。最大迭代次数分别设为10、50、100、200、400、1 000,依次探索这6种情况下的算例结果。
3.6 算例结果
采用10折交叉验证法对模型AI性能进行验证。数据集随机排序后划分为10份,9份(100条)用于训练,1份(18条)用于测试。FCM、FCM-GA与FCM-FN三种模型在数据集上10次运行后的SMAPE值作为AI性能指标。
分别计算6种迭代次数下SMAPE平均值。经过统计,FCM模型的AI值为27.39%,FCM-GA模型的AI值为22.26%至18.52%,比FCM模型提升了18.72%~32.37%。FCM-FN模型的AI值为20.35%至17.76%,比FCM模型提升了25.69%~35.17%,比FCM-GA模型提升了1.32%~8.58%。
三种模型不同迭代次数下的SMAPE值对比结果如图8所示。柱状统计图中的每一柱为10次运行后SMAPE的平均值,细实线为最大-最小值分布情况。从图中可以明显看出,6种迭代次数下,FCM-FN模型的SMAPE值均小于FCM-GA模型,且这两种模型远小于FCM的SMAPE值,即三种模型中FCM-FN模型的准确性指数最高。另外,从10次运行后得到的最大-最小值分布情况也可以看出,FCM-FN模型的SMAPE值波动范围小于FCM-GA模型,证明FCM-FN模型在准确性指数上更稳定。因此,可以得出结论:FCM-FN模型在准确性指标上优于FCM模型与FCM-GA模型。
8三种模型不同迭代次数下的SMAPE值对比
Fig.8Comparison of SMAPE values for three models with different iteration times
另外还发现,FCM-GA与FCM-FN模型的最优SMAPE值集中在200次与400次迭代时,也就是说对于当前样本量及优化参数数量下,1 000次迭代造成了过拟合,导致模型的准确性降低。后继研究中将对此问题做进一步探讨。
4 结论
本文提出了一种结合FCM、FN和GA方法的FCM-FN备件需求预测模型,采用FCM将数值数据聚类后形成了结构简单、可解释强的规则库;通过FN方法将输入变量映射到输出变量,所有隐含信息都能显现出来;经过GA算法的优化,模型准确性明显提升。FCM-FN模型作为一种特殊的SFS模型,可以将数值数据和语言评估值同时结合到预测模型中,实现了数据与知识双驱动,在数值模型中引入更多的知识信息,显示出了强大的效力。总之,FCM-FN模型比FCM及FCM-GA模型具有更好的可解释性,同时具有更高的准确性。
致谢
英国朴茨茅斯大学Gegov博士邀请第一作者赴该校做一年访问学者并分享模糊网络理论,为本研究提供了基本理论与研究思路,谨致谢意!
1FN的层级式结构示例
Fig.1An example of hierarchical structure in FN
2垂直合并运算的框图示例
Fig.2Block diagram example of vertical merge operation
3水平合并运算的框图示例
Fig.3Block diagram example of horizontal merge operation
4FN框图示例
Fig.4An example of block-scheme in FN
5FCM-FN模型流程图
Fig.5Flow chart of FCM-FN model
6FN模型的结构
Fig.6Structure of FN model
7算例分析所用的简单FCM-FN模型
Fig.7Simple FCM-FN model for the example analysis
8三种模型不同迭代次数下的SMAPE值对比
Fig.8Comparison of SMAPE values for three models with different iteration times
1三种模型的可解释性对比
2归一化后的数据库
韩盛, 李书杰, 陈宗海. 不确定性知识表达的新方法: 灰概率测度集[J]. 系统工程与电子技术,2013,35(5):1018-1022. HAN S, LI S J, CHEN Z H. New representation method for uncertain knowledge:grey probability measure set[J]. Systems Engineering and Electronics,2013,35(5):1018-1022.(in Chinese)
李德毅, 刘常昱, 杜鹢, 等. 不确定性人工智能[J]. 软件学报,2004,15(11):1583-1594. LI D Y, LIU C Y, DU Y,et al. Artificial intelligence with uncertainty[J]. Journal of Software,2004,15(11):1583-1594.(in Chinese)
BACON J B. An interesting uncertainty-based combinatoric problem in spare parts forecasting:the FRED system[C]//Proceedings of the 3rd Conference on Uncertainty in Artificial Intelligence,1987.
李晓燕, 宋建社, 毋文峰, 等. 基于战斗损伤的备件消耗预测仿真建模方法研究[J]. 系统仿真学报,2013,25(增刊1):99-103. LI X Y, SONG J S, WU W F,et al. Research on simulation modeling method of spare parts consumption prediction based on combat damage[J]. Journal of System Simulation,2013,25(Suppl 1):99-103.(in Chinese)
刘喜春, 祝龙石, 张伟. 基于模糊推理的战时备件需求预测[J]. 兵工学报,2013,34(9):1197-1200. LIU X C, ZHU L S, ZHANG W. Demand forecasting of fuzzy inference-based wartime spares[J]. Acta Armamentarii,2013,34(9):1197-1200.(in Chinese)
ROHAAN D, TOPAN E, GROOTHUIS-OUDSHOORN C G M. Using supervised machine learning for B2B sales forecasting:a case study of spare parts sales forecasting at an after-sales service provider[J]. Expert Systems with Applications,2022,188:115925.
杨帆, 王铁宁, 吴龙涛, 等. 基于任务的装备器材非稳态需求预测[J]. 系统工程与电子技术,2019,41(12):2796-2801. YANG F, WANG T N, WU L T,et al. Unstable equipment material demand forecasting based on tasks[J]. Systems Engineering and Electronics,2019,41(12):2796-2801.(in Chinese)
JIANG P, HUANG Y B, LIU X. Intermittent demand forecasting for spare parts in the heavy-duty vehicle industry:a support vector machine model[J]. International Journal of Production Research,2021,59(24):7423-7440.
杨超, 侯兴明, 陈小卫, 等. 新型小规模装备备件品种确定的犹豫模糊粗糙集决策方法[J]. 国防科技大学学报,2022,44(3):201-210. YANG C, HOU X M, CHEN X W,et al. Hesitant fuzzy rough set decision-making method for determining spare parts variety of new small-scale equipment[J]. Journal of National University of Defense Technology,2022,44(3):201-210.(in Chinese)
陈顶, 方志耕, 刘思峰. 可修排队系统备件灰色生灭预测模型[J]. 系统工程理论与实践,2020,40(5):1326-1338. CHEN D, FANG Z G, LIU S F. Grey BD prediction model for spare parts of repairable queuing system[J]. Systems Engineering: Theory & Practice,2020,40(5):1326-1338.(in Chinese)
贺拥亮. 基于改进的神经网络的军械备件需求预测[J]. 火力与指挥控制,2021,46(3):125-130. HE Y L. Ordnance spare parts demand prediction based on improved neural network[J]. Fire Control & Command Control,2021,46(3):125-130.(in Chinese)
BABAI M Z, TSADIRAS A, PAPADOPOULOS C. On the empirical performance of some new neural network methods for forecasting intermittent demand[J]. IMA Journal of Management Mathematics,2020,31(3):281-305.
AKTEPE A, YANIK E, ERSÖZ S. Demand forecasting application with regression and artificial intelligence methods in a construction machinery company[J]. Journal of Intelligent Manufacturing,2021,32:1587-1604.
PINCE C, TURRINI L, MEISSNER J. Intermittent demand forecasting for spare parts:a critical review[J]. Omega,2021,105:102513.
张云景, 王鑫鑫, 王洋, 等. 一种基于证据理论的战时备件需求预测方法[J]. 系统仿真学报,2020,32(2):314-322. ZHANG Y J, WANG X X, WANG Y,et al. Demand forecasting of wartime spares based on evidence theory[J]. Journal of System Simulation,2020,32(2):314-322.(in Chinese)
李浩, 王铁宁. 基于组合预测的装甲装备器材需求确定[J]. 系统工程与电子技术,2018,40(10):2276-2281. LI H, WANG T N. Armored equipment material demand ascertaining based on forecast combination[J]. Systems Engineering and Electronics,2018,40(10):2276-2281.(in Chinese)
郎祎平, 毛文涛, 罗铁军, 等. 间歇性时间序列的可预测性评估及联合预测方法[J]. 计算机应用,2022,42(9):2722-2731. LANG Y P, MAO W T, LUO T J,et al. Predictability evaluation and joint forecasting method for intermittent time series[J]. Journal of Computer Applications,2022,42(9):2722-2731.(in Chinese)
CHANDRIAH K K, NARAGANAHALLI R V. RNN/LSTM with modified Adam optimizer in deep learning approach for automobile spare parts demand forecasting[J]. Multimedia Tools and Applications,2021,80:26145-26159.
DOMBI J, JÓNÁS T, TÓTH Z E. Modeling and long-term forecasting demand in spare parts logistics businesses[J]. International Journal of Production Economics,2018,201:1-17.
LI X, ZHAO X D, PU W. Battle damage-oriented spare parts forecasting method based on wartime influencing factors analysis and ε-support vector regression[J]. International Journal of Production Research,2020,58(4):1178-1198.
程恺, 陈刚, 余晓晗, 等. 知识牵引与数据驱动的兵棋AI设计及关键技术[J]. 系统工程与电子技术,2021,43(10):2911-2917. CHENG K, CHEN G, YU X H,et al. Knowledge traction and data-driven wargame AI design and key technologies[J]. Systems Engineering and Electronics,2021,43(10):2911-2917.(in Chinese)
NAIR M K S, MOHAMED H, JAMIL H A,et al. Forecasting military vehicle spare parts requirement using neural networks followed by application of tacit knowledge[J]. International Journal of Engineering & Technology Sciences,2018,7:13-17.
ARVAN M, FAHIMNIA B, REISI M,et al. Integrating human judgement into quantitative forecasting methods:a review[J]. Omega,2019,86:237-252.
WANG X W, GEGOV A, FARZAD A,et al. Fuzzy network based framework for software maintainability prediction[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems,2019,27(5):841-862.
GEGOV A, ARABIKHAN F, PETROV N. Linguistic composition based modelling by fuzzy networks with modular rule bases[J]. Fuzzy Sets and Systems,2015,269:1-29.
AJA-FERNANDEZ S, ALBEROLA-LOPEZ C. Matrix modeling of hierarchical fuzzy systems[J]. IEEE Transactions on Fuzzy Systems,2008,16(3):585-599.
JOO M G, LEE J S. A class of hierarchical fuzzy systems with constraints on the fuzzy rules[J]. IEEE Transactions on Fuzzy Systems,2005,13(2):194-203.
GEGOV A, SANDERS D, VATCHOVA B. Mamdani fuzzy networks with feedforward rule bases for complex systems modelling[J]. Journal of Intelligent & Fuzzy Systems,2016,30(5):2623-2637.
DING Y, FU X. Kernel-based fuzzy c-means clustering algorithm based on genetic algorithm[J]. Neurocomputing,2016,188:233-238.
JIANG G C, SUN Z J. Improvement on a fuzzy c-means algorithm based on genetic algorithm[J]. Applied Mechanics and Materials,2014,614:385-388.
CHEN S W, XU Z M, TANG Y. A hybrid clustering algorithm based on fuzzy c-means and improved particle swarm optimization[J]. Arabian Journal for Science and Engineering,2014,39:8875-8887.
胡建华, 尹慧琳. 基于PSO-TVAC的中心自适应权的FCM聚类算法[J]. 应用数学进展,2021,10(4):953-962. HU J H, YIN H L. FCM clustering algorithm based on PSO-TVAC algorithm with adaptively weighted centers[J]. Advances in Applied Mathematics,2021,10(4):953-962.(in Chinese)
ESPINOSA J, VANDEWALLE J. Constructing fuzzy models with linguistic integrity from numerical data-AFRELI algorithm[J]. IEEE Transactions on Fuzzy Systems,2000,8(5):591-600.