1.一种多维时间序列的定量因果关系判定方法,其特征是:能够定量地估算出多维时间序列间的因果关系的大小与方向,具体实施方案如下:步骤1,采集m条时间序列,每条序列对应一个事件,m条时间序列分别为X1,X2,…,Xm;
步骤2,对每条时间序列进行预处理,得到具有相同时间间隔的多条时间序列;
步骤3,当步骤2中的某些时间序列不平稳时,需对这些序列进行进一步处理,使之变得近似平稳;当步骤2中的时间序列平稳时,进行步骤4;
步骤4,计算各个时间序列之间定量、定向的因果关系;具体计算方法如下:给定m条平稳、等距的时间序列X1,X2,…,Xm,记由Xj到Xi,i,j=1,2,..,m,i≠j的信息流为Tj→i,则Xj和Xi之间的因果关系可由根据Tj→i与Ti→j来进行判断,Tj→i可由下式估算:其中, 为信息流Tj→i的最大似然估计值; 为m条时间序列X1,X2,…,Xm的协方差矩阵;detC为C的行列式;△jk为Cjk的代数余子式;Ck,di为Xk与一条导出序列 之间的协方差,导出序列的定义为:△t为该序列的时间间距;
当 显著地不为零时,则Xj是Xi的因, 就是因果关系的大小;
步骤5,对步骤4中的计算得到的各两两时间序列之间的因果关系数据进行整合,得到完整的因果关系网络图;
通过获取多地区PM2.5浓度监测站的某个时间段内的大气中的PM2.5浓度数据,形成相应的时间序列,通过计算得出多地点之间的雾霾因果网络图,进而找到一个或多个主源头。
2.根据权利要求1所述的一种多维时间序列的定量因果关系判定方法,其特征在于:在步骤3中得到的数据平稳的时间序列中选取时间点tn,以时间点tn为中心取时间窗口[tn‑L/
2,tn+L/2],在时间长度为L的时间窗口条件下执行步骤4和步骤5,得到时间点tn处的因果关系网络图;
按照时间序列中的时间顺序顺次取不同位置的时间点,重复执行步骤4和步骤5,得到随时间变化的因果关系网络图。
3.根据权利要求1或2所述的一种多维时间序列的定量因果关系判定方法,其特征在于:所述的步骤4中所得的 必须做显著性检验,用以判定它是否显著地异于零、抑或不显著地异于零,当显著性检验结果显著地异于零时,则证明两事件之间有因果关系,当显著性检验结果不显著地异于零时,则证明两事件之间的因果关系不显著;所述的显著性检验的具体流程如下:将Xi和Xj排列至第一、二的位置, 转换为 在推导步骤4的公式的过程中,我们用到了下述线性模型:其中,X=(X1,X2,...,Xm)是状态矢量,在这里即表现为m条时间序列, 是白噪声,(f1,b1,a11,a12,...,a1m)是待估计的参数,可以证明,这些参数的最大似然估计为:其中 是序列Xk的算术平均值; 是序列 的算术平均值;
N为序列长总时间步数,根据中心极限定理,
近似服从一个正态分布,这里只需用到 记其方差为
它与Fisher信息矩阵I有关,而Fisher信息矩阵I的计算如下:记n时间点的状态矢量X=(X1,X2,...,Xm)为X(n),n=1,2,...,N,假设已知X(n)=(X1,n,X2,n,...,Xm,n)的情况下,下一步的状态矢量X(n+1)=(X1,n+1,X2,n+1,...,Xm,n+1)的概率密度,即转移概率密度为ρ,则Fisher信息矩阵乘上时间总步数N为可以证明上式为:
此矩阵中a1j,f1,b1用其估计值 代替;
对所得的矩阵NI求逆,则所得逆阵的第四个对角分量 即方差 的估计值;
的方差则为:
给定置信水平α,查标准正态分布表得置信区间系数zα,进一步求得 的标准差为换言之,对于置信水平α,X2至X1的真实因果性的置信区间为:当该置信区间不包括零在内,则X2是X1的因;反之则因果性不显著;对于任意序列Xi与Xj之间的因果关系的显著性检验,则只需把Xi与Xj放置到第一、二的位置,重复以上步骤即可。
4.根据权利要求3所述的一种多维时间序列的定量因果关系判定方法,其特征在于:当置信水平设置为90%时,置信区间系数zα=1.65,此时置信区间为:当置信水平设置为95%时,置信区间系数zα=1.96,此时置信区间为:当置信水平设置为99%时,置信区间系数zα=2.56,此时置信区间为:
5.根据权利要求3所述的一种多维时间序列的定量因果关系判定方法,其特征在于:当Xi和Xj之间的因果关系不显著时,不能简单断定它们之间不存在因果关系,在资料、数据允许的情况下,应扩大数据样本,重复执行步骤1到步骤4。