由于城市道路交通符合网络数据集的典型结构特征,本文将一般网络数据的研究方法,运用于城市道路交通网络的分析中,即将道路视为顶点,路口的每个可行驶方向视为连接顶点的有向边,构建道路交通网络的有向图结构.
其中,与(2.1)不同的是,(2.2)中相邻顶点处响应变量对应的回归系数$\boldsymbol{\eta}=(\eta_1,\ldots,\eta_d)^\top$为$d$维待估参数向量.
其解的形式为:
其中,$\boldsymbol{\varepsilon}_t=(\varepsilon_{1,t},\ldots,\varepsilon_{d,t})^\top$.特别地,若$\varepsilon_{i,t}$独立同分布于标准正态分布,即$\varepsilon_{i,t}\simN\left(0,\sigma^{2}\right)$,严格平稳解服从正态分布,均值$\boldsymbol{\mu}$和协方差矩阵$\boldsymbol{\Sigma}$分别为:
进一步,若
定义$\boldsymbol{\Omega}=\left\{\boldsymbol{\Omega}\in\mathbb{R}^{\infty}:\sum_{i=1}^\infty\left\vert\omega_{i}\right\vert<\infty\right\}$,其中$\boldsymbol{\Omega}=\left(\omega_{i}\in\mathbb{R}^{1}:1\leqi\leq\infty\right)^{\top}\in\mathbb{R}^{\infty}$.对于任意$\boldsymbol{\Omega}\in\boldsymbol{\Omega}$,令$\boldsymbol{\Omega}_{d}=\left(\omega_{1},\cdots,\omega_{d}\right)^{\top}\in\mathbb{R}^{d}$是截断的$d$维向量.若${\bf{Y}}_{\cdot,t}$满足下列条件:$\forall\boldsymbol{\Omega}\in\boldsymbol{\Omega}$,
(ⅰ)$Y_{t}^{\omega}=\lim_{d\rightarrow\infty}\boldsymbol{\Omega}_{d}^{\top}{\bf{Y}}_{\cdot,t}$几乎必然存在,
(ⅱ)$\left\{Y_{t}^{\omega}\right\}$是严格平稳的,
(ⅲ)${\bf{Y}}_{\cdot,t}$具有有限的一阶矩,即$\underset{1\leqi\leq\infty}{\max}E\left\vertY_{it}\right\vert<\infty$,
其中
$\boldsymbol{\beta}=\left(\beta_{0},\beta_{1}\right)^\top\in\mathbb{R}^{2}$,且$\lambda>0$为调节参数,$\vert\cdot\vert_r$表示向量的$\ell_r$-范数,$1\leqr\leq\infty$.根据优化问题(3.1)的Karush–Kuh–Tucker条件,可以得到如下等式:
其中${{\bf{X}}}_{i,t}=\left(1,Y_{i,t}\right)^{T}$,${\bf{X}}_{\cdot,t}=\left({{\bf{X}}}_{1,t},\cdots,{{\bf{X}}}_{d,t}\right)^{\top}$,且$\widehat{{\bf{H}}}={\rmdiag}(\widehat{\boldsymbol{\eta}})$.由于(3.1)中的目标函数是凸函数,通过(3.3)和(3.4)中的关系,本文运用交替迭代的方式结合坐标下降算法以求优化问题的最优解.记$\Pi_{\theta,m}({\bf{v}})=(v_1,\ldots,v_{m-1},0,v_{m+1},\ldots,v_d)^{T}$为作用在向量${\bf{v}}=(v_1,\ldots,v_d)^{T}$上的投影算子.所提算法的迭代过程如下:
其中$L^{\left(m\right)}\left(\cdot\right)$为第$m$次分割的损失函数
本文通过求取${\rmCV}\left(\lambda\right)$的最小值点以得到调节参数$\lambda$的选取值.
值得注意的是,由于正则化方法只给出了参数的估计值,而对于其假设检验问题未曾涉及.显然,该问题具有更大的挑战性.鉴于此,这些统计结论均为描述性的,其显著性如何尚未考究.