分位数回归

ZZ 表示一个随机变量,其概率密度函数为 f(z)f(z),累积分布函数为 F(z)F(z)。定义函数

L(Z,Z^)=ρmax(ZZ^,0)+(1ρ)max(Z^Z,0)L(Z,\hat Z)=\rho\cdot\max(Z-\hat Z, 0)+(1-\rho)\cdot\max(\hat Z-Z, 0)

其中 Z^R\hat Z\in \mathbb Rρ(0,1)\rho\in(0,1)。求使得 L(Z,Z^)L(Z,\hat Z) 的期望最小的 Z^\hat Z 的取值。

L(Z,Z^)L(Z,\hat Z) 的期望为

E[L(Z,Z^)]=+L(z,Z^)f(z)dz=ρZ^+(zZ^)f(z)dz+(1ρ)Z^(Z^z)f(z)dz\begin{aligned} \mathbb{E}[L(Z,\hat Z)] &= \int_{-\infty}^{+\infty}L(z,\hat Z)f(z)\mathrm dz\\ &= \rho\int_{\hat Z}^{+\infty}(z-\hat Z)f(z)\mathrm dz + (1-\rho)\int_{-\infty}^{\hat Z}(\hat Z - z)f(z)\mathrm dz \end{aligned}

E[L(Z,Z^)]Z^=0=ρZ^+f(z)dz+(1ρ)Z^f(z)dz=ρ[1F(Z^)]+(1ρ)F(Z^)=F(Z^)ρ\begin{aligned} \frac{\partial \mathbb{E} [L(Z,\hat Z)]}{\partial \hat Z} &= 0\\ &=-\rho\int_{\hat Z} ^{+\infty}f(z)\mathrm dz+(1-\rho)\int_{-\infty}^{\hat Z}f(z)\mathrm dz\\ &=-\rho[1-F(\hat Z)]+(1-\rho)F(\hat Z)\\ &=F(\hat Z)-\rho \end{aligned}

解得

Z^=F1(ρ)\hat Z^*=F^{-1}(\rho)

即使得 L(Z,Z^)L(Z,\hat Z) 的期望最小的 Z^\hat Z 的取值为 ZZρ\rho 分位数。

DeepAR 等模型中,我们的预测目标是某个确定形式的概率分布的参数,通过最大化对数似然来优化网络。如果我们把预测的目标改为分位数,用 L()L(\cdot) 作为损失函数呢?下图是实验的结果:

看起来也不错。且这种方式并不预先假设分布的具体形式,似乎更加通用一些。