灵魂拷问：是否真的需要深度学习模型来预测时间序列？

背景

这一篇文章类似于 Rethinking 系列，主要想法来自于文章 Do We Really Need Deep Learning Models for Time Series Forecasting?。学术界不断增加模型复杂度以增加创新，而工业界就需要考虑模型的实际效果和模型解释性了，这一篇文章就通过实验证明：在时间序列预测任务中只要特征工程和模型参数处理合适，最经典的树模型预测效果同样优于最新的深度学习模型！

众所周知，与传统技术相比深度模型的一个主要缺点是过于复杂。与深度神经网络(DNN)模型相似，这篇文章中将时间序列预测任务转化为基于窗口的回归问题，通过实验证明经典模型 梯度推进回归树(GBRT)模型 的预测效果优于深度学习模型的结果。👍

既然是对比模型效果，那么就需要一些基准数据集和评价指标。

数据集

本文采用的数据集如下：

注： $M=0$ 表示单指标，其它为多元序列。

本文采用的评价指标如下：

其中 $y_{i}$ 为观测值， $\hat{y}_{i}$ 为预测值。

RMSE：（Root Mean Squard Error）均方根误差
$\sqrt{\frac{1}{m} \sum_{i=1}^{m}\left(y_{i}-\hat{y}_{i}\right)^{2}}$
WAPE：（Weighted Absolute Percentage Error）加权绝对百分比误差
$\mathrm{WAPE}=\frac{\sum_{i}\left|y_i-\hat{y}_i\right|}{\sum_{i}\left|y_{i}\right|}$
MAE：（Mean Average Error）平均绝对误差
$\frac{1}{m} \sum_{i=1}^{m}\left|\left(y_{i}-y_{i}\right)\right|$