7.6 回归预测

7.6 回归预测

事前预测与事后预测

当我们将回归模型用于时间序列数据时,根据假设的不同,模型可以生成不同类型的预测值。

事前预测 是仅使用预先提供的信息进行预测。例如,对美国季度消费百分比变化的事前预测应仅使用2016年第三季度以前可用的信息。这是使用当前所有可用信息进行的预测。因此,为了生成事前预测,模型需要预测变量的预测值。为获得预测变量的预测值,我们可以使用5.2节中介绍的方法,或采用第9章中更复杂的纯时间序列方法。或者还可以采用其他来源(例如政府部门)的预测值。

事后预测 是使用后来的预测变量信息进行的预测。例如,消费的事后预测可以使用预测变量的实际观察进行预测。这些不是真正的预测值,但对研究预测模型的行为很有用。

不应使用预测期内的数据估计事后预测模型。也就是说,事后预测应该假设预测变量(\(x\))已知,而被预测变量(\(y\))未知。

对事前预测和事后预测的比较评估有助于区分预测不确定性的来源。这将表明预测误差是由于预测变量的预测偏差还是由于预测模型效果不佳所引起。

示例:澳大利亚季度啤酒产量

一般来说,在事前预测中,我们不能使用预测变量的未来实际值,因为我们无法得知它们的未来值。然而,7.4节中介绍的特殊因子都是事先已知的,它们基于日历变量(例如,季节性虚拟变量或公共假日指标)或时间的确定性函数(例如时间趋势),在这种情况下,事前预测和事后预测没有区别。

recent_production <- aus_production |>

filter(year(Quarter) >= 1992)

fit_beer <- recent_production |>

model(TSLM(Beer ~ trend() + season()))

fc_beer <- forecast(fit_beer)

fc_beer |>

autoplot(recent_production) +

labs(

x="年份",

y = "啤酒产量(万升)",

title="利用回归模型预测啤酒产量"

)

图7.17: 啤酒生产回归模型的预测。暗阴影区域表示80%的预测区间,浅阴影区域表示95%的预测区间