Я уже рассмотрела AR и I и MA, теперь для завершения краткого описания модели мне осталось рассмотреть ту часть, которая в аббревиатуре зашифрована буквой X - «eXtended».
Целью расширения всякой модели прогнозирования является добавление в нее учета внешних факторов.
Расширение модели ARIMAX имеет дело с моделью авторегрессии AR(p). В заметке об авторегрессии я писала, что формула для определения Z(41) выглядит следующим образом и называется авторегрессией порядка p:
![Модель авторегрессии](/sites/default/files/images/04_arimax/ar-p.png)
Если же нам нужно добавить в модель учет, например, двух показателей, представленных в виде временных рядов X(t) и Y(t), то выражение авторегрессии будет иметь вид
![Модель авторегрессии](/sites/default/files/images/04_arimax/ar-p-x.png)
Мы видим, что в линейную комбинацию добавлены два члена (их называют регрессорами), которые позволяют учет значений рассматриваемых внешних факторов.
Коэффициенты данной линейной регрессии находятся аналогичным образом при помощи метода наименьших квадратов для набора уравнений
![Модель авторегрессии](/sites/default/files/images/04_arimax/matrix-ar-x.png)
Имея все фактические значения Z(t), X(t) и Y(t), мы легко составляем систему для определения коэффициентов. Подробно пример использования метода наименьших квадратов приведен в диссертации в разделах 3.1. Алгоритм экстраполяции временного ряда без учета внешних факторов и 3.2. Алгоритм экстраполяции временного ряда с учетом внешних факторов.
Учет будущих значений внешних факторов в модели прогнозирования
Важно отметить, что в моделях прогнозирования внешние факторы, то есть показатели X(t) и Y(t) должны учитываться в соответствующие моменты времени. Если мы прогнозируем временной ряд Z(t) на завтра, то нам нужно иметь под рукой значения внешних факторов X(t) и Y(t) на то же самое завтра, иначе модель будет работать некорректно.
Самым простым примером внешнего фактора для временного ряда потребления электроэнергии является температура воздуха. Целый ряд исследований был проведен по данному вопросу и в настоящее время множество моделей прогнозирования потребления электроэнергии включают учет влияния температуры окружающей среды. Однако при прогнозировании в модели учитываются не фактические значения, а прогнозные. Их, как правило, предоставляют специализированные сервисы, например, ГисМетео.
Дополнительные разъяснения по этому вопросу приведены в диссертации 2.2.4 Описание модели
Влияние количества внешних факторов в модели на точность прогнозирования
Я не едижожны слышала от дилетантов мнение о том, что модель прогнозирования тем точнее, чем большее число внешних факторов мы в ней учтем. Это принципиально неверное положение!
Мы используем в модели, как правило, будущие значения внешних факторов, которые или спрогнозировали заранее, или получили откуда-то из вне, например, прогноз температуры на завтра у ГисМетео. Таким образом, каждый внешний фактор несет в себе ошибку собственного прогноза и эта ошибка может быть большой, а потому самым негативным образом сказаться на точности прогнозирования искомого временного ряда.
Из личного опыта, из статей, с которыми знакома, заключу, что в авторегрессионных моделях прогнозирования следует учитывать не более 3 внешних факторов. В нейросетевых моделях, которые работают несколько иначе, число внешних факторов иногда увеличивают до 5.
Доброго времени суток, Ирина!
Подскажите, будьте добры, если в курсе, как и в какой модели можно использовать фактические значения внешних факторов, если они качественные. Например, период экономического кризиса или ухуджение полит. ситуации в стране. Спасибо!
Татьяна, добрый день!
Вам подойдут нейронные сети (ANN) и классификационно-регрессионные деревья (CART).