рекомендации

четверг, 6 января 2022 г.

Временные ряды для начинающих. Часть 3. Прогнозирование

Первая часть
Вторая часть

Теперь, когда мы рассмотрели основы анализа временных рядов, мы наконец можем погрузиться в прогнозирование!

3.1 Что такое прогнозирование?

Прогнозирование - это просто процесс использования прошлых значений данных для обоснованного прогнозирования будущих значений данных. Как было сказано в предыдущей главе, если вы хотите делать хорошо обоснованные прогнозы, временные ряды должны быть стационарными. Это может быть сделано путем подбора модели arima с помощью функции auto.plot() в пакете forecast. Затем все, что вам нужно сделать, это применить функцию forecast(), чтобы получить прогноз! Функция forecast() может принимать другой аргумент вместе с вашей моделью. Вы также можете ввести h, желаемое количество прогнозируемых периодов времени. Эта функция очень удобна для анализа временных рядов в реальном мире.

Прогнозирование используется во многих областях по всему миру. Вы часто можете видеть прогнозы в сфере бизнеса и финансов для компаний, которые хотят спрогнозировать свою прибыль или расходы. Прогнозирование также можно использовать для прогнозирования цен на акции! В экономической сфере также широко используются временные ряды и прогнозирование для прогнозирования поведения общества. Это всего лишь несколько примеров использования множества временных рядов и прогнозов в реальном мире.

3.2 Пример: глобальная температура

Давайте теперь сделаем прогноз на основе наших данных о глобальной температуре. Как вы видели, мы сопоставили данные с SARIMA (2,1,3) (1,0,0) 12. Теперь, когда у нас есть наша модель, мы можем просто использовать функцию forecast(ts, h) из пакета forecast. Как уже упоминалось, h представляет собой количество наблюдений, которые мы хотим предсказать в будущем. Допустим, мы хотим спрогнозировать будущее на 5 лет. Поскольку наши данные закончились в декабре 2016 года, следующие 5 лет будут включать каждый месяц с января 2017 года по декабрь 2022 года. Более того, поскольку наши наблюдения проводились каждый месяц, мы можем установить h равным 12 х 5 = 60. Давай посмотрим что происходит.


Исходный временной ряд отображается темно-синим цветом, а прогнозируемые данные - красной линией. Серая заливка вокруг предсказанных значений представляет 95% доверительный интервал. Это просто означает, что мы на 95% уверены, что точка данных в момент времени t окажется между двумя границами. Вы можете изменить доверительные интервалы в функции forecast и даже просмотреть границы доверительного интервала в прогнозируемом объекте.

Что вы можете извлечь из этой прогнозной модели?

Похоже, что в 2017 году средний перепад температур снизится, однако кажется, что он постепенно снова будет расти. Это согласуется с тем, что мы видим в остальных данных. Кажется, что за последние 66 лет температура время от времени снижалась, но затем постепенно повышалась. Похоже, это довольно хороший прогноз.

Есть много других методов для создания модели данных временных рядов. Вы также можете проверить, какой из предикторов является лучшим, посмотрев на среднюю абсолютную ошибку (MAPE). Это выходит за рамки этого короткого руководства, но я рекомендую вам почитать об этом здесь.


Оригинал: Chapter 3 Forecasting

Комментариев нет:

Отправить комментарий