Лабы

Статистический анализ

Читаем Нильсон, Э. Практический анализ временных рядов (2021) со стр. 106.

Задание 1

Скачиваем датасет о ежедневных ценах закрытия четырех основных европейских фондовых индексов, указанных с 1991 по 1998 год.

  • Существуют ли в наборе данных взаимосвязанные столбцы?
  • Вывести среднее значение изучаемой величины и дисперсию.
  • Изменяется ли диапазон доступных значений с изменением временного периода или другой подвергаемой анализу характеристики?
  • Являются ли данные однородными и логически взаимосвязанными или же предполагают временные изменения в способах измерения или в поведении?
  • Построить гистограмму абсолютных значений и гистограмму разностей. Сделать выводы.
  • Построить две диаграммы рассеяния: для определения взаимосвязи между ценами двух акций в отдельные моменты времени и для отслеживания их временных изменений.
  • Посчитать ковариацию для двух индексов. Вывести график ковариационной матрицы.
  • Прочитать про ложную корреляцию стр. 135 - 137. Найти и продемонстрировать интересную ложную корреляцию на упомянутом сайте.

Авторегрессия

Стационарный временной ряд характеризуется неизменными во времени статистическими показателями, в частности средним значением и дисперсией.

Его можно представить в виде ряда $X_n$ и шума (последовательности некоррелирующих и одинаково распределенных случайных величин $\varepsilon_i$ с нулевым средним):

$X_t = F(X_{t-1}, …, X_{t-p}, \varepsilon_t, …, \varepsilon_{t-k})$

В авторегрессионной модели (AR) значения временного ряда в данный момент линейно зависят от предыдущих $p$ значений этого же ряда:

$X_t = a_0 + \sum_{i=1}^p a_t X_{t-i} + \varepsilon_t $

Задание 2

  • Найти стационарный ряд в этих данных. Или привести ряд к стационарному.
  • Использовать модель авторегрессии (AR) для предсказания следующих значений ряда (могу порекомендовать использовать библиотеку statsmodels):
    • Определить лаг с помощью графика частичной автокорреляционной функции.
    • Создать и обучить модель AR.
    • Построить график.

Cкользящее среднее

Cкользящее среднее - функция, значения которой в каждой точке равно некоторому среднему значению исходной функции за предыдущий период.

Модель скользящего среднего (Moving Average - MA) предназначена для описания процессов, в которых значение в каждой отдельной временной точке является функцией недавних независящих друг от друга компонентов “ошибок”:

$X_t = \sum_{i=0}^q b_i \varepsilon_{t-i}$

Задание 3

  • Использовать тот же временной ряд, что и в предыдущем задании. Апроксимировать функцию скользящим средним с окнами 3, 5, 10, 50. Построить график.
  • Построить график предсказания с помощью модели скользящего среднего (MA).

ARMA

Линейные модели типа ARMA (Auto Regression Moving Average - авторегрессия скользящего среднего):

$X_t = a_0 + \sum_{i=1}^p a_t X_{t-i} + \sum_{i=0}^q b_i \varepsilon_{t-i}$

Задание 4

  • Используя модель авторегрессии скользящего среднего (ARMA) или ее интегрированного варианта (ARIMA), сделать предсказание (построить график). Использовать тот же временной ряд, что и в предыдущем задании.
  • По вариантам реализовать одну из задач построения или предсказания $n$ значений временного ряда самостоятельно (не используя для этого готовые высокоуровневые библиотеки). Выше заданы уравнения для моделей, вам нужно по ним сгенерировать временной ряд (любые p, q, {a}, {b}), либо продолжить существующий ряд предсказанием (значения p, q, {a}, {b} можно взять из обученной модели из предыдущего пункта).
№ варианта Реализовать
1 Построение модели AR(p)
2 Предсказание моделью AR(p)
3 Построение модели MA(q)
4 Предсказание моделью MA(q)
5 Построение модели ARMA(p,q)
6 Предсказание моделью ARMA(p,q)