Скачиваем датасет о ежедневных ценах закрытия четырех основных европейских фондовых индексов, указанных с 1991 по 1998 год.
Существуют ли в наборе данных взаимосвязанные столбцы?
Вывести среднее значение изучаемой величины и дисперсию.
Изменяется ли диапазон доступных значений с изменением временного
периода или другой подвергаемой анализу характеристики?
Являются ли данные однородными и логически взаимосвязанными или же
предполагают временные изменения в способах измерения или в поведении?
Построить гистограмму абсолютных значений и гистограмму разностей. Сделать выводы.
Построить две диаграммы рассеяния: для определения взаимосвязи между ценами двух акций в отдельные моменты времени и для отслеживания их временных изменений.
Посчитать ковариацию для двух индексов. Вывести график ковариационной матрицы.
Прочитать про ложную корреляцию стр. 135 - 137. Найти и продемонстрировать интересную ложную корреляцию на упомянутом сайте.
Авторегрессия
Стационарный временной ряд характеризуется неизменными во времени статистическими показателями, в частности средним значением и дисперсией.
Его можно представить в виде ряда $X_n$ и шума (последовательности некоррелирующих и одинаково распределенных случайных величин $\varepsilon_i$ с нулевым средним):
Найти стационарный ряд в этих данных. Или привести ряд к стационарному.
Использовать модель авторегрессии (AR) для предсказания следующих значений ряда (могу порекомендовать использовать библиотеку statsmodels):
Определить лаг с помощью графика частичной автокорреляционной функции.
Создать и обучить модель AR.
Построить график.
Cкользящее среднее
Cкользящее среднее - функция, значения которой в каждой точке равно некоторому среднему значению исходной функции за предыдущий период.
Модель скользящего среднего (Moving Average - MA) предназначена для описания процессов, в которых значение в каждой отдельной временной точке является функцией недавних независящих друг от друга компонентов “ошибок”:
$X_t = \sum_{i=0}^q b_i \varepsilon_{t-i}$
Задание 3
Использовать тот же временной ряд, что и в предыдущем задании. Апроксимировать функцию скользящим средним с окнами 3, 5, 10, 50. Построить график.
Построить график предсказания с помощью модели скользящего среднего (MA).
ARMA
Линейные модели типа ARMA (Auto Regression Moving Average - авторегрессия скользящего среднего):
Используя модель авторегрессии скользящего среднего (ARMA) или ее интегрированного варианта (ARIMA), сделать предсказание (построить график). Использовать тот же временной ряд, что и в предыдущем задании.
По вариантам реализовать одну из задач построения или предсказания $n$ значений временного ряда самостоятельно(не используя для этого готовые высокоуровневые библиотеки). Выше заданы уравнения для моделей, вам нужно по ним сгенерировать временной ряд (любые p, q, {a}, {b}), либо продолжить существующий ряд предсказанием (значения p, q, {a}, {b} можно взять из обученной модели из предыдущего пункта).