Разработка Finepromo: выявление сезонности. Часть 1
Анализ временных рядов — далеко не самая простая часть работы аналитика, однако, если овладеть этим инструментом, то из полученных данных можно прогнозировать число конверсий и оптимизировать расходы.
В статье будут показаны результаты применения простейших математических моделей анализа временных рядов с объяснением на максимально простом языке.
Изначально в нашем распоряжении был набор данных, в котором отражалось число конверсий по дням, в разрезе по городам. Целью было выявление трендов и сезонности и ответы на вопросы:
- Как ведут себя конверсии в зависимости от числа, дня недели?
- Есть ли некоторые общие шаблоны или же процесс в большинстве своем случаен?
Выявление сезонности
Если отобразить количество конверсий суммарно по всем городам, в зависимости от времени, то график будет выглядеть следующим образом:
Достаточно сложно, основываясь только на визуальной составляющей, делать какие-либо выводы относительно выявления сезонности. Прежде чем приступать к анализу, сперва “на пальцах” дадим определение таким понятиям, как корреляция и автокорреляция.
Под корреляцией двух графиков будем понимать степень схожести их поведения. То есть, если в основном при возрастании/убывании первого графика, второй график также возрастает/убывает, то можно говорить о сильной корреляции между ними. Покажем на примере:
Как мы видим, все три графика ведут себя похожим образом. Они возрастают и убывают на одних и тех же промежутках. Причем нам не столько важны значения в конкретных точках, сколько общее поведение графиков. Рассмотрим теперь другой пример:
Здесь между красным и зеленым графиками сохраняется сильная корреляция. Там, где возрастает/убывает красный график, зеленый ведет себя похожим образом. Однако, синий график здесь ведет себя абсолютно по-другому. Там, где убывают два остальных, он возрастает, и наоборот. Можно сказать, что он ведет себя как бы “зеркально”. В этом случае мы говорим о сильной отрицательной корреляции.
Если графики ведут себя абсолютно независимо и нет ни схожести в поведении, ни зеркальности, то будем говорить об отсутствии корреляции.
Теперь, когда у нас есть общее представление о корреляции, дадим понятие такому термину, как автокорреляция.
До этого мы говорили о корреляции между двумя, тремя и т.д. графиками. Но конкретно в нашей задаче есть всего один график — количество конверсий по дням. О корреляции между чем и чем будет идти речь? Всё очень просто: будем сравнивать наш исходный график с ним же самим, но сдвинутым на определенное число дней. Идея заключается в следующем: сдвинем наш график на один день вправо, и посчитаем корреляцию (степень схожести) между сдвинутым графиком и исходным. Затем сдвинем график уже на два дня, и опять посчитаем корреляцию. Будем проделывать такую операцию дальше и дальше, пока не посчитаем корреляции для всех сдвигов. И теперь, если изобразить зависимость корреляции от числа сдвигов, то картина может проясниться. Для нашего примера имеем следующую визуализацию:
О чем нам говорит график? Здесь невооруженным глазом видна цикличность. Также видно, что пики приходятся на 7-ой, 14-ый, 21-ый, 28-ой и т.д. дни. Напомню, что на графике показано то, как ведет себя корреляция (степень схожести) от числа сдвигов. То есть, если сдвинуть наши данные на одну, две, три и т.д. недель, то сдвинутый график будет очень похож на исходный. Это значит, что общая модель поведения повторяется из недели в неделю. Следовательно, можно сделать вывод о существовании недельной сезонности.
Надеемся, наша статья будет вам полезна! В следующей части расскажем о том, как с помощью математических моделей выявить трендовую составляющую.
Для запуска рекламы в интернете вы всегда можете обратиться в наше агентство — позвоните по номеру телефона, указанному на сайте, или оставьте заявку через форму!
Добавить комментарий