Прогнозирование телесмотрения

7 сообщений / 0 новых
Последнее сообщение
Прогнозирование телесмотрения

Добрый день.

 

Передомной стоит задача написания приложения, которое бы прогнозировала телесмотрение (на которое влияет много факторов: сезонность, погода, доля каналов  и тд), прогнозировала рейтенг рекламного блока, так же могло анализировать рекламные блоки на основе передачи которая в которой они размещены и определять насколько он "надежен" (то есть что не будет каких-то глобальных изменений в рейтингах).

 

Подскажите, пожалуйста, с чего начать, что почитать?

 

Спасибо.

Добрый день!

Добрый день!

Интересная у вас тема! Я бы начала с того, что прочитала об этом что-то совсем общее, например, статью в википедии на тему television advertisement. Потом бы разобралась в основах планирования, например, в Introduction to TV Planning. И уж после подумала о том, что конкретно мне нужно для поставленной задачи.

Рекомендации: общие вещи читать на английском, к математическому моделированию подходить тогда, когда вы четко разобрались с предметной областью и понимаете, как будете использовать результат расчета модели.

Удачи!

----------------------
Ирина Чучуева,
команда Математического бюро

Ирина,

Ирина,

 

Я уже около года работаю в этой области, по этому понимаю как происходят все процессы. К тому же у меня есть вся нужная информация и собственно данные, которые ежедневно обновляються.

На данный момент система прогнозирования которую используеться очень примитивная: 24 часа разбиваються на интервалы в 15 минут(разбитие происходит для всех дней недели)  и для каждого канала считаеться средней рейтинг за 3 недели (в случаи аномальных недель, береться меньше значение). Затем есть еще сезонность то есть это средний рейтинг всех каналов на неделе (высчитываеться коефициент: текущая неделя/среднее 3-х передыдущих недель).

Дальше у меня есть выход с приблезительным временем. Находиться 15-ти минутный интервал в который он входит и это значение домножаеться на коефициент сезонности.

 

Вот и все планирование :) В дальнейшем уже сам предполагаю будет падение или рост, тем самым внося коррективы в недельный коефициент, но это все сроди гадания на кофейной гущи.

 

Меня интересует именно математическая часть. По этому задачей являеться улучшение точности планирования (я хочу привязать сюда погоду, как пример, которую парсил бы из какого-то приличного интернет ресурса, внося соотвествующие коррективы) и нахождения критических рекламных блоков, у которых высокая вероятность значительного изменения рейтинга.

 

К тому же есть еще такое понятие как доля каналов, она тоже изменяеться, то есть происходит переток с одного канала аудитории на другой и тд.

 

Спасибо.

 

Цитата:Меня интересует именно
Quote:
Меня интересует именно математическая часть.

А, вон как обстоят дела.

Итак, что мы имеем? Временной ряд показателя рейтинга с шагом 15 минут, на который оказывают влияния различные по природе факторы (с ваших слов):

  1. сезонность (различная: месяцы, недели, часы суток),
  2. погода (наверное, в первую очередь осадки),
  3. наличие/отсутствие критических рекламных блоков (я так понимаю, что эта та паршивая реклама, на которой человек переключает канал),
  4. доля каналов.

Раз дело обстоит таким образом, то стоит попробовать использовать нейронные сети. Они работаю как с количественными показателями (например, осадки в мм), так и с качественными, переведенными в цифры (0/1 в зависимости от того, есть ли критический рекламный блок).

Для работы с нейронными сетями нужно

  • или знать программирование
  • или использовать пакет Weka, который позволяет делать сеть при помощи кнопок
  • .

Ссылки на источники погоды могу выложить, у меня была подборка открытых источников с прогнозами погоды.

----------------------
Ирина Чучуева,
команда Математического бюро

chuchueva wrote:

chuchueva wrote:

Ссылки на источники погоды могу выложить, у меня была подборка открытых источников с прогнозами погоды.

Буду благодарен.

 

Еще такой вопрос: передачи на ТВ деляться по категориям: сериалы, новости, ток-шоу и тд. К примеру на каналах есть сериалы которые идут годами, у которых сложилась своя аудитория и следовательно, изменения рейтингов таких сериалов будет не значительно (если учесть все остальные факторы влияющие на смотрение), но в тоже время есть передачи которые могут сегодня набрать много рейтингов, а завтра мало. Или к примеру на канале может старовать сериал который ранее не транслировался вместо сериала который шел продолжительное время. 

 

Каким образом можно проанализировать такие данные и построить модель которая могла бы грубо говоря ставить бал конкретной программе который бы показывал на сколько она надежна?

 

Спасибо.

Цитата:Каким образом можно
Quote:
Каким образом можно проанализировать такие данные и построить модель которая могла бы грубо говоря ставить бал конкретной программе который бы показывал на сколько она надежна?

Проанализировать данные стоит в первую очередь глазами: внимательно посмотреть на графики и сделать агрегации (среднее значение, суммы) для различных разрезов времени. Боюсь, что дать общие рекомендации мне будет сложно, так как такого сорта задач не решала. Попробуйте посмотреть англоязычную литературу на эту тему: как это делают продвинутые специалисты. Возможно, найдете идеи, которые будут применимы к вашим данным.

Ссылки на прогноз погоды

  1. Норвежский сервис погоды www.yr.no
  2. Британский сервис погоды www.weatheronline.co.uk
  3. Очень древний Американский архив погоды
  4. Отечественный сервис бесплатных прогнозов погоды
  5. Сервис погоды от Wikipedia.org, данные можно получать по API http://openweathermap.org

Если найдете что-то еще, то пишите!

----------------------
Ирина Чучуева,
команда Математического бюро

Цитата:К примеру на каналах
Quote:
К примеру на каналах есть сериалы которые идут годами, у которых сложилась своя аудитория и следовательно, изменения рейтингов таких сериалов будет не значительно

Мне подумалось, что тип передачи можно сделать качественным параметром. Например, передачи с очень постоянным рейтингом обозначить 1, передачи с более или менее постоянным — 2, с переменчивым — 3 и т.д. То есть исходя из качества передачи и ее аудитории, сформировать ей тип и использовать этот тип при прогнозе. При формировании типов можно использовать кластеризацию: задаться количеством типов и математически разнести передачи по кластерам (типам). Смотрите, например, метод К-средних.

----------------------
Ирина Чучуева,
команда Математического бюро

2010 - 2018 © Математическое бюро

Все права защищены в соответствии с законодательством РФ

При полном или частичном использовании материалов ссылка на сайт обязательна