Это спарсенные через API данные расписания Московского общественного транспорта. В изначальном файле
pred_data.csv лежат записи того, во сколько времени, по данным системы, приедет автобус. Предсказание системы может
меняться, поэтому в изначальном дата-сете много похожих строк, с разницей от нескольких секунд до десятков минут.
Полученная база покрывает не весь транспорт Москвы. Мы собирали лишь некоторые остановки, выбирая их таким образом, чтобы покрыть все существующие в Москве маршруты. Стоит учитывать, что при дальнейшей очистки, условие про включение всех маршрутов в выборку может быть недействительным.
Посмотреть скрипт очистки данных и сами дата-сеты можно на отдельной странице
вот здесь. Давайте вместе включаться в изучение городских данных. Регистрируйтесь на наш дата-челлендж через кнопку ниже!