Сколь, веревочка, ни вейся - все равно совьешься в кнут.
Начала колупать датасет. Казалось бы, всего четыре колонки. Сколько данных можно наскрести из четырех колонок?
За два часа датасет расширился до 4-х колонок. И это я еще до механической обработки самих записей не дошла, про смысловую вообще молчу.
Кажется, это будет гораздо увлекательней, чем мне казалось.
Пишу вот, например, вот эту хистограмму. И понимаю, что надо разбить часы на времена суток, и посмотреть на графики по ним.
![](https://diary.ru/resize/-/-/1/3/5/6/1356/TWbtY.png)
А потом еще ручки чешутся классифицировать самых активных пользователей по предпочитаемому ими времени активности, а также средним и медианным временем записи.
При этом до самого исследования я пока даже близко не дошла. Это этап первичной обработки данных: самый длинный, самый замороченный и... хотела сказать, что самый интересный, но, если так подумать, неинтересных этапов в проектах data analysis нет от слова вообще.
За два часа датасет расширился до 4-х колонок. И это я еще до механической обработки самих записей не дошла, про смысловую вообще молчу.
Кажется, это будет гораздо увлекательней, чем мне казалось.
Пишу вот, например, вот эту хистограмму. И понимаю, что надо разбить часы на времена суток, и посмотреть на графики по ним.
![](https://diary.ru/resize/-/-/1/3/5/6/1356/TWbtY.png)
А потом еще ручки чешутся классифицировать самых активных пользователей по предпочитаемому ими времени активности, а также средним и медианным временем записи.
При этом до самого исследования я пока даже близко не дошла. Это этап первичной обработки данных: самый длинный, самый замороченный и... хотела сказать, что самый интересный, но, если так подумать, неинтересных этапов в проектах data analysis нет от слова вообще.