
В этом видео мы подробно рассмотрим, как работать с пропущенными данными на примере знаменитого набора Titanic. Вы увидите, как быстро находить и визуализировать отсутствующие значения с помощью Python, библиотеки pandas и missingno. Мы покажем три основных способа обработки пропусков: удаление строк с неполными данными, заполнение числовых пропусков средним значением и создание новой категории для отсутствующих значений в категориальных данных. Все эти методы — важный шаг на пути подготовки данных к построению надёжных моделей машинного обучения. Если вы хотите улучшить качество своих данных и понимать, как справляться с неполнотой информации — это видео для вас!
Исходник тут
Улучшенная версия