tg-me.com/dsproglib/6551
Last Update:
📌 Промт дня: как обрабатывать пропущенные значения в данных
Пропуски в данных — не просто шум, а важный сигнал. Как вы их обработаете — влияет на всё: от качества модели до честности метрик.
🎯 Вот промт, который можно дать ChatGPT, чтобы продумать стратегию:
У меня есть датафрейм с пропущенными значениями. Помоги:
– Проанализировать, в каких признаках есть пропуски и сколько их
– Разделить признаки на числовые и категориальные
– Предложить разумные стратегии для каждого типа (например: среднее, медиана, мода, отдельная категория, KNN, IterativeImputer)
– Добавить индикаторные признаки “was\_missing”, если это может быть полезно
– Проверить, связаны ли пропуски с целевой переменной
– Посоветовать визуализации, чтобы увидеть структуру пропусков (heatmap, matrix и т.п.)
– Указать, какие признаки стоит удалить из-за большого числа пропусков
💡 Подходит для ChatGPT в режиме кода или анализа пайплайна. Используйте этот промт, чтобы сэкономить время и продумать работу с пропусками системно.
Библиотека дата-сайентиста #буст
BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283
Share with your friend now:
tg-me.com/dsproglib/6551