Warning: preg_grep(): Compilation failed: quantifier does not follow a repeatable item at offset 142 in /var/www/tg-me/post.php on line 75 Библиотека собеса по Data Science | вопросы с собеседований | Telegram Webview: ds_interview_lib/965 -
❓Как использовать категориальные признаки в k-Means
Алгоритм k-Means плохо работает с категориальными признаками, потому что понятие среднего значения неприменимо к строковым значениям вроде «красный», «синий» или «зелёный».
🛠Что можно сделать
📍One-hot encoding — преобразуем каждую категорию в бинарный вектор. Это позволяет применить *k-Means*, но увеличивает размерность и может искажать расстояния. 📍Label encoding — простой способ, но порядок присвоенных чисел может ввести модель в заблуждение (например, «cat» = 0, «dog» = 1, «elephant» = 2). 📍Оба метода не гарантируют адекватную интерпретацию расстояний между категориями.
🔄Альтернатива
Вместо k-Means для категориальных или смешанных данных лучше использовать: 📍k-Modes — аналог k-Means, но для чисто категориальных признаков (использует моду вместо среднего). 📍 k-Prototypes — работает с числовыми и категориальными данными одновременно.
❓Как использовать категориальные признаки в k-Means
Алгоритм k-Means плохо работает с категориальными признаками, потому что понятие среднего значения неприменимо к строковым значениям вроде «красный», «синий» или «зелёный».
🛠Что можно сделать
📍One-hot encoding — преобразуем каждую категорию в бинарный вектор. Это позволяет применить *k-Means*, но увеличивает размерность и может искажать расстояния. 📍Label encoding — простой способ, но порядок присвоенных чисел может ввести модель в заблуждение (например, «cat» = 0, «dog» = 1, «elephant» = 2). 📍Оба метода не гарантируют адекватную интерпретацию расстояний между категориями.
🔄Альтернатива
Вместо k-Means для категориальных или смешанных данных лучше использовать: 📍k-Modes — аналог k-Means, но для чисто категориальных признаков (использует моду вместо среднего). 📍 k-Prototypes — работает с числовыми и категориальными данными одновременно.
Some messages aren’t supposed to last forever. There are some Telegram groups and conversations where it’s best if messages are automatically deleted in a day or a week. Here’s how to auto-delete messages in any Telegram chat. You can enable the auto-delete feature on a per-chat basis. It works for both one-on-one conversations and group chats. Previously, you needed to use the Secret Chat feature to automatically delete messages after a set time. At the time of writing, you can choose to automatically delete messages after a day or a week. Telegram starts the timer once they are sent, not after they are read. This won’t affect the messages that were sent before enabling the feature.
The seemingly negative pandemic effects and resource/product shortages are encouraging and allowing organizations to innovate and change.The news of cash-rich organizations getting ready for the post-Covid growth economy is a sign of more than capital spending plans. Cash provides a cushion for risk-taking and a tool for growth.
Библиотека собеса по Data Science | вопросы с собеседований from us