Warning: preg_grep(): Compilation failed: quantifier does not follow a repeatable item at offset 142 in /var/www/tg-me/post.php on line 75 Библиотека собеса по Data Science | вопросы с собеседований | Telegram Webview: ds_interview_lib/924 -
Оба метода помогают выбрать оптимальное количество кластеров (k), но делают это по-разному:
📍Метод локтя: — Основан на внутрикластерной дисперсии (сумме квадратов расстояний до центров кластеров) — При увеличении количества кластеров дисперсия снижается — Нужно найти точку, в которой снижение становится менее выраженным — ту самую «локтевую точку» — Минус: нахождение локтя субъективно и может быть неочевидным
📍Метод силуэта: — Для каждой точки рассчитывается оценка силуэта — насколько хорошо она вписывается в свой кластер и насколько далеко от других — Средняя оценка по всем точкам показывает качество кластеризации — Позволяет интерпретировать качество кластеров более детально — Часто даёт более чёткий выбор оптимального k
📍Вывод: — Метод локтя проще в реализации и быстрее на больших датасетах. — Метод силуэта — более интерпретируемый и точный, особенно когда нужно оценить, насколько хорошо модель «чувствует» структуру данных.
Оба метода помогают выбрать оптимальное количество кластеров (k), но делают это по-разному:
📍Метод локтя: — Основан на внутрикластерной дисперсии (сумме квадратов расстояний до центров кластеров) — При увеличении количества кластеров дисперсия снижается — Нужно найти точку, в которой снижение становится менее выраженным — ту самую «локтевую точку» — Минус: нахождение локтя субъективно и может быть неочевидным
📍Метод силуэта: — Для каждой точки рассчитывается оценка силуэта — насколько хорошо она вписывается в свой кластер и насколько далеко от других — Средняя оценка по всем точкам показывает качество кластеризации — Позволяет интерпретировать качество кластеров более детально — Часто даёт более чёткий выбор оптимального k
📍Вывод: — Метод локтя проще в реализации и быстрее на больших датасетах. — Метод силуэта — более интерпретируемый и точный, особенно когда нужно оценить, насколько хорошо модель «чувствует» структуру данных.
The global forecast for the Asian markets is murky following recent volatility, with crude oil prices providing support in what has been an otherwise tough month. The European markets were down and the U.S. bourses were mixed and flat and the Asian markets figure to split the difference.The TSE finished modestly lower on Friday following losses from the financial shares and property stocks.For the day, the index sank 15.09 points or 0.49 percent to finish at 3,061.35 after trading between 3,057.84 and 3,089.78. Volume was 1.39 billion shares worth 1.30 billion Singapore dollars. There were 285 decliners and 184 gainers.
Библиотека собеса по Data Science | вопросы с собеседований from us