tg-me.com/ai_machinelearning_big_data/7697
Last Update:
Ребята из финтеха Точка сделали классный разбор того, как обучать ML-модели, когда размеченных данных мало, а времени и бюджета на ручную разметку нет.
В посте собрали описания несколько подходов, которые реально работают: Active Learning, Semi-Supervised Learning, Transfer Learning. Главный фокус — на Weak Supervision и том, как автоматизировать разметку с помощью эвристик, баз знаний, краудсорсинга и языковых моделей.
Подробно разложен по полочкам Programmatic Weak Supervision (PWS). Рассказали:
- как создавать разметочные функции;
- как агрегировать противоречивые слабые метки;
- как использовать генеративную модель для оценки качества;
- как на основе этой автоматической разметки обучать полноценную дискриминативную модель.
Если в ваших проектах нет разметки, этот пост поможет обойти это ограничение и быстро и качественно обучить модели.
Читать пост
Подписывайтесь на канал Точки .ml — там разборы инструментов, обзоры фреймворков и выжимки из статей.
BY Machinelearning
Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283
Share with your friend now:
tg-me.com/ai_machinelearning_big_data/7697