Please open Telegram to view this post
VIEW IN TELEGRAM
Привет! Мы очень рады, что вы с нами и хотим отблагодарить вас за ваше внимание! 💚
В честь этого разыгрываем 5 подписок Telegram Premium на год 🔥🔥🔥
Никаких сложных условий!🎉
Для участия в розыгрыше необходимо:
— Быть подписанным на канал ИИ песочница
— Быть подписанным на канал LightAutoML
— Дождаться результатов
Итоги подведем 12 февраля в 16:00, так что следите за новостями, вдруг именно вы заберёте приз!🎁
В честь этого разыгрываем 5 подписок Telegram Premium на год 🔥🔥🔥
Никаких сложных условий!
Для участия в розыгрыше необходимо:
— Быть подписанным на канал ИИ песочница
— Быть подписанным на канал LightAutoML
— Дождаться результатов
Итоги подведем 12 февраля в 16:00, так что следите за новостями, вдруг именно вы заберёте приз!
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from ИИ Песочница | RnD про ML, AI, Data Science
Команда Avito рассказала на Хабре, как использовала нашу либу AutoWoE для повышения ликвидности объявлений на площадке.
Модель анализирует успешные объявления и подсказывает, что можно улучшить: добавить фото, скорректировать цену, активнее отвечать или включить продвижение. AutoWoE разбивает фичи на бины, оценивает их влияние на отклики и формирует скор-карту инструментов, переведённую в рекомендации пользователям.
A/B-тесты показали рост целевых контактов и увеличение числа сделок.
Круто, когда open-source находит применение в реальных задачах!
#новости
Please open Telegram to view this post
VIEW IN TELEGRAM
Audio
Всем привет, друзья!
Напоминаем, что наш конкурс на 5 Telegram Premium подписок на год заканчивается уже сегодня в 16.00 (проходит он довольно интересно, конечно 🙈).
В качестве интересного интерактива для конца конкурса предлагаю вам послушать подборкусгенерированных треков про LightAutoML, PyTorch-LifeStream и AutoML Grand Prix - есть ощущение что получилось прям неплохо 🔥
Также, если вы по доброте душевной хотите поддержать нас звездой на GitHub - будем только рады ⭐
Please enjoy🦙
Напоминаем, что наш конкурс на 5 Telegram Premium подписок на год заканчивается уже сегодня в 16.00 (проходит он довольно интересно, конечно 🙈).
В качестве интересного интерактива для конца конкурса предлагаю вам послушать подборку
Также, если вы по доброте душевной хотите поддержать нас звездой на GitHub - будем только рады ⭐
Please enjoy
Please open Telegram to view this post
VIEW IN TELEGRAM
Какой трек понравился больше? 🔥 (можно выбрать несколько)
Anonymous Poll
21%
1_Victory_Code
24%
2_LightAutoML
22%
3_PyTorch_LifeStream
21%
4_AutoML_Fusion
21%
5_Coders
LightAutoML framework
Please open Telegram to view this post
VIEW IN TELEGRAM
В классических алгоритмах для решения suprevised задач на табличных данных модель обучается с нуля, в статье используется подход с предобучением:
1. Генерируются 130 миллионов синтетических датасетов с помощью каузальных графов, которые имитируют сложные зависимости в данных, пропуски, выбросы.
2. На сгенерированных данных предобучается трансформер, предсказывая таргет test выборки, получая на вход train как контекст. Для каждой ячейки таблицы используется отдельная репрезентация. Используется механизм внимания как по строкам, так и по столбцам таблицы.
3. Вместо привычных отдельных "fit" и "predict", трансформер за один проход получая и train, и test новой задачи одновременно, делает инференс на test, используя in-context learning. Простыми словами, модель обучена однажды, но подхватывает зависимости в данных из подаваемого в контекст датасета и сразу делает предсказания.
1. Скорость и качество: в задачах классификации и регрессии на данных до 10к строк и 500 признаков за несколько секунд получает качество лучше, чем ансамбль из базовых алгоритмов (бустинги, лес, линейные), которые тюнились в течение нескольких часов.
2. Минимум работы: алгоритм не нужно тюнить, имеет отбор признаков, нативно работает с числовыми и категориальными признаками, а также с пропусками.
3. Плюсы foundation моделей: возможность получить распределение таргета, генерировать данные итд.
4. Неплохо показывает себя на временных рядах.
1. Статья показала эффективность foundation моделей в домене табличных данных, теперь у бустингов сильные конкуренты.
2. Пока есть вопросы с точки зрения эффективности инференса, ограниченности контекста, но дальше будут улучшения.
3. Интересно, что TabPFN v2 можно назвать AutoML решением, ведь для решения задачи он не требует ни настройки гиперпараметров, ни предобработки данных.
Тема интересная, у нас имеются наработки по этой теме, и мы работаем над их применением в LightAutoML
#обзор
Please open Telegram to view this post
VIEW IN TELEGRAM
Nature
Accurate predictions on small data with a tabular foundation model
Nature - Tabular Prior-data Fitted Network, a tabular foundation model, provides accurate predictions on small data and outperforms all previous methods on datasets with up to 10,000 samples by a...
Хочешь знать, сколько на самом деле зарабатывают специалисты в Data Science? Давайте соберем статистику, пройдя опрос от наших коллег по индустрии, и узнаем 💸💸💸
Forwarded from Нескучный Data Science (Евгений Смирнов)
💸 Сколько ты зарабатываешь на Data Science?
👉 Пройди опрос сейчас, не откладывай на потом❗️
🤔 Вы можете примерно оценить вилку на вашей позиции благодаря вакансиям из каналов, где они публикуются. Тем не менее вилки довольно широкие и одни работодатели недоплачивают или платят строго по низу вилки, другие наоборот переплачивают и выходят за ее пределы. Вам в свою очередь нужно на собеседовании или при повышении назвать одно число, ровно столько вам будет платить довольно продолжительный период времени.
📊 Запускаю опрос, который в будущем поможет подписчикам сопоставить свой набор навыков с рынком труда. Прошу вас ответить на вопросы про ваш опыт, текущую роль в компании, ваш уровень удовлетворенности и планы на будущее. Чем прозрачнее будет рынок труда, тем выгоднее будет обоим сторонам, ведь дата сайентисты не будут смотреть в лес рынка труда.
🔖 Результаты опроса буду порционно публиковать в канале Нескучный Data Science @not_boring_ds.
😉 классические вопросы с популярных интервью тоже включены)
P.S. при публикации статистики дам ссылки на каналы поддержавшие опрос.
👉 Пройди опрос сейчас, не откладывай на потом❗️
🤔 Вы можете примерно оценить вилку на вашей позиции благодаря вакансиям из каналов, где они публикуются. Тем не менее вилки довольно широкие и одни работодатели недоплачивают или платят строго по низу вилки, другие наоборот переплачивают и выходят за ее пределы. Вам в свою очередь нужно на собеседовании или при повышении назвать одно число, ровно столько вам будет платить довольно продолжительный период времени.
📊 Запускаю опрос, который в будущем поможет подписчикам сопоставить свой набор навыков с рынком труда. Прошу вас ответить на вопросы про ваш опыт, текущую роль в компании, ваш уровень удовлетворенности и планы на будущее. Чем прозрачнее будет рынок труда, тем выгоднее будет обоим сторонам, ведь дата сайентисты не будут смотреть в лес рынка труда.
🔖 Результаты опроса буду порционно публиковать в канале Нескучный Data Science @not_boring_ds.
😉 классические вопросы с популярных интервью тоже включены)
P.S. при публикации статистики дам ссылки на каналы поддержавшие опрос.
Привет! Помимо работы над LightAutoML, мы занимаемся и следим за многими другими темами в области ML.
Завтра сотрудник нашей команды Миле Митрович выступит на научном семинаре с обзорным докладом на тему агентов, ждем вас онлайн!
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
ИИ песочница
🤖 From LLMs to AI Agents
Запускаем открытые семинары про AI, и первый уже скоро!
6 марта в 17:00 Миле Митрович (Sber AI Lab) расскажет, как LLM выходят за рамки чат-ботов и становятся частью агентных систем
Что обсудим:
🔘 Сильные и слабые стороны LLM…
Запускаем открытые семинары про AI, и первый уже скоро!
6 марта в 17:00 Миле Митрович (Sber AI Lab) расскажет, как LLM выходят за рамки чат-ботов и становятся частью агентных систем
Что обсудим:
🔘 Сильные и слабые стороны LLM…
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
ML with MiLE
Привет всем!
📢 Сегодня в 17ч в ТеДо состоится панельная дискуссия по LLM-Агентах. В том числе один из спикеров буду я.
👉 Присоединяйтесь по ссылке
📢 Сегодня в 17ч в ТеДо состоится панельная дискуссия по LLM-Агентах. В том числе один из спикеров буду я.
👉 Присоединяйтесь по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
OTP Tech
Вчера встречу нашего профессионального сообщества AI BusinessBoost посетил Александр Рыжков (ex исполнительный директор Сбера). Поговорили про то, как увлечение соревнованиями на платформе Kaggle привело к развитию методов автоматизации машинного обучения…
В новой версии внедрили ряд исправлений, улучшающие стабильность и надежность библиотеки. Основные изменения:
Ошибка "KeyError: Numeric role ...", которая возникала при использовании класса NumericRole, возникала в основном в AutoUplift (строковое задание роли работало штатно).
Первая из перечисленных проблем была критической, поэтому версия v0.4.0 будет изъята из PyPI. Настоятельно рекомендуем обновиться до версии v0.4.1. Спасибо за ваше терпение и поддержку!
Please open Telegram to view this post
VIEW IN TELEGRAM
https://www.youtube.com/watch?v=-1JL8h-SM50
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
LightAutoML — история создания и победы (Александр Рыжков)
Семинар проекта «Открытый код ФКН»
Семинар посвящен истории создания фреймворка LightAutoML для автоматического построения моделей машинного обучения: как зародилась идея этого проекта и каким образом он превратился в мощный инструмент, сумевший превзойти…
Семинар посвящен истории создания фреймворка LightAutoML для автоматического построения моделей машинного обучения: как зародилась идея этого проекта и каким образом он превратился в мощный инструмент, сумевший превзойти…