Telegram Group Search
Митап позади, но остались не только тёплые воспоминания, но и фотографии — смотрите их здесь!

Если хотите пересмотреть понравившиеся выступления, запись трансляции уже доступна.

Совсем скоро мы выложим избранные выступления в наш YouTube-канал. Stay tuned!
Небольшой дайджест интересных ссылок, попавшихся за недавние дни:

- Некоторое время назад в нашем чате обсуждали опенсорсные модели T-Lite и T-Pro, с участием их разработчиков.
Сегодня на Хабре вышел training report по этим моделям. Написано довольно подробно и интересно.

- В конце февраля вышла YandexGPT5 (также в вариантах Lite - открытом и Pro - закрытом). Почитать про технические подробности можно также в посте на Хабре.

- На днях Яндекс анонсировал платформу для разработки sourcecraft.dev и запустил её закрытое тестирование (выдают по запросу). Я свой доступ уже получил, немного попробую и опишу подробнее. Особенно, конечно, интересен ИИ-ассистент для работы с кодом. Почитать чуть подробнее можно тут.

- Для тех, кто уже пользуется платформой GitVerse: коллеги запустили опрос, в котором можно дать обратную связь и пожелания по различным аспектам использования их решений. Все ответы можно давать в анонимном формате.
Вчера как раз вспоминали про ИИ-ассистентов для работы с кодом - и вот по близкой тематике вышла очередная подборка от ICT.Moscow.

Упомянуты разработки СберТеха (GigaCode), Яндекса (Source Craft Code Assistant), MTS AI (Kodify) и других компаний. Также обсуждены различные сервисы для хранения кода, обеспечения CI/CD и т.д.

Как уже рассказывали на недавнем митапе, у нас сейчас тоже в разработке подобный ассистент, но для работы с опенсорсными научными репозиториями - OSA.
Продублирую из нашего чата полезный анонс:

До 31.03.2025 студенты (и даже школьники) могут подать заявку на "Всероссийский конкурс проектов с открытым кодом" в номинации авторов проектов или контрибьюторов.

Для контрибьюторов, например, условия участия довольно свободные:
"Для заявки на направление достаточно указать ссылку на принятый мердж-реквест в уже популярный в сообществе open source проект. Эксперты оценят качество и объем вклада"

Неплохая возможность дополнительно подсветить свой проект или вклад в полезный опенсорс, получив заодно немного мерча)

Пару лет назад от нас успешно участвовал Андрей @AGet_man_off в его коммитами в FEDOT.
Тем временем, первый анонс DataFest 2025 - собирают заявки на доклады и тематические треки.

Как и в прошлом году, наше сообщество организует трек Open Source. Приглашаем всем заинтересованных поучаствовать!

В репосте ниже перечислены остальные треки - как видно, тематики весьма разнообразны: от фронтиров DL до химии.

По самой конференции:
Даты мероприятия: фест пройдет с 24 мая по 1 июня 2025 года — 2 пары выходных, 9 дней в общей сложности
Формат: гибридный (онлайн + офлайн).

Города прошлого года снова в деле: Москва, Питер, Новосибирск и Алматы!
(new) География расширяется: в 2025 добавляется Белград, и это еще не все — stay tuned!


Крайний срок подачи темы доклада - 7 мая 2025 года.
Forwarded from ODS Events
Привет ☺️

🔥24 мая - 1 июня 2025 состоится главное событие года для нашего сообщества — Data Fest 2025!

Приглашаем вас присоединиться в роли спикеров или организаторов секций, пока времени до мероприятия еще достаточно 😉

Да-да, это тот самый CALL 4 SPEAKERS & CALL 4 ORGS 📣📣📣
Переходите по ссылкам ниже, пишите о темах, с которыми хотите выступить, пересылайте этот пост друзьям 🦜

Предварительный список секций, куда уже можно податься с докладом:
🔮 Больше про ML в разрезе DS доменов: NLP, Advanced LLMs, CV, Speech, RecSys, TS & Forecasting, Reliable ML
🏭 Больше про индустрии и их приложения: ML in Manufacturing, Ужасы Медицинских Данных, ML in Marketing, ML in [Physics] Science, Robotics, Scoring, ML in Security, Code Generation / AI code (new), ML in Chemistry (new)
🛠 Больше про инженерию: MLOps, Optimal DL, Open Source, DL Frontier (new)
🎁 Неформат: Career & TeamLead, Random DS/ML
….и список будет пополняться!

Стать спикером <— тык
Стать организатором <— тык

🥰 Всех ждем!
Please open Telegram to view this post
VIEW IN TELEGRAM
В завершение рабочей недели - небольшой дайджест научно-опенсорсных материалов, попавшихся в последние несколько дней:

- Подборка видео про актуальные AI-инструменты для ученых;

- Разбор препринта про новый бенчмарк PaperBench, предназначенный для оценки эффективности ИИ-агентов в задачах воспроизведения научных результатов из статьей;

- Deep Dive про этих самых ИИ-агентов от ICT Moscow;

- Awesome-репозитории со статьями по тематикам Graph Research / Molecular ML с недавних А*-конференций. Углядел несколько любопытных статей.
Сообщают, что на Хабре объявили совместный с GitVerse конкурс статей про опенсорс - https://habr.com/ru/specials/898552/

Статьи могут быть посвящены опыту создания, поддержке и сопровождении open-source-проектов, описанию глубоких погружений в код популярных решений и другие смежным темам.

На конкурс можно подавать новые или уже вышедшие после начала 2025 года материалы.
Описание правил, призов и прочего - по ссылке.

Тоже сейчас готовим статью на Хабр про ИИ для научного опенсорса, так что попробуем поучаствовать.
На днях вышла ещё одна подборка программных решений от ICT Moscow, на этот раз - про MLOps. Не все решения опенсорсные, но и такие тоже представлены:
https://ict.moscow/news/cards-mlops-llmops-platforms/

Про нас тоже пишут - в подборку включены созданные в ИТМО AutoML-фреймворки FEDOT и FEDOT.Industrial, развитие которых мы активно поддерживаем.
Также упомянута созданная студентами ИТМО библиотека mljet (к сожалению, давно не обновляется).
Коллеги из блога ИТМО на Хабре подготовили материал на основе доклада Олега Сиротюка (лидера сообщества OpenScaler) на нашем недавнем опенсорс-митапе.

Теперь про поддержку open-source ИИ-проектов в Китае можно почитать и в текстовом формате - https://habr.com/ru/companies/spbifmo/articles/901346
Мы в ИТМО много занимаемся применением ИИ для задач автоматизации разработки ПО, поэтому решили поучаствовать в подготовке тематического исследования, которое проводит исследовательская компания Online Market Intelligence (OMI).

В рамках этого исследования, IT-специалистам, студентам IT-специальностей и преподавателям предлагается пройти опрос на тему платформ разработки и кодовых ИИ-ассистентов.

В нем поднимаются следующие вопросы:
- Какие инструменты разработки (платформы разработки, кодовые ИИ-ассистенты) используют компании и ВУЗы с направлениями подготовки IT-специалистов, как измеряется их эффективность использования.
- Как инструменты разработки влияют на метрики эффективности и производительность процессов. Что влияет на эффективность работы разработчиков? По каким параметрам оценивается их эффективность?
- Как ИИ влияет на рынок труда: заменит ли ИИ IT-специалистов? Кто подвержен риску замены ИИ? И какие нужны навыки, чтобы оставаться востребованным?

Среди успешно прошедших опрос организаторы планируют разыграть приз.
Обработанными результатами и их анализом обязательно поделимся в этом канале.
🌿 Весенний митап ITMO Opensource 🌿

Приглашаем вас на онлайн-митап, где поговорим о том, как поддерживать Open Source не только идеями, но и реальными ресурсами 💸

Что вас ждёт:
• Обзор актуальных грантов на разработку Open Source решений
• Инструкции и лайфхаки по подаче заявки
• Реальные истории успеха от победителей конкурсов вроде «КОД ИИ»
• Разбор кейсов и трудностей, с которыми сталкиваются разработчики
• Ответы на главный вопрос: что делать, когда грант заканчивается?

🔊 В программе выступят:
18:00 — Николай Никитин (ИТМО): какие формы поддержки Open Source доступны сегодня?
18:30 — Александр Нозик (МФТИ): существует ли жизнь для open source без грантов?
19:00 — Ирина Деева (ИТМО): как выиграли «КОД ИИ» и во что это вылилось
19:30 — Андрей Остроух (МАДИ): создание учебного курса по Open Source — опыт и выводы

🎯 Митап будет полезен:
— тем, кто уже работает над open source-проектом
— тем, кто планирует привлекать грантовую поддержку
— всем, кто хочет понять, как устроена инфраструктура открытой разработки в России

📢 Не пропустите встречу!
Ссылка на подключение - https://telemost.yandex.ru/j/0937487211
Ссылка на трансляцию в YouTube - https://www.youtube.com/live/y3ef9TgBhlI

📅 Когда: сегодня, 25 апреля, 18:00
📍 Где: онлайн
🔗 Не забудьте зарегистрироваться
🔥 С 24 мая по 1 июня пройдёт Data Fest 2025 — главное событие сообщества Open Data Science! Это отличная возможность выступить с докладом, найти единомышленников, завести новых друзей и просто классно провести время.

В этом году наша лаборатория представит сразу два трека:

🔹 Open Source — про открытые библиотеки и фреймворки для DS/ML, а также обмен опытом в сфере open-source разработок в целом.

🔹 PGM & CausalML — новый трек! Теория, инструменты и практика вероятностных графовых моделей и методов причинного машинного обучения.

Треки будут функционировать как онлайн, так и офлайн: города проведения - Москва, Питер, Новосибирск, Алматы и планируется площадка в Белграде.

Ждём ваши заявки на доклады! 👉 тык
Дедлайн подачи заявок - 7 мая, так что торопитесь!
В канун Первомая выпустили статью на Хабре, где рассказываем о деталях реализации нашего проекта OSA — "улучшателя" научных репозиториев на базе LLM.

https://habr.com/ru/companies/spbifmo/articles/906018/

Также в статье поделились примерами использования OSA и обратной связью от коллег, попробовавших проект на своих репозиториях. В их числе — сотрудники лаборатории КТ ИТМО, ФКН ВШЭ и бразильского Universidade Federal de Juiz de Fora.

Приятного чтения!

P.S. Попробовать Осу можно здесь. Будем рады вашим звёздочкам.
Всем привет! 👋
Мы — команда probAI, и рады представить applybn — нашу новую библиотеку для прикладного анализа данных на базе байесовских сетей (БС) и каузальных моделей. Разработано в рамках гранта «КодИИ».

Однажды мы собрались и поняли, что существует множество классных алгоритмов на основе байесовских сетей и каузальных моделей, которые умеют детектировать выбросы, отбирать и генерировать признаки, объяснять влияние частей модели на результат и многое другое. Так почему бы не собрать лучших из них в одну удобную библиотеку? Так и появился applybn.

Что умеет applybn?

1. Обнаружение аномалий

✔️Табличные данные: сочетание байесовских сетей и методов близости для поиска плотностных аномалий и аномалий зависимостей

✔️Временные ряды: динамические БС, автоматически учитывающие временные и межпеременные зависимости

2. Генерация синтетических данных и балансировка выборок

✔️Автоматическое выравнивание несбалансированных выборок при помощи гибридных БС и гауссовских смесей с учётом взаимодействий признаков

3. Отбор и генерация признаков

✔️Каузальный отбор: ищет только те фичи, которые имеют ненулевой причинный эффект (без ручных порогов)

✔️MI‑отбор: находит марковские окружения по нормализованной взаимной информации

✔️Генерация фичей на основе БС: дополняет данные вероятностными параметрами условных зависимостей для повышения качества моделей

4. Объяснимый анализ

✔️Каузальный анализ компонентов моделей: строит структурную каузальную модель, чтобы оценить и убрать неважные компоненты модели (например, фильтры CNN)

✔️ACE‑анализ признаков в данных: рассчитывает средний эффект влияния признаков на уверенность модели для интерпретации и отладки

⚙️ Все модули библиотеки совместимы с экосистемой scikit-learn, так что её легко интегрировать в существующие пайплайны анализа данных.

Заглядывайте в репозиторий applybn, ставьте звёздочки ⭐️ и делитесь впечатлениями!
Please open Telegram to view this post
VIEW IN TELEGRAM
На Хабре вышла статья Дмитрия Кабанова "«Теплый ламповый» опенсорс — новые мега-подборки, пет-проекты, комиксы и книги, абсурдные и полезные лицензии".

В ней - подборка интересных opensource-related материалов: интересных репозиториев, книг, awesome-листов и т.д.

Среди прочего, упоминают про научный код и нашего ИИ-ассистента для опенсорс-разработки OSA, про которого мы недавно рассказывали в канале.
Всем привет! Мы обновили и расширили документацию с примерами нашей библиотеки TorchCNNBuilder. Инструмент довольно простой в освоении, позволяет быстро создавать сверточные сети для любых целей не задумываясь о внутренних размерностях - достаточно задать размер входных и выходных данных.

Модельки можно собрать легковесные, но в качестве бейзлайнов для прогнозирования, сегментации, автоэнкодеров - отличный вариант. Кто еще не пробовал, но внезапно почувствует потребность в свертках, приглашаем затестировать или поконтрибьютить) ну и поддержите звездочками, нам будет очень приятно ☺️
Please open Telegram to view this post
VIEW IN TELEGRAM
"Зоопарк из слоновой кости" вновь включил наш канал "Научный опенсорс" в свою подборку. На этот раз - по близким мне техническим наукам.

По ссылкам в репосте - tg-папки с интересными ресурсами из разных областей, среди которых можно поискать чего-то по душе.

Мы бы тоже собрали свою папку с каналами про open-source, но кажется их не слишком много) Может, кто-то когда-то возьмется.
2025/06/14 06:15:52
Back to Top
HTML Embed Code: