Статью команды Sber-AI приняли на ведущую конференцию NAACL 2025 🎉
Исследователи из Сбера и AIRI представили RusCode — первый бенчмарк, оценивающий способность генеративных моделей подстроиться под российский культурный код в задачах text-to-image. Модель должна не просто рисовать «суп», а уметь отличить борщ от окрошки, узнавать Лермонтова по фуражке, а Пушкина по бакенбардам.
Что внутри:
🔘 1250 сложных текстовых описаний культурных объектов на русском и английском
🔘 19 категорий: от литературы и фольклора до мемов, автомобилей и научных открытий
🔘 Эталонные изображения для каждого промпта
🔘 Сравнительная оценка качества генерации у DALL·E 3, Stable Diffusion 3, Kandinsky 3.1, YandexART 2 от 48 независимых экспертов
📊 Вывод: большинство западных моделей «не считывают» российский визуальный код. Только модели, дообученные на русскоязычных данных, уверенно справляются.
🌏 Авторы поднимают важный вопрос: чтобы модели были по-настоящему универсальными, им нужно «понимать» культурный контекст запроса, а не только рисовать красиво. Благодаря появлению RusCode пользователи со всего мира смогут создавать более аутентичный контент в российском стиле.
Подробности по ссылкам:
🔗 ArXiv
🔗 GitHub
Исследователи из Сбера и AIRI представили RusCode — первый бенчмарк, оценивающий способность генеративных моделей подстроиться под российский культурный код в задачах text-to-image. Модель должна не просто рисовать «суп», а уметь отличить борщ от окрошки, узнавать Лермонтова по фуражке, а Пушкина по бакенбардам.
Что внутри:
Подробности по ссылкам:
🔗 ArXiv
🔗 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Data Fest’25 в гостях у Сбера — уже завтра!
До главного события сообщества Open Data Science осталось совсем немного✅
Доклады о трендах в AI от топовых экспертов, нетворкинг и игры на развитие soft skills — в штаб-квартире Сбера в Москве на Кутузовском проспекте.
Если не успели зарегистрироваться, чтобы прийти лично, можете посмотреть выступления онлайн. Прямая трансляция будет доступна по этим ссылкам:
➡️ Main Stage
➡️ AI Disrupt Stage
До главного события сообщества Open Data Science осталось совсем немного
Доклады о трендах в AI от топовых экспертов, нетворкинг и игры на развитие soft skills — в штаб-квартире Сбера в Москве на Кутузовском проспекте.
Если не успели зарегистрироваться, чтобы прийти лично, можете посмотреть выступления онлайн. Прямая трансляция будет доступна по этим ссылкам:
Please open Telegram to view this post
VIEW IN TELEGRAM
Скорее подключайтесь к трансляции по этим ссылкам:
А мы будем записывать кружочки, чтобы вы не пропустили самые яркие моменты
Please open Telegram to view this post
VIEW IN TELEGRAM
Подошёл к концу первый блок лекций 📆
Послушали рассказы Ивана Оселедца и Федора Минькина о больших языковых моделях и их разработке, с Александром Капитановым обсудили AI-фотошоп, с Александром Абрамовым — память LLM, с Андреем Кузнецовым — Generative Design, разработку Kandinsky — с Денисом Димитровым.
Трансляции смотрите тут и тут💻
Послушали рассказы Ивана Оселедца и Федора Минькина о больших языковых моделях и их разработке, с Александром Капитановым обсудили AI-фотошоп, с Александром Абрамовым — память LLM, с Андреем Кузнецовым — Generative Design, разработку Kandinsky — с Денисом Димитровым.
Трансляции смотрите тут и тут
Please open Telegram to view this post
VIEW IN TELEGRAM
Тем временем на второй сцене...
... Сергей Марков рассказал об AI в эпоху больших языковых моделей. Также обсудили работу с большим контекстом, ландшафт loss-функций и оценку генеративных способностей LLM для русского языка.
➡️ Смотрим
Please open Telegram to view this post
VIEW IN TELEGRAM
Завершаем день в секции робототехники 🎮
Разбираем навигацию мобильных роботов, построение карт знаний и навигационные датасеты.
✅ Смотреть здесь
Разбираем навигацию мобильных роботов, построение карт знаний и навигационные датасеты.
Please open Telegram to view this post
VIEW IN TELEGRAM