Media is too big
VIEW IN TELEGRAM
🔮Как должна выглядеть генерация картинок в будущем
Разработчик показал в X свой проект, который вполне может стать примером для систем генерации изображений будущего.
Вы просто сидите перед монитором и произносите вслух то, что хотите видеть на экране. whisper.cpp переводит ваши слова в текст, а Stable Diffusion на основе этого бесконечно генерирует изображения.
Автор утверждает, что больше двух минут видео разрешением 1280x1024 пикселей было создано в режиме генерации в реальном времени на основе его голоса. Он обещает выложить код позже.
Разработчик показал в X свой проект, который вполне может стать примером для систем генерации изображений будущего.
Вы просто сидите перед монитором и произносите вслух то, что хотите видеть на экране. whisper.cpp переводит ваши слова в текст, а Stable Diffusion на основе этого бесконечно генерирует изображения.
Автор утверждает, что больше двух минут видео разрешением 1280x1024 пикселей было создано в режиме генерации в реальном времени на основе его голоса. Он обещает выложить код позже.
⚔️ Midjourney v7 vs DALLE-3
В блоге Midjourney v7 опубликовали сравнение этой модели с DALLE-3. Если коротко, выводы такие:
🔘 Midjourney хороша возможностью детальной настройки. Изображения могут получаться более реалистичными.
🔘 DALL-E 3 выделяется более высокой скоростью и удобством использования, но предоставляет меньше опций для детальной настройки.
🔘 Midjourney хорошо удаётся генерировать детализированные текстуры и природные элементы, такие как отражения в воде. DALLE-3 склонен создавать слегка перенасыщенные изображения с более широким цветовым диапазоном.
🔘 DALLE-3 доступна с подпиской ChatGPT Plus, которая стоит $20 в месяц. У чат-бота нет ограничений на количество сгенерированных изображений. Стоимость использования Midjourney v7 начинается с $10 в месяц. Однако по такой цене у модели есть ограничения на количество изображений — примерно 200 ежемесячно.
В блоге Midjourney v7 опубликовали сравнение этой модели с DALLE-3. Если коротко, выводы такие:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Стал доступен сайт Midjourney alpha, который позволяет генерировать изображения не в интерфейсе Discord, а на отдельной странице.
Пока генерацией через Midjourney alpha могут воспользоваться только юзеры Discord, которые уже успели создать через чат-бот более 100 изображений. Однако в будущем веб-интерфейс станет доступен всем.
Please open Telegram to view this post
VIEW IN TELEGRAM
Как обычно, вы можете взять эти шаблоны за основу и экспериментировать с разными вариациями и моделями.
A split color photography of a [subject/description], one half [color1] the other [color2], against a [background], [angle], portrait photography, digital art, higly-detailed
Split color photograph of a [landscape], half in [color1] and the other in [color2], realistic photography, color gradient, natural landscapes
A split color photo of an [food], half [color1], half [color2], against a [background], macro photography, high color saturation, food photography, minimalistic style, sharp focus, higly-detailed
Split color photography collage of [subject] one half in [color1], the other in [color2], against a minimalist background, [theme], thematic contrast, artistic color schemes, digital collage, sharp details
#промпты_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Демо-пространства находятся на Hugging Face. Это бесплатные интерфейсы для моделей, которые могут редактировать изображения. Вот, что доступно на данный момент:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Диффузионную модель обновили до версии 1.3. Как объясняют в Яндексе, нейросеть перешла на технологию латентной диффузии. Кроме того, разработчики увеличили в 2.5 раза датасет, на котором обучалась модель. Благодаря этому новая версия YandexART лучше понимает текстовые запросы и создаёт более реалистичные изображения.
YandexART 1.3 уже доступна в Шедевруме. Это приложение для генерации. Чтобы им воспользоваться, нужно:
Please open Telegram to view this post
VIEW IN TELEGRAM
Это интересная и полезная статья на «Хабре», которая рассказывает об опыте генерации фоновых изображений для сайта.
Для решения задачи выбрали Stable Diffusion, так как она смогла выдавать более стабильные результаты, чем Midjourney. Кроме того, SD позволяет:
Please open Telegram to view this post
VIEW IN TELEGRAM
Компания сообщила, что уже начала тестировать детектор сгенерированных изображений. Пока он доступен лишь некоторым исследователям.
Как пишет OpenAI, классификатор показывает высокую точность в распознавании изображений, созданных ИИ. Он правильно определяет ~98% изображений, сгенерированных DALL-E 3, и менее ~0,5% изображений, созданных не с помощью искусственного интеллекта. С картинками других моделей классификатор пока справляется намного хуже.
Please open Telegram to view this post
VIEW IN TELEGRAM
Флаг
–sref
в промпте для Midjourney позволяет модели случайным образом выбрать стиль для генерируемого изображения. Однако если указать после –sref
код, то можно избавиться от случайности и выбрать необходимый стиль. Вот несколько кодов:
–sref 71
Для стиля иллюстрация с элементами графики и сюрреализма.
–sref 2028329475
Для яркого и насыщенного стиля с элементами поп-арта.
–sref 2974021716
Для минималистичного элегантного стиля в светло-голубых тонах.
–sref 2656431748
Для изображений с ярко выраженной цветовой палитрой, доминирующей в красно-оранжевых и голубых тонах
–sref 2930026128
Для красивых изображений в фэнтези стиле с акцентом на светлые, пастельные тона и сказочные элементы.
–sref 1557554703
Для смешанного стиля пейзажной фотографии и иллюстрации.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Команда Stability AI представила Stable Artisan — чат-бота в Discord для генерации изображений и видео.
Это не бесплатно — расценки можно посмотреть тут
/dream
, а далее начать писать свой промпт. После создания изображение можно редактировать.Please open Telegram to view this post
VIEW IN TELEGRAM
❤️ — Midjourney
👍 — DALL-E
⚡️— Stable Diffusion
🤔 — использую сторонние боты/сайты
Please open Telegram to view this post
VIEW IN TELEGRAM
Теперь если кто-то опубликует в соцсети созданную, например, DALL-E картинку, у неё появится надпись: «AI-generated».
Нововведение в ближайшие недели начнёт применяться ко всем пользователям по всему миру.
В ближайшие месяцы TikTok также запустит добавление метаданных к сгенерированному контенту. Они будут содержать информацию о том, где и как были сделаны или отредактированы картинки.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Обновлений DALL-E не дождались👍
Please open Telegram to view this post
VIEW IN TELEGRAM