Telegram Group Search
Альбом каверов на MC Dimache — Шашлычок.

Я неиронично люблю творчество MC Dimache. Кто не знает — это школьник, который в 2008 напевал на диктофон песни и целые альбомы. Одна из них — культовая Шашлычок (обязательно послушайте). Люблю за то, что, помимо милой искренности и забавных текстов, это очень классная демонстрация того, что для реализации идей не обязательно пользоваться привычными инструментами и подходами. Этот альбом — трибьют этой идее и персонально мистеру Диманчу.

Сделано в Suno, визуал Dalle-3/Midjourney. Советую брать, как OST для IRL шашлыков (проверено на практике).
😎 Немного контента про волшебную нейрошарманку #Suno.

1. Сделал GPT'шку для автоматической разметки текстов песен.

Указываете жанр и кидаете свой текст — получаете его обратно с проставленными [verse], [сhorus] и прочими важностями для модели. Если хотите больше контроля, то второй пункт:

2. Сделал шпаргалку по использованию метатэгов в текстах (на основе Suno WIKI):

База: текст песни важнее метатегов. Тэги лишь помогают модели, но не гарантируют результат. Структура текста, стиль и жанр влияют сильнее. Подбирайте метатеги по жанру!

Основная структура:

Куплет [Verse].
Припев [Chorus].

Дополнительные части песни:

[Pre-chorus] - промежуточная часть между куплетом и припевом.
[Bridge] - часть песни, отличающаяся от основной структуры, создает переход.

Другие части структуры:

[Intro] - тег не всегда работает, лучше описать как [instrumental intro].
[Hook] - повторяющаяся фраза или инструментальная часть.
[Break] - короткая пауза, где ведущие инструменты или вокал замолкают.
[Interlude] - инструментальная секция внутри песни.
[Outro] - завершающая часть песни, можно использовать теги [Fade out] или [Big Finish].

Инструментальные теги:

Можно использовать для создания инструментальных секций, например: [Instrumental Interlude], [Melodic Bass], [Percussion Break]. Важно учитывать жанр песни при использовании инструментальных тегов.

Голосовые теги:

Стиль вокала и пол исполнителя могут быть описаны в промпте стиля и жанра. Можно использовать стилевые вокальные теги, например: [Female Narrator], [Diva Solo], [Gospel Choir]. Но все очень зависит от жанра.

3. Выложил Шашлычок на Ютуб (кто-то просил в комментариях).
Please open Telegram to view this post
VIEW IN TELEGRAM
🍿 Через 10 минут начнется презентация OpenAI — смотрим, чем Альтман будет удивлять.
https://www.youtube.com/live/DQacCB9tDaw?si=rT4ow2ugBndRwm9G
Если вы пропустили, Денис уже накатал саммари презентации. От себя могу сказать, что: огонь, пушка, бомба. Жду возможность прикрутить голос Скарлет Йоханссон, чтобы полностью оказаться в фильме «Her» (усы у меня уже есть).
Forwarded from Denis Sexy IT 🤖
– Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах.

– GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали.

– GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее.

– Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок).

– Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран.


Дополнительные мелочи:

— Заявленные фичи выкатят через пару недель.
— Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим);

— Во время демки ассистент тормозил хехе.

А вот что я предсказывал в посте выше и что сбылось или не сбылось:

Демку ассистента как из фильма Her
Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте
Размер контекстного окна в 1М (мы не знаем пока)
Новую архитектуру к новой модели, у которой сразу будут все фишки выше
GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны)
Новую версию Dalle 3, с улучшенным фотореализмом
Literally me (через пару недель) 😬
This media is not supported in your browser
VIEW IN TELEGRAM
Open AI и Google: итоги.

Специально дождался двух ключевых презентаций, чтобы собрать мысли в кучу и поделиться с вами несколькими тезисами.

Презентации OpenAI - это новые "те самые" презентации Apple.

Только лучше. Когда ты такой: "ЧТООООО?!" и трясущимися руками пытаешься подобрать челюсть с пола. При этом без миллионного продакшена и свистоперделок мемного диджея (привет, Гугл). Только продукт и его техномагия.

Что на самом деле показали?

Новую веху. Почему? Если убрать все рядовые (хоть и крутые) обновления текущих продуктов, то останется самое важное - нам показали новый мультимодальный способ взаимодействия с ИИ, который скоро станет новой нормой. Бесшовное и естественное общение голосом + возможность нейросети "видеть" то, что видите вы в реальном времени - это, как говорили классики, историческая ступень. Одна из важнейших областей разработки в сфере - это не сами модели, а интерфейс и опыт использования. Как этими моделями будут пользоваться? Чат-бот, например, был и остается хорошим решением. Но время двигаться дальше.

Дайте железа.

С точки зрения удобства и привычки, общение по телефону - база. Но думаю, что все же нас ждет новый тип мобильных устройств, рассчитанных на новые мультимодальные возможности. Такие уже есть, но технически провальные: Rabbit, Humane AI pin. Решение лежит в качественном симбиозе железа и софта, так что думаю, что OpenAI наверняка объединит усилия с Microsoft или Apple, чтобы сделать железяку, идеально подходящую для их моделей. А Google на этом давно руку набил (тот же Pixel), и решение с очками уже выглядит перспективно.

Что в итоге?

Очень интересно, но ничего не понятно. С одной стороны, оказываемся в реальности из фантастических фильмов, с другой, поднимается еще больше вопросов. Не усилит ли это изоляцию, когда мы предпочтем общение с идеально понимающей нас нейросетью живым людям? Какие сферы пострадают и что им делать? Те же переводчики или тьюторы? Одно можно посоветовать точно: спите 8 часов, правильно питайтесь, заботьтесь о себе и своих близких.
Королевская серия 👑👺

Я, признаюсь, в восторге от официального портрета короля Чарльза. Абсолютно инфернальный, но из-за этого — впечатляющий.

Представил, что еще королевского можно показать в таком стиле. Довольно интересное упражнение на стилизацию.

Пайплайн: midjourney + magnific (о нем напишу подробнее)+ photoshop.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Тридевятый архив: Панельск 💀

Давно хотел создать свою карманную вселенную, в рамках которой можно рассказывать жанровые истории.

Итак!

Тридевятый архив: это found footage (псевдодокументальный жанр) из альтернативной реальности постсоветского пространства, которое переплетается с необъяснимыми аномалиями и секретными проектами.

Этот файл посвящен проекту "Панельск" — ходячему городу, перспективной и амбициозной разработке, который впоследствии был заброшен.

Если задумка найдет отклик, то займусь реализацией других файлов из архива, пока SORA не вышла.

Инструменты: Midjourney, Stable, Photoshop, Suno, Gen-2, CapCut, руки, голос.

Ну и ссылка на ютуб, кому нужно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Немного процесса из Панельска.

Помимо сотни генераций самих домов и различных ассетов, а также ретуши и композинга, попробовал несколько новых приемов.

Интеграция реальной съемки.

Здесь понял, что катастрофически не хватает навыков в видеокомпозинге, поэтому иду учить After Effects. Хорошо, что товарищ помог вырезать руки (Антон, с меня пиво). Из интересного: на напечатанный чертеж полил немного кофе и подпалил зажигалкой для фактурности, а снимал на фоне зеленого чемодана.

Апскейл сцены для разных масштабов.

Раньше пробовал такое в клипе, но здесь решил пойти еще дальше (буквально), можно увидеть на примере с панелькой на двух ногах.

Тиражирование персонажа.

Вот здесь интересно, на основе этого дома попробовал сделать 3D-модель с помощью instantmesh. Сама модель плохенькая, но прикол в том, что сервис дает картинкой несколько ракурсов персонажа. В ужасном качестве, но ведь это можно апскейлить и доработать.

В общем, как-то так, пока не вышла SORA, а я не прокачен в AE, приходится на ходу придумывать решения из костылей.

Если есть вопросики, пишите!

#tips
This media is not supported in your browser
VIEW IN TELEGRAM
Как создаются и развиваются популярные сервисы вроде Яндекс Браузера или Алисы? Что нужно уметь, чтобы заниматься технологичными продуктами? Узнайте всё из первых уст — на лектории Яндекса, посвящённом 10-летию факультета компьютерных наук ВШЭ! 

Эксперты компании расскажут, какой путь они прошли, чтобы заниматься сервисами с многомиллионной аудиторией, какие навыки им в этом пригодились, а также как их профессии меняются с развитием искусственного интеллекта.
На мероприятии ждут не только студентов НИУ ВШЭ, но и всех, кто влюблён в IT и технологии. Присоединяйтесь к лекторию 11 июня в Культурном центре НИУ ВШЭ или смотрите трансляцию онлайн.

Участие бесплатное, нужна только регистрация. Заполняйте форму по ссылке и вдохновляйтесь историями лучших!
Легкие деньги

В последнее время, из-за мейнстримизации нейросетей, всё чаще стал замечать рекламу разных курсов с тезисами из серии "ЗАРАБОТАЙ 1000000 РУБЛЕЙ ЗА ДВА ДНЯ С ПОМОЩЬЮ ИИ 🤑🤑🤑". Потрясающе! Но полный шлак. Давайте быстро расставим точки над AI и быстрым заработком.

Думаю, большинство моих подписчиков - молодцы и уже достаточно в теме, чтобы понимать, что к чему. Поэтому скиньте этот пост тем, кто только смотрит в сторону AI-штук и курсов по их изучению.

Короче говоря, товарищи маркетологи используют один из множества мифов о нейросетях (рассказываю о них на своих лекциях, но, видимо, нужно сделать отдельный пост). Конкретно - о магической кнопке , которая за вас будет делать всю работу, а вы будете пить манго-шейк на тайском пляже. Fucking NO.😅

Нейросеточки - просто инструменты, которые усиливают вашу экспертизу и уже наработанные компетенции. Всё.

Если вы: 1) ничего не умеете, 2) ни в чем не разбираетесь - нейронки вам никак не помогут. Вы просто не сможете 1) доработать результат, 2) проверить результат. Если вы что-то умеете, то можете делать работу быстрее, брать дополнительный фриланс, запустить свой AI-based стартап, стать AI-блогером. Стратегий много. Но ничего из этого даже близко не пахнет лёгкой прогулкой.

Если уже реклама - фейк, с чего вы взяли, что в самом таком курсе вас ждёт качественный контент, а не водичка? 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
2024/06/12 18:46:27
Back to Top
HTML Embed Code: