Telegram Group & Telegram Channel
Добавили Llama 4 Maverick и Llama 4 Scout на llmarena.ru

Вышли две новые модели с открытыми весами:
Llama 4 Scout и Llama 4 Maverick — обе мультимодальные, обе на MoE, обе 🔥

Что нового и крутого:
10М контекста у Scout — да, 10 миллионов токенов, и модель тянет это с качеством
Мультимодальность из коробки: текст, картинки, видео, всё в одной архитектуре
Llama 4 Scout — 17B активных параметров / 109B общих (16 экспертов), работает на одном H100
Llama 4 Maverick — 17B активных / 400B общих (128 экспертов), уделывает GPT-4o и Gemini 2.0 Flash на бенчмарках
— В основе — Behemoth (ещё в обучении): 288B активных / 2T общих

Обе модели мощно посттренились:
— Сложные данные, онлайн RL, мягкий DPO
— Вычищены «лёгкие» примеры — упор на reasoning, код, математику
— Scout отлично держит длинный контекст (10М) + iRoPE архитектура
— Maverick — топ в мультимодальности и диалогах

Где трогать:
Hugging Face
Блогпост
llmarena.ru

Модели доступны совершенно бесплатно как в публичной, так и в анонимной арене, го тестировать!



tg-me.com/llm_arena/42
Create:
Last Update:

Добавили Llama 4 Maverick и Llama 4 Scout на llmarena.ru

Вышли две новые модели с открытыми весами:
Llama 4 Scout и Llama 4 Maverick — обе мультимодальные, обе на MoE, обе 🔥

Что нового и крутого:
10М контекста у Scout — да, 10 миллионов токенов, и модель тянет это с качеством
Мультимодальность из коробки: текст, картинки, видео, всё в одной архитектуре
Llama 4 Scout — 17B активных параметров / 109B общих (16 экспертов), работает на одном H100
Llama 4 Maverick — 17B активных / 400B общих (128 экспертов), уделывает GPT-4o и Gemini 2.0 Flash на бенчмарках
— В основе — Behemoth (ещё в обучении): 288B активных / 2T общих

Обе модели мощно посттренились:
— Сложные данные, онлайн RL, мягкий DPO
— Вычищены «лёгкие» примеры — упор на reasoning, код, математику
— Scout отлично держит длинный контекст (10М) + iRoPE архитектура
— Maverick — топ в мультимодальности и диалогах

Где трогать:
Hugging Face
Блогпост
llmarena.ru

Модели доступны совершенно бесплатно как в публичной, так и в анонимной арене, го тестировать!

BY LLM Arena


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/llm_arena/42

View MORE
Open in Telegram


telegram Telegram | DID YOU KNOW?

Date: |

What is Secret Chats of Telegram

Secret Chats are one of the service’s additional security features; it allows messages to be sent with client-to-client encryption. This setup means that, unlike regular messages, these secret messages can only be accessed from the device’s that initiated and accepted the chat. Additionally, Telegram notes that secret chats leave no trace on the company’s services and offer a self-destruct timer.

The SSE was the first modern stock exchange to open in China, with trading commencing in 1990. It has now grown to become the largest stock exchange in Asia and the third-largest in the world by market capitalization, which stood at RMB 50.6 trillion (US$7.8 trillion) as of September 2021. Stocks (both A-shares and B-shares), bonds, funds, and derivatives are traded on the exchange. The SEE has two trading boards, the Main Board and the Science and Technology Innovation Board, the latter more commonly known as the STAR Market. The Main Board mainly hosts large, well-established Chinese companies and lists both A-shares and B-shares.

telegram from in


Telegram LLM Arena
FROM USA