Telegram Group & Telegram Channel
В последние дни было много новостей про релизы open-source моделей различного масштаба, нацеленных на русский язык - собрал небольшую подборку:

1. T-Lite и T-Pro – открытые русскоязычные опенсорс-модели (7B, 32B)

"T-Lite — небольшая и эффективная в инференсе модель с отличными метриками, ее можно использовать для базовых задач или файнтюнинга на целевую задачу.
T-Pro подойдет для решения более широкого класса задач в промптинге или для решения более сложных задач в режиме файнтюнинга, где модели меньшего размера не справляются."

https://habr.com/ru/companies/tbank/articles/865582/

2. Сбер выкладывает GigaChat Lite в открытый доступ (20B)

"- GigaChat-20B-A3B - первая открытая MoE модель в России. В мировой практике мало кому в мире удается обучать MoE архитектуры с хорошим качеством.
- GigaChat обучен преимущественно на русском языке, поэтому не совершает грамматических и пунктуационных ошибок и не переключается на другие языки во время разговора
- В GigaChat-20B-A3B дешевый инференс сочетается с хорошими показателями метрик
- Модель отлично подходит для исследований, например, концентрации"

https://habr.com/en/companies/sberdevices/articles/865996/

3. Meno-Tiny-0.1 от "Сибирских нейросетей" (1.5B)

"Основная цель Meno-Tiny - быть частью RAG-пайплайна, решая такие задачи, как ответы на вопросы по релевантным документам, абстрактивная саммаризация, разрешение анафоры в пользовательских вопросах, определение токсичности, детоксификация и другие задачи"

https://www.tg-me.com/dialoger_tech/179

Дополняйте, если что-то свеженькое пропустил.



tg-me.com/scientific_opensource/46
Create:
Last Update:

В последние дни было много новостей про релизы open-source моделей различного масштаба, нацеленных на русский язык - собрал небольшую подборку:

1. T-Lite и T-Pro – открытые русскоязычные опенсорс-модели (7B, 32B)

"T-Lite — небольшая и эффективная в инференсе модель с отличными метриками, ее можно использовать для базовых задач или файнтюнинга на целевую задачу.
T-Pro подойдет для решения более широкого класса задач в промптинге или для решения более сложных задач в режиме файнтюнинга, где модели меньшего размера не справляются."

https://habr.com/ru/companies/tbank/articles/865582/

2. Сбер выкладывает GigaChat Lite в открытый доступ (20B)

"- GigaChat-20B-A3B - первая открытая MoE модель в России. В мировой практике мало кому в мире удается обучать MoE архитектуры с хорошим качеством.
- GigaChat обучен преимущественно на русском языке, поэтому не совершает грамматических и пунктуационных ошибок и не переключается на другие языки во время разговора
- В GigaChat-20B-A3B дешевый инференс сочетается с хорошими показателями метрик
- Модель отлично подходит для исследований, например, концентрации"

https://habr.com/en/companies/sberdevices/articles/865996/

3. Meno-Tiny-0.1 от "Сибирских нейросетей" (1.5B)

"Основная цель Meno-Tiny - быть частью RAG-пайплайна, решая такие задачи, как ответы на вопросы по релевантным документам, абстрактивная саммаризация, разрешение анафоры в пользовательских вопросах, определение токсичности, детоксификация и другие задачи"

https://www.tg-me.com/dialoger_tech/179

Дополняйте, если что-то свеженькое пропустил.

BY Научный опенсорс


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/scientific_opensource/46

View MORE
Open in Telegram


telegram Telegram | DID YOU KNOW?

Date: |

To pay the bills, Mr. Durov is issuing investors $1 billion to $1.5 billion of company debt, with the promise of discounted equity if the company eventually goes public, the people briefed on the plans said. He has also announced plans to start selling ads in public Telegram channels as soon as later this year, as well as offering other premium services for businesses and users.

In many cases, the content resembled that of the marketplaces found on the dark web, a group of hidden websites that are popular among hackers and accessed using specific anonymising software.“We have recently been witnessing a 100 per cent-plus rise in Telegram usage by cybercriminals,” said Tal Samra, cyber threat analyst at Cyberint.The rise in nefarious activity comes as users flocked to the encrypted chat app earlier this year after changes to the privacy policy of Facebook-owned rival WhatsApp prompted many to seek out alternatives.telegram from us


Telegram Научный опенсорс
FROM USA