tg-me.com/data_analysis_ml/3699
Last Update:
🧠 Крупнейшие reasoning-модели 2025 года с техническими отчётами
(с акцентом на те, где используется RL)
📌 Для изучения, сравнения и анализа архитектур
1. DeepSeek R1 (22 янв)
https://arxiv.org/abs/2501.12948
2. Kimi 1.5 (22 янв)
https://arxiv.org/abs/2501.12599
3. Open-Reasoner-Zero (31 мар)
https://arxiv.org/abs/2503.24290
4. Seed 1.5-Thinking (10 апр)
https://arxiv.org/abs/2504.13914
5. Phi-4 Reasoning (30 апр)
https://arxiv.org/abs/2504.21318
6. Llama-Nemotron (2 мая)
https://arxiv.org/abs/2505.00949
7. Qwen 3 (14 мая)
https://arxiv.org/abs/2505.09388
8. Skywork Open Reasoner 1 (28 мая)
https://arxiv.org/abs/2505.22312
9. Xiaomi MiMo (4 июня)
https://arxiv.org/abs/2505.07608
10. Magistral (10 июня)
https://mistral.ai/static/research/magistral.pdf
11. OpenThoughts —https://arxiv.org/abs/2506.04178
💡 Эти модели — основа новой волны "умных" LLM, которые не просто генерируют, а думают, планируют и корректируют поведение через обратную связь
BY Анализ данных (Data analysis)
Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283
Share with your friend now:
tg-me.com/data_analysis_ml/3699