Qwen2 — самый мощный релиз открытых LLM со времен Llama 3

Alibaba только что выпустили свое новое семейство мультиязычных моделей, которых превосходят по производительности Llama 3 по многим параметрам.

🤯 Qwen2 выпущен в 5 размерах, обучен на 29 языках! 

5️⃣ Размеры: 0.5B, 1.5B, 7B, 57B-14B (MoE), 72B.

✅ Контекст: 32k для 0.5B & 1.5B, 64k для 57B MoE, 128k для 7B и 72B

✅ Поддерживает 29 языков.

📜 Выпущены под лицензией Apache 2.0, за исключением версии 72B.

📖 BLOG: https://qwenlm.github.io/blog/qwen2/

🤗 HF collection: https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f

🤖 https://modelscope.cn/organization/qwen

💻 GitHub: https://github.com/QwenLM/Qwen2

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

Источник: habr.com

0 0 голоса
Рейтинг новости
0
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии