Google выпустила открытые языковые модели Gemma 2B и 7B. Компания отмечает, что во время обучения использовала методы и технологии, которые применяла в закрытой Gemini.
Gemma — семейство лёгких языковых моделей с открытым кодом, которые построены на тех же технологиях и исследованиях, что и Gemini. Кроме того, компания делится всеми необходимыми инструментами для сторонних разработчиков, с помощью которых можно дополнительно обучать модели и использовать их в своих проектах.
Google выпустила модели Gemma с двумя и семью миллиардами параметров. Пользователям доступны готовые к использованию файлы Colab, Kaggle и интеграции с Hugging Face, MaxText, Nvidia NeMo и TensorRT-LLM. Всё это, по мнению инженеров компании, облегчает работу с Gemma.
Предварительно обученные и настроенные модели можно запускать как локально, так и в облаке Vertex AI и Google Kubernetes Engine (GKE). Языковые модели оптимизировали для работы на графических процессорах Nvidia и Google Cloud TPU. Модели Gemma можно использовать в коммерческих проектах.
Источник: habr.com