Китайский стартап MiniMax представил модель MiniMax M1 — конкурент для Gemini 2.5 Pro

Китайский стартап в области искусственного интеллекта MiniMax выпустил MiniMax-M1 — новую языковую модель с открытым исходным кодом, которая превосходит R1 от Deepseek.

MiniMax-M1 — это модель, ориентированная на рассуждения, с большим контекстным окном до одного миллиона токенов и «мыслительным» бюджетом до 80 000 токенов. Модель использует особенно эффективный подход к обучению с подкреплением, что делает её намного компактнее, чем другие варианты с открытым исходным кодом.

Он доступен бесплатно по лицензии Apache-2.0. В тестовых испытаниях MiniMax-M1 превосходит другие открытые модели, такие как DeepSeek-R1-0528 и Qwen3-235B-A22B, в нескольких категориях. В тесте OpenAI MRCR, который измеряет способность к сложным многоэтапным рассуждениям на основе длинных текстов, производительность M1 близка к ведущей закрытой модели Gemini 2.5 Pro.

В то время как проприетарные модели, такие как OpenAI o3 и Gemini 2.5 Pro, по-прежнему имеют преимущество в некоторых областях, MiniMax-M1 значительно сократил разрыв. Модель доступна в двух версиях на Hugging Face.

Расцвет стартапов в сфере искусственного интеллекта в Китае

MiniMax, стартап в области искусственного интеллекта из Шанхая, быстро стал крупным игроком на растущем рынке ИИ в Китае. Компания, основанная в конце 2021 года при поддержке таких инвесторов, как Alibaba, специализируется на разработке передовых языковых и мультимодальных моделей.

Ранее в этом году компания MiniMax выпустила несколько языковых моделей с открытым исходным кодом, в том числе MiniMax-Text-01, которая может обрабатывать до четырёх миллионов токенов контекста — в два раза больше, чем ведущие модели на данный момент. Хотя большее окно контекста впечатляет, исследователи предупреждают, что большее количество токенов не всегда означает более точную формулировку ответов.

MiniMax также разрабатывает мультимодальные системы искусственного интеллекта, в том числе MiniMax-VL-01, которые могут обрабатывать как текст, так и изображения. В сентябре 2024 года компания выпустила abab-video-1 («Видео-01»), модель преобразования текста в видео, которая создаёт короткие HD-видео с виртуальным движением камеры.

Пользуясь случаем, хочу порекомендовать BotHub — платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!

Источник

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии