Дешёвый DeepSeek уже опередили — и снова китайцы

Китайская компания Z.AI представила новую открытую языковую модель GLM-4.5. Это MoE-модель с архитектурой на 355 миллиардов параметров, из которых 32 миллиарда активны.

Искусственный интеллект

Стартап Z.ai, ранее известный как Zhipu, объявил, что его новая модель ИИ GLM-4.5 будет стоить дешевле, чем DeepSeek. В отличие от логики, лежащей в основе существующих моделей ИИ, Z.ai заявил, что новая модель GLM-4.5 построена на так называемом «агентном» ИИ, то есть модель автоматически разбивает задачу на подзадачи для более точного её выполнения.

По уровню общих знаний и результатам в научных тестах модель немного отстаёт как от западных флагманов, так и от некоторых китайских open-source конкурентов. Зато в задачах с агентами, программированием и автономной работой в интернете показывает выдающиеся результаты — вплоть до превосходства над лидерами рынка. При этом по стоимости примерно в 5 раз дешевле Grok 4 и Sonnet 4.

Nvidia адаптировала чип специально для Китая, чтобы он соответствовал требованиям американского экспортного контроля. В этом месяце компания сообщила, что США разрешили ей возобновить продажи в Китае после трёхмесячного перерыва. Однако сроки начала поставок пока остаются неопределёнными.

Генеральный директор Z.ai Чжан Пэн заявил, что компании не нужно закупать дополнительные чипы, поскольку у неё пока достаточно вычислительной мощности, но отказался раскрыть сумму, потраченную Z.ai на обучение модели ИИ. Подробности будут опубликованы позже, добавил он.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии