Вышла Kimi-Linear-A3B: гигантский контекст при разумных требованиях к железу

Moonshot AI выложила на Hugging Face новую большую языковую модель под названием Kimi-Linear-48B-A3B-Instruct. Главная особенность — она умеет работать с контекстом до 1 млн токенов, то есть способна держать очень длинные документы, переписки или наборы исходников. Веса модели открыты, поэтому использовать может любой желающий.

Архитектура использует вариант линейного внимания , который позволяет не раздувать память и не замедляться на длинных запросах. Формально модель насчитывает около 48 млрд параметров, но в работу на каждом шаге вовлекается примерно 3 млрд. Такой подход позволяет при сохранении качества понизить требования к железу. В карточке модели приведен пример запуска через vLLM с разбиением на четыре видеокарты — на этом основании делают осторожную оценку, что Kimi-Linear-48B-A3B-Instruct ориентирована на конфигурации уровня 4×GPU с 24–40 ГБ памяти каждая.

Версия, выложенная в открытый доступ, уже дообучена в формате Instruct, то есть настроена на диалог и выполнение инструкций, а не только на «продолжи текст». Это делает ее пригодной для ассистентов, систем анализа больших документов, агентов, которые должны последовательно обрабатывать длинную историю запросов.

Moonshot пока не публиковала официальных бенчмарков, но для рынка открытых LLM это заметный шаг: до сих пор миллионный контекст чаще был либо маркетинговым заявлением, либо требовал слишком дорогого оборудования.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”