Inception Labs представляет серию программ LLM Mercury на основе диффузии

Inception Labs представила Mercury, новую серию больших языковых моделей, которые используют технологию диффузии вместо традиционной авторегрессионной обработки. Компания сообщает, что эти модели могут обрабатывать задачи в 10 раз быстрее, чем текущие подходы, причем первые выпуски были сосредоточены на кодировании приложений.

Непоследовательный подход позволяет по-разному обрабатывать рассуждения, структуру ответа и исправление ошибок. Хотя технология диффузии является стандартной в генерации изображений и видео, она остается редкостью в текстовых и аудио-приложениях.

Mercury Coder создает клон «Сапера» за меньшее время, чем требуется для решения игры.

Mercury Coder доступен для тестирования на chat.inceptionlabs.ai. Система обрабатывает запросы, одновременно показывая интерактивный предварительный просмотр сгенерированного программного обеспечения в боковой панели.

В стандартных тестах генерации кода Mercury Coder работает аналогично авторегрессионным моделям, таким как Gemini 2.0 Flash-Lite и GPT-4o-mini, достигая при этом более высоких скоростей на стандартных графических процессорах Nvidia H100. Система генерирует более 1000 токенов в секунду — ранее это было возможно только со специализированными чипами вывода AI, такими как у Groq.

Диаграмма рассеивания сравнивает производительность различных кодирующих AI на основе скорости их вывода. 

Inception Labs тестирует технологию для поддержки клиентов, генерации кода и автоматизации бизнеса. Некоторые из ее клиентов начали заменять авторегрессионные модели на Mercury, а модель чата находится в стадии закрытого бета-тестирования.

Бывший исследователь OpenAI Андрей Карпати обсудил подход Mercury к X, отметив, что предпочтение авторегрессивной обработки в тексте и аудио по сравнению с диффузией в изображениях и видео было постоянным техническим вопросом и «для меня и многих других было загадкой, почему по какой-то причине текст предпочитает авторегрессию» диффузии.

«Если присмотреться, то можно заметить много интересных связей между ними», — пишет Карпати, отмечая, что Меркьюри может продемонстрировать «новую, уникальную психологию или новые сильные и слабые стороны».

Mercury Coder доступен через Playground. Корпоративные клиенты могут запросить доступ к Mercury Coder Mini и Mercury Coder Small через API или локальное развертывание инфраструктуры. Информация о ценах не была опубликована.

Источник

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии