Японский стартап в области искусственного интеллекта Sakana AI разработал новый метод, который позволяет нескольким большим языковым моделям, таким как ChatGPT и Gemini, совместно решать одну и ту же задачу. Предварительные тесты показывают, что такой совместный подход превосходит работу отдельных моделей.
Метод под названием AB-MCTS (адаптивный поиск по дереву Монте-Карло с ветвлением) представляет собой алгоритм, который позволяет нескольким моделям ИИ решать задачу одновременно. Модели обмениваются данными и уточняют свои предложения, работая сообща, как команда людей.
AB-MCTS сочетает в себе две разные стратегии поиска: он может либо совершенствовать существующее решение (поиск в глубину), либо пробовать совершенно новые подходы (поиск в ширину). Вероятностная модель постоянно определяет, в каком направлении двигаться дальше.
В версии с несколькими языковыми моделями (Multi LLM AB-MCTS) система динамически выбирает, какая модель — например, ChatGPT, Gemini или DeepSeek — лучше всего подходит для решения текущей задачи. Этот выбор меняется в зависимости от того, какая модель даёт наилучшие результаты при решении конкретной проблемы.
Комбинации нескольких LLM заметно повышают производительность AB-MCTS Pass@k на ARC-AGI-2 по мере увеличения количества вызовов LLM, при этом o4-mini + Gemini-2.5-Pro + R1-0528 превосходят одиночные модели AB-MCTS получает результаты от ARC-AGI-2
Во время тестирования на сложном бенчмарке ARC-AGI-2 модель Multi-LLM AB-MCTS решила больше задач, чем любая другая модель, работающая отдельно (Single-LLM AB-MCTS).
Всё же есть некоторые ограничения. Если разрешить моделям неограниченное количество попыток, система будет находить правильный ответ примерно в 30% случаев. Но в официальном тесте ARC-AGI-2, где обычно можно дать только один или два ответа, процент успешных попыток значительно снижается.
Чтобы решить эту проблему, Sakana AI планирует разработать новые методы автоматического определения и выбора наиболее подходящих вариантов. Одна из идей заключается в использовании дополнительной модели ИИ для оценки вариантов. Этот подход также можно сочетать с системами, в которых модели ИИ обсуждают решения друг с другом.
Компания Sakana AI выпустила алгоритм в виде программного обеспечения с открытым исходным кодом под названием TreeQuest, чтобы другие разработчики могли применять этот метод для решения своих задач.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Перевод, источник новости здесь.
Источник: habr.com