Пока OpenAI совершенствует закрытые версии своих систем, китайский стартап Moonshot AI выпустил нечто необычное: полностью открытую модель, которая способна размышлять сотни шагов, кодить целые приложения и самостоятельно искать научные статьи. И самое интересное — это бесплатно.
Стартап Moonshot AI, базирующийся в Китае, запустил K2 Thinking — открытую нейросетевую модель, которая способна конкурировать с дорогостоящими решениями от американских гигантов. Это не просто еще один языковой инструмент. Это система, которая думает пошагово, использует внешние ресурсы и способна решать задачи, требующие глубокого анализа.
Что отличает K2 Thinking от обычных больших языковых моделей — способность к многоуровневому рассуждению. Модель может выполнить до 200−300 последовательных операций с инструментами без участия человека. Представьте: система получает сложный запрос, начинает обдумывать решение, при необходимости запускает код, проверяет результаты, ищет информацию в сети и на основе этого делает вывод. Все это происходит автоматически, в одном потоке мышления.
На тесте Humanity’s Last Exam, экзамене с тысячами вопросов экспертного уровня из более чем сотни дисциплин, K2 Thinking показала 44,9%. На BrowseComp, который проверяет способность постоянно просматривать веб и искать информацию, результат 60,2% при человеческом базовом уровне в 29,2%. Для задач кодирования на SWE-Bench модель достигла 71,3% успеха.
Источник: hi-tech.mail.ru