Представлена Kimi-K2 Thinking: китайская ИИ-модель умнее GPT-5

Пока OpenAI совершенствует закрытые версии своих систем, китайский стартап Moonshot AI выпустил нечто необычное: полностью открытую модель, которая способна размышлять сотни шагов, кодить целые приложения и самостоятельно искать научные статьи. И самое интересное — это бесплатно.

Стартап Moonshot AI, базирующийся в Китае, запустил K2 Thinking — открытую нейросетевую модель, которая способна конкурировать с дорогостоящими решениями от американских гигантов. Это не просто еще один языковой инструмент. Это система, которая думает пошагово, использует внешние ресурсы и способна решать задачи, требующие глубокого анализа.

Что отличает K2 Thinking от обычных больших языковых моделей — способность к многоуровневому рассуждению. Модель может выполнить до 200−300 последовательных операций с инструментами без участия человека. Представьте: система получает сложный запрос, начинает обдумывать решение, при необходимости запускает код, проверяет результаты, ищет информацию в сети и на основе этого делает вывод. Все это происходит автоматически, в одном потоке мышления.

На тесте Humanity’s Last Exam, экзамене с тысячами вопросов экспертного уровня из более чем сотни дисциплин, K2 Thinking показала 44,9%. На BrowseComp, который проверяет способность постоянно просматривать веб и искать информацию, результат 60,2% при человеческом базовом уровне в 29,2%. Для задач кодирования на SWE-Bench модель достигла 71,3% успеха.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”