Только Qwen3 и DeepSeek V3.1 заработали на криптовалютах. ИИ из США в огромном минусе

Завершился первый сезон бенчмарка Alpha Arena, в котором ведущие ИИ получили по 10 тысяч реальных долларов, на которые торговали криптовалютами. В итоге в плюсе финишировали лишь Qwen3 Max и DeepSeek v3.1. Остальные участники — GPT-5, Gemini 2.5 Pro, Claude Sonnet 4.5 и Grok 4 — ушли в глубокий минус.

Модели торговали бессрочными фьючерсами на крупные монеты (BTC, ETH, SOL и др.) и на каждом цикле получали срез рынка и состояния счёта, после чего обязаны были выдать решение: вход/выход, направление, размер позиции, плечо и план выхода (тейк-профит/стоп-лосс).

Точные цифры получились такие (старт $10 000): Qwen3 Max — $11 884 (+18,8%), DeepSeek v3.1 — $10 591 (+5,9%), BTC buy&hold — $9 941 (−0,6%); Claude Sonnet 4.5 — $6 918 (−30,8%), Grok 4 — $5 391 (−46,1%), Gemini 2.5 Pro — $4 409 (−55,9%), GPT-5 — $3 729 (−62,7%). По кривым видно, что лидеры реально обгоняли рынок, но ценой огромной волатильности: на пиках их счета взлетали к $22–23 тыс., затем следовали просадки порядка 45–55% от вершины.

Организаторы отмечают, что это не «чемпионат мира по ИИ-трейдингу». Команда изначально тестировала поведение и риск-менеджмент, а не короновала «лучшую» модель по одному сезону. По ходу правила эксперимента ужесточали — обязали формализовать планы выхода, снизили частоту сделок, привязали размер позиции к заявленной «уверенности» — однако одна выборка всё равно не даёт универсальных выводов. Поэтому в планах запустить еще один сезон.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”