Китайский DeepSeek показал самую мощную открытую модель

DeepSeek выпустил предварительные версии новой флагманской модели искусственного интеллекта DeepSeek V4 Pro и DeepSeek V4 Flash. Разработчики назвали их самыми мощными открытыми версий на рынке, превосходящими модели искусственного интеллекта от OpenAI и Anthropic.

Новинка представлена в двух вариантах. DeepSeek V4 Pro — это тяжеловес с 1,6 триллиона параметров, который нацелен на максимальную производительность в сложных задачах. Более легкая версия Flash получила 284 миллиарда параметров и рассчитана на быструю и недорогую работу через API. Обе модели поддерживают контекст до миллиона токенов и используют фирменную гибридную архитектуру внимания, которая, по заявлениям компании, заметно экономит вычислительные ресурсы.

Разработчики особенно гордятся успехами модели в программировании. На платформе Codeforces V4 Pro набирает 3206 баллов, обходя последнюю версию GPT. В бенчмарке LiveCodeBench модель показывает точность выше 93%, превосходя и Gemini от Google, и свежие версии Claude от Anthropic. В самой DeepSeek уже используют V4 Pro для внутренних задач по написанию кода, и сотрудники считают, что модель работает удобнее Sonnet 4.5, приближаясь по качеству к топовому Opus 4.6.

Помимо кода, модель заметно прокачалась в рассуждениях и выполнении сложных поручений. По тестам на агентные задачи и общим знаниям V4 Pro оставляет позади все другие открытые модели и уступает разве что самому сильному закрытому конкуренту.

DeepSeek сохраняет репутацию «ценового диверсанта». V4 Pro стоит 12 юаней за миллион входных токенов и 24 юаня за миллион выходных. Экономный Flash обойдется всего в 1 и 2 юаня соответственно. Веса моделей уже выложили на Hugging Face с открытой лицензией MIT, а разработчики могут подключиться к API через знакомые интерфейсы OpenAI или Anthropic.

Компания подтвердила, что V4 адаптировали под свои, китайские чипы. Пока пропускная способность Pro‑версии ограничена из‑за нехватки высокопроизводительных мощностей, но во второй половине года DeepSeek обещает массовый запуск суперузлов на базе Huawei Ascend 950 и, как следствие, серьёзное снижение цен. Это очередной шаг к тому, чтобы меньше зависеть от графических процессоров Nvidia и экосистемы CUDA.

Напомним, год назад выпуск модели R1, которая имитирует процесс человеческого рассуждения, обвалил фондовый рынок на триллион долларов. R1 работала почти так же хорошо, как передовые системы OpenAI, но, по слухам, была создана за очень небольшие деньги. После этого техногиганты и инвесторы начали сомневаться в оправданности многомиллиардных инвестиций в разработку ИИ. Правда, позже расходы снова выросли, и в 2026 году американские компании планируют инвестировать около 650 миллиардов долларов в ИИ-инфраструктуру и центры обработки данных.

Между тем, Вашингтон китайских разработчиков ИИ-моделей в систематических попытках «выжать» ключевые возможности из американских передовых технологий. По версии Белого дома, речь идет не о разовых экспериментах, а о масштабной и хорошо организованной кампании, которая позволяет получать ценную интеллектуальную собственность без прямого доступа к исходным системам.

В США считают, что Китай ворует технологии искусственного интеллекта. Не просто пробует создать подобное, а копирует абсолютно все: системно и в больших масштабах. Китайские компании якобы массово обращаются к американским ИИ-моделям, задают им миллионы вопросов, а потом на основе ответов учат свои собственные модели. Таким способом они получают почти такие же умные системы, но бесплатно, без огромных затрат на разработку.

Белый дом заявляет, что это нечестно и опасно, потому что китайцы могут заодно сломать защитные настройки американских моделей. Например, научить их выдавать опасные или запрещенные ответы. Впрочем, китайское посольство в США отрицает эти «грязные инсинуации», и заявляет, что они и сами всеми силами ратуют за охрану интеллектуальной собственности.

Если Америка испугается, что её модели воруют, она может закрыть к ним доступ для всех, включая Россию. Сейчас многие наши разработчики пользуются американским ИИ через обходные пути. Если их заблокируют окончательно, работать станет намного сложнее. Олег Бунин: «Для меня промышленный ИИ — это ИИ, обладающий пространственным мышлением» Когда внутренние ИТ-решения становятся драйвером роста корпорации Как правильно управлять ІоТ-проектами

Надеяться на Китай тоже не очень получается. Китай и сам под санкциями, он вряд ли станет делиться своими наработками с Россией. У него своих забот хватает.

Сама технология копирования чужих наработок со временем перестанет работать. Так что российским компаниям лучше не пытаться повторять этот путь, а вкладываться в свои собственные разработки. Да, это дорого и долго, но другого устойчивого варианта нет.

Российский рынок ИИ зажат между Америкой и Китаем. Прямо сейчас ничего моментально поменять не удастся, но готовиться к отключению от западных сервисов нужно. И конечно же, не стоит сидеть и ждать, когда кто-то добрый придет и бесплатно даст современные технологии.

Источник: www.it-world.ru

0 0 голоса

Рейтинг новости