По некоторым данным, выпуск R2, изначально запланированный на май, может состояться значительно раньше. Компания не раскрывает деталей, но известно, что модель получит улучшенные возможности программирования и расширенную поддержку многоязычного анализа. DeepSeek воздерживается от комментариев по поводу ускоренных сроков разработки.
Новая реальность для ИИ-отрасли
Прорыв DeepSeek кардинально меняет баланс сил в индустрии. Несмотря на использование менее мощных чипов Nvidia, модель R1 смогла составить конкуренцию решениям крупнейших разработчиков. Компания доказала, что можно создавать мощные ИИ-модели при меньших затратах. Это заставило другие компании ускорить свои разработки и сломало монополию ведущих игроков.
Вашингтон напряженно следит за создавшейся ситуацией. Известно, что в США технологическое лидерство в ИИ считается стратегическим приоритетом. Вполне возможно, что по результатам «наблюдений», американцы введут новые ограничения на поставки вычислительных компонентов в Китай. Тем временем китайские корпорации уже начали интеграцию моделей DeepSeek в свои продукты, усиливая влияние компании.
Стратегия с нестандартным подходом
Несмотря на стремительный успех, основатель DeepSeek Лян Вэньфэн остается загадочной фигурой. Разбогатев, он практически исчез из публичного пространства в 2024 году. Кроме того, рабочие процессы в компании отличаются от принятых в китайских корпорациях: вместо жестких иерархий и изнурительных рабочих часов сотрудники работают в гибкой среде, получая высокие зарплаты и свободу в исследованиях.
Лян делает ставку не на массовую коммерциализацию, а на фундаментальные исследования. Его инвестиционный фонд High-Flyer финансирует передовые разработки и предоставляет DeepSeek доступ к мощным вычислительным ресурсам.
Секрет успеха в вычислительных мощностях
Ключевым фактором успеха DeepSeek стал доступ к вычислительным мощностям. High-Flyer начал собирать кластеры суперкомпьютеров задолго до создания DeepSeek, что стало решающим преимуществом, когда США ввели санкции против Китая. Компания активно использует передовые архитектуры, такие как Mixture-of-Experts (MoE) и Multihead Latent Attention (MLA), что значительно снижает затраты на вычисления. Аналитики оценивают, что модели DeepSeek обходятся в 20–40 раз дешевле, чем аналоги от OpenAI.
Реакция на новинку в Китае и мире
По мере роста DeepSeek реакция мировых регуляторов становится все более неоднозначной. Австралия, Италия и Тайвань запретили использование приложения DeepSeek на всех правительственных устройствах/ По официальной версии это произошло из-за проблем с конфиденциальностью. Эксперты IT-World предполагают, что если модели DeepSeek будут использоваться в китайских государственных структурах, то это может привести и к новым санкциям со стороны США.
Пекин, в свою очередь, все больше поддерживает DeepSeek. Китайские корпорации Baidu, Tencent и Lenovo, уже начали интеграцию моделей DeepSeek в свои сервисы.
Между тем, xAI, основанная Илоном Маском, представила свою новую модель искусственного интеллекта — Grok 3. По предварительным данным, эта нейросеть намного мощнее, чем известные модели, такие как Gemini 2 Pro от Google DeepMind, DeepSeek V3, Claude 3.5 от Anthropic и даже GPT-4o от OpenAI. Читайте также Кто дотянет до финиша в гонке ИИ? Искусственный интеллект переписывает правила, а Китай и США ведут ожесточённую гонку за лидерство. Миллионы инвестиций, технологические прорывы, растущие ставки — кто окажется впереди? Аналитический экскурс IT-World погружает в этот захватывающий мир, где даже самые смелые прогнозы напоминают детективный сюжет.
Источник: www.it-world.ru