DeepSeek выпустила обновление своего чат-бота — версию 3.1

Китайский конкурент ChatGPT, компания DeepSeek, выпустила обновление своего чат-бота — версию 3.1. Это обновление принесло расширение контекстного окна до 128 000 токенов и увеличение количества параметров до 685 млрд. Благодаря расширению контекстного окна чат-бот может работать с большими техническими документами и вести многовариантные диалоги, сохраняя в памяти входные данные в объёме, эквивалентном 300-400 текстовым страницам. Эксперты рынка ожидали, что компания представит следующее поколение своей модели DeepSeek R2. Но, согласно попавшим в сеть данным, ей не удалось добиться прогресса в обучении этой версии большой языковой модели из-за проблем, возникших при использовании чипов Huawei Ascend, поэтому компания представила промежуточное решение в версии V3.1. Компания DeepSeek не снимает с повестки выпуск следующего поколения модели DeepSeek R2, но пока не ясно, когда он может состояться. Задержки с выходом новой версии большой языковой модели демонстрируют ограниченность возможностей китайских разработчиков в условиях отсутствия достаточного количества современных процессоров от Nvidia, которые лучше подходят для обучения последних поколений моделей генеративного искусственного интеллекта.

Источник: mobile-review.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии