13 мая в 20:00 по Москве прошла презентация OpenAI, где компания представила обновления, которые многие с нетерпением ждали (даже больше чем GPT-4).
Итак, что же нам показали?
Компания представила новую моделю искусственного интеллекта GPT-4o (тот самый загадочный чат-бот с арены). Это обновление расширяет доступность GPT-4 как для платных, так и для бесплатных пользователей.
Технический директор OpenAI, Мира Мурати, отметила, что GPT-4o значительно превосходит предыдущие модели по мощности и скорости. Эта модель вдвое эффективнее и экономичнее своих предшественников, обладает возможностью обрабатывать текст, изображения и аудио, а также распознавать интонации голоса.
Согласно проведенным тестам, GPT-4o занимает лидирующие позиции, опережая другие модели как в программировании, так и в решении разнообразных задач.
https://twitter.com/LiamFedus/status/1790064963966370209
Пройдемся по всем нововведениям:
Модель GPT-4o разработана с мультимодальными возможностями, что позволяет ей обучаться, используя как изображения, так и звуки с самого начала;
GPT-4o уже доступна для интеграции через API, при этом она обладает удвоенной скоростью работы и стоит вдвое меньше предыдущих версий;
Была продемонстрирована усовершенствованная версия аудио-чата с помощью ассистента, который теперь не только шутит и распознает эмоции пользователя, но и позволяет пользователю перебивать его голосом. Ассистент теперь может говорить эмоционально и изменять эмоции по запросу пользователя, включая пение. Функция перевода с использованием GPT-4o работает настолько гладко, что напоминает сцены из научно-фантастических фильмов, без путаницы и необходимости дополнительных действий;
Контекстное окно 128k;
В скором времени будет запущено десктопное приложение:
Справа — окно ChatGPT. Модель обрабатывает выделенную мышкой область.
GPTs + GPT Store теперь для всех;
Модель работает на 50 языках;
Модель оснащена функцией визуального распознавания(+ способна распознавать эмоции человека по видео или фото);
Поддержка видео;
Благодаря новой технологии токенизации, для русского языка количество токенов сократилось в 1.7 раза, что упрощает и ускоряет обработку текста:
Ссылка на презентацию.
Дополнительная информация.
И официальная страница модели.
Видео-примеры использования.
Источник: habr.com