Весеннее обновление OpenAI: новая модель GPT-4o и десктопная версия

13 мая в 20:00 по Москве прошла презентация OpenAI, где компания представила обновления, которые многие с нетерпением ждали (даже больше чем GPT-4).

Итак, что же нам показали?

Компания представила новую моделю искусственного интеллекта GPT-4o (тот самый загадочный чат-бот с арены). Это обновление расширяет доступность GPT-4 как для платных, так и для бесплатных пользователей.

Технический директор OpenAI, Мира Мурати, отметила, что GPT-4o значительно превосходит предыдущие модели по мощности и скорости. Эта модель вдвое эффективнее и экономичнее своих предшественников, обладает возможностью обрабатывать текст, изображения и аудио, а также распознавать интонации голоса.

Согласно проведенным тестам, GPT-4o занимает лидирующие позиции, опережая другие модели как в программировании, так и в решении разнообразных задач.

https://twitter.com/LiamFedus/status/1790064963966370209

Пройдемся по всем нововведениям:

Модель GPT-4o разработана с мультимодальными возможностями, что позволяет ей обучаться, используя как изображения, так и звуки с самого начала;

GPT-4o уже доступна для интеграции через API, при этом она обладает удвоенной скоростью работы и стоит вдвое меньше предыдущих версий;

Была продемонстрирована усовершенствованная версия аудио-чата с помощью ассистента, который теперь не только шутит и распознает эмоции пользователя, но и позволяет пользователю перебивать его голосом. Ассистент теперь может говорить эмоционально и изменять эмоции по запросу пользователя, включая пение. Функция перевода с использованием GPT-4o работает настолько гладко, что напоминает сцены из научно-фантастических фильмов, без путаницы и необходимости дополнительных действий;

Контекстное окно 128k;

В скором времени будет запущено десктопное приложение:

Справа — окно ChatGPT. Модель обрабатывает выделенную мышкой область.

GPTs + GPT Store теперь для всех;

Модель работает на 50 языках;

Модель оснащена функцией визуального распознавания(+ способна распознавать эмоции человека по видео или фото);

Поддержка видео;

Благодаря новой технологии токенизации, для русского языка количество токенов сократилось в 1.7 раза, что упрощает и ускоряет обработку текста:

Ссылка на презентацию.

Дополнительная информация.

И официальная страница модели.

Видео-примеры использования.

Источник: habr.com

0 0 голоса
Рейтинг новости
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии