Компания OpenAI, известная своими передовыми разработками в области искусственного интеллекта, представила новую модель — GPT-4o mini. Это компактная и экономичная версия GPT-4o, нацеленная на то, чтобы сделать передовые технологии ИИ доступными для более широкого круга разработчиков и пользователей.
GPT-4o mini демонстрирует впечатляющие возможности: набирает 82 балла из 100 на тесте MMLU (Massive Multitask Language Understanding), который оценивает способность модели понимать и рассуждать на основе текста. Это ставит ее выше таких конкурентов, как Gemini Flash (77.9) и Claude Haiku (73.8). Модель также показывает отличные результаты в тестах на математические способности (87% на тесте MGSM) и программирование (87.2% на HumanEval), превосходя в этих дисциплинах Gemini 1.5 Flash и Claude 3 Haiku. GPT-4o mini также демонстрирует способность к мультимодальному мышлению, то есть умению работать не только с текстом, но и с изображениями. В будущем планируется добавить поддержку видео и аудио.
Главное преимущество GPT-4o mini — доступность. Её использование обойдется разработчикам в 10 раз дешевле, чем предыдущие модели, и на 60% дешевле, чем GPT-3.5 Turbo. Цена составляет всего 15 центов за миллион входных токенов и 60 центов за миллион выходных.
GPT-4o mini подходит для широкого спектра простых задач, требующих обработки большого объёма данных: от создания чат-ботов и анализа текстов до разработки голосовых помощников и систем машинного перевода. Это не замена для более мощной GPT-4, а более доступный инструмент для решения специфических задач. Модель обладает контекстным окном в 128 тысяч токенов, что позволяет ей обрабатывать и учитывать большой объем информации. Благодаря усовершенствованному токенизатору, GPT-4o mini эффективно работает не только с английским, но и с другими языками.
OpenAI уделила большое внимание безопасности GPT-4o mini. Модель унаследовала от GPT-4o передовые методы фильтрации данных на этапе обучения, обучение с подкреплением на основе отзывов людей (RLHF) и новый метод иерархии инструкций, который защищает от взлома и нежелательного использования.
В четверг OpenAI представила GPT-4o mini для разработчиков через Assistants API, Chat Completions API и Batch API. Пользователи ChatGPT на тарифах Free, Plus и Team получат доступ к модели сегодня, а пользователи Enterprise — на следующей неделе. При этом GPT-4o mini заменит GPT-3.5 Turbo в ChatGPT, и у пользователей больше не будет возможности выбирать между этими двумя моделями. GPT-3.5 Turbo пока останется доступной для разработчиков через API, но в будущем будет убрана.
OpenAI не раскрывает точный размер GPT-4o mini, но заявляет, что она примерно того же уровня, что и другие небольшие модели ИИ, такие как Llama 3 8b, Claude Haiku и Gemini 1.5 Flash. Тем не менее, компания утверждает, что GPT-4o mini быстрее, экономичнее и умнее, чем лучшие в отрасли небольшие модели, основываясь на предстартовом тестировании. Ранние независимые тесты подтверждают это: по сравнению с аналогичными моделями, GPT-4o mini очень быстра, со средней скоростью вывода 202 токена в секунду.
Компания OpenAI видит GPT-4o mini важным шагом на пути к будущему, где мощные технологии ИИ станут доступны каждому, делая нашу жизнь продуктивнее и интереснее. Компания планирует и дальше развивать GPT-4o mini, снижая стоимость и расширяя её возможности.
OpenAI долгое время фокусировалась на разработке более мощных моделей, таких как GPT-4, и только недавно обратила внимание на растущий спрос на более доступные решения. GPT-4o mini призвана заполнить этот пробел, предоставив разработчикам возможность создавать приложения на основе ИИ, не тратя огромные средства на вычислительные мощности. Например, финтех-стартап Ramp использовал GPT-4o mini для создания инструмента, который извлекает данные о расходах из чеков. Вместо того чтобы вручную вводить данные, пользователи могут загрузить фотографию чека, и модель сама распознает и отсортирует информацию. Superhuman, почтовый клиент, также успешно протестировал GPT-4o mini, создав на её основе функцию автоматического предложения ответов на письма.
Помимо релиза GPT-4o mini, OpenAI анонсировала в четверг новые инструменты для корпоративных клиентов. В своем блоге OpenAI анонсировала API-интерфейс Enterprise Compliance, который поможет компаниям в строго регулируемых отраслях, таких как финансы, здравоохранение, юридические услуги и государственное управление, соответствовать требованиям ведения журналов и аудита. API будет предоставлять записи о взаимодействиях с метками времени, включая разговоры, загруженные файлы, пользователей рабочей области и многое другое.
OpenAI также предоставляет администраторам более детальный контроль над GPTs рабочей области — пользовательской версией ChatGPT, созданной для конкретных бизнес-задач. Раньше администраторы могли только полностью разрешать или блокировать действия GPT, созданные в их рабочей области, но теперь владельцы рабочих областей могут создавать утвержденный список доменов, с которыми могут взаимодействовать GPT.
Источник: habr.com