GPT-5: самая безопасная, умная и масштабируемая модель от OpenAI

P.S — Пока идет трансляция на YouTube, я буду описывать GPT-5. 7 августа 2025 года OpenAI официально представила GPT‑5 — новую масштабную языковую модель, которая сочетает инженерную устойчивость, мультифункциональность и управляемость. В отличие от предыдущих релизов, GPT‑5 — это не одна модель, а интегрированная система с динамической маршрутизацией, многоступенчатой безопасностью и адаптацией под конкретные задачи. Модель создавалась не просто для улучшения результатов на бенчмарках, а для решения задач в бизнесе, науке, программировании и здравоохранении.

GPT‑5 — это семейство моделей, различающихся по скорости и глубине анализа:

Название

Назначение

gpt-5-main

Стандартная быстрая модель

gpt-5-main-mini

Упрощённая и ещё более быстрая

gpt-5-thinking

«Размышляющая» модель для сложных задач

gpt-5-thinking-pro

Ускоренная reasoning-модель с параллельной обработкой

gpt-5-thinking-nano

Компактная reasoning-модель для разработчиков

Модель выбирается автоматически: встроенный роутер анализирует тип запроса и выбирает подходящий вариант. Эта архитектура улучшает не только точность, но и эффективность работы ChatGPT.

Доступность и лицензирование

GPT‑5 уже доступна в ChatGPT:

Тип аккаунта

Что доступно

Pro / Plus / Team / Free

GPT‑5 с роутингом, reasoning частично

Enterprise / Edu

Доступ открывается в течение недели

Pro-подписчики

Неограниченный доступ к GPT‑5 и GPT‑5 Pro

Также GPT‑5 можно использовать в Codex CLI без отдельной оплаты за API — достаточно зайти через ChatGPT. Это открывает путь к работе с кодом и shell-командами в терминале.

🔁 Бесплатные пользователи получают доступ к reasoning примерно на 2–3 дня в неделю. После превышения лимита запросы перенаправляются на gpt-5-mini.

Ключевые метрики производительностиТочность

На реальных запросах ChatGPT (production prompts):

На 65% меньше галлюцинаций у gpt-5-thinking по сравнению с OpenAI o3;

На 44% меньше серьёзных ошибок у gpt-5-main по сравнению с GPT‑4o;

В задачах с медицинским риском ошибки снижены в 50 раз (данные HealthBench).

Безопасность

GPT‑5 реализует метод Safe Completions — отказ от бинарной логики «разрешено/запрещено» в пользу оценки результата и предоставления безопасного, но полезного ответа, особенно в так называемых dual-use сценариях (биология, кибербезопасность, химия).

Dual-use prompts — запросы, которые могут иметь как безвредные, так и потенциально вредные применения (например, описание биологического эксперимента).

Примеры защиты:

Категория

gpt-5-thinking

GPT‑4o

Устойчивость к джейлбрейкам

99.9%

95.5%

Отказ от самоповреждающего контента

95.5%

84.9%

Снижение лести (sycophancy)

–75%

На тестирование безопасности потратили более 9 тыс. часов — модель получила статус высокого риска по вопросам био- и химической безопасности, но она все равно безопаснее аналогов.

При «небезопасном» запросе модель не просто уйдет в отказ, а обоснованно объяснит пользователю, что не так с задачей.

GPT‑5 обеспечивает большую отдачу при меньшем времени на обдумывание. По нашим оценкам, GPT‑5 (с мышлением) работает лучше, чем OpenAI o3, на 50-80% сокращая количество выходных токенов по всем возможностям, включая визуальное мышление, агентное кодирование и решение научных задач на уровне выпускника.

Возможности GPT‑5 в программировании

Одно из ключевых направлений применения GPT‑5 — это программирование и автоматизация инженерных задач. Благодаря улучшенной архитектуре reasoning и поддержке инструментов, модель уверенно справляется с генерацией, отладкой и анализом кода в реальных условиях. Сейчас это лучшая модель для кодинга, создающая сложные приложения за один промпт, аккуратно и автономно работающая с инструментами и файлами. Не теряется в длинном контексте.

GPT‑5 полностью интегрирована в Codex CLI — инструмент, позволяющий использовать возможности модели в терминале. Пользователи ChatGPT с подпиской Plus, Pro или Team могут запускать Codex CLI без дополнительной платы за API.

Сценарии применения:

генерация скриптов и CLI-команд;

деплой и автоматизация процессов;

отладка кода и исправление ошибок;

написание автотестов;

анализ логов и поведение систем.

Codex CLI — это расширение ChatGPT, позволяющее использовать языковую модель как интерактивного ассистента в командной строке. Она объединяет ИИ с привычной оболочкой разработчика — без необходимости переключаться между окнами.

OpenAI также протестировала GPT‑5 в условиях задач типа Capture the Flag (CTF) — это тесты на проникновение, реверс-инжиниринг, криптоанализ и эксплуатацию уязвимостей. Модель показала стабильные результаты, сравнимые с GPT‑4.5, но с значительно более высоким уровнем безопасности и фильтрации вредных действий.

GPT‑5 не допускает генерации инструкций по созданию вредоносных скриптов, обходит провокационные запросы и не вовлекается в обсуждение эксплойтов — даже если они завуалированы.

Модель натренирована не просто писать код, а писать как персоналия — она учтет стиль кода в котором он написан и будет генерировать код в таком же стиле.

Особый уклон модели к ее «сдерживанию» (Containment)

С учётом растущих способностей GPT‑5, особенно в чувствительных областях (биология, химия, программирование), OpenAI внедрила жесткую систему сдерживания. Модель GPT‑5 Thinking официально отнесена к категории High Capability — то есть, обладающей потенциальным риском при злоупотреблении.

Применены следующие уровни защиты:

Техническое сдерживание — фильтрация вредоносных токенов, распознавание опасных цепочек рассуждений, запрет на вывод чувствительных инструкций;

Политическое сдерживание — доступ к API предоставляется только через закрытую Trusted Access Program;

Системное сдерживание — модели физически ограничены в генерации информации, касающейся синтеза ядов, вирусов, опасных веществ;

Редтиминг — более 400 независимых специалистов провели свыше 9000 часов тестирования модели в условиях вредоносных сценариев.

GPT‑5 в корпоративной практике

Одним из ключевых отличий GPT‑5 от предыдущих поколений моделей OpenAI является её готовность к производственному применению в масштабах крупного бизнеса. Модель не просто «общается» или помогает решать задачки, а встраивается в операционные процессы, снижает издержки, ускоряет анализ и улучшает принятие решений. Это подтверждается реальными кейсами внедрения в международных компаниях.

Примеры использования GPT‑5 в бизнесе

Компания

Отрасль

Применение GPT‑5

Amgen

Биотехнологии

Поддержка научных исследований, анализ публикаций, биоинформатика

Moderna

Фармацевтика

Подготовка медицинской документации, поиск клинических решений

BBVA

Финансовые услуги

Создание внутренних ассистентов, генерация отчётов, поддержка аналитиков

Uber

Технологии / Логистика

Автоматизация внутренней документации, генерация корпоративных инструкций

Lowe’s

Ритейл

Поддержка команд HR, Legal, IT, маркетинга: автоматизация шаблонов, генерация контента

Salesforce

SaaS / CRM

Интеграция в продукты для клиентов, генерация кастомных бизнес-отчётов

PwC

Консалтинг

Анализ документов, автоматизация рутинной аналитики для клиентов

Что конкретно делает GPT‑5 внутри компаний?

Автоматизация рутинных задач Генерация справок, служебных записок, отчётов, внутренних инструкций, стандартных ответов.

Помощь в принятии решений Модель обучена reasoning-подходу и может анализировать контекст задач, строить логические выводы и предлагать обоснованные рекомендации (например, на базе юридических текстов или финансовых отчётов).

Инструмент разработчика и аналитика Генерация SQL-запросов, преобразование данных, написание unit-тестов, проверка кодовой базы, помощь в CI/CD.

Обработка естественного языка GPT‑5 переводит сложные документы (например, юридические, технические) на понятный язык для сотрудников или клиентов.

Работа с большим объёмом данных Модель может обрабатывать, структурировать и суммировать десятки документов, табличных отчётов, email-цепочек и других входов в формате RAG (retrieval-augmented generation).

Почему GPT‑5 применим в enterprise-сценариях?

Критерий

Что реализовано в GPT‑5

Надёжность reasoning

Модель рассуждает, а не просто подбирает вероятный ответ

Контроль и безопасность

Сдерживание, отказ от генерации опасного контента, аудит

Масштабируемость

Поддержка десятков тысяч пользователей в одной организации

Инструменты командной работы

ChatGPT for Teams, управление доступами, админ-панель

Интернационализация

Поддержка 13+ языков, адаптация под локальные рынки

По данным OpenAI, свыше 5 миллионов рабочих команд уже используют GPT‑5 в рамках подписки ChatGPT Business.

Корпоративный доступ и условия

GPT‑5 доступен в следующих тарифах:

Подписка

Возможности

ChatGPT Team

Общий доступ для команд, единая оплата, политика безопасности

ChatGPT Enterprise

Расширенные лимиты, кастомизация, API-интеграция, SOC 2

Codex CLI

Без отдельной оплаты за API, работает в терминале разработчика

В ближайшие недели планируется открытие доступа к GPT‑5 Pro и reasoning-функционалу для командных и корпоративных пользователей через админ-консоль с логами, лимитами и аналитикой использования.

Как GPT-5 решает Bernoulli effect?

Bernoulli effect в контексте LLM (а не физики) — это наименование проблемы случайного маршрута в генерации ответа. Термин заимствован метафорически из теории вероятностей: как монета (или распределение Бернулли) даёт 0 или 1 случайным образом, так и языковая модель выбирает путь рассуждения, не всегда оптимальный.

В больших языковых моделях типа GPT‑4 и GPT‑5 возможен разный порядок мышления (chain-of-thought) для одного и того же запроса;

Если модель выбирает неудачную траекторию reasoning (логическую цепочку), итоговый ответ может оказаться ошибочным, неуверенным или галлюциногенным;

Это особенно критично в задачах с единственным правильным ответом — например, в программировании, математике, медицине.

Пример: если попросить модель решить задачу на логику, она может пойти по верной цепочке, но случайно пропустить шаг или выбрать менее надёжный маршрут, потому что в выборке он встречался чаще. Это и есть проявление эффекта Бернулли.

GPT‑5 внедряет структурные и методологические изменения, чтобы снизить влияние Bernoulli effect:

1. Dynamic Model Routing (Динамическая маршрутизация)

GPT‑5 — это не одна модель, а семейство моделей, включая:

gpt-5-main — базовая быстрая модель;

gpt-5-thinking — reasoning-ориентированная;

gpt-5-thinking-pro — с параллельной логикой;

gpt-5-mini — для ограниченного reasoning в бесплатном доступе.

Как это помогает?

Модель-роутер анализирует тип задачи, её сложность и необходимую глубину и направляет запрос не в случайную цепочку reasoning, а в оптимальную модель. Это уменьшает вероятность «соскальзывания» в неэффективное рассуждение.

2. Parallel Thought Sampling в GPT‑5 Pro

GPT‑5 Pro использует технику одновременного запуска нескольких reasoning-путей и выбора наилучшего результата. Это:

уменьшает зависимость от начального случайного выбора;

снижает variance между ответами;

позволяет системе выбрать путь с наибольшей логической достоверностью.

По данным OpenAI, GPT‑5 Pro при тестировании на более чем 1000 задач показала на 22% меньше критических ошибок по сравнению с обычной reasoning-моделью.

3. Chain-of-Thought Validation

В GPT‑5 применяется верификация логических цепочек рассуждения перед финальной генерацией. Это позволяет:

сравнивать несколько рассуждений между собой;

отбрасывать слабые или противоречивые;

фиксировать потенциальные нарушения политики (например, побочные harmful reasoning paths).

Эта техника реализует не только безопасность, но и устойчивость reasoning — то есть, один и тот же запрос приводит к стабильно точным ответам, что критически важно в профессиональных сценариях.

4. RLHF с контекстной оценкой reasoning

GPT‑5 обучалась с помощью обратной связи от человека (RLHF) с прицелом на неправильные reasoning-пути, а не только на итоговые ответы. В том числе:

обучающие аннотаторы помечали не просто правильный ответ, а хорошую траекторию рассуждений;

система училась избегать типичных логических ловушек (логических shortcut’ов и шаблонов);

отбирались предпочтительные reasoning-последовательности на этапе обучения.

Показатель

GPT‑5 Thinking

GPT‑5 Pro

GPT‑4o

Предпочтение reasoning-ответов (экспертами)

67.8%

Уменьшение ошибок reasoning

–22%

Снижение variance в ответах

Среднее

Низкое

Высокое

СТОИМОСТЬ

Длинный контекст показывает заметно лучшие результаты по сравнению с предыдущими моделями компании. К тому же его увеличили до 400 тысяч токенов. При этом стоимость очень демократичная — всего $1.25 за миллион входных токенов и $10 за миллион выходных.

GPT‑5 — первая модель от OpenAI, которая выглядит не как эксперимент, а как готовая к масштабному внедрению платформа для бизнеса, образования и науки. Он:

Мультимодален

Интегрирован в продуктивные сценарии

Предельно точен, особенно в медицине, науке, программировании

Безопасен и этически контролируем

На LMArena моделька первая во всех категориях с устойчивым отрывом и обучена на знаниях до октября 2024, то есть одна из самых современных моделей, которая уже многое знает про прогресс последних лет. Все бенчмарки можно найти на середине этой страницы.

На момент написания этой новости конференция ещё не прошла, а я уже поделился инсайтами о новой модели. Если хочешь быть в числе первых, кто узнает о технологических трендах, то приглашаю в свой канал «Охота за технологиями». Здесь я пишу о бизнесе и технологиях, которые покоряют сердца миллионов. И, кстати, делюсь уникальными фишками по ИИ, которые не найдешь больше нигде! Это не спам, и не реклама ради рекламы — я просто хочу, чтобы люди, которым это действительно интересно, получали самую свежую и грамотную информацию.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии