Всё, что надо знать о медленной, но умной OpenAI Strawberry

OpenAI выпустили вчера свою долгожданную модель o1 (также известную как Strawberry), первую модель компании, способную к рассуждению.

Если пропустили, а вникать лень, то вот собрал со всех уголков основное:

Основная фишка — новые модели могут решать более сложные задачи в областях науки и программирования. Но им требуется больше времени на ответ. В ходе обучения они совершенствуют процесс размышления, пробуют различные стратегии и осознают свои ошибки.

Интересно, что разработчики говорят о том, что «мы стремимся к тому, чтобы будущие версии думали часами, днями и даже неделями». Звучит странно, вроде хочется ответ получить побыстрей, но тут логика такая, что чем дольше модель ворочает нейромозгами, тем ответ качественней. Сейчас o1 думает несколько секунд.

Первая «превью»-модель уже интегрирована в чат-бот ChatGPT и API.

Также выпущена облегченная модель o1-mini, ориентированная конкретно на программирование.

Сейчас новые модели доступны пользователям платных пакетов ChatGPT Plus и Team, но o1-mini планируется включить и в бесплатную версию чат-бота.

В неделю можно отправить 30 сообщений в старшую версию o1-preview, 50 сообщений в маленькую o1-mini.

Новая модель — не замена gpt-4o во всех задачах. Лучше использовать её, чтобы посчитать что-то или закодить — модель справляется с олимпиадными задачами по математике и программированию на уровне золотых медалистов международного тура. По физике в сложных тестовых заданиях, устойчивых к решению с использованием поисковика Google, она сравнима с PhD-level студентом.

Пока нет связи с интернетом, там она искать не умеет.

В preview-версии могут быть баги, полноценная модель уже есть, её тестируют и выкатят позднее.

Промпты для новой модели можно использовать простые — o1 всё понимает, нет необходимости в обширных объяснениях

Источник: habr.com

0 0 голоса
Рейтинг новости
10510
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии