В Thinking Machines Lab бывший технический директор OpenAI Мира Мурати использует более целенаправленный подход к моделям ИИ. Вместо того чтобы стремиться к созданию универсального сверхразума, она считает, что создание индивидуального ИИ для конкретных бизнес-задач более ценно.
Согласно The Information, новая компания Мурати, Thinking Machines Lab (TML), специализируется на разработке моделей ИИ, адаптированных к основным бизнес-показателям клиента. Цель состоит в том, чтобы предложить специализированные решения для таких отраслей, как обслуживание клиентов, инвестиционный банкинг и розничная торговля, — модели ИИ, разработанные для достижения измеримых бизнес-результатов и продаваемые по высокой цене.
Сообщается, что в основе стратегии TML лежит обучение с подкреплением, при котором модели вознаграждаются за достижение поставленных целей и наказываются за ошибки. Инвесторы начали называть это «RL для бизнеса». Этот метод лежит в основе так называемых моделей рассуждений, таких как OpenAI o1.
Такой акцент на обучении с подкреплением для специализированных приложений соответствует рекомендациям исследователя OpenAI Рохана Панди, который назвал парадигму LLM-RL особенно перспективной для стартапов в сфере вертикального ИИ. Обучение с подкреплением позволяет добиться глубокой специализации, что даже OpenAI с трудом удается масштабировать. В конце 2024 года OpenAI представила собственный интерфейс для разработчиков, позволяющий проводить тонкую настройку с подкреплением (RFT), но доступ к этому методу по-прежнему ограничен несколькими партнерами.
Совместное использование слоев модели и открытый исходный код
Что касается технической стороны, The Information сообщает, что TML объединяет слои нейронной сети из ряда моделей с открытым исходным кодом — процесс, аналогичный слиянию моделей, методу, представленному в марте 2024 года японским стартапом Sakana AI.
Модели с открытым исходным кодом, как правило, отстают от коммерческих систем, таких как GPT-4o, но недавние проекты, такие как Deepseek, показывают, что разрыв сокращается. TML надеется воспользоваться этой тенденцией, чтобы быстрее выводить продукты на рынок, используя открытый исходный код в качестве основы. Инфраструктура компании основана на серверах Nvidia, арендуемых через Google Cloud.
TML не ограничивается корпоративными клиентами. По данным The Information, команда также обсуждала создание чат-бота для потребителей, который мог бы конкурировать с ChatGPT от OpenAI, хотя подробности пока не разглашаются, и неясно, будет ли проект развиваться дальше.
В сообщении также говорится, что TML уже наняла более двух десятков ведущих исследователей и инженеров из OpenAI и Anthropic, включая соучредителя OpenAI Джона Шульмана и бывших исследователей OpenAI Баррета Зофа и Люка Метца.
Почему Мурати покинула OpenAI?
Уход Мурати из OpenAI последовал за неспокойным периодом в компании — по слухам, она была в ссоре с генеральным директором Сэмом Альтманом, хотя она это отрицает.
Но помимо закулисного напряжения, её уход поднимает более серьёзный вопрос: почему технический директор покидает компанию, которая, предположительно, находится на грани достижения AGI или даже большего?
Имея инсайдерский взгляд на прогресс OpenAI, Мурати выбрал другой путь. Одна из возможных причин — бизнес-модель. AGI — это смелый проект, но он сопряжён с серьёзными рисками. Специализированные модели, ориентированные на прибыль и эффективность, могут разрабатываться и масштабироваться гораздо быстрее — и с меньшим количеством неизвестных факторов.
Также есть большая вероятность, что Мурати, как и многие другие специалисты в этой области, не считает, что AGI достижим с помощью современных технологий LLM. Её стратегия отражает это убеждение — она делает ставку на целенаправленные, практичные решения, а не на погоню за универсальным интеллектом.
Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.
Источник
Источник: habr.com