Microsoft представила новую генеративную модель искусственного интеллекта Phi-4i. Она получила улучшения в нескольких областях, в частности, в решении математических задач.
В этой задаче продемонстрирован один из примеров математических рассуждений, на которые способна Phi-4.
Phi-4 пока доступна только на недавно запущенной Microsoft платформе разработки Azure AI Foundry и только для исследовательских целей.
Небольшая языковая модель имеет размер 14 млрд параметров и призвана конкурировать с GPT-4o mini, Gemini 2.0 Flash и Claude 3.5 Haiku.
Microsoft объяснила скачок производительности Phi-4 использованием «высококачественных синтетических наборов данных» наряду с повышением качества созданного человеком контента и другими неуказанными улучшениями уже после обучения.
Примечательно, что Phi-4 — первая модель серии Phi, запущенная после ухода Себастьена Бубека. Ранее занимавший должность вице-президента по ИИ в Microsoft и ключевую фигуру в разработке модели Phi компании, Бубек покинул Microsoft в октябре, чтобы присоединиться к OpenAI.
В апреле Microsoft выпустила маленькую модель Phi-3 Mini, которая стала первой из трёх малых языковых моделей Phi-3. Она насчитывает 3,8 млрд параметров и обучалась на меньшем наборе данных в сравнении с большими языковыми моделями, такими как GPT-4.
В августе компания представила семейство моделей Phi-3,5, которая включает Phi-3.5-vision, Phi-3,5-MoE и Phi-3.5-mini. Все они построены на основе синтетических данных и отфильтрованных общедоступных сайтов. Линейка ИИ-моделей поддерживает контекст длиной 128 тыс. токенов.
Источник: habr.com