Смартфоны без приложений: зачем пользователям ИИ-агенты

Саша Данилов — генеральный директор и основатель Nodul, платформы создания ИИ-агентов (российский аналог n8n). Занимается развитием агентных систем, интеграцией LLM в бизнес-процессы и вопросами безопасного доступа ИИ к данным и сервисам.

Основатель британского производителя смартфонов Nothing Карл Пей заявил, что привычная модель мобильных приложений может измениться. Пользователям не придется вручную переключаться между десятками сервисов, а часть действий возьмут на себя ИИ-агенты. Похожий сценарий уже тестирует Google. На Android-устройствах в США и Южной Корее Gemini помогает заказывать еду или вызывать такси.

Часть задач действительно можно будет делегировать единому интерфейсу в виде ИИ-агента. Но это не означает исчезновение самих сервисов и бизнесов. Меняется слой взаимодействия с ними. Вместо человека в приложение все чаще будет заходить агент.

По-настоящему важный сдвиг, считает Пей, начнется тогда, когда ИИ научится не просто исполнять команды, а лучше понимать намерения человека. В такой модели пользователю не нужно будет каждый раз подробно формулировать запрос. Но здесь тоже есть ограничение. Сегодня у агентов еще нет устойчивого пользовательского контекста и накопленной истории взаимодействия, достаточной для того, чтобы надежно угадывать намерения без явных инструкций.

Если план Пея реализуется, интерфейс смартфона будущего будет проектироваться не только для человека, вручную перемещающегося по экранам и меню, но и для ИИ-агента, который действует от имени пользователя. При этом агент не заменит маркетплейсы или банковские приложения. За каждым таким сервисом останется большая инфраструктура, логистика, каталог товаров, платежи и служба поддержки. Агент может лишь стать новым фронтендом и сократить число шагов, которые пользователь тратит на поиск, выбор и оформление товаров.

Android и агентная модель

Как Android переходит к агентной модели

Google первой запустила функцию, которая позволяет владельцам Android-смартфонов делегировать Gemini отдельные действия в сторонних сервисах заказа такси и еды. Новая возможность доступна в бета-версии приложения Gemini для Pixel 10, Pixel 10 Pro и смартфонов серии Samsung Galaxy S26. Пока пилот работает только для пользователей из США и Южной Кореи.

Этот сценарий близок к тому будущему смартфонов, о котором говорит Карл Пей. Пользователю достаточно зажать кнопку питания и попросить Gemini заказать поездку домой или повторить последний заказ еды. Но важно понимать, что агент не создает сервис такси или доставки заново и не заменяет их. Он лишь взаимодействует с уже существующим приложением вместо пользователя. Поэтому приложения никуда не исчезают, они становятся совместимыми с агентами. Тесты именно на еде и такси выглядят логично, потому что это одни из самых массовых и понятных цифровых сценариев, на которых проще всего показать сам принцип делегирования действия.

Обозреватель The Verge протестировала Gemini в США. Судя по ее отзыву, Gemini пока справляется с задачами довольно медленно. Оформление заказа может занимать почти 10 минут. С точки зрения работы LLM это объяснимо. В таком сценарии модели недостаточно просто ответить текстом. Ей нужно правильно интерпретировать намерение пользователя, удерживать контекст, планировать цепочку шагов, вызывать функции приложения, проверять промежуточные результаты и реагировать на возможные ошибки интерфейса. Каждый такой этап добавляет задержку, а надежность пока важнее скорости. Поэтому агентные сценарии сегодня медленнее привычного ручного действия, но для разработчиков это скорее показатель того, насколько сложна оркестрация между моделью, операционной системой и приложениями. По мере накопления данных и оптимизации этих связок время должно сокращаться.

Агентный подход меняет и работу геосервисов. Google запустила на базе Gemini новую функцию Ask Maps, которая позволяет пользователям задавать картам вопросы голосом. Например, можно спросить, где удастся зарядить телефон, не стоя в длинной очереди в кафе. До появления таких интерфейсов для этого приходилось вручную изучать отзывы на картах и отбирать подходящие точки. Ask Maps — это скорее не самостоятельный агент, а LLM-интерфейс поверх данных карт и поисковых сигналов. Но для пользователя разница уже не так важна, так как сервис превращает сложный поиск в диалог.

Очевидно, что к агентному будущему должны адаптироваться и остальные приложения. Для этого Google продвигает специальный инструмент для разработчиков AppFunctions, который позволяет связать приложения с ИИ-агентами. Это единый интерфейс, через который приложение может описать свои функции и дать агенту контролируемый доступ к ним. Для разработчиков это означает, что им придется структурировать функции и разрешения так, чтобы агентные системы могли с ними работать.

Разные ИИ-модели

От одного ассистента к выбору между ИИ-моделями

Производители смартфонов постепенно продвигают ИИ-агентов как единую точку входа в цифровые сервисы вместо набора отдельных приложений. Важная часть этой стратегии — возможность выбирать конкретного ИИ-ассистента или LLM-модель, а не ограничиваться одним навязанным решением. Для Android-производителей это способ не допустить монополизации новой точки входа одним игроком и сохранить контроль над пользовательским опытом.

Samsung делает ставку сразу на нескольких ИИ-ассистентов Bixby, Gemini и Perplexity. Они могут брать на себя повседневные пользовательские задачи. Идея выбора разных моделей внутри одного ассистента не выглядит революционной. Это прагматичный ответ на то, что разные нейросети сильны в разных типах задач, а производителям смартфонов выгодно сохранить гибкость и пространство для партнерств. Особенно это важно в тех сценариях, где агент добавляет ценность, в первую очередь, при выборе одежды, еды, поиске оптимального варианта среди множества параметров. А вот в такси дополнительный слой не обязательно дает заметный выигрыш. Путь и так короткий: открыть приложение и нажать одну кнопку.

Судя по всему, и Apple отходит от первоначальной идеи развивать Siri и Apple Intelligence эксклюзивно на базе одной LLM. По сообщениям СМИ, компания планирует разрешить сторонним разработчикам нейросетей подключаться к Siri. Если эти планы реализуются, Siri сможет стать не только фирменным ассистентом Apple, но и точкой доступа к нескольким конкурирующим ИИ-моделям внутри экосистемы iPhone.

Такие изменения могут стать частью обновления iOS 27. Речь идет о механике, при которой сторонние ИИ-приложения смогут напрямую интегрироваться с Siri. Это позволит пользователям перенаправлять запросы из ассистента в такие сервисы, как Gemini от Google или Claude от Anthropic, не покидая интерфейс Siri. Siri начнет выполнять роль маршрутизатора между разными приложениями и нейросетями.

Выводы

ИИ-агенты в смартфонах не являются заменой приложений и тем более самих бизнесов. Это новый интерфейсный слой над уже существующей цифровой инфраструктурой. Задача агентов не заменить маркетплейсы, банки, доставку или карты, а сократить путь пользователя там, где он сегодня слишком длинный и фрагментированный.

Агенты с наибольшей вероятностью начнут доминировать в сценариях выбора одежды, еды, путешествий, сложных покупок, то есть везде, где нужно сравнивать разные параметры и быстро находить оптимальный вариант. В простых сценариях с минимальным числом действий эффект может оказаться гораздо скромнее.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости