Агент Google для обработки данных: новый бесплатный помощник на базе искусственного интеллекта Gemini 2.0, который автоматизирует анализ данных, теперь доступен пользователям старше 18 лет в некоторых странах и на некоторых языках бесплатно.
Ассистент доступен через Google Colab — восьмилетний сервис компании для запуска кода Python в режиме реального времени на графических процессорах (GPU), принадлежащих поисковому гиганту, и на собственных тензорных процессорах (TPU).
Агент для обработки данных, впервые представленный в декабре 2024 года для доверенных тестировщиков, предназначен для того, чтобы помочь исследователям, специалистам по обработке данных и разработчикам оптимизировать рабочие процессы, создавая полнофункциональные блокноты Jupyter на основе описаний на естественном языке прямо в браузере пользователя.
Это расширение соответствует текущим усилиям Google по интеграции функций программирования на основе ИИ и анализа данных в Colab. Оно основано на предыдущих обновлениях, таких как помощь в программировании на основе ИИ Codey, о которой было объявлено в мае 2023 года.
Он также выступает в качестве своего рода расширенного и запоздалого ответа на расширенный анализ данных ChatGPT (ранее интерпретатор кода) от OpenAI, который теперь встроен в ChatGPT при использовании GPT-4.
Google Colab — это облачная платформа Jupyter Notebook, позволяющая выполнять код Python в браузере. Jupyter Notebook, созданное в 2014 году в рамках проекта IPython, это веб-приложение с открытым исходным кодом для создания документов с кодом, уравнениями, визуализациями и текстом. Оно поддерживает более 40 языков программирования, включая Python, R и Julia, и широко используется в науке о данных, исследованиях и обучении.
С момента своего появления в 2017 году Google Colab стал популярным инструментом для машинного обучения и обработки данных. Ори Абрамовский, руководитель отдела обработки данных в Spectralops.io, в посте на Medium в 2023 году отметил, что благодаря простоте использования и бесплатному доступу к GPU и TPU, Colab — отличный выбор для разработчиков и исследователей. Он также упомянул, что интеграция с Google Диском и поддержка TPU помогают сократить время обучения при работе с ИИ.
Тем не менее, Абрамовский указал на недостатки Colab: ограничения по времени сеанса для пользователей бесплатной версии, непредсказуемое распределение ресурсов при пиковых нагрузках, отсутствие функций для эффективного выполнения конвейера и планирования, а также ограниченная служба поддержки. Несмотря на это, он подчеркнул, что Colab остаётся одним из лучших решений для ноутбуков, особенно на ранних стадиях проектов по машинному обучению и анализу данных.
Агент для обработки данных использует облачную среду Colab, исключая необходимость в ручной настройке. Благодаря искусственному интеллекту Google Gemini, пользователи могут легко сформулировать свои аналитические задачи на английском языке. Например, они могут описать цель как «визуализировать тенденции» или «обучить модель прогнозирования». В ответ агент создает полностью функциональные блокноты Colab.
По данным Google, первые пользователи, опробовавшие агента по обработке данных, сообщили о значительной экономии времени.
Например, учёные из Национальной лаборатории имени Лоуренса в Беркли, изучающие выбросы метана в тропических болотах, подсчитали, что при использовании этого агента время обработки данных сократилось с недели до пяти минут.
Этот инструмент также показал хорошие результаты в отраслевых тестах, заняв 4-е место в DABStep: тесте агентов данных для многоэтапного анализа на Hugging Face, опередив таких агентов ИИ, как ReAct (GPT-4.0), Deepseek, Claude 3.5 Haiku и Llama 3.3 70B.
Однако конкурирующие модели OpenAI o3-mini и o1, а также Claude 3.5 Sonnet от Anthropic превзошли новый агент Gemini.
Источник
Источник: habr.com