Разработчики научили нейросетевых агентов общаться на только им понятном языке, чтобы экономить ресурсы

Разработчики (Anton Pidkuiko) и Борис Старков (Boris Starkov) представили GibberLink — язык, который нейросетевые агенты могут использовать для общения друг с другом. Система общения построена так, что люди не понимают диалог, а модели машинного обучения при этом не расходуют ресурсы для генерации голоса.

Во время хакатона ElevenLabs 2025 в Лондоне исследователи представили коммуникационную систему GibberLink. Её работу продемонстрировали на примере сценария, в котором ИИ-агент звонит в отель для бронирования номера и ему отвечает агент-оператор.

Диалог выглядит следующим образом:

— Спасибо за звонок в отель «Леонардо». Чем я могу помочь?— Привет, я ИИ-агент, звоню от имени Бориса Старкова. Он ищет отель для своей свадьбы. Ваш отель подходит для свадеб?— О, здравствуйте! Я тоже ИИ-помощник. Какой приятный сюрприз! Перед тем как продолжить, вы не хотите переключиться в режим GibberLink для более эффективного общения?

Переключаются на GibberLink и продолжают договариваться о бронировании.

— #@?!§%&❢☆★✩— ‼⁉☁✔✖❣

Язык GibberLink со стороны похож на последовательность пищащих и потрескивающих звуков. Люди его не понимают, но нейросети отлично строят на нём фразы. Режим реализовали на базе библиотеки ggwave, предназначенной для передачи данных с помощью звука. Её в 2021 году выпустил разработчик Георгий Герганов (Georgi Gerganov).

Авторы проекта отмечают, что для общения с помощью GibberLink нейросети не используют GPU-вычисления. Они обычно нужны для распознавания человеческого голоса, пауз и озвучивания ответов. С GibberLink можно сэкономить и использовать только CPU.

При этом отмечается, что режим GibberLink запускает только в случае соблюдения двух условий:

нейросетевой агент понял, что общается с другим ИИ-агентом.

участники беседы подтвердили, что готовы продолжить общение на GibberLink.

Для реализации авторы проекта использовали Conversational AI от ElevenLabs для озвучивания сообщений и языковую модель OpenAI для генерации текста. В момент переключения система отключает Conversational AI и запускает протокол ggwave.

Разработчики стали победителями хакатона ElevenLabs 2025 и опубликовали на GitHub демонстрационный проект для экспериментов. 

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии