Самый популярный ИИ для программирования убивает SSD на компьютерах

Самый популярный ИИ для программирования убивает SSD на компьютерах

Один из инженеров заметил странную нагрузку на собственном ноутбуке: SSD стремительно расходовал ресурс, хотя машина использовалась для обычных задач разработки. После проверки выяснилось, что основным источником записи был ИИ-ассистент для кода Codex от OpenAI — точнее, его внутренний механизм логирования.

Программа постоянно сохраняет служебные данные в локальную базу SQLite на диске пользователя. Звучит безобидно, но на практике это превращалось в настоящий конвейер записи. За 21 день непрерывной работы накопитель получил около 37 терабайт данных только от этого процесса. Если посчитать годовую нагрузку, получается порядка 640 терабайт, а у многих бытовых SSD заявленный ресурс держится в районе 600 ТБ суммарной записи за весь срок службы. Получается, что инструмент мог «съесть» гарантийный лимит накопителя меньше чем за год.

Самое интересное в этой истории — разрыв между тем, что реально хранится в базе, и тем, сколько туда было записано. На момент проверки файл базы занимал чуть больше гигабайта и содержал около 500 тысяч строк. При этом внутренний счетчик идентификаторов уже перевалил за 5,5 миллиарда. Разница почти в десять тысяч раз, и программа без остановки делала новые записи, а затем сразу же их удаляла, освобождая место под следующие. Диск физически фиксировал каждую такую операцию, и именно в этом постоянном цикле «записал-стер» скрывался основной износ.

Причина крылась в настройках логирования. Разработчики по умолчанию включили максимально подробный уровень детализации для абсолютно всех событий программы, включая внутренние библиотеки и технические подсистемы. Львиную долю объема занимали даже не полезные данные, а сырые копии сетевого трафика — содержимое веб-сокетов и потоковых соединений, через которые Codex общается с серверами. Отдельный кусок нагрузки создавало дублирование одних и тех же событий сразу в несколько журналов телеметрии.

После публикации проблемы команда OpenAI отреагировала быстро. Уже через несколько дней вышли два апдейта: один убирал избыточную фиксацию каждого события сетевого соединения, а второй отфильтровал шумные технические источники, которые не несли практической пользы для отладки. По оценке автора находки, эти изменения сократили объем лишних записей примерно на 85%.

История получилась показательной для всей индустрии ИИ-инструментов: чем активнее программа собирает данные для собственной диагностики, тем выше риск, что эта функция начнет работать против пользователя — в буквальном смысле сокращая срок жизни его оборудования.

Также недавно писали, что Anthropic выпустила бесплатное руководство по созданию ИИ-стартапа. Подробности в статье.

Источник: hi-tech.mail.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев