ИИ научился копировать программное обеспечение open source

Современные технологии искусственного интеллекта оказались способны клонировать и воспроизводить open source проекты. Результат их работы выглядит как полностью функциональный продукт, который при этом можно выдать за самостоятельную разработку и закрыть его код под проприетарной лицензией.

По идее, в настоящее время любой желающий может использовать искусственный интеллект для добавления в продукт с открытым кодом, не имеющих особого смысла «улучшений», и продавать получившееся ПО как свою собственность. Можно сказать, что постоянное совершенствование систем искусственного интеллекта стирает границы между творчеством, авторским правом и принципами открытого исходного кода, на которых последние десятилетия и держалась значительная часть современного интернета.

В своей презентации Дилан Эйри, основатель компании Truffle Security, и Майк Нолан, архитектор программного обеспечения, представили инструмент под названием malus.sh. За небольшую плату этот сервис обещает воссоздать любой проект с открытым исходным кодом. Сайт инструмента прямо заявляет, что на выходе пользователь получает юридически отличный код с корпоративной лицензией, не требующий указания авторства и не обремененный копилефтом. По сути, это тестовый полигон для столкновения интеллектуального права, которое до сих пор во многом опирается на прецеденты XIX века, с автоматизацией XXI века.

Сложившаяся юридическая практика по делам, касающимся авторских прав в сфере ПО, защищает форму выражения, а не саму идею или функцию. Это общепризнанное определение когда-то породило метод «чистой комнаты», при котором инженеры восстанавливают работу системы без прямого доступа к исходному коду. Как классический пример из 1980-х годов, можно привести случай с компанией Phoenix Technologies, которая таким образом создала собственную версию BIOS для персональных компьютеров.

Нынешний эксперимент показал, что искусственный интеллект способен выполнить аналогичную работу за минуты вместо месяцев. Однако скорость не всегда означает честность. Традиционные методы «чистой комнаты» требовали участия целых команд разработчиков, которые документально фиксировали и воспроизводили функциональность, а сам процесс проходил под контролем специалистов в области авторского права. На сегодняшний день, искусственный интеллект позволяет запустить «чистую комнату» буквально несколькими командами.

Многие компании, особенно стартапы, строят свой бизнес на открытых проектах. Они вкладывают ресурсы в разработку, а затем зарабатывают на поддержке, облачных версиях или дополнительных проприетарных модулях. Если крупная корпорация сможет одним запросом к ИИ превратить открытый продукт в свою внутреннюю проприетарную версию, не указывая авторов и не делясь доходами, то никакого экономического смысла инвестиций в open source не будет. Раньше компаниям было проще заплатить за коммерческую лицензию или нанять разработчиков оригинального проекта, чем переписывать все с нуля. Теперь же ИИ делает переписывание тривиально дешевым.

Разработчики open source привыкли к культуре прозрачности и взаимного обмена. Их код лежит в открытом доступе именно для того, чтобы его изучали, улучшали и распространяли на честных и прозрачных условиях. Осознание того, что любой конкурент может за пару минут и за несколько долларов получить функционально идентичную копию без единой строчки из оригинального кода, способно подорвать это доверие. Некоторые авторы могут начать использовать более агрессивные лицензии, например, переходить с лицензии MIT на GPL, которая требует открывать изменения. Другие могут вовсе уйти в закрытую разработку или начать шифровать критические части кода. Это противоречит самой идее открытого исходного кода и приведет к фрагментации экосистемы.

Для обычных программистов, которые работают над корпоративными продуктами, ситуация тоже выглядит тревожно. Если менеджмент решит, что можно сгенерировать аналог любой open source библиотеки буквально за минуты, возникнет соблазн запретить использование открытых компонентов напрямую. Вместо честного использования проверенной библиотеки с понятной лицензией и активным сообществом разработчикам прикажут прогнать ее через ИИ и получить «собственный чистый» код. На практике это означает дополнительные часы на проверку сгенерированного кода, который может содержать тонкие ошибки или скрытые копии защищенных фрагментов. Кроме того, команда лишится автоматических обновлений безопасности от оригинального проекта. Когда в исходной библиотеке найдут уязвимость, компании придется самостоятельно исправлять свою ИИ-копию, потому что процесс слияния с оригиналом больше невозможен.

Команды разработчиков окажутся в правовой серой зоне. Даже если ИИ-сгенерированный код не содержит дословных совпадений, он может повторять уникальную структуру, алгоритмы и последовательности действий оригинальной программы. В разных юрисдикциях суды по-разному относятся к небуквальному копированию. Некоторые решения уже признавали нарушением авторских прав, если программа воспроизводила организацию кода и архитектурные решения, даже при полной замене имен переменных и синтаксиса. Это означает, что компания, использовавшая ИИ для чистого переписывания, может проиграть суд и быть вынуждена выплатить огромные компенсации. При этом доказать сам факт использования ИИ для копирования будет непросто. Разработчики могут оказаться в ситуации, когда их работодатель требует использовать такие инструменты, а ответственность за возможные иски возлагает на саму команду.

В ответ на эту угрозу open source сообщества могут начать внедрять новые методы защиты. Например, специальные лицензионные условия, явно запрещающие использование кода для обучения моделей, которые потом генерируют коммерческие аналоги. Некоторые проекты уже экспериментируют с добавлением в код скрытых цифровых водяных знаков или специально внесенных нестандартных конструкций, по которым можно идентифицировать происхождение даже после переписывания ИИ. Также возможно появление сервисов, которые будут анализировать проприетарные кодовые базы и искать в них следы оригинальных открытых проектов. В долгосрочной перспективе открытая разработка может сместиться в сторону проектов, которые ценятся не только за сам код, но и за живую экосистему, документацию, сообщество и поддержку, то есть за то, что ИИ не может воспроизвести автоматически. Однако что-то подсказывает нам, что этот переход будет очень болезненным и займет годы. MSI Cubi Z AI 8M: от переговорки до фронт-офиса Государство хочет знать раньше. К чему ведет централизация уведомлений об инцидентах Почему ручной разбор запароленных архивов путь к катастрофе и что с этим делать

Между тем, локальные ИИ-модели и ИИ-агенты уже приходят в команды разработки. IT-World разбирался, что это дает и где без тестирования и метрик нельзя обойтись.

Источник: www.it-world.ru

0 0 голоса

Рейтинг новости