LLM изменят структуру документации и потребление контента в интернете

Андрей Карпати, бывший сотрудник OpenAI, размышляет о будущем, в котором LLM станут основным интерфейсом для контента.

В посте на X он предполагает, что, хотя большая часть контента по-прежнему будет создаваться для людей, 99,9% усилий по оптимизации будут направлены на то, чтобы сделать его понятным для LLM. Этот сдвиг может кардинально изменить структуру документации.

Карпати приводит в пример текущую практику документирования: «В 99% библиотек по-прежнему есть документация, которая в основном представляет собой красивые статичные страницы в формате .html, рассчитанные на использование человеком». Он утверждает, что к 2025 году документация должна существовать в виде единого файла проекта, оптимизированного для контекстного окна LLM.

Карпати отмечает, что, хотя объединение кодовых баз в отдельные файлы технически несложно, настоящая проблема заключается в контенте, хранящемся в ориентированных на человека форматах — веб-сайтах, PDF-файлах, изображениях, видео- и аудиофайлах.

Эти форматы «до эры LLM» затрудняют оптимизацию ИИ. По словам Карпати, отрасли нужны новые стандарты, которые одинаково хорошо подходят как для людей, так и для машин.

Новый предлагаемый веб-стандарт под названием «llms.txt» соответствует видению Карпати структуры контента, оптимизированной для ИИ. Разработанная Джереми Ховардом спецификация работает аналогично index.html, но для систем ИИ. В то время как index.html направляет пользователей на HTML-версию страницы, llms.txt направляет системы ИИ на машиночитаемую версию Markdown (.md).

Такой двойной подход позволяет веб-сайтам поддерживать как удобочитаемые, так и оптимизированные для ИИ версии своего контента. Такие компании, как Anthropic, уже внедрили этот стандарт.

Последствия выходят далеко за рамки технических изменений. Современная экономика цифрового контента основана на человеческом внимании — через рекламу и подписки. Теперь перед отраслью стоит задача полностью переосмыслить свои цепочки создания ценности и модели получения прибыли, поскольку контент переходит в сферу потребления ИИ.

Компании, занимающиеся искусственным интеллектом, начали лицензировать новостные ленты в реальном времени, и это тоже вызывает серьёзные вопросы. Когда такие компании, как OpenAI, получают возможность решать, какой контент видят их системы искусственного интеллекта, они, по сути, становятся могущественными хранителями информации.

Этот сдвиг угрожает изменить потребление онлайн-контента, поднимая серьёзные вопросы о том, кто контролирует наш доступ к информации. Ставки ещё выше, учитывая, что ИИ всё ещё часто допускает ошибки при обработке и воспроизведении информации.

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”