ИИ без галлюцинаций: как Lean 4 заставляет модели доказывать правду

Современные большие языковые модели демонстрируют впечатляющие способности, но остаются ненадёжными и могут галлюцинировать, выдавая ошибочные факты за правду. В ответ на это появляется Lean 4 — открытый язык программирования и помощник для формальных доказательств (theorem prover), который приносит математическую строгость в мир ИИ. Именно строгость и проверка по логике делают Lean 4 ключевым инструментом для создания надёжных и безопасных систем.

Lean 4 сочетает в себе два аспекта: это язык программирования и механизм формальной верификации. Любое утверждение или программа в Lean 4 должно пройти строгую проверку через надёжное ядро (trusted kernel), и результат либо доказан корректным, либо отвергается. Такой подход исключает неясность — результат либо верен, либо нет.

В отличие от нейросетей, которые ведут себя вероятностно и могут давать разные ответы на один и тот же запрос, Lean 4 работает детерминированно. То есть при тех же входных данных проверка доказательства всегда даёт один и тот же вывод, и любой шаг рассуждений можно проаудировать. Это обеспечивает прозрачность и предсказуемость — свойства, без которых сложно доверять ИИ в важных сценариях.

Ярким примером применения является стартап Harmonic AI. Их система, называемая Aristotle, решает математические задачи, генерируя доказательства в Lean 4. Только после того, как доказательство проходит проверку Lean, система выдаёт ответ пользователю. По словам основателей, это делает ответы без галлюцинаций. Более того, в решении задач Международной математической олимпиады (IMO) он выступал как «золото», но при этом с формальными доказательствами.

Lean 4 полезен не только для математики. Он может применяться при написании программного кода с гарантией безопасности. Ошибки и уязвимости — это часто логические недочёты, и Lean позволяет создавать код, где свойства корректности, например «эта функция никогда не падает» или «нет утечек данных», доказаны формально.

Интересно, что разработчики уже работают над автоматизацией этой проверки. LLM могут писать код, а Lean4 потом проверяет его. По данным исследования, даже если начальные версии справляются с небольшим числом задач, то при включении итеративной самокоррекции с обратной связью от Lean их эффективность растёт.

Среди вызовов всё ещё остаются трудоёмкость формализации. Перевести реальные задачи, спецификации и бизнес‑логику в язык Lean — непросто. Но с ростом инструментов автоматической формализации и интеграции с LLM путь становится доступнее. Тем не менее, для полноценного распространения Lean необходимо, чтобы больше разработчиков и компаний приняли парадигму доказательств как норму, а не как экзотическую практику. Следим за обновлениями и новыми новостями!

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”