В Швейцарии представили Apertus — первую национальную большую языковую модель с полностью открытым исходным кодом. Разработкой занимался консорциум государственных институтов, а сама инициатива позиционируется как альтернатива закрытым коммерческим решениям.
Проект отличается полной прозрачностью: опубликованы не только сама модель, но и весь процесс обучения — от исходных данных до документации. Обучение велось на массиве в 15 триллионов токенов, при этом более 40% данных не на английском языке, что делает Apertus одной из самых многоязычных моделей на рынке. Всего поддерживается свыше 1000 языков.
Особое внимание уделено юридическим аспектам: модель соответствует швейцарским и европейским требованиям в области защиты данных и авторского права. Это делает Apertus особенно привлекательной для локального бизнеса и государственных организаций. Модель доступна на Hugging Face в двух версиях — на 8 и 70 миллиардов параметров.
Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.
Подробнее
Источник: habr.com