Microsoft и OpenAI объявили о поддержке Инициативы по институциональным данным (Institutional Data Initiative, IDI), запущенной Библиотекой Гарвардского университета. В рамках исследовательской инициативы американский университет будет работать с библиотеками и музеями, правительственными учреждениями и другими организациями для публикации их коллекций в виде данных.
Переданную информацию будут использовать для различных целей, включая обучение моделей искусственного интеллекта.
IDI сосредоточится на уточнении миллиона книг, находящихся в открытом доступе и отсканированных Гарвардской библиотекой. В сотрудничестве с Бостонской публичной библиотекой Гарвард сделает доступными в качестве данных миллионы страниц старых газет. Хотя эти коллекции относятся к длинным текстам, IDI стремится к партнёрству с другими субъектами по всем формам данных, включая научные и биомедицинские.
Помимо Microsoft и OpenAI, для долгосрочного финансирования IDI намерена сотрудничать с благотворительными и отраслевыми организациями.
Вице-президент и заместитель генерального юрисконсульта Microsoft Бёртон Дэвис заявил, что корпорация стремится обеспечить широкий доступ к данным и нарастить возможности более инклюзивной экосистемы ИИ. С 2020 года Microsoft работает над устранением разрыва в доступе к данным, гарантируя каждой организации возможность обратиться к информации, которая необходима для инноваций, что важно для развития экономики ИИ, подчеркнул топ-менеджер.
В 2020 году Microsoft запустила кампанию Open Data, в рамках которой организации всех размеров имеют доступ к наборам данных, полученных в результате деятельности корпорации по курированию и изучению информации из опубликованных научных работ. Подобные данные можно использовать для разработки ИИ-приложений.
Источник: habr.com