Развитие технологий искусственного интеллекта заставляет производителей чипов постоянно совершенствовать процессоры, чтобы повысить производительность и эффективность. Согласно данным издания SCMP, учёные из университета Цинхуа разработали первый в мире оптический чип для нужд ИИ-задач. Новинка получила название Taichi-II, а её работа основана на свете, что делает процесс моделирования и обучения максимально эффективным. Лучший Telegram-канал про технологии (возможно)
Новый чип основан на ранее представленной модели Taichi, которая, как утверждают её создатели, более чем в 1000 раз по производительности превосходит процессор NVIDIA H100. И если Taichi для работы требовались электронные компоненты, с выходом второй версии чипы необходимость в них отпала.
Учёные утверждают, их разработка стала огромным шагом по направлению к широкомасштабному экспериментальному использованию оптических вычислений. Таким образом удастся удовлетворить постоянно растущий спрос на вычислительные мощности, обладающие высокой производительностью и низким энергопотреблением.
Проведённые тесты показали, мощность Taichi-II в разы превосходить мощность предшественника. Это позволяет ускорить обучение оптических сетей с миллионами параметров и на 40% повысить точность задач классификации. В области визуализации сложных сценариев энергоэффективность Taichi-II в условиях низкой освещенности улучшилась на шесть порядков.
Авторы разработки пояснили, традиционные методы оптического ИИ обычно включают в себя эмуляцию электронных искусственных нейронных сетей на основе фотонной архитектуры (основанной на свете), разработанной на электронных компьютерах. «Из-за несовершенства системы и сложности распространения световых волн идеально точное моделирование общей оптической системы невозможно, и между автономной моделью и реальной системой всегда возникает несоответствие», — рассказали учёные.
Чтобы преодолеть эти проблемы, команда разработала метод, в котором компьютерно-интенсивный процесс обучения проводится непосредственно на оптическом чипе – так что большая часть машинного обучения может выполняться параллельно. Они назвали это обучением в полностью прямом режиме (или FFM). «Эта архитектура обеспечивает высокоточное обучение и поддерживает обучение крупномасштабных сетей», — пишет Сюэ Чживэй, ведущий автор исследования.
Обучение FFM использует преимущества коммерчески доступных высокоскоростных оптических модуляторов и детекторов и может превзойти графические процессоры в задачах ускоренного обучения.
Источник: trashbox.ru