Компания EdgeCortix представила ускоритель нового поколения под названием SAKURA-II производительностью до 60 триллионов операций в секунду (TOPS) при энергопотреблении 8 Вт.
Предназначен ускоритель для обеспечения энергоэффективных вычислений для языковых моделей и генеративных рабочих нагрузок искусственного интеллекта.
SAKURA-II доступен в двух вариантах: модуль M.2 PCI Express для устройств с ограниченным пространством и полноразмерная дополнительная плата PCI Express (AIB) для рабочих станций и серверов. AIB с один или двумя чипами SAKURA-II обеспечивает до 120 TOPS производительности на плату.
Ускоритель поддерживается программным стеком MERA от EdgeCortix, который обеспечивает поддержку широкого спектра моделей ИИ, включая сверточные нейронные сети, такие как ResNet 50/101 и YoloX, а также модели на основе трансформаторов, такие как DINO, GPT-2, Open-Llama2 и Llama 3.