После торжественного представления ранее на этой неделе нового поколения процессоров китайской компании Loongson новинки прописались на сайте разработчика, что дало нам возможность узнать о них чуть больше из первых рук. Но начнём мы с того, что Loongson заявила о достижении и даже преодолении уровня архитектуры AMD 28-нм поколения Excavator.
Как и процессоры AMD поколения Excavator, новые настольные процессоры Loongson 3A4000 и серверные 3B4000 выпускаются с использованием 28-нм техпроцесса. В бенчмарке SPEC CPU2006 китайские процессоры на вычислениях одним ядром целочисленных значений и на операциях с плавающей запятой набирают свыше 20 баллов, что даёт Loongson право заявлять о создании практически современных процессоров. Пройдёт ещё год, и Loongson намерена представить 12-нм 4-ядерные и 16-ядерные процессоры 3A5000 и 3C5000, которые по производительности встанут в один ряд с актуальными на тот момент моделями.
Возвращаясь к сегодняшнему дню, напомним, что обе новинки в лице четырёхъядерных Loongson 3A4000 и 3B4000 по-прежнему используют 28-нм техпроцесс на пластинах FD-SOI. Однако вычислительные ядра перешли на новую архитектуру GS464V и увеличили тактовую частоту с 1,5 до 2 ГГц. Пиковое энергопотребление, судя по всему, не изменилось и составляет не больше 30 Вт на частоте 1,5 ГГц, не больше 40 Вт на частоте 1,8 ГГц и не больше 50 Вт на частоте 2 ГГц. Однако использование новых механизмов динамического управления частотой и питанием блоков процессора и его вычислительными ядрами существенно продлевает автономную работу ноутбуков на новых процессорах, а именно до двух раз, по уверениям Loongson.
Новая архитектура GS464v 64-битная суперскалярная с поддержкой неупорядоченного исполнения команд, совместимых с MIPS64. Два блока обработки векторных инструкций могут оперировать 128- и 256-разрядными инструкциями. Объём кеш-памяти не изменился: на каждое ядро приходится по 64 Кбайт L1 и 256 Кбайт L2, а также 8 Мбайт разделяемой кеш-памяти L3. Чистая производительность по сравнению с предыдущими процессорами выросла более чем в два раза.
Межпроцессорное соединение, обеспечиваемое двумя 16-битными контролерами HyperTransport 3.0 в каждом процессоре, позволяет создавать двух-, четырёх- и восьмипроцессорные конфигурации. Утверждается что четырёхпроцессорная конфигурация из новых процессоров более чем в четыре раза мощнее, чем двухпроцессорная конфигурация из процессоров предыдущего поколения.
Контроллер памяти новинок остался двухканальным, но теперь он поддерживает память DDR4 с ECC и частотами до 2400 МГц (ранее только DDR2 и DDR3). Это, а также другие архитектурные изменения привели к тому, что новые процессоры получили иное конструктивное исполнение и процессорный разъём ― FC-BGA 1211. Он несовместим с прежним процессорным разъёмом FC-BGA 1121 и это означает несовместимость новых и старых материнских плат и процессоров. Совместимость операционной системы и приложений сохранена.
Из других оптимизаций отметим улучшения в работе виртуальных машин. Эффективность этих задач выросла с 85 % до 95 %. Также разработчики подчёркивают высочайшую защищённость вычислительной архитектуры и составных блоков новых процессоров. Абсолютно всё разработано в компании силами её проектировщиков. В новинках нет ни одного блока, приобретённого по лицензии, включая физические уровни интерфейсов. Компания приобрела только CAD-пакеты для проектирования, вероятно, только с библиотеками элементов.
Встроенные механизмы защиты от взлома гарантируют предотвращение атак с использованием уязвимостей Meltdown и Spectre. Заявлено о широком спектре аппаратных механизмов шифрования, таких MD5, AES, SHA и стандартов китайской криптозащиты. В дальнейшем разработчик будет делать ставку на выпуск многоядерных моделей, считая, что в однопоточных вычислениях процессоры Loongson достигли современного уровня производительности и следует добиваться преимуществ за счёт наращивания числа ядер.