Графические процессоры семейства Turing, которые NVIDIA выпустила четыре месяца тому назад, стали одним из крупнейших событий в истории 3D-графики. Видеокарты для домашних ПК и рабочих станций впервые приобрели функции трассировки лучей в реальном времени. Пусть пока что лишь Battlefield V да свежий тест 3DMark дают возможность увидеть Ray Tracing в деле, внедрение этой технологии в других проектах тоже не за горами, а в перспективе именно трассировка лучей будет поддерживать развитие компьютерных игр. Ведь она не только обеспечивает принципиально иное качество освещения, но и облегчает задачу разработчиков за счет того, что те эффекты, которые в контексте растеризации требуют кропотливой ручной настройки, теперь элегантно автоматизируются.
Однако первый опыт NVIDIA в этой области дал понять, что переход к модели гибридного рендеринга (так в компании называют сочетание метода растеризации с трассировкой лучей) не дается бесплатно. Видеокарты серии GeForce RTX 20 не так сильно отличаются от предыдущего поколения по быстродействию в играх без трассировки лучей, как те, в свою очередь, от их предшественников. При этом три модели, представленные в августе (GeForce RTX 2070, RTX 2080 и RTX 2080 Ti), оказались настолько дорогими, что правило апгрейда GPU, которое безотказно работало ранее (больше FPS за те же деньги), больше не действует.
Наконец, опыт Battlefield V показал, что Ray Tracing в реальном времени пока с трудом дается даже столь мощному железу, как новые ускорители на чипах Turing. Поэтому вплоть до момента, когда NVIDIA представила GeForce RTX 2060, было неясно, планирует ли компания распространить архитектуру Turing в неизменном виде на видеокарты средней ценовой категории, или гибридный рендеринг пока останется привилегией устройств за $500 и выше. Но сомнения остались в прошлом, ведь само название RTX 2060 говорит о том, что трассировке лучей в условно-массовых графических картах дан зеленый свет.
Технические характеристики, цена
В первой волне моделей 20-й серии GeForce RTX 2070 был единственной видеокартой, которая получила полностью функциональный графический процессор, в то время как GeForce RTX 2080 и RTX 2080 Ti построены на GPU с частично заблокированными вычислительными блоками. Чип TU106, который дебютировал в составе GeForce RTX 2070, относится к третьему эшелону семейства Turing и является формальным наследником GP106, но по меркам предыдущей архитектуры NVIDIA — Pascal — это все еще чрезвычайно крупный кристалл: с транзисторным бюджетом 10,8 млрд он уступает лишь GP102 (12 млрд транзисторов) и на 50 % превосходит GP104. А значит, выпуск следующей модели серии GeForce RTX 20 на основе «урезанных» чипов TU106 был абсолютно логичным шагом со стороны NVIDIA. Единственная интрига в подобных ситуациях — это масштаб потерь в наборе вычислительных блоков графического процессора.
TU106 в конфигурации GeForce RTX 2060 имеет 1920 активных ядер CUDA (в данном случае мы считаем только ядра, выполняющие операции FP32), распределенных по 30 потоковым мультипроцессорам (Streaming Multiprocessor, SM), в то время как «физически» кристалл состоит из 36 SM и содержит 2304 CUDA-ядра. Чипы NVIDIA, выпущенные со времен архитектуры Fermi, позволяют масштабировать все главные компоненты аппаратного конвейера путем отключения дефектных или просто «ненужных» для конкретной модели SM. Как следствие, GeForce RTX 2060 одновременно утратил 17% вычислительной мощности при исполнении 32-битных операций с плавающей запятой (CUDA-яра FP32), целочисленных операций (CUDA-ядра INT32) и скорости наложения текстур. И все же в GeForce RTX 2060 осталось много от изначальной мощи GeForce RTX 2070. Для сравнения: GeForce GTX 1060 содержит в 1,5 раза меньше CUDA-ядер, чем следующая по старшинству модель — GTX 1070. Но главное, процессор GP106 даже в «урезанной» форме сохранил часть логики, отличающей архитектуру Turing от ее предшественников, — тензорные ядра и ядра трассировки лучей.
Производитель | NVIDIA | ||||||
---|---|---|---|---|---|---|---|
Название | GP104 | GP102 | GP100 | GV100 | TU106 | TU104 | TU102 |
Микроархитектура | Pascal | Pascal | Pascal | Volta | Turing | Turing | Turing |
Техпроцесс, нм | 16 nm FinFET | 16 nm FinFET | 16 nm FinFET | 12 нм FFN | 12 нм FFN | 12 нм FFN | 12 нм FFN |
Число транзисторов, млн | 7 200 | 12 000 | 15 300 | 21 100 | 10 800 | 13 600 | 18 600 |
Площадь чипа, мм2 | 314 | 471 | 610 | 815 | 445 | 545 | 754 |
Конфигурация SM/TPC/GPC | |||||||
Число SM | 20 | 30 | 60 | 84 | 36 | 48 | 72 |
Число TPC | 20 | 30 | 30 | 42 | 18 | 24 | 36 |
Число GPC | 4 | 6 | 6 | 6 | 3 | 6 | 6 |
Конфигурация потокового мультипроцессора (SM) | |||||||
FP32-ядра | 128 | 128 | 64 | 64 | 64 | 64 | 64 |
FP64-ядра | 4 | 4 | 32 | 32 | 2 | 2 | 2 |
INT32-ядра | Н/Д | Н/Д | Н/Д | 64 | 64 | 64 | 64 |
Тензорные ядра | Н/Д | Н/Д | Н/Д | 8 | 8 | 8 | 8 |
RT-ядра | Н/Д | Н/Д | Н/Д | Н/Д | 1 | 1 | 1 |
Программируемые вычислительные блоки GPU | |||||||
FP32-ядра | 2 560 | 3 840 | 3 840 | 5 376 | 2 304 | 3 072 | 4 608 |
FP64-ядра | 80 | 120 | 1 920 | 2 688 | 72 | 96 | 144 |
INT32-ядра | Н/Д | Н/Д | Н/Д | 5 376 | 2 304 | 3 072 | 4 608 |
Тензорные ядра | Н/Д | Н/Д | Н/Д | 672 | 288 | 384 | 576 |
RT-ядра | Н/Д | Н/Д | Н/Д | Н/Д | 36 | 48 | 72 |
Блоки фиксированной функциональности | |||||||
TMU (блоки наложения текстур) | 160 | 240 | 240 | 336 | 144 | 192 | 288 |
ROP | 64 | 96 | 128 | 128 | 64 | 64 | 96 |
Конфигурация памяти | |||||||
Объем кеша L1 / текстурного кеша, Кбайт | 48 | 48 | 24 | ≤ 128 из 128, общий с разделяемой памятью | 32/64 из 96 (общий с разделяемой памятью) | 32/64 из 96 (общий с разделяемой памятью) | 32/64 из 96 (общий с разделяемой памятью) |
Объем разделяемой памяти / SM, Кбайт | 96 | 96 | 64 | ≤ 96 из 128 (общий с кешем L1) | 32/64 из 96 (общий с кешем L1) | 32/64 из 96 (общий с кешем L1) | 32/64 из 96 (общий с кешем L1) |
Объем регистрового файла / SM, Кбайт | 256 | 256 | 256 | 256 | 256 | 256 | 256 |
Объем регистрового файла / GPU, Кбайт | 5 120 | 7 680 | 15 360 | 21 504 | 9 216 | 12 288 | 18 432 |
Объем кеша L2, Кбайт | 2 048 | 3 072 | 4 096 | 6 144 | 4 096 | 4 096 | 6 144 |
Разрядность шины RAM, бит | 256 | 384 | 4 096 | 4 096 | 256 | 256 | 384 |
Тип микросхем RAM | GDDR5/GDDR5X | GDDR5X | HBM2 | HBM2 | GDDR6 | GDDR6 | GDDR6 |
Шина NVLINK | Н/Д | Н/Д | 4 × NVLink 1.0 x8 | 6 × NVLink 2.0 x8 | Н/Д | 1 × NVLink 2.0 x8 | 2 × NVLink 2.0 x8 |
Трансформация GeForce RTX 2070 в RTX 2060 гораздо сильнее ударила по той части GPU, которая называется back-end: контроллерам памяти, блокам ROP и объему кеша второго уровня. NVIDIA отключила в TU106 два из восьми 32-битных контроллеров RAM, а значит, GPU теперь располагает лишь 192-битной шиной памяти, а спецификации GeForce RTX 2060 предусматривают 6 Гбайт типа GDDR6 с пропускной способностью 14 Гбит/с на бит шины. Однако есть намеки на то, что NVIDIA не ограничится единственным вариантом GeForce RTX 2060 и в будущем появятся конфигурации с иным объемом (3 либо 4 Гбайт) и типом микросхем (GDDR5). А если взглянуть на разнообразие видеокарт GeForce GTX 1060, то и набор активных вычислительных блоков в потенциальных шести (!) версиях GeForce RTX 2060 тоже может изменяться.
По частотному диапазону GPU новинка не слишком отличается от GeForce RTX 2070. NVIDIA понизила базовую частоту ядра с 1410 до 1365 МГц, и в то же время Boost Clock оказался выше по сравнению с референсными параметрами RTX 2070: 1680 против 1620 МГц. Сокращенный набор вычислительных блоков отразился и на TDP видеокарты: лимит мощности RTX 2060 и RTX 2070 составляет 160 и 175 Вт соответственно.
Производитель | |||||
---|---|---|---|---|---|
Модель | GeForce GTX 1060 6 Гбайт | GeForce RTX 2060 | GeForce RTX 2070 | GeForce RTX 2080 | GeForce RTX 2080 Ti |
Графический процессор | |||||
Название | GP106 | TU106 | TU106 | TU104 | TU102 |
Микроархитектура | Pascal | Turing | Turing | Turing | Turing |
Техпроцесс, нм | 16 нм FinFET | 12 нм FFN | 12 нм FFN | 12 нм FFN | 12 нм FFN |
Число транзисторов, млн | 4400 | 10 800 | 10 800 | 13 600 | 18 600 |
Тактовая частота, МГц: Base Clock / Boost Clock | 1506/1708 | 1365/1680 | 1 410 / 1 620 (Founders Edition: 1 410 / 1 710) | 1 515 / 1 710 (Founders Edition: 1 515 / 1 800) | 1 350 / 1 545 (Founders Edition: 1 350 / 1 635) |
Число шейдерных ALU | 1280 | 1920 | 2304 | 2944 | 4352 |
Число блоков наложения текстур | 80 | 120 | 144 | 184 | 272 |
Число ROP | 48 | 48 | 64 | 64 | 88 |
Оперативная память | |||||
Разрядность шины, бит | 192 | 192 | 256 | 256 | 352 |
Тип микросхем | GDDR5 SDRAM | GDDR6 SDRAM | GDDR6 SDRAM | GDDR6 SDRAM | GDDR6 SDRAM |
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) | 2000 (8000) 2250 (9000) | 1 750 (14 000) | 1 750 (14 000) | 1 750 (14 000) | 1 750 (14 000) |
Объем, Мбайт | 6 144 | 8 192 | 8 192 | 8 192 | 11 264 |
Шина ввода/вывода | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 |
Производительность | |||||
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) | 4372 | 6451 | 7 465 / 7 880 (Founders Edition) | 10 069 / 10 598 (Founders Edition) | 13 448 / 14 231 (Founders Edition) |
Производительность FP32/FP64 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 |
Пропускная способность оперативной памяти, Гбайт/с | 192/216 | 336 | 448 | 448 | 616 |
Вывод изображения | |||||
Интерфейсы вывода изображения | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b |
TBP/TDP, Вт | 120 | 160 | 175/185 (Founders Edition) | 215/225 (Founders Edition) | 250/260 (Founders Edition) |
Розничная цена (США, без налога), $ | 249 (рекомендованная) / 299 (Founders Edition, nvidia.com) | 349 (рекомендованная) / 349 (Founders Edition, nvidia.com) | 499 (рекомендованная) / 599 (Founders Edition, nvidia.com) | 699 (рекомендованная) / 799 (Founders Edition, nvidia.com) | 999 (рекомендованная) / 1 199 (Founders Edition, nvidia.com) |
Розничная цена (Россия), руб. | НД (рекомендованная) / 22 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 31 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 47 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 63 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 95 990 (Founders Edition, nvidia.ru) |
GeForce RTX 2060 изначально доступен как в референсной модификации (Founders Edition), так и в виде партнерских устройств. С тех пор как NVIDIA начала самостоятельно продавать видеокарты под маркой Founders Edition, компания стремится дистанцировать их от понятия «референсная модель». Но GeForce RTX 2060 FE уместно называть именно так — ведь в этот раз NVIDIA обошлась без заводского разгона видеокарты, а цена Founders Edition не отличается от рекомендованной.
В отношении позиционирования на рынке GeForce RTX 2060 продолжает политику, которую установили старшие модели 20-й серии: по цене — $349 — новинка соответствует модели предыдущего поколения, которая стояла на одну ступень выше в семействе GeForce 10 — GTX 1070, в то время как GeForce GTX 1060 когда-то был выпущен по рекомендованной цене $249. Со стороны AMD ближайшим соперником GeForce RTX 2060 станет Radeon RX Vega 56, рекомендованная цена которого составляет $399. Трудно предсказать, какая из двух видеокарт станет победителем сегодняшнего теста: с одной стороны, Vega 56 даже в момент ее выхода, когда преобладали игры под Direct3D 11, а драйверы AMD были не столь хорошо оптимизированы, как сейчас, легко превосходила по быстродействию GeForce GTX 1070. С другой стороны, NVIDIA тоже стремится предложить за цену GeForce GTX 1070 не только функцию трассировки лучей, но и бонус в виде дополнительных FPS.
Коль скоро GeForce RTX 2060 построен на том же GPU, что и GeForce RTX 2070, NVIDIA не стала проектировать для новой модели 20-й серии отдельную печатную плату и систему охлаждения, а полностью скопировала оснастку устройства, представленного в августе. Если учесть, что у нас до сих пор не было возможности изучить GeForce RTX 2070, это наш первый взгляд на конструкцию младших ускорителей семейства Turing под маркой Founders Edition.
GeForce RTX 2060 и 2070 Founders Edition скроены по тем же лекалам, что RTX 2080 и RTX 2080 Ti. В прошлом референсные версии топовых GeForce оснащались закрытыми системами охлаждения с центробежным вентилятором. «Турбинная» конструкция хороша тем, что выбрасывает нагретый воздух за пределы ПК и не настолько сильно зависит от вентиляции внутри корпуса, как ее открытые аналоги. Но пример GeForce GTX 1080 Ti показал, что центробежный кулер не может эффективно охлаждать видеокарты с резервом мощности 250 Вт и выше, сохраняя комфортный уровень шума, поэтому для GeForce RTX 2080 и RTX 2080 Ti инженеры NVIDIA создали открытую систему охлаждения, причем, благодаря испарительной камере в основании радиатора, весьма эффективную для ее небольших габаритов.
GeForce RTX 2060 и RTX 2070 обладают значительно меньшим тепловыделением (160 и 185 Вт в модификациях Founders Edition) и вполне могли обойтись стандартной «турбиной». Но коль скоро СО нового образца отлично справляется с отводом тепла от чипов TU104 и TU102, младшему чипу Turing под аналогичным кулером и подавно будет комфортно.
Габариты GeForce RTX 2060 FE существенно меньше, чем у старших моделей, но есть и ряд других отличий. Как и RTX 2070, видеокарта лишена интерфейса NVLink, а место одного из разъемов DisplayPort занял выход DVI-D: коль скоро адаптеры такого класса не рассчитаны на игру при разрешении выше 1440p, их по-прежнему могут использовать в связке со старыми мониторами. В то же время NVIDIA сохранила разъем USB Type-C, который позволяет соединить видеокарту со шлемом VR по протоколу DisplayLink или подключить к ПК любую периферию со скоростью передачи данных вплоть до 10 Гбит/с.
Кожух системы охлаждения, сделанный из толстых алюминиевых пластин, окружает внутренности видеокарты с трех сторон и позволяет двум вентиляторам диаметром 85 мм прогонять воздух вдоль короткой стороны печатной платы. Радиатор заполняет все свободное место внутри внутри кожуха, но его конструкция существенно упрощена по сравнению с GeForce RTX 2080 и RTX 2080 Ti и напоминает референсные видеокарты семейства GeForce 10. Испарительная камера уже не охватывает всю площадь печатной платы и прижата только к кристаллу графического процессора, а распределению тепла по ребрам радиатора способствует плоская термотрубка. Другие компоненты, нуждающиеся в активном охлаждении, накрыты отдельной металлической рамкой.
Печатная плата GeForce RTX 2070 перешла к младшей модели с минимальными изменениями. NVIDIA удалила две из восьми микросхем GDDR6, а вот все компоненты регулятора напряжения остались в сохранности. VRM содержит шесть фаз для питания графического процессора и две — для чипов RAM. ШИМ-контроллер uPI uP9512 в сочетании с микросхемами DrMOS (полевой транзистор с интегрированным драйвером) обеспечивает высокочастотный и точный мониторинг напряжения на стоке транзистора по сигналу IMON и позволяет динамически регулировать число активных фаз с целью поддержания высокого КПД во всем диапазоне потребляемой мощности.
Дополнительное питание видеокарта получает через единственный восьмиконтактный разъем. Если учесть силовые линии слота PCI Express, номинальная мощность устройства может достигать 225 Вт, но разводка разъема говорит о том, что к серьезному оверклокингу GeForce RTX 2060 FE не подготовлен. Дело вот в чем: печатная плата Founders Edition короче системы охлаждения, и, чтобы кабель блока питания можно было подключать с торца корпуса, разъем соединен с PCB промежуточным кабелем, причем линии «плюса» и «земли» собраны в два пучка, каждый из которых запаян в одно отверстие (желтый и зеленый провода используются некоторыми БП для контроля напряжения, но в большинстве случаев работают как дополнительная «земля»). Такую же конструкцию мы видели в референсном варианте GeForce GTX 1060. Вряд GeForce RTX 2060 FE что-то угрожает даже при умеренном разгоне GPU, но все же это попросту не самое элегантное решение и потенциальный источник проблем в случае дефекта пайки при сборке PCB.