Пн
Вт
Ср
Чт
Пт
Сб
Вс

Новая статья: Обзор видеокарты NVIDIA GeForce RTX 2060 Founders Edition: трассировка лучей для всех (почти)

21.01.2019 2:21

Новая статья: Обзор видеокарты NVIDIA GeForce RTX 2060 Founders Edition: трассировка лучей для всех (почти)

Графические процессоры семейства Turing, которые NVIDIA выпустила четыре месяца тому назад, стали одним из крупнейших событий в истории 3D-графики. Видеокарты для домашних ПК и рабочих станций впервые приобрели функции трассировки лучей в реальном времени. Пусть пока что лишь Battlefield V да свежий тест 3DMark дают возможность увидеть Ray Tracing в деле, внедрение этой технологии в других проектах тоже не за горами, а в перспективе именно трассировка лучей будет поддерживать развитие компьютерных игр. Ведь она не только обеспечивает принципиально иное качество освещения, но и облегчает задачу разработчиков за счет того, что те эффекты, которые в контексте растеризации требуют кропотливой ручной настройки, теперь элегантно автоматизируются.

Однако первый опыт NVIDIA в этой области дал понять, что переход к модели гибридного рендеринга (так в компании называют сочетание метода растеризации с трассировкой лучей) не дается бесплатно. Видеокарты серии GeForce RTX 20 не так сильно отличаются от предыдущего поколения по быстродействию в играх без трассировки лучей, как те, в свою очередь, от их предшественников. При этом три модели, представленные в августе (GeForce RTX 2070, RTX 2080 и RTX 2080 Ti), оказались настолько дорогими, что правило апгрейда GPU, которое безотказно работало ранее (больше FPS за те же деньги), больше не действует.

Наконец, опыт Battlefield V показал, что Ray Tracing в реальном времени пока с трудом дается даже столь мощному железу, как новые ускорители на чипах Turing. Поэтому вплоть до момента, когда NVIDIA представила GeForce RTX 2060, было неясно, планирует ли компания распространить архитектуру Turing в неизменном виде на видеокарты средней ценовой категории, или гибридный рендеринг пока останется привилегией устройств за $500 и выше. Но сомнения остались в прошлом, ведь само название RTX 2060 говорит о том, что трассировке лучей в условно-массовых графических картах дан зеленый свет.

Технические характеристики, цена

В первой волне моделей 20-й серии GeForce RTX 2070 был единственной видеокартой, которая получила полностью функциональный графический процессор, в то время как GeForce RTX 2080 и RTX 2080 Ti построены на GPU с частично заблокированными вычислительными блоками. Чип TU106, который дебютировал в составе GeForce RTX 2070, относится к третьему эшелону семейства Turing и является формальным наследником GP106, но по меркам предыдущей архитектуры NVIDIA — Pascal — это все еще чрезвычайно крупный кристалл: с транзисторным бюджетом 10,8 млрд он уступает лишь GP102 (12 млрд транзисторов) и на 50 % превосходит GP104. А значит, выпуск следующей модели серии GeForce RTX 20 на основе «урезанных» чипов TU106 был абсолютно логичным шагом со стороны NVIDIA. Единственная интрига в подобных ситуациях — это масштаб потерь в наборе вычислительных блоков графического процессора.

TU106 в конфигурации GeForce RTX 2060 имеет 1920 активных ядер CUDA (в данном случае мы считаем только ядра, выполняющие операции FP32), распределенных по 30 потоковым мультипроцессорам (Streaming Multiprocessor, SM), в то время как «физически» кристалл состоит из 36 SM и содержит 2304 CUDA-ядра. Чипы NVIDIA, выпущенные со времен архитектуры Fermi, позволяют масштабировать все главные компоненты аппаратного конвейера путем отключения дефектных или просто «ненужных» для конкретной модели SM. Как следствие, GeForce RTX 2060 одновременно утратил 17% вычислительной мощности при исполнении 32-битных операций с плавающей запятой (CUDA-яра FP32), целочисленных операций (CUDA-ядра INT32) и скорости наложения текстур. И все же в GeForce RTX 2060 осталось много от изначальной мощи GeForce RTX 2070. Для сравнения: GeForce GTX 1060 содержит в 1,5 раза меньше CUDA-ядер, чем следующая по старшинству модель — GTX 1070. Но главное, процессор GP106 даже в «урезанной» форме сохранил часть логики, отличающей архитектуру Turing от ее предшественников, — тензорные ядра и ядра трассировки лучей.

Производитель	NVIDIA
Название	GP104	GP102	GP100	GV100	TU106	TU104	TU102
Микроархитектура	Pascal	Pascal	Pascal	Volta	Turing	Turing	Turing
Техпроцесс, нм	16 nm FinFET	16 nm FinFET	16 nm FinFET	12 нм FFN	12 нм FFN	12 нм FFN	12 нм FFN
Число транзисторов, млн	7 200	12 000	15 300	21 100	10 800	13 600	18 600
Площадь чипа, мм2	314	471	610	815	445	545	754
Конфигурация SM/TPC/GPC
Число SM	20	30	60	84	36	48	72
Число TPC	20	30	30	42	18	24	36
Число GPC	4	6	6	6	3	6	6
Конфигурация потокового мультипроцессора (SM)
FP32-ядра	128	128	64	64	64	64	64
FP64-ядра	4	4	32	32	2	2	2
INT32-ядра	Н/Д	Н/Д	Н/Д	64	64	64	64
Тензорные ядра	Н/Д	Н/Д	Н/Д	8	8	8	8
RT-ядра	Н/Д	Н/Д	Н/Д	Н/Д	1	1	1
Программируемые вычислительные блоки GPU
FP32-ядра	2 560	3 840	3 840	5 376	2 304	3 072	4 608
FP64-ядра	80	120	1 920	2 688	72	96	144
INT32-ядра	Н/Д	Н/Д	Н/Д	5 376	2 304	3 072	4 608
Тензорные ядра	Н/Д	Н/Д	Н/Д	672	288	384	576
RT-ядра	Н/Д	Н/Д	Н/Д	Н/Д	36	48	72
Блоки фиксированной функциональности
TMU (блоки наложения текстур)	160	240	240	336	144	192	288
ROP	64	96	128	128	64	64	96
Конфигурация памяти
Объем кеша L1 / текстурного кеша, Кбайт	48	48	24	≤ 128 из 128, общий с разделяемой памятью	32/64 из 96 (общий с разделяемой памятью)	32/64 из 96 (общий с разделяемой памятью)	32/64 из 96 (общий с разделяемой памятью)
Объем разделяемой памяти / SM, Кбайт	96	96	64	≤ 96 из 128 (общий с кешем L1)	32/64 из 96 (общий с кешем L1)	32/64 из 96 (общий с кешем L1)	32/64 из 96 (общий с кешем L1)
Объем регистрового файла / SM, Кбайт	256	256	256	256	256	256	256
Объем регистрового файла / GPU, Кбайт	5 120	7 680	15 360	21 504	9 216	12 288	18 432
Объем кеша L2, Кбайт	2 048	3 072	4 096	6 144	4 096	4 096	6 144
Разрядность шины RAM, бит	256	384	4 096	4 096	256	256	384
Тип микросхем RAM	GDDR5/GDDR5X	GDDR5X	HBM2	HBM2	GDDR6	GDDR6	GDDR6
Шина NVLINK	Н/Д	Н/Д	4 × NVLink 1.0 x8	6 × NVLink 2.0 x8	Н/Д	1 × NVLink 2.0 x8	2 × NVLink 2.0 x8

Трансформация GeForce RTX 2070 в RTX 2060 гораздо сильнее ударила по той части GPU, которая называется back-end: контроллерам памяти, блокам ROP и объему кеша второго уровня. NVIDIA отключила в TU106 два из восьми 32-битных контроллеров RAM, а значит, GPU теперь располагает лишь 192-битной шиной памяти, а спецификации GeForce RTX 2060 предусматривают 6 Гбайт типа GDDR6 с пропускной способностью 14 Гбит/с на бит шины. Однако есть намеки на то, что NVIDIA не ограничится единственным вариантом GeForce RTX 2060 и в будущем появятся конфигурации с иным объемом (3 либо 4 Гбайт) и типом микросхем (GDDR5). А если взглянуть на разнообразие видеокарт GeForce GTX 1060, то и набор активных вычислительных блоков в потенциальных шести (!) версиях GeForce RTX 2060 тоже может изменяться.

По частотному диапазону GPU новинка не слишком отличается от GeForce RTX 2070. NVIDIA понизила базовую частоту ядра с 1410 до 1365 МГц, и в то же время Boost Clock оказался выше по сравнению с референсными параметрами RTX 2070: 1680 против 1620 МГц. Сокращенный набор вычислительных блоков отразился и на TDP видеокарты: лимит мощности RTX 2060 и RTX 2070 составляет 160 и 175 Вт соответственно.

Производитель
Модель	GeForce GTX 1060 6 Гбайт	GeForce RTX 2060	GeForce RTX 2070	GeForce RTX 2080	GeForce RTX 2080 Ti
Графический процессор
Название	GP106	TU106	TU106	TU104	TU102
Микроархитектура	Pascal	Turing	Turing	Turing	Turing
Техпроцесс, нм	16 нм FinFET	12 нм FFN	12 нм FFN	12 нм FFN	12 нм FFN
Число транзисторов, млн	4400	10 800	10 800	13 600	18 600
Тактовая частота, МГц: Base Clock / Boost Clock	1506/1708	1365/1680	1 410 / 1 620 (Founders Edition: 1 410 / 1 710)	1 515 / 1 710 (Founders Edition: 1 515 / 1 800)	1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU	1280	1920	2304	2944	4352
Число блоков наложения текстур	80	120	144	184	272
Число ROP	48	48	64	64	88
Оперативная память
Разрядность шины, бит	192	192	256	256	352
Тип микросхем	GDDR5 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	2000 (8000) 2250 (9000)	1 750 (14 000)	1 750 (14 000)	1 750 (14 000)	1 750 (14 000)
Объем, Мбайт	6 144	8 192	8 192	8 192	11 264
Шина ввода/вывода	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	4372	6451	7 465 / 7 880 (Founders Edition)	10 069 / 10 598 (Founders Edition)	13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64	1/32	1/32	1/32	1/32	1/32
Пропускная способность оперативной памяти, Гбайт/с	192/216	336	448	448	616
Вывод изображения
Интерфейсы вывода изображения	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b
TBP/TDP, Вт	120	160	175/185 (Founders Edition)	215/225 (Founders Edition)	250/260 (Founders Edition)
Розничная цена (США, без налога), $	249 (рекомендованная) / 299 (Founders Edition, nvidia.com)	349 (рекомендованная) / 349 (Founders Edition, nvidia.com)	499 (рекомендованная) / 599 (Founders Edition, nvidia.com)	699 (рекомендованная) / 799 (Founders Edition, nvidia.com)	999 (рекомендованная) / 1 199 (Founders Edition, nvidia.com)
Розничная цена (Россия), руб.	НД (рекомендованная) / 22 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 31 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 47 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 63 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 95 990 (Founders Edition, nvidia.ru)

GeForce RTX 2060 изначально доступен как в референсной модификации (Founders Edition), так и в виде партнерских устройств. С тех пор как NVIDIA начала самостоятельно продавать видеокарты под маркой Founders Edition, компания стремится дистанцировать их от понятия «референсная модель». Но GeForce RTX 2060 FE уместно называть именно так — ведь в этот раз NVIDIA обошлась без заводского разгона видеокарты, а цена Founders Edition не отличается от рекомендованной.

В отношении позиционирования на рынке GeForce RTX 2060 продолжает политику, которую установили старшие модели 20-й серии: по цене — $349 — новинка соответствует модели предыдущего поколения, которая стояла на одну ступень выше в семействе GeForce 10 — GTX 1070, в то время как GeForce GTX 1060 когда-то был выпущен по рекомендованной цене $249. Со стороны AMD ближайшим соперником GeForce RTX 2060 станет Radeon RX Vega 56, рекомендованная цена которого составляет $399. Трудно предсказать, какая из двух видеокарт станет победителем сегодняшнего теста: с одной стороны, Vega 56 даже в момент ее выхода, когда преобладали игры под Direct3D 11, а драйверы AMD были не столь хорошо оптимизированы, как сейчас, легко превосходила по быстродействию GeForce GTX 1070. С другой стороны, NVIDIA тоже стремится предложить за цену GeForce GTX 1070 не только функцию трассировки лучей, но и бонус в виде дополнительных FPS.

⇡#Конструкция

Коль скоро GeForce RTX 2060 построен на том же GPU, что и GeForce RTX 2070, NVIDIA не стала проектировать для новой модели 20-й серии отдельную печатную плату и систему охлаждения, а полностью скопировала оснастку устройства, представленного в августе. Если учесть, что у нас до сих пор не было возможности изучить GeForce RTX 2070, это наш первый взгляд на конструкцию младших ускорителей семейства Turing под маркой Founders Edition.

GeForce RTX 2060 и 2070 Founders Edition скроены по тем же лекалам, что RTX 2080 и RTX 2080 Ti. В прошлом референсные версии топовых GeForce оснащались закрытыми системами охлаждения с центробежным вентилятором. «Турбинная» конструкция хороша тем, что выбрасывает нагретый воздух за пределы ПК и не настолько сильно зависит от вентиляции внутри корпуса, как ее открытые аналоги. Но пример GeForce GTX 1080 Ti показал, что центробежный кулер не может эффективно охлаждать видеокарты с резервом мощности 250 Вт и выше, сохраняя комфортный уровень шума, поэтому для GeForce RTX 2080 и RTX 2080 Ti инженеры NVIDIA создали открытую систему охлаждения, причем, благодаря испарительной камере в основании радиатора, весьма эффективную для ее небольших габаритов.