Уходящий год мы встретили с надеждой на большие перемены в категории дискретных видеоадаптеров (см. итоги 2014 года). Прошедшие двенадцать месяцев, конечно, не идут ни в какое сравнение с уже далеким 2011-2012 годом, когда оба крупнейших производителя GPU перенесли основную часть своих продуктовых линеек на рельсы техпроцесса 28 нм, практически удвоив производительность, доступную топовым моделям видеоадаптеров по сравнению с предыдущим поколением эпохи 40 нм. Но в отличие от откровенно застойного 2014 года, когда единственным способом сдвинуть планку быстродействия для производителей был выпуск «двухголовых» видеоадаптеров Radeon R9 295X2 и GeForce GTX TITAN Z (в этот раз особенно неуклюжих и монструозных в связи с тепловыделением соответствующих GPU), AMD и NVIDIA все же породили две микросхемы, ныне по праву занимающих верхний ранг в иерархии дискретных GPU – AMD Fiji (семейство Radeon R9 Fury) и NVIDIA GM200 (GeForce GTX 980 Ti, GTX TITAN X).
И это по-своему уникальная ситуация, ведь дискретные GPU уже четыре года подряд выпускаются на базе одной и той же фотолитографической технологии TSMC с нормой 28 нм. Прорыв, который обеспечили Fiji и GM200, стал возможен в первую очередь благодаря тому факту, что оба чипа по площади практически достигли предела, заданного фотомаской, применяемой на конвейере TSMC (596 и 601 мм2 для Fiji и GM200 соответственно). Но, что не менее важно, в этих продуктах воплотились лучшие достижения в проектировании энергоэффективной процессорной архитектуры.
GPU нижних эшелонов в связи с появлением новых флагманов по большей части просто сдвинулись вниз и будут нести службу до тех пор, пока производители не представят им замену в лице чипов, произведенных по более прогрессивной норме (заветный час уже близок), однако у нас есть и третий новичок – NVIDIA GM206, который лег в основу видеоадаптеров GeForce GTX 950/960.
Таким образом, архитектура Maxwell, уже второго поколения, теперь заполнила всю линейку продуктов NVIDIA, начиная с карточек доступной геймерской категории. AMD, со своей стороны, перетасовала состав и конфигурацию уже существовавших GPU на базе архитектуры GCN различных версий и представила их под маркой Radeon R5/R7/R9 300.
Расскажем обо всем этом чуть более подробно, а в конце статьи по традиции будет синопсис слухов и публичных обещаний производителей относительно планов по выпуску новых GPU в следующие 12 месяцев. Можно с большой уверенностью утверждать, что в следующем году уж точно AMD и NVIDIA сменят изживший свое техпроцесс 28 нм на более прогрессивный – 14/16 нм, миновав промежуточную ступень 20 нм.
⇡#Что было
⇡#Большой Maxwell – NVIDIA GM200
NVIDIA внедрила новую архитектуру довольно быстрыми по меркам индустрии темпами, так что к моменту появления нового короля дискретных GPU уже существовали четыре чипа линейки Maxwell – GM107 (GeForce GTX 750, GTX 750 Ti), GM108 (GeForce GTX 730), GM204 (GeForce GTX 970, GTX 980) и GM206 (GeForce GTX 960).
Появление в этом ряду чипа с индексом 200 было предопределено, только выбор конкретного техпроцесса оставался под вопросом. Вопреки наилучшему сценарию, NVIDIA по-прежнему использовала проверенный техпроцесс с нормой 28 нм, однако архитектура Maxwell сама по себе создавалась с расчетом на максимально эффективное использование теплового пакета и площади кристалла. Как следствие, ограничения производственной линии на TSMC вполне позволили создать чип, вмещающий в 1,5 раза больше ROP и ядер CUDA и вдвое больше текстурных блоков по сравнению с GM204.
Впрочем, количественным составом вычислительных блоков отличия GM200 от двух остальных GPU из второго поколения Maxwell – GM204 и GM206 – и ограничиваются (не считая того, что GM206 единственный из тройки обладает аппаратным декодером видео формата H.265).
Два продукта, построенных на основе GM200, – GeForce GTX TITAN X и GTX 980 Ti – на сегодняшний день удерживают лидерство в скорости игрового 3D-рендеринга среди дискретных GPU. Единственная проблема GM200 – весьма ограниченная производительность в расчетах двойной точности (FP64). В отличие от предыдущих «Титанов» на базе GK110, TITAN X не имеет никаких преимуществ перед геймерским флагманом (GTX 980 Ti) в этом отношении.
⇡#GeForce GTX 950 и GTX 960
Эти видеокарты, вышедшие в 2015 году, не предназначены поражать воображение. NVIDIA просто обновила середину своего модельного ряда (и убрала лишние позиции) за счет чипа GM206 на базе архитектуры Maxwell второго поколения. GTX 960 на своем месте заменил GTX 660 и GTX 760, принадлежащие к семейству Kepler, что принесло колоссальное снижение энергопотребления при сохранении прежнего уровня быстродействия. GTX 950 не так эффектно выглядит на фоне остающихся в продаже GTX 750 и GTX 750 Ti (так как это уже GM107 – Maxwell первого поколения), однако принес и рост производительности, и дополнительные функции рендеринга, свойственные второму поколению Maxwell.
GeForce GTX 950 и GTX 960 обладают уникальной на данный момент особенностью среди дискретных видеоадаптеров – аппаратным блоком декодирования видео, сжатого в формате H.265.
О новом флагманском GPU от AMD ходили самые разнообразные, во многом противоречивые слухи. Что-то из этого сбылось, что-то – нет, но в результате AMD представила действительно оригинальный и передовой продукт.
Как и GM200 от NVIDIA, новое «большое ядро» от AMD – Fiji – по площади кристалла практически исчерпало возможности производственной линии 28 нм на TSMC. Архитектура вычислительных блоков Fiji включает в 1,45 раза больше шейдерных ALU («потоковых процессоров») и текстурных модулей, чем в предыдущем флагманском GPU – Hawaii, при неизменном количестве ROP.
Революционная особенность Fiji – новый тип памяти HBM (High-Bandwidth Memory), предусматривающий размещение микросхем на одной кремниевой подложке с графическим процессором. За счет этого стала возможной реализация чрезвычайно широкой, 4096-битной шины памяти, которая при относительно низкой частоте 1 ГГц обеспечивает лидирующую пропускную способность и втрое более низкое удельное энергопотребление сравнительно с GDDR5.
Однако несмотря на свои достоинства и новаторство, дизайн Fiji содержит досадное ограничение в виде низкой пропускной способности front-end’а, выполняющего растеризацию треугольников. Как следствие, топовый продукт на базе Fiji – Radeon R9 Fuxy X, изначально оцененный производителем наравне с GeForce GTX 980 Ti, по совокупной производительности все же немного недотягивает до уровня конкурента. Первая итерация памяти HBM также наложила ограничение на объем RAM, доступный Fiji, – 4 Гбайт, чего в ряде случаев уже не вполне хватает для игр, наиболее требовательных к этому параметру. Впрочем, Fury X на равных соревнуется с GTX 980 Ti в 4К-разрешении и может похвастаться эффективной и тихой системой жидкостного охлаждения в референсной конфигурации.
Помимо флагманского Radeon R9 Fury X, GPU Fiji лег в основу двух других видеокарт – Radeon R9 Fury и R9 Nano. Обе по игровому быстродействию занимают промежуточное положение между GeForce GTX 980 и Fury X. Но если Fury – это более дешевая карта на базе Fiji с частично ограниченной конфигурацией вычислительных блоков, в стандартном форм-факторе, с массивным воздушным кулером, то R9 Nano обладает уникальным сочетанием компактного форм-фактора и полнофункционального чипа Fiji с пониженными частотами (цена за такое удовольствие – как у Fury X).
⇡#AMD Radeon 300-й серии
Fiji – единственный GPU десктопного класса, который AMD представила в 2015 году. Остальную линейку в связи с появлением новых позиций вверху реорганизовали и выпустили под названиями Radeon R5/R7/R9 300-й серии.
Наибольший интерес в ней представляют Radeon R9 390 и R9 390X (де-факто разогнанные версии Radeon R9 290 и R9 290X на ядре Hawaii), которые AMD позиционирует как более дешевую и/или выгодную альтернативу GeForce GTX 970 и GTX 980 соответственно, которая к тому же обладает объемом RAM 8 Гбайт – вдвое большим, чем предлагает NVIDIA в этом сегменте.
В более низком эшелоне AMD полностью исключила продукты на базе заслуженного чипа Tahiti в пользу простых и дешевых в производстве карточек на процессоре Tonga, обладающем 256-битной шиной памяти (Antigua, согласно новой номенклатуре). Radeon R9 380 является близким соперником GeForce GTX 960 при более низкой цене. R9 380X, в свою очередь, не имеет прямых конкурентов по быстродействию в линейке NVIDIA и целит в промежуток между GeForce GTX 960 и GTX 970.
Что касается Radeon R9 360 и Radeon R9 370, то эти модели играют в одной категории с GeForce GTX 750 Ti и GTX 950 соответственно. И та и другая – медленнее и одновременно дешевле своих прямых соперников. К слову, чип под кодовым именем Pitcairn/Curacao/Trinidad в составе Radeon R9 360 – старейший из GPU, используемых AMD в десктопных видеокартах: он дебютировал еще в 2012 году в Radeon HD 7850/7870.
В целом в каждой позиции 300-й линейки AMD стремится дать покупателю более выгодное соотношение цены и производительности, чем у ближайшего «зеленого» соперника. Главная проблема, которая касается всех дискретных видеокарт AMD уровня ниже Fury (с технической точки зрения), – это несопоставимо низкая по сравнению с Maxwell энергоэффективность и, как следствие, более высокие требования к системе охлаждения (впрочем, конкретные производители здесь в силах многое исправить) и более низкий разгонный потенциал.
Кроме того, AMD проигрывает в плане модной сегодня поддержки DirectX 12. Как мы уже неоднократно отмечали, всем GPU архитектуры GCN доступна оптимизированная производительность новой runtime-библиотеки Direct3D. Однако в плане новых функций рендеринга AMD пока что отстает. Графические процессоры с архитектурой GCN 1.1-1.2, составляющие костяк действующей линейки Radeon, поддерживают feature level 12_0, в то время как Maxwell второго поколения совместим с feature level 12_1.
⇡#Что будет
⇡#NVIDIA Pascal
Продукты на базе следующей версии графической архитектуры от NVIDIA – Pascal – постепенно обретают все более реалистичный вид. Ранее производитель уже объявил две ключевые особенности флагманских продуктов на базе Pascal – проприетарная высокоскоростная шина NVLINK и «трехмерная» память, аналогичная той, которую впервые применила AMD в процессоре Fiji. Теперь нет сомнений, что последняя представляет собой не что иное, как чипы HBM второго поколения совокупным объемом 16 Гбайт, которые для NVIDIA выпустит SK Hynix. Сами GPU поступят в производство на мощностях TSMC с нормой 16 нм FinFET+.
О конкретных характеристиках чипов, формирующих линейку Pascal, пока можно судить лишь по слухам. Говорят, что GP100, флагман семейства, будет содержать 17 млрд транзисторов – почти двукратный рост по сравнению с GM200 (9 млрд). Предполагаемое увеличение производительности на 60-80% сделает GP100 первым GPU, способным в одиночку «вытянуть» современные игры на 4К-экране с частотой смены кадров 60 FPS.
Еще меньше известно о том, каким образом NVIDIA сумеет сделать на базе GPU высшего эшелона более доступный продукт в дополнение к флагманской видеокарте. Не исключено, что, помимо стандартного решения – срезать частоты и отключить часть вычислительных блоков, производитель сменит память HBM2 на GDDR5X – высокочастотную и энергоемкую версию преобладающего сегодня типа GDDR5.
И совсем трудно пока говорить о графических процессорах, которые обеспечат смену архитектуры Maxwell на Pascal на всем протяжении линейки продуктов NVIDIA. Ну а в 2017 году ожидается пришествие архитектуры Volta, которая, возможно, уже будет производиться по техпроцессу 10 нм.
⇡#AMD Radeon R9 Fury X 2 и линейка Arctic Islands
Прежде чем погрузиться в планы компании на ближайшее будущее, напомним, что за AMD должок – двухпроцессорная графическая карта на базе GPU Fiji. Судя по тому, что известно на сегодняшний день, устройство давно могло бы поступить в продажу, но запуск все откладывается – теперь уже до второго квартала 2016 года. Вероятная причина в том, что AMD желает согласовать старт продаж Radeon R9 Fury X2 с массовой доступностью шлемов виртуальной реальности, которым как раз и требуется столь высокая вычислительная мощность. Но так как этот сегмент рынка развивается медленнее, чем хотелось бы AMD, Radeon R9 Fury X2 придется постоять на запасном пути.
Значит ли это, что будущие GPU от AMD под кодовым названием Arctic Islands увидят свет уже после намеченной для Fury X2 даты? Ответа на этот вопрос пока нет. Известно только, что в течение 2016 года AMD планирует полностью обновить свой ассортимент дискретных GPU. Подрядчиком по производству микросхем на этот раз выступит GlobalFoundries, а не TSMC и чипы будут выпускаться по техпроцессу 14 нм FinFET LPP (Low Power Plus).
Поколение Arctic Islands, согласно заявлениям AMD, принесет третье по счету крупное обновление архитектуры GCN и удвоит энергоэффективность микросхем. Как и в NVIDIA Pascal, здесь найдет применение оперативная память типа HBM2.
Дальнейшие подробности основываются исключительно на слухах. В частности, ожидается, что топовый графический процессор следующего поколения под названием Greenland будет состоять из 18 млрд транзисторов и получит 32 Гбайт памяти HBM2. Всплыли имена двух других чипов семейства Arctic Islands – Baffin и Ellesmere. Больше о них, однако, ничего не известно.
⇡#Приложение. Актуальные линейки дискретных видеоадаптеров AMD и NVIDIA
Дискретные видеоадаптеры AMD
Модель | Графический процессор | Видеопамять | Шина ввода/вывода | TDP, Вт | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Кодовое название | Число транзис-торов, млн | Техпро-цесс, нм | Тактовая частота, МГц: High State / Boost State | Число пото-ковых проц-ров | Число текстур-ных блоков | Число ROP | Ширина шины, бит | Тип микросхем | Тактовая частота, МГц (пропускная способность, Мбит/с на линию) | Объем, Мбайт | |||
Radeon R5 230 | Caicos | 370 | 40 | 625/– | 160 | 8 | 4 | 64 | GDDR3 SDRAM | 533 (1066) | 1024/2048 | PCI Express 2.1 x16 | 19 |
Radeon R7 240 | Oland PRO | 1040 | 28 | 730/780 | 320 | 20 | 8 | 128 | GDDR3/GDDR5 SDRAM | 900 (1800) / 1125 (4500) | 1024/2048 | PCI Express 3.0 x16 | 30 |
Radeon R7 250 | Oland XT | 1040 | 28 | 1000/1050 | 320 | 20 | 8 | 128 | GDDR3/GDDR5 SDRAM | 900 (1800) / 1150 (4600) | 1024/2048 | PCI Express 3.0 x16 | 75 |
Radeon R7 250X | Cape Verde XT | 1500 | 28 | 1000/- | 640 | 40 | 16 | 128 | GDDR5 SDRAM | 1125 (4500) | 1024/2048 | PCI Express 3.0 x16 | 95 |
Radeon R9 360 | Tobago PRO | 2080 | 28 | 1050/- | 768 | 48 | 16 | 128 | GDDR5 SDRAM | 1625 (6500) | 2048 | PCI Express 3.0 x16 | 100 |
Radeon R9 370 | Trinidad PRO | 2800 | 28 | 975/- | 1024 | 64 | 32 | 256 | GDDR5 SDRAM | 1400 (5600) | 2048/4096 | PCI Express 3.0 x16 | 110 |
Radeon R9 380 | Antigua PRO | 5000 | 28 | 970/- | 1792 | 112 | 32 | 256 | GDDR5 SDRAM | 1425 (5700) | 2048/4096 | PCI Express 3.0 x16 | 190 |
Radeon R9 380X | Antigua XT | 6200 | 28 | 970/- | 2048 | 128 | 32 | 256 | GDDR5 SDRAM | 1500 (6000) | 4096 | PCI Express 3.0 x16 | 190 |
Radeon R9 390X | Grenada XT | 6200 | 28 | 1000/- | 2816 | 176 | 64 | 512 | GDDR5 SDRAM | 1500 (6000) | 8192 | PCI Express 3.0 x16 | 275 |
Radeon R9 Fury | Fiji PRO | 8900 | 28 | 1000/- | 3584 | 224 | 64 | 4096 | HBM | 500 (1000) | 4096 | PCI Express 3.0 x16 | 275 |
Radeon R9 Nano | Fiji XT | 8900 | 28 | 1000/- | 4096 | 256 | 64 | 4096 | HBM | 500 (1000) | 4096 | PCI Express 3.0 x16 | 175 |
Radeon R9 Fury X | Fiji XT | 8900 | 28 | 1050/- | 4096 | 256 | 64 | 4096 | HBM | 500 (1000) | 4096 | PCI Express 3.0 x16 | 275 |
Дискретные видеоадаптеры NVIDIA
Модель | Графический процессор | Видеопамять | Шина ввода/вывода | TDP, Вт | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Кодовое название | Число транзис-торов, млн | Техпро-цесс, нм | Тактовая частота, МГц: Base Clock / Boost Clock | Число ядер CUDA | Число текстур-ных блоков | Число ROP | Разряд-ность шины, бит | Тип микросхем | Тактовая частота, МГц (пропускная способность, Мбит/с на линию) | Объем, Мбайт | |||
GeForce GT 720 | GK208 | 1300 | 28 | 797/- | 192 | 16 | 8 | 64 | GDDR3/GDDR5 SDRAM | 900 (1800) / 1250 (5000) | 1024/2048 | PCI-Express 2.0 x16 | 19 |
GeForce GT 730 (128-bit) | GF108 | 585 | 40 | 700/- | 96 | 16 | 4 | 128 | GDDR3 SDRAM | 900 (1800) | 1024 | PCI-Express 2.0 x16 | 49 |
GeForce GT 730 (64-bit) | GK208 | 1300 | 28 | 902/- | 384 | 16 | 8 | 64 | GDDR3/GDDR5 SDRAM | 900 (1800) / 1250 (5000) | 1024/2048 | PCI-Express 2.0 x16 | 23/25 |
GeForce GT 740 | GK107 | 1300 | 28 | 902/- | 384 | 32 | 16 | 128 | GDDR3/GDDR5 SDRAM | 900 (1800) / 1250 (5000) | 1024/2048 | PCI-Express 3.0 x16 | 65 |
GeForce GTX 750 | GM107 | 1870 | 28 | 1020/1085 | 512 | 32 | 16 | 128 | GDDR5 SDRAM | 1250 (5000) | 1024 | PCI-Express 3.0 x16 | 55 |
GeForce GTX 750 Ti | GM107 | 1870 | 28 | 1020/1085 | 640 | 40 | 16 | 128 | GDDR5 SDRAM | 1350 (5000) | 2048 | PCI-Express 3.0 x16 | 60 |
GeForce GTX TITAN Z | GK110 | 7 100 | 28 | 705/876 | 2880 | 240 | 48 | 2 x 384 | GDDR5 SDRAM | 1750 (7000) | 2 x 6144 | PCI-Express 3.0 x16 | 375 |
GeForce GTX 950 | GM206 | 2 940 | 28 | 1024/1188 | 768 | 48 | 32 | 128 | GDDR5 SDRAM | 1653 (6612) | 2048 | PCI-Express 3.0 x16 | 90 |
GeForce GTX 960 | GM206 | 2 940 | 28 | 1126/1178 | 1024 | 64 | 32 | 128 | GDDR5 SDRAM | 1753 (7010) | 2048 | PCI-Express 3.0 x16 | 120 |
GeForce GTX 970 | GM204 | 5 200 | 28 | 1050/1178 | 1664 | 104 | 56 | 256 | GDDR5 SDRAM | 1750 (7000) | 4096 | PCI-Express 3.0 x16 | 145 |
GeForce GTX 980 | GM204 | 5 200 | 28 | 1126/1216 | 2048 | 128 | 64 | 256 | GDDR5 SDRAM | 1750 (7000) | 4096 | PCI-Express 3.0 x16 | 165 |
GeForce GTX 980 Ti | GM200 | 8 000 | 28 | 1000/1076 | 2816 | 176 | 96 | 384 | GDDR5 SDRAM | 1753 (7012) | 6144 | PCI-Express 3.0 x16 | 250 |
GeForce GTX TITAN X | GM200 | 8 000 | 28 | 1000/1076 | 3072 | 256 | 96 | 384 | GDDR5 SDRAM | 1753 (7012) | 12 280 | PCI-Express 3.0 x16 | 250 |