Вчера был большой день для Nvidia, мистер Хуанг рассказал о разнообразных новинках и кое-что даже показал.
Мои коллеги с VideoCardz предоставили следующую табличку, дабы мы могли узнать о характеристиках основанного на GP100 (Pascal) графического решения Tesla P100:
Решения серии Tesla | Tesla K40 | Tesla M40 | Tesla P100 |
---|---|---|---|
GPU | GK110 (Kepler) | GM200 (Maxwell) | GP100 (Pascal) |
SM | 15 | 24 | 56 |
TPC | 15 | 24 | 28 |
FP32 CUDA ядра / SM | 192 | 128 | 64 |
FP32 CUDA ядра / GPU | 2880 | 3072 | 3584 |
FP64 CUDA ядра / SM | 64 | 4 | 32 |
FP64 CUDA ядра / GPU | 960 | 96 | 1792 |
Тактовая частота |
745 МГц | 948 МГц | 1328 МГц |
Тактовая частота в Boost | 810/875 МГц | 1114 МГц | 1480 МГц |
FP64 ГФЛОПС | 1680 | 213 | 5304 |
Текстурные блоки |
240 | 192 | 224 |
Интерфейс памяти |
384-бит GDDR5 | 384-бит GDDR5 | 4096-бит HBM2 |
Объём памяти |
до 12 ГБ | до 24 ГБ | 16 ГБ |
Размер кеша второго уровня (L2) | 1536 КБ | 3072 КБ | 4096 КБ |
Register File Size / SM | 256 КБ | 256 КБ | 256 КБ |
Register File Size / GPU | 3840 КБ | 6144 КБ | 14336 КБ |
TDP | 235 ватт | 250 ватт | 300 ватт |
Количество транзисторов |
7.1 млрд. | 8 млрд. | 15.3 млрд. |
Площадь чипа GPU | 551 мм² | 601 мм² | 610 мм² |
Производственный процесс | 28нм | 28нм | 16нм |
Пока неизвестно, когда же появятся предназначенные для домашнего использования видеокарты на базе GP100 и каким типом памяти они будут оснащены. ТОП-варианты наверняка получат HBM2, в то время как более доступные по цене (решения среднего уровня) будут довольствоваться GDDR5/X. Поставки HPC платы Tesla P100 начнутся лишь в следующем году, в первом квартале, будем надеяться, что с графическими картами для домашних систем Nvidia так затягивать не будет.
Нам также показали ряд снимков с HPC платой Tesla P100, схематикой GP100 (Pascal) и прочим интересным контентом:
А теперь посмотрим на компактный суперкомпьютер DGX-1 от Nvidia:
Данное решение включает в себя восемь HPC плат Tesla P100 (напомню, у каждой 16ГБ памяти HBM2), обладает производительностью в 170 ТЕРАФЛОПС (FP16), использует NVLink Hybrid Cube Mesh, а также 7ТБ SSD в качестве кеша. Для связи задействовано два 10GbE порта и Quad InfiniBand 100Gb, размещение - 3U, потребление - 3200 ватт. Устройство создано для целей, простым смертным непонятным (искусственный интеллект и так далее), цена вопроса мало кого порадует - 129000 долларов США.
Послушаем, что скажет мистер Хуанг:
Ну что же... ждём, ничего другого не остаётся.
|
|