Лучшие вопросы
Таймлайн
Чат
Перспективы

Список графических процессоров Nvidia

статья-список в проекте Викимедиа Из Википедии, свободной энциклопедии

Remove ads

Этот список содержит основную информацию о графических процессорах NVIDIA серии GeForce и видеокартах, построенных на официальных спецификациях NVIDIA.

Remove ads

Замечания о версиях DirectX

Версия DirectX обозначает ключевую доступную особенность.

Remove ads

Замечания о версиях OpenGL

Версия OpenGL обозначает то, какие операции графического ускорения поддерживает данная графическая карта.

  • OpenGL 1.1 — объекты текстур
  • OpenGL 1.2 — 3D-текстуры, форматы BGRA и упакованных пикселей[1]
  • OpenGL 1.3 — мультитекстурирование, мультисемплинг, сжатие текстур
  • OpenGL 1.4 — текстуры глубины
  • OpenGL 1.5 — VBO, Occlusion Querys[2]
  • OpenGL 2.0 — GLSL 1.1, MRT, текстуры с размерами, не являющимися степенью двойки, Point Sprites, Two-sided stencil[2]
  • OpenGL 2.1 — GLSL 1.2, Pixel Buffer Object (PBO), текстуры sRGB [2]
  • OpenGL 3.0 — GLSL 1.3, Массивы текстур, условный рендеринг , FBO[3]
  • OpenGL 3.1 — GLSL 1.4, Instancing, Texture Buffer Object, Uniform Buffer Object, Primitive restart[4]
  • OpenGL 3.2 — GLSL 1.5, Geometry Shader, Multi-sampled textures[5]
Buffer Object: FBO (Frame), VBO (Vertex), PBO (Pixel), Texture, Uniform
  • OpenGL 4.0 — GLSL 4.00, тесселяция на GPU, шейдеры с 64-битной точностью.
Remove ads

Расшифровка обозначений в полях таблицы

Суммиров вкратце
Перспектива

Поля таблицы, перечисленные ниже, обозначают следующее:

  • Модель — рыночное название для графического процессора (ГП), присвоенное компанией Nvidia.
  • Год (дата) — год (дата) выпуска процессора.
  • Кодовое имя — внутреннее имя процессора в процессе разработки (обычно обозначается именем вида NVXY и позже GXY, где X обозначает серийный номер поколения, а Y — этап проекта для этого поколения).
  • Техпроцесс — средний размер элементарных компонентов процессора.
  • Шина — шина, по которой графический процессор подключён к системе (обычно слот расширения, такой как PCI, AGP или PCI-Express).
  • Макс. объём памяти — максимальное количество памяти, которое может использоваться процессором.
  • Частота ядра — максимальная фабричная частота ядра (так как некоторые производители видеокарт могут её увеличивать или уменьшать, эта частота всегда является официально специфицированной Nvidia).
  • Частота памяти — максимальная фабричная частота работы с памятью (так как некоторые производители видеокарт могут её увеличивать или уменьшать, эта частота всегда является официально специфицированной Nvidia).
  • Конвейеры x TMU x VPU — список, состоящий из количества пиксельных конвейеров, текстурных обработчиков (на каждый конвейер) и вершинных обработчиков в процессоре. В поздних моделях шейдеры интегрированы в унифицированную шейдерную архитектуру, в результате любой шейдер может выполнять любую из трёх перечисленных функций. Графические процессоры с ограниченным функционированием обработчика T&L обозначаются, как имеющие 0.5 VPU.
  • SPU x TAU x ROP — список, состоящий из количества шейдерных процессоров, обработчиков текстурных адресов (общее количество) и операторов растеризации (общее количество) в процессоре.
  • Скорость заполнения — максимальная теоретически доступная скорость заполнения (филрейт) в текстурированных пикселях в секунду. Это количество в основном используется как «максимальная пропускная способность» для графического процессора и в основном более высокая скорость заполнения характеризует более мощные (и быстрые) ГП.
  • Пропускная способность памяти — максимальная теоретическая пропускная способность процессора, работающего на фабричной частоте с фабричной разрядностью шины (здесь ГБ = 10⁹ байт).
  • Тип шины памяти — тип используемой шины памяти.
  • Ширина шины памяти — максимальная используемая ширина шины памяти в битах. Это всегда фабричная ширина шины.
  • DirectX — максимальная полностью поддерживаемая версия Direct3D.
  • OpenGL — максимальная полностью поддерживаемая версия OpenGL.
  • Особенности — дополнительные особенности.
Remove ads

Сравнительная таблица: десктопные графические процессоры

Суммиров вкратце
Перспектива

До GeForce

Подробнее Модель, Дата ...

GeForce series

Подробнее Модель, Дата ...

GeForce 2 Series

Подробнее Модель, Дата ...

GeForce 3 Series

Подробнее Модель, Дата ...

GeForce 4 Series

AGP 3.0 обозначает понижение напряжения и увеличение максимальной теоретической полосы пропускания (доступные скорости 4X и 8X, вместо 2X и 4X); сами ядра не имели никаких изменений (от NV17 до NV18 или NV25 к NV28). Кроме увеличенной тактовой частоты и уменьшенного напряжения колебания сигнала (от 1.5 V к 0.8 V), AGP 3.0 все ещё поддерживает sideband адресацию (позднее добавлена к спецификациям AGP 1.0, увеличила практическую пропускную способность), и быструю запись (в спецификациях AGP 2.0, данные прямо записываются в памяти видеокарты).

Подробнее Модель, Дата ...

GeForce 5 Series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • * NV31, NV34 и NV36 используют 2x2 конвейерный дизайн, выполняя вертексный шейдер, в остальных случаях используют 4x1 конвейерный дизайн.
  • ** GeForce FX series имеют ограниченную поддержку OpenGL 2.1 (с последним драйвером Windows XP, выпущенным для этого, 175.19).
Подробнее Модель, Дата ...

GeForce 6 Series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • 2 Графическая карта, поддерживающая TurboCache в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM
Подробнее Модель, Дата ...

GeForce 7 Series

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • 2 Для графической карты, поддерживающей TurboCache в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM
Подробнее Модель, Дата ...

GeForce 8 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Полный G80 содержит 32 блока адресации текстур и 64 блока фильтрации текстур, в отличие от G92, который содержит 64 блока адресации текстур и 64 блока фильтрации текстур
  • 3 С этих видеокарт начинается поддержка OpenGL 3.3.
Подробнее Модель, Дата ...

GeForce 9 Series

Подробнее Модель, Дата ...

GeForce 100 Series

Подробнее Модель, Дата ...

GeForce 200 Series

  • 1 Потоковый процессор : Текстурный блок : Блок растеризации
Подробнее Модель, Дата ...

GeForce 300 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры G80/GT200 содержит 8 шейдерных процессоров(SP) и 2 блока специализированных функций(SFU). Каждый SP может выполнять до двух операций MAD(ADD+MUL) одинарной точности за такт, а каждый SFU до четырёх операций за такт (эти блоки также могут обрабатывать одно умножение одинарной точности с плавающей запятой за такт). Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU 2:1. Теоретическая суммарная производительность [FLOPSsp+sfu, GFLOPS] блоков SP и SFU рассчитывается по формуле:FLOPSsp+sfu ≈ f × n × 3 , где [n] — количество SP, [f, GHz] — их частота. Аналогичная формула: FLOPSsp+sfu ≈ f × m × (8 SPs × 2 (MAD) + 4 × 2 SFUs), где [m] — количество SM.
Подробнее Модель, Дата ...

GeForce 400 Series

  • Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • Каждый потоковый мультипроцессор (SM) в GPU архитектуры GF100 содержит 32 шейдерных процессора (SP) и 4 блока специализированных функций(SFU).
  • Каждый потоковый мультипроцессор (SM) в GPU архитектуры GF104/GF106/GF108 содержит 48 шейдерных процессоров (SP) и 8 блоков специализированных функций(SFU). Каждый SP может выполнять до двух операций FMA (Fused ADD+MUL) одинарной точности за такт, а каждый SFU до четырёх операций за такт. Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU: для GF100 SFU 4:1, для GF104/106/108 3:1.
  • Теоретическая производительность [FLOPSsp+sfu, GFLOPS] блоков SP рассчитывается по формуле:FLOPSsp ≈ f × n × 2 , где [n] — количество SP [f, GHz] — их частота. Аналогичная формула: для GF100 FLOPSsp ≈ f × m × (32 SPs × 2 (FMA), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA)), где [m] — количество SM. Полную производительность GPU можно рассчитать по формуле: для GF100 FLOPSsp ≈ f × m ×(32 SPs × 2(FMA)+ 4 × 4 SFUs), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA) + 4 × 8 SFUs) или для GF100 FLOPSsp ≈ f × n × 2.5, для GF104/106/108 FLOPSsp ≈ f × n × 8 / 3.[8]
Подробнее Модель, Дата ...

GeForce 500 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры GF110 содержит 32 шейдерных процессора(SP) и 4 блока специализированных функций(SFU). Каждый SP может выполнять до двух операций FMA(Fused ADD+MUL) одинарной точности за такт, а каждый SFU — до четырёх операций за такт. Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU: для GF100 SFU 4:1. Теоретическая производительность [FLOPSsp+sfu, GFLOPS] блоков SP рассчитывается по формуле:FLOPSsp ≈ f × n × 2 , где [n] — количество SP [f, GHz] — их частота. Аналогичная формула: для GF110 FLOPSsp ≈ f × m × (32 SPs × 2 (FMA), где [m] — количество SM. Полную производительность GPU можно рассчитать по формуле: для GF110 FLOPSsp ≈ f × m × (32 SPs × 2(FMA) + 4 × 4 SFUs) или для GF110 FLOPSsp ≈ f × n × 2.5.
Подробнее Модель, Дата ...

GeForce 600 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 GeForce 605 (OEM) — переименованная GeForce 510.
  • 3 GeForce GT 610 — переименованная GeForce GT 520.
  • 4 GeForce GT 620 (OEM) — переименованная GeForce GT 520.
  • 5 GeForce GT 620 — переименованная GeForce GT 530.
  • 6 GeForce GT 630 (DDR3) — переименованная GeForce GT 440 (DDR3).
  • 7 GeForce GT 630 (GDDR5) — переименованная GeForce GT 440 (GDDR5).
  • 8 GeForce GT 640 (OEM) — переименованная GeForce GT 545 (DDR3).
  • 9 GeForce GT 645 (OEM) — переименованная GeForce GTX 560 SE.
Подробнее Модель, Дата ...

GeForce 700 Series

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на базовую тактовую частоту ядра.
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на базовую тактовую частоту ядра.
  • 4 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на базовую частоту ядра (FP32USPs × 2 × GPU Clock speed).
  • 5 Производительность GTX Titan в операциях над 64-битными числами составляет 1/3 от его производительности при работе над 32-битными[14], тогда как для прочих чипов на базе Kepler это соотношение равно 1/24[15].
Подробнее Модель, Дата ...

GeForce 900 Series (Maxwell 2.0)

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на максимальную тактовую частоту ядра.
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на максимальную тактовую частоту ядра.
  • 4 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту ядра (FP32USPs × 2 × GPU Clock speed).
  • 5 Производительность в операциях над 64-битными числами для чипов на базе «Maxwell» составляет 1/32 от его производительности при работе над 32-битными.[33][34]
  • 6 SLI поддерживает подключение до 4 графических процессоров одинаковых карт для конфигурации 4-Way SLI. То есть, 4-way SLI включает поддержку 3-way SLI и 2-way SLI, однако двухчиповые карты уже сконфигурированы в 2-way SLI, поэтому они поддерживают 4-way SLI с одинаковыми двухчиповыми картами, но не поддерживает 3 -way SLI.
  • 7 В связи с отключением одного или более блока кэша L2/ROP блоков без отключения контроллеров памяти, изначально подключенных к отключенным блокам, память была сегментирована. Для достижения пиковой скорости из одного блока должно производиться чтение, в другой — запись.
  • 8 Видеокарты серии GTX 950—980 TI. Titan X. всех дочерних производителей (Asus, Gigabyte, Zotac, KFA, Palit.) не являются средством шифрования и криптографии. Не могут участвовать в построении станций шифрования.
  • 9 Является инновационной функцией масштабирования — общая графика в компьютере, более мощные технологии, то NVIDIA ® SLI tm получит выгоду от увеличения пропускной способности шины архитектуры PCI экспресс ™решения, оборудование и программное обеспечение. Интеллектуальное программное обеспечение, которое позволяет множественные графические процессоры NVIDIA
Подробнее Модель, Дата ...

GeForce 10 Series (Pascal)

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальной частоте, но у 1000 Series видеокарт NVIDIA частота ядра без разгона может превышать даже паспортную максимальную частоту.(максимальная тактовая частота * кол-во блоков растеризации)
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальной частоте. (максимальная тактовая частота * кол-во блоков текстурных блоков)
  • 4 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту ядра (FP32USPs × 2 × GPU Clock speed).
  • 5 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.
Подробнее Модель, Дата ...

GeForce 16 Series (Turing)

Подробнее Модель, Датавыхода ...
  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.

GeForce 20 Series (Turing)

Подробнее Модель, Дата выхода ...
  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.

GeForce 30 Series (Ampere)

Подробнее Модель, Дата выхода ...
  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.

GeForce 40 Series (Ada Lovelace)

Подробнее Модель, Дата выхода ...
  • Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32 ≈ USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/XXFP32 У «xxxx». В других видеокартах на этой архитектуре производительность FP64 может быть другой.

GeForce 50 Series (Blackwell)

Remove ads

Таблица вычислительных возможностей (compute capability)

Подробнее Compute capability (version), GPUs ...

Подробнее на странице CUDA.

Remove ads

Сравнительная таблица: мобильные графические процессоры

Суммиров вкратце
Перспектива

GeForce 2 Go series

GeForce 2 Go series для ноутбуков.

Подробнее Модель, Дата ...

GeForce 4 Go series

GeForce 4 Go series для ноутбуков.

Подробнее Модель, Дата ...

GeForce FX Go 5 (Go 5xxx) series

GeForce FX Go 5 series для ноутбуков.

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • * NV31, NV34 и NV36 используют 2x2 конвейерный дизайн, выполняя вертексный шейдер, в остальных случаях используют 4x1 конвейерный дизайн.
  • ** GeForce FX series имеют ограниченную поддержку OpenGL 2.1 (с последним драйвером Windows XP, выпущенным для этого, 175.19).
Подробнее Модель, Дата ...

GeForce Go 6 (Go 6xxx) series

GeForce Go 6 series для ноутбуков.

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • 2 Для графической карты, поддерживающей TurboCache в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM
Подробнее Модель, Дата ...

GeForce Go 7 (Go 7xxx) series

GeForce Go 7 series для ноутбуков.

  • 1 Вершинных шейдеров : Пиксельных шейдеров : Текстурных блоков : Блоков растеризации
  • 2 Для графической карты, поддерживающей TurboCache, в размер памяти входит полная память (VRAM + System RAM), иначе входит только VRAM
Подробнее Модель, Дата ...

GeForce 8M (8xxxM) series

GeForce 8M series для ноутбуков.

Подробнее Модель, Дата ...

GeForce 9M (9xxxM) series

GeForce 9M series для ноутбуков.

Подробнее Модель, Дата ...

GeForce 100M (1xxM) series

GeForce 100M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 103M, 105M, 110M, 130M переименованные GPU, то есть используются те же самые ядра GPU предыдущего поколения, 9M, с обещанной оптимизацией на других особенностях
Подробнее Модель, Дата ...

GeForce 200M (2xxM) series

GeForce 200M series для ноутбуков.

Подробнее Модель, Дата ...

GeForce 300M (3xxM) series

GeForce 300M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры G80/GT200 содержит 8 шейдерных процессоров(SP) и 2 блока специализированных функций(SFU). Каждый SP может выполнять до двух операций MAD(ADD+MUL) одинарной точности за такт, а каждый SFU — до четырёх операций за такт (эти блоки также могут обрабатывать одно умножение одинарной точности с плавающей запятой за такт). Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU 2:1. Теоретическая суммарная производительность [FLOPSsp+sfu, GFLOPS] блоков SP и SFU рассчитывается по формуле:FLOPSsp+sfu ≈ f × n × 3 , где [n] — количество SP, [f, GHz] — их частота. Аналогичная формула: FLOPSsp+sfu ≈ f × m × (8 SPs × 2 (MAD) + 4 × 2 SFUs), где [m] — количество SM.
Подробнее Модель, Дата ...

GeForce 400M (4xxM) series

GeForce 400M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Каждый потоковый мультипроцессор(SM) в GPU архитектуры GF100 содержит 32 шейдерных процессора(SP) и 4 блока специализированных функций(SFU). Каждый потоковый мультипроцессор(SM) в GPU архитектуры GF104/GF106/GF108 содержит 48 шейдерных процессоров(SP) и 8 блоков специализированных функций(SFU). Каждый SP может выполнять до двух операций FMA(Fused ADD+MUL) одинарной точности за такт, а каждый SFU — до четырёх операций за такт. Пиковое соотношение операций выполняемыми SP к операциям выполняемыми SFU: для GF100 SFU 4:1, для GF104/106/108 3:1. Теоретическая производительность [FLOPSsp+sfu, GFLOPS] блоков SP рассчитывается по формуле:FLOPSsp ≈ f × n × 2 , где [n] — количество SP [f, GHz] — их частота. Аналогичная формула: для GF100 FLOPSsp ≈ f × m × (32 SPs × 2 (FMA), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA)), где [m] — количество SM. Полную производительность GPU можно рассчитать по формуле: для GF100 FLOPSsp ≈ f × m ×(32 SPs × 2(FMA)+ 4 × 4 SFUs), для GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA) + 4 × 8 SFUs) или для GF100 FLOPSsp ≈ f × n × 2.5, для GF104/106/108 FLOPSsp ≈ f × n × 8 / 3.[8]
  • 3 Каждый SM в GF100 также содержит 4 блока адресации текстур и 16 блоков фильтрации текстур. Всего для GF100 c 16 SM получаем 64 блока адресации текстур и 256 блоков фильтрации текстур. Каждый SM в GF104/GF106/108 также содержит 8 блоков адресации текстур и 32 блока фильтрации текстур. Каждый SM в GF104/GF106/108 также содержит на один блок адресации текстур и 8 блоков фильтрации текстур. Всего для GF104 c 8 SM получаем 64 блока адресации текстур и 512 блоков фильтрации текстур. Всего для GF106 c 4 SM получаем 32 блока адресации текстур и 256 блоков фильтрации текстур. Всего для GF108 c 2 SM получаем 16 блоков адресации текстур и 128 блоков фильтрации текстур.
Подробнее Модель, Дата ...

GeForce 500M (5xxM) series

GeForce 500M series для ноутбуков.

Подробнее Модель, Дата ...

GeForce 600M (6xxM) series

GeForce 600M series для ноутбуков.

Подробнее Модель, Дата ...

GeForce 700M (7xxM) series

GeForce 700M series для ноутбуков.

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Показатель вычислительной мощности получается путём умножения тактовой частоты шейдеров на количество ядер и количество инструкций, которое ядро способно выполнять за один цикл.
Подробнее Модель, Дата выхода ...

GeForce 800M (8xxM) series

GeForce 800M series для ноутбуков

Подробнее Модель, Дата выхода ...

GeForce 900M (9xxM) series

GeForce 900M series для ноутбуков

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации). В это правило не входят GeForce GT 920M(Fermi 2.0) и GeForce GT 920M (Kepler 2.0). Почему???
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) находится по формуле: частота памяти * битность шины / 8. (8-переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/32FP32 У Maxwell,Maxwell2.0. 1/12FP у Fermi2.0. 1/3 у Kepler2.0.В других видеокартах на этих архитектурах производительность FP64 может быть другой. Например, gtx 590(Fermi2.0) FP64=1/8FP32
Подробнее Модель, Дата выхода ...

GeForce 10 Series (Notebooks)

GeForce 10 Series для ноутбуков

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/32FP32 У Pascal. В других видеокартах на этой архитектуре производительность FP64 может быть другой.
Подробнее Модель, Дата выхода ...

GeForce MX100 (MX1xx) series

GeForce MX100(MX1xx) series для ноутбуков

  • 1 Унифицированных шейдерных процессоров : Текстурных блоков : Блоков растеризации
  • 2 Скорость заполнения пикселей рассчитывается умножением количества блоков растеризации (англ. Raster Operations Pipeline, ROP) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во блоков растеризации).
  • 3 Скорость заполнения текстур рассчитывается умножением количества текстурных блоков (англ. Texture Mapping Unit, TMU) на тактовую частоту ядра. В реальных условиях тактовая частота ядра держится на максимальных значениях(Boost). (максимальная тактовая частота * кол-во текстурных блоков)
  • 4 Пропускная способность памяти (псп) рассчитывается по формуле: Частота памяти * разрядность шины / 8. (8 — переводной коэффициент из бит в Байты)
  • 5 Производительность в FLOPS одинарной точности (32 бита) равна произведению количества шейдерных процессоров и двух, умноженному на максимальную частоту шейдера. Если не указана максимальная частота шейдера, умножайте на максимальную частоту ядра (FP32USPs × 2 × GPU Clock speed).
  • 6 Производительность в FLOPS двойной точности (64-бит) равна 1/32FP32 У Maxwell и Pascal. В других видеокартах на этих архитектурах производительность FP64 может быть другой.
Подробнее Модель, Дата выпуска ...

Quadro

  • 1 Вертексный шейдер : Пиксельный шейдер : Текстурный блок : Блок растеризации
  • 2 Унифицированный шейдер (Вертексный шейдер/Геометрический шейдер/Пиксельный шейдер) : Текстурный блок : Блок растеризации
Подробнее Модель, Кодовое имя ...

Quadro NVS

  • 1 Вертексный шейдер : Пиксельный шейдер : Текстурный блок : Блок растеризации
  • 2 Унифицированный шейдер (Вертексный шейдер/Геометрический шейдер/Пиксельный шейдер) : Текстурный блок : Блок растеризации
Подробнее Модель, Кодовое имя ...
Remove ads

Сравнительная таблица: графические процессоры для рабочих станций

Quadro

  • 1 Вертексный шейдер : Пиксельный шейдер : Текстурный блок : Блок растеризации
  • 2 Унифицированный шейдер (Вертексный шейдер/Геометрический шейдер/Пиксельный шейдер) : Текстурный блок : Блок растеризации
  • * NV31, NV34 и NV36 используют 2x2 конвейерный дизайн, выполняя вертексный шейдер, в остальных случаях используют 4x1 конвейерный дизайн.
Подробнее Модель, Кодовое имя ...

Tesla

  • 1Спецификации, не определённые NVIDIA, как предполагается, основаны на GeForce 8800GTX.
  • 2Спецификации, не определённые NVIDIA, как предполагается, основаны на GeForce GTX280
  • 3Спецификации, не определённые NVIDIA, как предполагается, основаны на GeForce 400 Series
  • 4С активированным ECC, доступная для пользователя память, составит 2.625 Гбайта на GPU для C2050, S2050 и 5.25 Гбайт на GPU для C2070, S2070.
  • 5 GF100 выполняет новую соединенную инструкцию умножения-сложения (FMA) для обоих 32-битных чисел одинарной точности с плавающей запятой и 64-битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница мужду инструкциями FMA и MAD при выполнении операции вида A*B+C заключается в том, что FMA не округляет результат произведения перед суммированием, что даёт более точный результат.

FMA — Fused Multiply-Add
MAD — Multiply-Add

Подробнее Описание, Модель ...
Remove ads

См. также

Примечания

Ссылки

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads