Топ питань
Часова шкала
Чат
Перспективи

Kepler (мікроархітектура)

З Вікіпедії, вільної енциклопедії

Kepler (мікроархітектура)
Remove ads

Kepler — це мікроархітектура компанії NVIDIA, яка створена для високопродуктивних обчислень з акцентом на енергоефективності.

Коротка інформація Створено ...

Опис

Узагальнити
Перспектива

Спрямованість попередньої архітектури Fermi була продуктивність, а Kepler розрахований на енергоефективність, програмованість та продуктивність.

Енергоефективність досягнута за рахунок використання уніфікованої тактової частоти (шейдерні блоки працюють на одній частоті з ядром). Відмова від моделі з незалежною частотою шейдерних блоків, яка використовувалася в попередніх GPU NVIDIA, дозволяє знизити енергоспоживання навіть при тому, що для досягнення продуктивності на рівні попередніх розробок, потрібно використовувати більшу кількість шейдерних ядер. Зменшення енергоспоживання відбувається не тільки від того, що нова архітектура більш енергоефективна, ніж архітектура попереднього покоління (два шейдерних ядра Kepler використовують близько 90% живлення, необхідного одному ядру Fermi), але й тому, що уніфікація тактової частоти призводить до зниження частоти шейдерних блоків, що в свою чергу серйозно знижує енергоспоживання

Покращена програмованість досягнута за рахунок введення нової моделі обробки текстур, яка не вимагає прив'язки до CPU.

Покращення продуктивності досягнуто за рахунок впровадження абсолютно нових контролера пам'яті та шини. У свою чергу це дозволило підняти тактову частоту пам'яті до 6 ГГц, що все ще нижче, ніж теоретично максимальні для GDDR5 7 ГГц, але значно більше, ніж частота пам'яті в 4 ГГц при архітектурі попереднього покоління

Remove ads

Особливості

Узагальнити
Перспектива
  • Інтерфейс PCI Express 3.0
  • DisplayPort 1.2
  • HDMI 1.4a 4K x 2K
  • Purevideo VP5
  • Підтримка до 4 -х незалежних 2D дисплеїв, або 3 стереоскопічних / 3D дисплеїв
  • Next Generation Streaming Multiprocessor (SMX)
  • GPU Boost
  • Підтримка TXAA
  • Динамічний паралелізм
  • Hyper-Q
  • NVIDIA GPUDirect (тільки для Tesla)

Архітектура Next Generation Streaming Multiprocessor (SMX)

Архітектура Kepler використовує нову потокову мультипроцесорну архітектуру під назвою «SMX». SMX є причиною енергетичної ефективності Kepler, оскільки весь графічний процесор використовує єдину уніфіковану тактову частоту. Таке використання дозволяє ядрам CUDA споживати на 90% менше енергії, ніж CUDA ядра архітектури Fermi.

GPU Boost

GPU Boost є новою функцією, яка приблизно аналогічна турбо розгону центрального процесора. Частота, при якій графічний процесор завжди гарантовано працює, називається базовою частотою. Ця тактова частота встановлена на рівні, який гарантуватиме, що графічний процесор залишається в межах специфікації TDP, навіть при максимальних навантаженнях.

Підтримка Microsoft Direct3D

Графічні процесори NVIDIA Fermi і Kepler з серії GeForce 600 підтримують специфікацію Direct3D 11.0.

Підтримка Microsoft DirectX

Графічні процесори серії GeForce 600/700 підтримують DirectX 12. NVIDIA буде підтримувати DX12 API на всіх графічних процесорах, які підтримують Directx11. Вони належать до сімейств архітектур Kepler, Maxwell та Fermi.

Підтримка TXAA

Ексклюзивом архітектури Kepler є TXAA — новий метод згладжування від Nvidia, який призначений для безпосереднього застосування в ігрових рушіях. TXAA заснований на MSAA. Він призначений для вирішення ключової проблеми в іграх, відомої як мерехтливе або тимчасове накладення.

Динамічний паралелізм

Динамічний паралелізм можливий для ядра, щоб мати можливість направляти інші ядра. В архітектурі Fermi тільки процесор може направляти ядро, яке бере на себе певну кількість накладних витрат через необхідність взаємодіяти з процесором.

Grid Management Unit

Включення динамічного паралелізму вимагає нового управління сіткою та системи диспетчерського управління. Grid Management Unit управляє пріоритетом сітки, яка повинна виконуватися. Grid Management Unit може призупинити відправлення нових мереж і черги в очікуванні, поки вони не готові виконуватись, забезпечуючи гнучкість та потужність автономної роботи.

NVIDIA GPUDirect

Технологія NVIDIA GPUDirect забезпечує більш швидку передачу даних між GPU і іншими пристроями на шині PCIe, знімаючи непотрібне навантаження з CPU. GPUDirect v1.0 дозволяє драйверам пристроїв сторонніх виробників (наприклад, для адаптерів InfiniBand) працювати безпосередньо з драйвером CUDA, уникаючи копіювання даних на CPU. GPUDirect v2.0 забезпечує peer-to-peer (P2P) з'єднання між графічними процесорами в одній системі, уникаючи додаткових витрат ресурсів процесора.

Під торговою маркою GeForce

МодельGeForce GTGeForce GTGeForce GTGeForce GTXGeForce GTXGeForce GTXGeForce GTXGeForce GTX 660GeForce GTXGeForce GTXGeForce GTXGeForce GTX 770GeForce GTXGeForce GTXGeForce GTX[1]GeForce GTX780 Ti
Технологічний процес28 nm
Код чипуGK107GK106GK1042× GK104GK110
Розмір чипу118mm²221mm²294mm²2× 294mm²569mm²
Транзисторів1,3 G2.54 G3.54 G7,1 G
Частота 3D797 MHz900 MHz950 MHz1058 MHz928 MHz980 MHz823 MHz915 MHz10061045 MHz915 MHz863 MHz837 MHz875 MHz
Частота TurboН/ДН/ДН/ДН/ДН/Д1032 MHz888 MHZ980 MHz1006 MHz1058 MHz1084 MHz1019 MHZ902 MHz876 MHz928 MHz
Частота TDP HeadroomН/ДН/ДН/ДН/ДН/Д1110 MHz927 MHz1136 MHz1084 MHz1123 MHz1136 MHz1071 MHz1006 MHz1020 MHz
Максимальна температура з Turbo94 °C94 °C80 °C80 °C80 °C80 °C
Блоків ROP1624322× 3248
Блоків TMU326480961121282× 128192224240
Кількість ядер Cuda3847689601152134415362× 1536230426882880
Кількість FP32320640800912106412162× 1216182413442280
Кількість FP644856642× 6496896120
Кількість SFU641281601922242562× 256384448480
Кількість GPC12342× 45
Кількість SMX2456782× 8121415
TDP50 Watts65 Watts75 Watts65 Watts85 Watts130 Watts140 Watts130 Watts150 Watts170 Watts195 Watts230 Watts300 Watts250 Watts250 Watts250 Watts
Тип пам'ятіDDR3GDDR5
Можливе навантаження1/2 Go1 Go1/2 Go1 Go1/2 Go2 Go1,5/3 Go2/3 Go2/4 Go3 Go6 Go3 Go
Тактова частота пам'яті1782 MHz1250 MHz1350 MHz1500 MHz14501500 MHz1750 MHz1500 MHz1750 MHz
Ширина шини пам'яті128 bits192 bits256 bits384 bits
Пропускна здатність пам'яті28,5 Go/s80 Go/s86,4 Go/s144,2 Go/s134 Go/s144,2192,3 Go/s209 Go/s250 Go/s268 Go/s
Фільтрація пікселів12,814,415,216,914,823,519,821,929,332,22× 29,327,633,542,0 Gpixels/s
TurboН/ДН/ДН/ДН/ДН/Д26,622,327,334,735,92× 34,340,240,244,54 Gpixels/s
Фільтрація текстур25,528,830,433,959,462,778,479102,5128,82× 117,1166187,5210,0 Gtexels/s
TurboН/ДН/ДН/ДН/ДН/Д7188,889127,2121,4143,7193225,3222,72 Gtexels/s
Геометрична фільтрація797 Mtriangles/s900 Mtriangles/s950 Mtriangles/s1058 Mtriangles/s1856 Mtriangles/s1960 Mtriangles/s2450 Mtriangles/s2469 Mtriangles/s3203 Mtriangles/s4024 Mtriangles/s2× 3660 Mtriangles/s5178 Mtriangles/s5859 Mtriangles/s5250 Mtriangles/s
TurboН/ДН/ДН/ДН/ДН/Д2220 Mtriangles/s2775 Mtriangles/s2781 Mtriangles/s3976 Mtriangles/s3794 Mtriangles/s4492 Mtriangles/s2× 4284 Mtriangles/s6036 Mtriangles/s7042 Mtriangles/s5555 Mtriangles/s
Розрахунок з одинарною точністю612,1691,2 Gflo/s729,6 Gflo/s812,51425,41505,3 Gflo/s1881,61896,22459,5 Gflo/s3090,42× 2810,93977 Gflo/s4500 Gflo/s?
TurboН/ДН/ДН/ДН/ДН/Д1704,92131,22135,83053,62913,83449,92× 3290,146365408,35040 Gflo/s
Розрахунок з подвійною точністю25,7 Gflo/s28,8 Gflop/s30,4 Gflop/s33,9 Gflop/s59,4 Gflop/s62,7 Gflop/s78,4 Gflop/s79 Gflop/s102,5 Gflop/s128,8 Gflop/s2× 117,1 Gflop/s166 Gflo/s1499,9 Gflop/s?
TurboН/ДН/ДН/ДН/ДН/Д7188,889127,2121,4143,71931523210 Gflo/s
Поточна ціна (Квітень 2013)45€79€99€119€169€179€185€255€340€450€840€650€980€700€

Під торговою маркою Quadro

Більше інформації Модель, Quadro 410 ...

Чипи Kepler

  • GK104
  • GK106
  • GK107
  • GK110
  • GK208
  • Tegra K1 включає Kepler IGP
Remove ads

Примітки

Посилання

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads