Top Qs
Chronologie
Chat
Contexte

Kepler (microarchitecture)

microarchitecture de carte graphique développée par Nvidia De Wikipédia, l'encyclopédie libre

Kepler (microarchitecture)
Remove ads

Kepler est une microarchitecture a été développée par NVidia pour ses processeurs graphiques. Elle est censée doubler les performances par watt par rapport à Fermi, l'architecture précédente, ce qui permet de l'utiliser dans des cartes graphiques pour ordinateurs portables. La première carte graphique utilisant cette architecture est la GTX 680, utilisant le processeur graphique GK 104.

Faits en bref Date de sortie, Procédé ...
Remove ads

Historique

  •  : sortie de la GTX 680, première carte graphique à utiliser l'architecture Kepler
  •  : sortie de la GTX 690, première carte graphique utilisant deux puces Kepler
  •  : sortie des Tesla K20 et K20X, premières cartes à utiliser le GK 110
  •  : sortie de la GeForce Titan, première carte graphique grand public à utiliser le GK 110
  •  : Sortie de la GeForce GTX 780
  • : Sortie de la GeForce GTX 780 Ti, première carte grand public à utiliser un GK 110 complet.
  •  : Sortie de la GeForce GTX Titan Black Edition, évolution de la GTX Titan avec toutes ses unités de calculs actives.
  •  : Sortie de la GeForce GTX Titan Z, première carte graphique à utiliser deux GK 110 complets.
Remove ads

Architecture

Elle reprend à peu près l'architecture Fermi, c'est donc une puce divisée en plusieurs GPC ou Graphics Processing Cluster qui sont les équivalents d'un cœur de microprocesseur sauf qu'ils sont dépourvus de mémoire cache ; ils sont eux-mêmes constitués d'un, deux ou trois SMX et ils contiennent 8 unités de ROP. Pour soutenir les cœurs CUDA, qui sont les unités de calcul, la puce propose deux niveaux de mémoire cache (L1 et L2). La puce est dotée de 512 Ko de mémoire cache L2, avec un débit revu à la hausse par rapport à Fermi[1].

Les SMX (Next Generation Streaming Multiprocessor), la grande nouveauté introduite par Kepler, sont les remplaçant des SM (Streaming Multiprocessor) de Fermi. Un SMX peut contenir jusqu'à 192 cœurs CUDA, ou unités de calcul, dans la version la plus évoluée contre 32 cœurs CUDA avec les SM de Fermi. Par contre, le SMX abandonne le système de double cadencement de Fermi qui multipliait par deux la fréquence des SM et donc des unités de calcul. Chaque SMX dispose de 64 ko de mémoire partagée et 16 unités de texture[2],[3].

Remove ads

GPU Boost

NVidia profite de Kepler pour introduire le « GPU Boost » qui augmente la fréquence du processeur en fonction de sa consommation et de sa température, qui sont directement mesurées sur la carte. Le gain peut atteindre plusieurs dizaines de MHz. Avec la GeForce Titan, Nvidia utilise le nom « GPU Boost 2.0 », dont le seul changement est que la température remplace la consommation comme facteur limitant[4],[5].

Liste des processeurs et des cartes graphiques utilisant Kepler

Résumé
Contexte

L'architecture Kepler est utilisée dans plusieurs GPU :

  • le GK 104, qui est utilisé dans les cartes GTX 680, GTX 690, GTX 670, GTX 660, GTX 660ti, GTX 760, GTX 770 ,Tesla K10[6], Tesla K8 ;
  • le GK 106, qui est utilisé dans les GTX 660, il est composé de 5 SMX ;
  • le GK 107, qui est utilisé dans les cartes mobiles de NVidia, ainsi que dans les cartes d'entrée de gamme, à partir de la GT 640 ;
  • le GK 110, qui a 15 SMX plus puissants et 1,5 Mo de mémoire cache, il est utilisé dans les Tesla K20, GeForce Titan, GeForce GTX 780 et GeForce GTX 780 Ti

En 2013, les puces Kepler sont toutes gravées en 28 nm.

Sous la marque GeForce

Elles fonctionnent toutes avec DirectX 11.0[7], OpenGL 4.3, OpenCL 1.2, et le PCI-Express 16x 3.0.

ModèlesGeForce GT 640 (A2)GeForce GT 640 (DDR3)GeForce GT 640 (DDR5)GeForce GTX 650GeForce GTX 650TiGeForce GTX 650Ti BoostGeForce GTX 660GeForce GTX 660 OEMGeForce GTX 660TiGeForce GTX 670GeForce GTX 680GeForce GTX 770GeForce GTX 690GeForce GTX 780GeForce GTX Titan[8]GeForce GTX780 Ti
Finesse de gravure des processeurs28 nm
Code de la puceGK107GK106GK1042× GK104GK110
Surface de la puce118 mm²221 mm²294 mm²2× 294 mm²569 mm²
Nb. transistors1,3 G2.54 G3.54 G 3,54 G7,1 G
Fréquence 3D797 MHz900 MHz950 MHz1058 MHz928 MHz980 MHz823 MHz915 MHz1006 MHz1045 MHz915 MHz863 MHz837 MHz875 MHz
Fréquence TurboNCNCNCNCNC1032 MHz888 MHZ980 MHz1006 MHz1058 MHz1084 MHz1019 MHZ902 MHz876 MHz928 MHz
Fréquence TDP HeadroomNCNCNCNCNC1110 MHz927 MHz1136 MHz1084 MHz1123 MHz1136 MHz1071 MHz1006 MHz1020 MHz
Température maximale avec Turbo94 °C94 °C80 °C80 °C80 °C80 °C
Nombre de GPC12342× 45
Nombre de SMX2456782× 8121415
Nombre de cœurs CUDA3847689601152134415362× 1536230426882880
Nombre de FP32320640800912106412162× 1216182413442280
Nombre de FP64---4856642× 6496896120
Nombre de SFU641281601922242562× 256384448480
Nb. TMU326480961121282× 128192224240
Nb. ROP1624322× 3248
Enveloppe thermique50 watts65 watts75 watts65 watts85 watts130 watts140 watts130 watts150 watts170 watts195 watts230 watts300 watts250 watts250 watts250 watts
Type de mémoireDDR3GDDR5
Capacité possible1/2 Go1 Go1/2 Go1 Go1/2 Go2 Go1,5/3 Go2/3 Go2/4 Go 2/4 Go3 Go6 Go3 Go
Fréquence mémoire1782 MHz1250 MHz1350 MHz1500 MHz1450 MHz1500 MHz1750 MHz1500 MHz1750 MHz
Largeur du bus mémoire128 bits192 bits256 bits 256 bits384 bits
Bande passante mémoire28,5 Go/s80 Go/s86,4 Go/s144,2 Go/s134 Go/s144,2 Go/s192,3 Go/s209 Go/s250 Go/s 192,3 Go/s268 Go/s
Fillrate Pixels12,8 Gpixels/s14,4 Gpixels/s15,2 Gpixels/s16,9 Gpixels/s14,8 Gpixels/s23,5 Gpixels/s19,8 Gpixels/s21,9 Gpixels/s29,3 Gpixels/s32,2 Gpixels/s2× 29,3 Gpixels/s27,6 Gpixels/s33,5 Gpixels/s42,0 Gpixels/s
TurboNCNCNCNCNC26,6 Gpixels/s22,3 Gpixels/s27,3 Gpixels/s34,7 Gpixels/s35,9 Gpixels/s2× 34,3 Gpixels/s40,2 Gpixels/s40,2 Gpixels/s44,54 Gpixels/s
Fillrate Textures25,5 Gtexels/s28,8 Gtexels/s30,4 Gtexels/s33,9 Gtexels/s59,4 Gtexels/s62,7 Gtexels/s78,4 Gtexels/s79 Gtexels/s102,5 Gtexels/s128,8 Gtexels/s2× 117,1 Gtexels/s166 Gtexels/s187,5 Gtexels/s210,0 Gtexels/s
TurboNCNCNCNCNC71 Gpixels/s88,8 Gpixels/s89 Gpixels/s127,2 Gpixels/s121,4 Gpixels/s143,7 Gpixels/s 137,1 Gpixels/s193 Gpixels/s225,3 Gpixels/s222,72 Gtexels/s
Fillrate Géométrique797 Mtriangles/s900 Mtriangles/s950 Mtriangles/s1058 Mtriangles/s1856 Mtriangles/s1960 Mtriangles/s2450 Mtriangles/s2469 Mtriangles/s3203 Mtriangles/s4024 Mtriangles/s2× 3660 Mtriangles/s5178 Mtriangles/s5859 Mtriangles/s5250 Mtriangles/s
TurboNCNCNCNCNC2220 Mtriangles/s2775 Mtriangles/s2781 Mtriangles/s3976 Mtriangles/s3794 Mtriangles/s4492 Mtriangles/s2× 4284 Mtriangles/s6036 Mtriangles/s7042 Mtriangles/s5555 Mtriangles/s
FP32612,1 Gflo/s691,2 Gflo/s729,6 Gflo/s812,5 Gflo/s1425,4 Gflo/s1505,3 Gflo/s1881,6 Gflo/s1896,2 Gflo/s2459,5 Gflo/s3090,4 Gflo/s2× 2810,9 Gflo/s3977 Gflo/s4500 Gflo/s ?
TurboNCNCNCNCNC1704,9 Gflo/s2131,2 Gflo/s2135,8 Gflo/s3053,6 Gflo/s2913,8 Gflo/s3449,9 Gflo/s2× 3290,1 Gflo/s4636 Gflo/s5408,3 Gflo/s5040 Gflo/s
FP6425,7 Gflo/s28,8 Gflop/s30,4 Gflop/s33,9 Gflop/s59,4 Gflop/s62,7 Gflop/s78,4 Gflop/s79 Gflop/s102,5 Gflop/s128,8 Gflop/s2× 117,1 Gflop/s166 Gflo/s1499,9 Gflop/s ?
TurboNCNCNCNCNC71 Gflo/s88,8 Gflo/s89 Gflo/s127,2 Gpixels/s121,4 Gpixels/s143,7 Gpixels/s 137,1 Gpixels/s193 Gpixels/s1523 Gpixels/s210 Gflo/s
Prix actuel ()45€ H.T. l'unité pour 1000ex79€99€119€169€179€185€ H.T. l'unité pour 1000ex255€340€450€840€650€980€700€

Sous la marque Quadro

La série QUADRO 'Kx000' est conçue via le même schéma que les TESLA K. Les spécifications des GK104/106/110 sont donc identiques entre les séries TESLA et QUADRO.

Davantage d’informations Modèles, Quadro 410 ...

Sous la marque Tesla

L'architecture Kepler est présente dans les Tesla K8, K10, K20, K20X, K40 et K80.

Remove ads

Notes et références

Voir aussi

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads