GeForce 700-Serie - GeForce 700 series

GeForce 700-Serie
Logo der GTX 700-Serie mit Slogan.png
GTX780ti.png
GTX 780 Ti Founders Edition, die Flaggschiff-Karte der GeForce 700-Serie von 2013.
Veröffentlichungsdatum 19. Februar 2013 ; Vor 8 Jahren ( 19. Februar 2013 )
Code Name
Die Architektur
Modelle GeForce-Serie
Transistoren
Herstellungsprozess
Karten
Einstiegslevel
Mittelklasse
Hochwertig
Enthusiast
API- Unterstützung
Direct3D Direct3D 12.0 ( Funktionsebene 11_0)
OpenCL OpenCL 1.2
OpenGL OpenGL 4.6
Vulkan Vulkan 1.1
SPIR-V
Geschichte
Vorgänger GeForce 600-Serie
Variante GeForce 800M-Serie
Nachfolger GeForce 900-Serie

Die GeForce 700-Serie (stilisiert als GEFORCE GTX 700 SERIES ) ist eine von Nvidia entwickelte Serie von Grafikprozessoren . Während es sich hauptsächlich um eine Aktualisierung der Kepler-Mikroarchitektur (GK-Codename-Chips) handelt, verwenden einige Karten Fermi (GF) und spätere Karten verwenden Maxwell (GM). Karten der GeForce 700-Serie wurden erstmals im Jahr 2013 veröffentlicht, beginnend mit der Veröffentlichung der GeForce GTX Titan am 19. Februar 2013, gefolgt von der GeForce GTX 780 am 23. Mai 2013. Die ersten mobilen Chips der GeForce 700-Serie wurden im April 2013 veröffentlicht.

Überblick

GK110 wurde mit Blick auf die Rechenleistung entwickelt und vermarktet. Es enthält 7,1 Milliarden Transistoren. Dieses Modell versucht auch, die Energieeffizienz zu maximieren, indem so viele Aufgaben wie möglich parallel ausgeführt werden, je nach den Fähigkeiten seiner Streaming-Prozessoren.

Beim GK110 sind im Vergleich zu früheren Modellen sowohl der Speicherplatz als auch die Bandbreite sowohl für die Registerdatei als auch für den L2-Cache erhöht. Auf SMX-Ebene hat sich der Registerdateispeicherplatz von GK110 auf 256 KB erhöht, der aus 64 KB 32-Bit-Registern besteht, im Vergleich zu Fermis 32 KB 32-Bit-Registern mit insgesamt 128 KB. Was den L2-Cache betrifft, so wurde der L2-Cache-Speicherplatz des GK110 um bis zu 1,5 MB erhöht, doppelt so groß wie der des GF110. Sowohl die L2-Cache- als auch die Registerdatei-Bandbreite haben sich ebenfalls verdoppelt. Die Leistung in Szenarios mit Registermangel wird ebenfalls verbessert, da jedem Thread mehr Register zur Verfügung stehen. Dies geht einher mit einer Erhöhung der Gesamtzahl der Register, die jeder Thread adressieren kann, von 63 Registern pro Thread auf 255 Register pro Thread mit GK110.

Mit GK110 hat Nvidia auch den GPU- Textur-Cache überarbeitet , um für Computing verwendet zu werden. Mit einer Größe von 48 KB wird der Texturcache beim Compute zu einem schreibgeschützten Cache, der sich auf unausgerichtete Arbeitslasten mit Speicherzugriff spezialisiert hat. Darüber hinaus wurden Fehlererkennungsfunktionen hinzugefügt, um die Verwendung mit Workloads, die auf ECC angewiesen sind, sicherer zu machen .

Die Serie unterstützt auch DirectX 12 unter Windows 10 .

Kepler-GPUs mit den neuesten Nvidia-Treibern wurden um Dynamic Super Resolution (DSR) erweitert.

Die Architektur

Das PCB einer GTX 780.
Eine GTX 780M GPU mit MXM Sockel.

Die GeForce 700-Serie enthält Funktionen von GK104 und GK110. Kepler-basierte Mitglieder der 700er Serie ergänzen die GeForce-Familie um die folgenden Standardfunktionen.

Abgeleitet von GK104:

  • PCI Express 3.0- Schnittstelle
  • DisplayPort 1.2
  • HDMI 1.4a 4K x 2K Videoausgang
  • Purevideo VP5 Hardware-Videobeschleunigung (bis zu 4K x 2K H.264-Dekodierung)
  • Hardware H.264 Encoding Acceleration Block (NVENC)
  • Unterstützung für bis zu 4 unabhängige 2D-Displays oder 3 stereoskopische/3D-Displays (NV Surround)
  • Bindungslose Texturen
  • GPU-Boost
  • TXAA
  • Hergestellt von TSMC im 28-nm-Prozess

Neue Funktionen von GK110:

  • Compute Focus SMX-Verbesserung
  • CUDA- Rechenfähigkeit 3.5
  • Neue Shuffle-Anleitung
  • Dynamische Parallelität
  • Hyper-Q (die MPI-Funktionsreserve von Hyper-Q nur für Tesla)
  • Netzmanagementeinheit
  • NVIDIA GPUDirect (RDMA-Funktionsreserve von GPU Direct nur für Tesla und Quadro)
  • GPU-Boost 2.0

Computing Focus SMX-Verbesserung

Mit GK110 hat sich Nvidia dafür entschieden, die Rechenleistung zu erhöhen. Die größte Änderung gegenüber GK104 besteht darin, dass GK110 anstelle von 8 dedizierten FP64-CUDA-Kernen bis zu 64 hat, was ihm den 8-fachen FP64-Durchsatz eines GK104 SMX verleiht. Der SMX sieht auch eine Zunahme des Speicherplatzes für die Registerdatei. Der Speicherplatz der Registerdatei wurde im Vergleich zu Fermi auf 256 KB erhöht. Der Textur-Cache wurde ebenfalls verbessert. Mit einem Speicherplatz von 48 KB kann der Texturcache zu einem schreibgeschützten Cache für Compute-Workloads werden.

Neue Shuffle-Anleitung

Auf einer niedrigen Ebene sieht GK110 zusätzliche Anweisungen und Operationen, um die Leistung weiter zu verbessern. Neue Shuffle-Anweisungen ermöglichen es Threads innerhalb eines Warps, Daten gemeinsam zu nutzen, ohne in den Speicher zurückkehren zu müssen, wodurch der Prozess viel schneller ist als die vorherige Methode zum Laden/Teilen/Speichern. Atomare Operationen werden ebenfalls überarbeitet, wodurch die Ausführungsgeschwindigkeit atomarer Operationen erhöht und einige FP64-Operationen hinzugefügt werden, die zuvor nur für FP32-Daten verfügbar waren.

NVENC

Hyper-Q

Hyper-Q erweitert die GK110-Hardware-Arbeitswarteschlangen von 1 auf 32. Dies bedeutet, dass Fermi mit einer einzigen Arbeitswarteschlange manchmal unterbesetzt sein konnte, da in dieser Warteschlange nicht genug Arbeit vorhanden war, um alle SM zu füllen. Mit 32 Arbeitswarteschlangen kann der GK110 in vielen Szenarien eine höhere Auslastung erreichen, indem er unterschiedliche Aufgabenströme auf einem ansonsten untätigen SMX ablegen kann. Die einfache Natur von Hyper-Q wird noch verstärkt durch die Tatsache, dass es sich leicht auf MPI, eine häufig in HPC verwendete Schnittstelle zur Nachrichtenweiterleitung, abbilden lässt. Da ältere MPI-basierte Algorithmen, die ursprünglich für Multi-CPU-Systeme entwickelt wurden, die durch falsche Abhängigkeiten einen Engpass bekamen, jetzt eine Lösung haben. Durch die Erhöhung der Anzahl der MPI-Jobs ist es möglich, Hyper-Q für diese Algorithmen zu verwenden, um die Effizienz zu verbessern, ohne den Code selbst zu ändern.

Microsoft DirectX-Unterstützung

Nvidia Kepler GPUs der GeForce 700-Serie unterstützen DirectX 11.0 vollständig.

Nvidia unterstützt die DX12-API auf allen ausgelieferten GPUs der DX11-Klasse; diese gehören zu den Architekturfamilien Fermi, Kepler und Maxwell.

Dynamische Parallelität

Die Fähigkeit zur dynamischen Parallelität dient dazu, dass Kernel andere Kernel abfertigen können. Bei Fermi könnte nur die CPU einen Kernel abfertigen, was einen gewissen Overhead verursacht, indem sie mit der CPU zurück kommunizieren muss. Indem Kernel die Möglichkeit erhalten, ihre eigenen untergeordneten Kernel zu versenden, kann GK110 sowohl Zeit sparen, da nicht zur CPU zurückkehren muss, als auch die CPU für andere Aufgaben freigeben.

Produkte

GeForce 700 (7xx)-Serie

Die GeForce 700-Serie für Desktop-Architektur. Es wurde erwartet, dass im Laufe der Zeit billigere und leistungsschwächere Produkte auf den Markt kommen würden. Kepler unterstützt 11.1-Funktionen mit 11_0-Funktionsebene über die DirectX 11.1-API, jedoch hat Nvidia vier Nicht-Gaming-Funktionen in Hardware in Kepler (für 11_1) nicht aktiviert.

  • 1 Shader-Prozessoren  : Textur-Mapping-Einheiten  : Render-Ausgabeeinheiten
  • 2 Pixel-Füllrate wird berechnet als die Anzahl der ROPs multipliziert mit der Basis-Kerntaktgeschwindigkeit
  • 3 Die Texturfüllrate wird als Anzahl der TMUs multipliziert mit der Basistaktrate des Kerns berechnet.
  • 4 Die Leistung mit einfacher Genauigkeit wird berechnet als das 2-fache der Anzahl der Shader multipliziert mit der Basistaktrate des Kerns.
  • 5 Die Leistung mit doppelter Präzision der GTX Titan & GTX Titan Black beträgt entweder 1/3 oder 1/24 der Leistung mit einfacher Genauigkeit, abhängig von einer vom Benutzer ausgewählten Konfigurationsoption im Treiber, die die Leistung mit einfacher Genauigkeit erhöht, wenn doppelte Genauigkeit eingestellt ist 1/24 der Leistung mit einfacher Genauigkeit, während die Leistung anderer Kepler- Chips mit doppelter Genauigkeit auf 1/24 der Leistung mit einfacher Genauigkeit festgelegt ist. Die Leistung der Maxwell- Chips der GeForce 700-Serie mit doppelter Präzision beträgt 1/32 der Leistung mit einfacher Präzision.
  • 6 SLI unterstützt den Anschluss von bis zu 4 identischen Grafikkarten für eine 4-Wege-SLI-Konfiguration. Diejenigen, die 4-Wege-SLI unterstützen, können 3-Wege- und 2-Wege-SLI unterstützen, jedoch implementiert eine Dual-GPU-Karte bereits 2-Wege-SLI intern, daher können nur 2 Dual-GPU-Karten in SLI verwendet werden, um ein 4-Wege-SLI zu ergeben Aufbau.
Modell Start Code Name Fab ( nm ) Transistoren (Millionen) Matrizengröße ( mm 2 ) Bus - Schnittstelle Kernkonfiguration 1 Taktraten Füllrate Speicher API- Unterstützung (Version) Rechenleistung (GFLOPS) TDP (Watt) SLI- Unterstützung 6 Einführungspreis (USD)
Basis-Kerntakt ( MHz ) Kerntakt erhöhen ( MHz ) Speicher ( MT/s ) Pixel ( GP /s) 2 Textur ( GT /s) 3 Größe ( MB ) Bandbreite ( GB /s) Typ Busbreite ( Bit ) DirectX OpenGL OpenCL Vulkan Einfache Genauigkeit 4 Doppelte Präzision 5
GeForce GT 705 27. März 2014 GF119 40 292 79 PCIe 2.0 x16 48:8:4 874 N / A 1800 1,75 7,0 1024
2048
14,4
DDR3 64 12,0 (11_0) 4.6 1.1 N / A 168 14 29 N / A OEM
GeForce GT 710 29. Januar 2016 GK208-301-A1 28 1020 87 PCIe 2.0 x8 192:16:8 954 1800
5000
7,6 15,2 1024
2048
14,4
40
DDR3
GDDR5
32

/

64

1,2 1.1 366 15,2 19 N / A $42
GeForce GT 720 27. März 2014 GK208-201-B1 797 6.4 12,8 306 12,8 N / A $49
GeForce GT 730 (DDR3, 128-Bit) 18. Juni 2014 GF108 40 585 116 PCIe 2.0 x16 96:16:4 700 1800 2,8 11.2 1024

2048

4096

28,8 DDR3 128 1.1 N / A 134 Unbekannt 49 N / A Unbekannt
GeForce GT 730 (DDR3, 64-Bit) GK208-301-A1 TSMC 28 nm 1020 79 PCIe 2.0 x8 384:16:8 902 7.2 14,4 1024
2048

4096

14,4 64 1,2 ? 693 28,9 23 N / A Unbekannt
GeForce GT730 (GDDR5) GK208-400-A1 5000 1024
2048
40 DDR5 25 N / A Unbekannt
GeForce GT740 (DDR3) 29. Mai 2014 GK107 1270 118 PCIe 3.0 x16 384:32:16 993 1800 15.9 31,8 2048 28,8 DDR3 128 1.1 762 31,8 64 N / A $89
GeForce GT740 (GDDR5) 993
1085
5000 15,9
17,3
31,8
34,7
2048
4096
80 DDR5 762
832
31,8
34,7
N / A
GeForce GTX 745 (OEM) 18. Februar 2014 GM107 1870 148 384:24:16 1033 Unbekannt 1800 16,5 24.8 4096 28,8 DDR3 793 24.8 55 N / A OEM
GeForce GTX 750 29. Februar 2014
1. Dezember 2015
GM107
GM206
512:32:16

512:32:32

1020 1085 5000 16.3 32,6 1024
2048
4096
80,2 DDR5 12,0 (11_0)
12,0 (12_1)
1044 32,6 N / A $119
GeForce GTX 750 Ti 18. Februar 2014 GM107 640:40:16 16.3 40.8 1024
2048
4096
86,4 12,0 (11_0) 1306 40.8 60 N / A $149
GeForce GTX 760 192-Bit Unbekannt GK104 3540 294 1152:96:24 823 888 5808 19,8 79 1536
3072
134 192 1896 79 130 3-Wege OEM
GeForce GTX 760 25. Juni 2013 1152:96:32 980 1033 6008 31,4 94,1 2048
4096
192 256 2258 94,1 170 $ 249
GeForce GTX 760 Ti Unbekannt 1344:112:32 915 980 29,3 103 2048 192 2460 103 OEM
GeForce GTX 770 30. Mai 2013 1536:128:32 1046 1085 7010 33,5 134 2048
4096
224 3213 134 230 $399
GeForce GTX 780 23. Mai 2013 GK110 7080 561 2304:192:48 863 900 6008 41,4 166 3072
6144
288 384 3977 166 250 $649
GeForce GTX 780 Ti 7. November 2013 2880:240:48 876 928 7000 42,0 210 3072 336 5046 210 4-Wege $699
GeForce GTX Titan 19. Februar 2013 2688:224:48 837 876 6008 40,2 188 6144 288 4500 1500 $999
GeForce GTX Titan Schwarz 18. Februar 2014 2880:240:48 889 980 7000 42,7 213 336 5121 1707 250
GeForce GTX Titan Z 25. März 2014 2× GK110 2× 7080 2× 561 2× 2880:240:48 705 876 2× 33,8 2× 169 2× 6144 2× 336 2× 384 8122 2707 375 4-Wege auf 2 Karten $2999
Modell Start Code Name Fab ( nm ) Transistoren (Millionen) Matrizengröße ( mm 2 ) Bus - Schnittstelle Kernkonfiguration 1 Taktraten Füllrate Speicher API- Unterstützung (Version) Rechenleistung (GFLOPS) TDP (Watt) SLI- Unterstützung 6 Einführungspreis (USD)
Basis-Kerntakt ( MHz ) Kerntakt erhöhen ( MHz ) Speicher ( MT/s ) Pixel ( GP /s) 2 Textur ( GT /s) 3 Größe ( MB ) Bandbreite ( GB /s) Typ Busbreite ( Bit ) DirectX OpenGL OpenCL Vulkan Einfache Genauigkeit 4 Doppelte Präzision 5

GeForce 700M (7xxM)-Serie

Einige Implementierungen können unterschiedliche Spezifikationen verwenden.

Modell Start Code Name Fab ( nm ) Bus - Schnittstelle Kernkonfiguration 1 Taktfrequenz Füllrate Speicher API- Unterstützung (Version) Rechenleistung 2
(GFLOPS)
TDP (Watt) Anmerkungen
Kern ( MHz ) Shader ( MHz ) Speicher ( MT/s ) Pixel ( GP /s) Textur ( GT /s) Größe ( MB ) Bandbreite ( GB /s) Typ Busbreite ( Bit ) DirectX OpenGL OpenCL Vulkan
GeForce 705M 1. Juni 2013 GF119 40 PCIe 2.0 x16 48:8:4 775 1550 1800 1,48 5.9 bis 2048 ? DDR3 64 12,0 (11_0) 4.6 1.1 N / A 141.7 12 520M . mit neuem Abzeichen
GeForce 710M 1. April 2013 GF117 28 96:16:4 775 1550 1800 3.1 12,4 bis 2048 14,4 64 297.6 fünfzehn
GeForce GT 720M 1. April 2013 96:16:4 800 1600 1600 2.5 10 bis 2048 12,8 64 240 33
25. Dezember 2013 GK208 192:16:8 800 2.9 11,5 1,2 ? 276 33
GeForce GT 730M 1. April 2013 GK107 PCIe 3.0 x16 384:32:16 725 725 1800 5,8 23 bis 2048 14,4 – 64,0 DDR3 GDDR5 128 1.1 1.1 552,2 33
6. März 2014 GK208 PCIe 2.0 x8 384:16:8 5,8 11,5 64
GeForce GT 735M 1. April 2013 PCIe 2.0 x8 384:32:8 889 889 2000 4.6 9.2 bis 2048 16.0 DDR3 64 1,2 441.6 33
GeForce GT 740M 1. April 2013 GK107 PCIe 3.0 x16 384:32:16 810-1033 810-1033 1800/3600 6.48 25,9 bis 2048 14,4 – 57,6 DDR3 GDDR5 128 1.1 622.1 45
20. Juni 2013 GK208 PCIe 3.0 x8 384:16:8 980-1033 980-1033 7,84 15,7 64 1,2 752,6 33
GeForce GT 745M 1. April 2013 GK107 PCIe 3.0 x16 384:32:16 837 837 2000 – 5000 4.39 17,6 bis 2048 32,0 – 80,0 128 642.8 45
GeForce GT 750M 1. April 2013 384:32:16 967 967 2000 – 5000 7,53 30,1 bis 4096 32 – 80 128 1.1 722.7 50
GeForce GT 755M Unbekannt 384:32:16 1020 1020 5400 15,7 31,4 bis 2048 86,4 DDR5 128 752,6 50
GeForce GTX 760M 30. Mai 2013 GK106 768:64:16 657 657 4008 10 40,2 2048 64,1 128 964,6 55
GeForce GTX 765M 30. Mai 2013 768:64:16 850 850 4008 12,8 51 2048 64,1 128 1,2 1224 75
GeForce GTX 770M 30. Mai 2013 960:80:24 811 811 4008 14,1 56,5 3072 96,2 192 1356 75
GeForce GTX 780M 30. Mai 2013 GK104 1536:128:32 823 823 5000 24,7 98,7 4096 160,0 256 2369 100

Chipsatz-Tabelle

Einstellung des Supports

Nvidia hat angekündigt, dass nach der Veröffentlichung von 390.x-Treibern keine 32-Bit-Treiber für 32-Bit-Betriebssysteme mehr veröffentlicht werden.

Nvidia hat angekündigt, dass Kepler-Notebook-GPUs ab April 2019 auf Legacy-Support umstellen und bis April 2020 unterstützt werden. Von dieser Änderung sind alle Notebook-GPUs der 7xxM-Familie betroffen.

Nvidia kündigte an, nach der Veröffentlichung der 470-Treiber die Treiberunterstützung für die Betriebssysteme Windows 7 und Windows 8.1 auf den Legacy-Status umzustellen und bis September 2024 weiterhin kritische Sicherheitsupdates für diese Betriebssysteme bereitzustellen.

Nvidia hat angekündigt, dass alle verbleibenden Kepler-Desktop-GPUs ab September 2021 auf Legacy-Support umsteigen und bis September 2024 für kritische Sicherheitsupdates unterstützt werden. Die Nvidia GeForce GTX 745, 750 und 750 Ti aus der 7xx-Desktop-GPU-Familie wären davon nicht betroffen Veränderung.

In Windows ist der letzte Treiber, der CUDA mit 64-Bit Compute Capability 3.5 für Kepler in Windows 7 & Windows 8.1 64-Bit vollständig unterstützt, 388.71, getestet mit den neuesten CUDA-Z und GPU-Z, nach diesem Treiber der 64-Bit CUDA Support für GeForce 700-Serie GK110 mit Kepler-Architektur wird unterbrochen.

Der letzte Treiber, bei dem die Erkennung des Monitortyps unter Windows XP ordnungsgemäß funktioniert, ist 352.86.

Siehe auch

Verweise

Externe Links