
Johdanto
NVIDIA julkaisi maaliskuussa Hannoverissa (Saksa) järjestetyssä
Cebit 2006 IT-tapahtumassa kaksi uutta PCI Express (x16) -näytönohjainta, GeForce 7900 GTX ja GeForce 7900 GT.
Molemmat näytönohjaimet käyttävät NVIDIA:n G71-grafiikkapiiriä (GPU), joka on valmistettu TSMC:n (Taiwan Semiconductor
Manufacturing Company) 90nm tuotantolinjalla Taiwanissa. Uuden ja pienemmän valmistusprosessin ansiosta NVIDIA on voinut
maksimoida tuotannon laskemalla samalla lähes puoleen valmistuskustannukset verrattuna edelliseen 110nm valmistusprosessiin,
jota NVIDIA käytti G70-grafiikkapiirien (GeForce 7800-sarja) valmistuksessa. Fyysisesti 90nm prosessilla valmistettu
G71-grafiikkapiiri on noin 40% pienempi ja sisältää transistoreita 24 miljoonaa vähemmän kuin 110nm prosessilla valmistettu
G70-grafiikkapiiri. Lisäksi pienempi valmistusprosessi tarjoaa muutamia teknisiä etuja lopullisessa prosessissa, kuten
esimerkiksi korkeamman kellotaajuuden, pienemmän virrankulutuksen ja lämmöntuoton.
NVIDIA:n siirtyminen pienempään valmistusprosessiin oli odotettua vuoden 2006 aikana, sillä TSMC ei pystynyt enää
toimittamaan NVIDIA:lle riittävästi korkeilla kellotaajuuksilla toimivia 110nm prosessilla valmistettuja G70-grafiikkapiirejä.
Toisaalta myös ATI:n siirtyminen 90nm valmistusprosessiin (Radeon X1K-sarja) vuoden 2005 loppupuolella nopeutti merkittävästi
NVIDIA:n grafiikkapiirien julkaisuaikatauluja. 90nm valmistusprosessia NVIDIA on jo aikaisemmin testannut ja hyödyntänyt
mm. integroitujen C51-piirien valmistuksesta. Suorituskyvyn suhteen NVIDIA lupailee G71-grafiikkapiirin tarjoavan markkinoiden eniten
suorituskykyä per transistori ja kykenevän peleissä todelliseen "High Definition"-laatuun aina 2560x1600 näyttötarkkuudelle asti.
Arkkitehtuuriltaan G71-grafiikkapiiri ei sisällä uusia tai mullistavia ominaisuuksia ja kyseessä on 90nm valmistusprosessilla
päivitetty G70-grafiikkapiiri. G71/G70-grafiikkapiirien arkkitehtuurista löytyy lisää tietoa täältä.
Cebit 2006 IT-tapahtumassa julkistetuista näytönohjaimista GeForce 7900 GTX on suunnattu "high-end"-markkinoille
tekemään kiusaa ATI:n Radeon X1900 -näytönohjaimille. Valmistuskustannuksillaan GeForce 7900 GTX on kuitenkin huomattavasti
edullisempi valmistaa kuin ATI:n Radeon X1900 ja kokonaisuutena ohjain tarjoaa hyvän suorituskyvyn, vaikka ei aivan ominaisuuksiltaan
pärjääkkään Radeon X1900-sarjan näytönohjaimille. Jälleenmyyjien hyllyillä GeForce 7900 GTX on ollut suunnilleen 50
euroa edullisempi kuin Radeon X1900XTX.
Toinen julkistetuista näytönohjaimista, GeForce 7900 GT, on suunnattu kuluttajamarkkinoille korvaamaan 110nm prosessilla
valmistetut GeForce 7800 GTX ja GeForce 7800 GT -näytönohjaimet. Suorituskyvyltään GeForce 7900 GT on hivenen nopeampi tai samantasoinen
kuin GeForce 7800 GTX (256MB) ja se sopii myös täydellisesti kahden näytönohjaimen SLI (Scalable Link Interface) -järjestelmiin.
GeForce 7900 GT:n jälleenmyyntihinta on ollut alimmillaan noin 250-260 euroa.
Tässä artikkelissa Skenegroupin testipenkkiin kiinnitetään NVIDIA GeForce 7900 GTX -referenssinäytönohjain. Artikkeli käsittelee
enimmäkseen GeForce 7900 GTX -näytönohjaimen suorituskykyä peleissä ja sen perusominaisuuksia, kuten esimerkiksi yleisiä käyttökokemuksia,
tietoa ohjaimen piirilevystä ja jäähdystysratkaisun ominaisuuksista. Verrokkina suorituskykymittauksissa on käytetty pelkästään NVIDIA:n
valmistamia näytönohjaimia (mm. GeForce 7800 GTX 256MB ja 512MB mallit). Artikkeli ei käsittele NVIDIA:n SLI-tekniikkaa (Scalable Link
Interface).

Näytönohjainten tekniset tiedot
| Näytönohjaimen nimi |
GeForce 7800 GT |
GeForce 7800 GTX 256MB |
GeForce 7800 GTX 512MB |
GeForce 7900 GTX |
|
 |
 |
 |
 |
| AGP / PCI-E-väylä |
PCI-E |
PCI-E |
PCI-E |
PCI-E |
| Grafiikkapiirin nimi |
G70 |
G70 |
G70 |
G71 |
| Valmistusprosessi |
.11µ (TSMC) |
.11µ (TSMC) |
.11µ (TSMC) |
.09µ (TSMC) |
| Transistoreita |
302 milj. |
302 milj. |
302 milj. |
278 milj. |
Grafiikkapiirin kellotaajuus |
400-450 MHz |
430-495 MHz |
550-600 MHz |
650-720 MHz |
Muistiväylän leveys, bittiä |
256 bit [64x4] |
256 bit [64x4] |
256 bit [64x4] |
256 bit [64x4] |
| Muistin määrä |
256 MB [GDDR3] |
256 MB [GDDR3] |
512 MB [GDDR3] |
512 MB [GDDR3] |
Muistipiirien kellotaajuus (GDDR) |
500-550 MHz |
550-600 MHz |
600-850 MHz |
800-850 MHz |
| Tuetut muistit |
DDR / GDDR2 / GDDR3 |
DDR / GDDR2 / GDDR3 |
DDR / GDDR2 / GDDR3 |
DDR / GDDR2 / GDDR3 |
| Pikselitäyttösuhde |
2400 MP/s |
6880 MP/s |
8800 MP/s |
10400 MP/s |
| Tekselitäyttösuhde |
8000 MT/s |
10320 MT/s |
13200 MT/s |
15600 MT/s |
| Verteksinopeus |
700 Mtri/s |
950 Mtri/s |
1100 Mtri/s |
1400 Mtri/s |
Muistiväylän nopeus |
32.0 GB/s |
38.4 GB/s |
54.4 GB/s |
51.2 GB/s |
Verteksi- prosessoreiden lukumäärä |
7 |
8 |
8 |
8 |
Verteksi- prosessorin laskentayksiköt (ALU:t)
ALU = arithmetic logic unit fp = floating-point MIMD = Multiple Instruction, Multiple Data VTF = vertex texture fetch |
fp MIMD ALU [vec4] scalar MIMD ALU [vec1] VTF |
fp MIMD ALU [vec4] scalar MIMD ALU [vec1] VTF |
fp MIMD ALU [vec4] scalar MIMD ALU [vec1] VTF |
fp MIMD ALU [vec4] scalar MIMD ALU [vec1] VTF |
Verteksi- prosessorin vektorileveys |
Vec4 + scalar |
Vec4 + scalar |
Vec4 + scalar |
Vec4 + scalar |
Verteksi- käskyä kellojaksossa (fp)
[ ] Kaikki vp:t |
2 ALU [14 ALU] |
2 ALU [16 ALU] |
2 ALU [16 ALU] |
2 ALU [16 ALU] |
Verteksi- operaatiota kellojaksossa (fp)
[ ] Kaikki vp:t |
5 [35] |
5 [40] |
5 [40] |
5 [40] |
Fragmentti- prosessoreiden lukumäärä
|
20 x 1 [TMU] |
24 x 1 [TMU] |
24 x 1 [TMU] |
24 x 1 [TMU] |
Fragmentti- prosessorin laskentayksiköt (ALU:t)
ALU = arithmetic logic unit fp = floating-point SIMD = Single Instruction, Multiple Data MADD = multiply-add MUL = multiply ADD = add SFU = special function unit |
2 fp SIMD ALU:a [yhteensä 40]
ALU1: MADD ALU [vec3 + scalar] mini-ALU / SFU [scalar] teksturointiprosessori
ALU2: MADD ALU [vec3 + scalar] mini-ALU / SFU [scalar] |
2 fp SIMD ALU:a [yhteensä 48]
ALU1: MADD ALU [vec3 + scalar] mini-ALU / SFU [scalar] teksturointiprosessori
ALU2: MADD ALU [vec3 + scalar] mini-ALU / SFU [scalar] |
2 fp SIMD ALU:a [yhteensä 48]
ALU1: MADD ALU [vec3 + scalar] mini-ALU / SFU [scalar] teksturointiprosessori
ALU2: MADD ALU [vec3 + scalar] mini-ALU / SFU [scalar] |
2 fp SIMD ALU:a [yhteensä 48]
ALU1: MADD ALU [vec3 + scalar] mini-ALU / SFU [scalar] teksturointiprosessori
ALU2: MADD ALU [vec3 + scalar] mini-ALU / SFU [scalar] |
Fragmentti- prosessorin vektorileveys
vec = vector |
Vec4 + scalar |
Vec4 + scalar |
Vec4 + scalar |
Vec4 + scalar |
Fragmentti- prosessorin laskentatarkkuudet
fp = floating-point fx = fixed |
fp32 / fp16 |
fp32 / fp16 |
fp32 / fp16 |
fp32 / fp16 |
Fragmentti- käskyä kellojaksossa (fp)
[ ] Kaikki fp:t |
4 ALU + 1 NRM + 1 TEX [80 ALU + 20 NRM + 20 TEX] |
4 ALU + 1 NRM + 1 TEX [96 ALU + 24 NRM + 24 TEX] |
4 ALU + 1 NRM + 1 TEX [96 ALU + 24 NRM + 24 TEX] |
4 ALU + 1 NRM + 1 TEX [96 ALU + 24 NRM + 24 TEX] |
Fragmentti- operaatiota kellojaksossa (fp)
[ ] Kaikki fp:t |
10 [200] |
10 [240] |
10 [240] |
10 [240] |
Teksturointi- prosessoreiden lukumäärä |
20 [yhdysrakenteinen] |
24 [yhdysrakenteinen] |
24 [yhdysrakenteinen] |
24 [yhdysrakenteinen] |
Tekstuureja per vaihe |
16 |
16 |
16 |
16 |
ROP-pikseli- liukuhihnojen lukumäärä |
16 |
16 |
16 |
16 |
Z-syyvys- / maskausvertailua kellojaksossa |
32 |
32 |
32 |
32 |
Pikselivarjostimen versio / malli |
3.0 |
3.0 |
3.0 |
3.0 |
Verteksivarjostimen versio / malli |
3.0 |
3.0 |
3.0 |
3.0 |
| OpenGL / DirectX |
1.5 (2.0) / 9.0 |
1.5 (2.0) / 9.0 |
1.5 (2.0) / 9.0 |
1.5 (2.0) / 9.0 |
| NVIDIA CineFX -versio |
4.0 |
4.0 |
4.0 |
4.0 |
| RAMDAC |
2 x 400 MHz |
2 x 400 MHz |
2 x 400 MHz |
2 x 400 MHz |