Graphic amarcord: Chromatic Research, ArtX, Bitboys Oy

Dopo aver tributato il doveroso omaggio a 3dfx e aver ricordato Teng Labs, Number Nine e Rendition, questa settimana voglio dedicare un po’ di spazio ad alcune società produttrici di chip grafici, più o meno note, che hanno in comune una caratteristica: quella di essere state acquisite da ATi mentre nel prossimo capitolo vedremo le acquisizioni di Intel nel terzo di nVIDIA.

Alcune sono più note, altre meno conosciute dal grande pubblico e familiari solo agli addetti ai lavori, anche perchè non hanno mai fatto la loro comparsa nel segmento dei prodotti per il gaming, però risultano ugualmente importanti e degne di menzione in una rubrica che si propone l’obiettivo di tracciare un breve profilo di alcune delle protagoniste del mondo del retrocomputing.

Tra le società passate sotto l’egida della casa canadese, sicuramente merita una speciale menzione  ArtX. Fondata nel 1997 da un gruppo di ingegneri fuoriusciti da SGI, tra cui David Orton, uno dei “capoccioni” di Silicon Graphics che diverrà CEO in ATi, questa piccola società si rivela subito attiva nell’ambito della progettazione di chip 3D e architetture integrate. Nel giro di tre anni circa di attività, da ’97 al febbraio 2000, anno dell’acquisizione da parte di ATi, ArtX progetta un northbridge con chip grafico integrato e, soprattutto, la GPU del Nintendo GameCube, denominata Flipper.

Il Flipper è un chip dotato di 4 pipeline di rendering, ciascuna provvista di 1 TMU con Texture EnVironment engine (TEV) dal funzionamento analogo ai texture register combiner del Geforce 256; la funzione di questi combiner è quella di prelevare i dati in ingresso (RGA e alpha, dati sulle texture) e combinarli tra loro, eseguendo operazioni di addizione e moltiplicazione. In particolare NV10 era dotato di 3 combiner in cascata, i primi due soltanto, dei quali, utilizzati dalle DX7, mentre il terzo riservato alle OpenGL (v. figura sottostante)

register-combiner-nv10.jpg

Tornando a Flipper, il chip contava circa 51 milioni di transistor, 24 dei quali dedicati alle due cache interne, rispettivamente utilizzate per le texture (1 MB) e come z-buffer (2 MB). Per questa eDRAM era stato utilizzato un particolare tipo di RAM, definito, impropriamente, 1T SRAM. Impropriamente perchè la SRAM ha celle che contano almeno 3 transistor, mentre questo tipo di memoria, progettata da MoSys, fa uso di celle a transistor singolo con abbinata un condensatore, esattamente come le normali DRAM. Quello che le differenzia è la presenza di un circuito con relativo controller che serve a mascherare le latenze delle operazioni di precarica e refresh della ram, in modo che dall’esterno, siano viste come memorie di tipo SRAM. Ovviamente i tempi d’accesso non sono gli stessi delle SRAM vere e proprie mentre lo spazio occupato da una singola cella di 1T SRAM presente sul GameCube è poco meno della metà di quello di una cella di SRAM 6T di tipo standard. Grazie all’utilizzo di texture register combiner associati ad 1 MB di cache, Flipper riusciva ad applicare fino a 8 texture per pass (come il Kyro 2), contro, per fare un parallelo, le 4 dell’NV20 e dell’NV25 e le 6 dell’R200.

In dotazione a Flipper c’era anche un’unità di T&L di tipo fixed function, come quelle integrate in R100, NV10 ed NV15. L’utilizzo di eDRAM per le operazioni di texturing e come z-buffer interno permetteva una notevole ottimizzazione della comunque ampia banda passante (paragonabile a quelle del Radeon o della Geforce 2), fornendo una bandwidth maggiore alle operazioni che più ne hanno bisogno (una riedizione di questa soluzione la ritroveremo in xenos con i 10 MB di eDRAM integrati nel die secondario). Infatti, considerando il clock del chip (162 MHz) e il bus di 96 bit a disposizione di ciascuna delle 4 ROP’s, si raggiunge un totale di circa 7,76 GB/s di bandwidth a disposizione delle sole raster operation.

Integrato in Flipper c’era anche un DSP per le operazioni di decodifica audio, progettato da Macronis.

Il passaggio degli ingegneri di ArtX in ATi portò sicuramente giovamento a quest’ultima; a riprova di ciò, il fatto che alcune delle soluzioni più “eleganti” presenti su Flipper le ritroveremo anche in R500 (la eDRAM nelle ROP’s)  e in R300 (l’idea di abbandonare le architetture nx2 o, addirittura, nx3, come quelle di R200 o di R100, con a pipeline ciascuna dotata di più testure unit, per adottare un’architettura nx1 che da un lato permette di utilizzare register combiner e cache interne per applicare più testure per pass e dall’altra permette di utilizzare i transistor (e lo spazio) risparmiati per aumentare il parallelismo a livello di pixel output.

Altra società acquisita da ATi è Chromatic Research (CR), società nata nel 1993, dalle ceneri di un’altra società denominata Xenon Microsystem Corporation, per merito di alcuni ingegneri e tecnici provenienti da altre realtà operanti in quel periodo nel settore della microelettronica. Uno di questi fu anche tra i soci fondatori di RAMBUS e non deve meravigliare che la famiglia di chip progettata da CR e denominata MPACT faceva uso proprio di RDRAM.

In effetti ho parlato di chip e non di chip grafici per un motivo ben preciso: di fatto, i chip della famiglia MPACT (nella foto in basso montato su una scheda di STB su bus PCI)

mpact1.jpg

e MPACT 2 erano dei dispositivi di tipo special purpose improntati alla codifica ed alla decodifica di flussi audio e video e non dei veri chip votati alla riproduzione di immagini 2D/3D. Anzi, ad essere pignoli, il 3D era completamente assente, mentre il 2D era di elevatissima qualità. In pratica, si occupava di gestire i flussi video 2D, i flussi audio e fungeva da modem.

L’architettura dell’MPACT, presentato nel 1996, era di tipo SIMD, programmabile, con alu VLIW, al posto dei registri faceva uso di una cache di tipo SRAM e di 4 registri di tipo special purpose per indirizzare indirettamente gli accessi alla memoria. I bit per byte erano 9 anzichè 8, notazione che prevede l’adozione del segno, utile per le operazioni di codifica e decodifica audio e video e il memory controller faceva uso di DMA gestendo in maniera asincrona gli accessi alla RAM dalle altre operazioni delle alu, per mascherare le latenze delle RDRAM.
L’architettura VLIW, con scheduler interamente di tipo software, permetteva una notevole flessibilità e adattabilità. Così, quando furono rilasciate le specifiche per l’MPEG2 o per i modem 56K, fu possibile adattare l’MPACT a svolgere il tipo di operazioni richieste da quegli standard senza grossi problemi.

CR, al contrario della stragrande maggioranza delle società sue contemporanee, presentava una particolarità, ovvero vantava un gran numero di impiegati (circa 350) che si occupavano sia della progettazione dell’hardware che della realizzazione dei driver e dell’ottimizzazione del software.

I motivi del suo declino e della sua conseguente acquisizione, avvenuta nel 1998, col numero di impiegati ormai pressochè dimezzato, sono da imputare al disinteresse per il mondo dei pc e, di conseguenza, per il rifiuto di implementare funzionalità 3D nei propri chip.  In realtà, c’erano stati dei contatti tra CR e 3dfx per la realizzazione di un chip in cui CR si sarebbe occupato degli aspetti multimediali e avrebbe curato il 2D (di ottima fattura) e 3dfx avrebbe portato le sue conoscenze del mondo 3D. Alla fine, il progetto non andò in porto perchè CR credeva incrollabilmente nella scarsa utilità del 3D; così 3dfx decise di realizzare in proprio un engine 2D e CR continuò con sempre minor successo a proporre i propri prodotti, non accorgendosi di come il “vento digitale” stesse cambiando direzione.

Ultimo acquisto di ATi è Bitboys. Parlare della linea di prodotti della società finlandese è, per certi versi, come parlare del duca più famoso e meno raffinato della storia dei videogiochi. Fondati nel 1991, i Bitboys si affermano con alcune buone soluzioni nel segmento dei dispositivi mobili, tanto da instaurare una collaborazione con Ericsson, con scambio di brevetti, e da suscitare l’interesse di nokia che, nel febbraio 2006, investe nella società 4 milioni di € per finanziare lo sviluppo di soluzioni per telefoni cellulari. Con i brevetti licenziati da Ericsson, invece, i Bitboys acquisiscono un algoritmo di antialiasing per cellulari e palmari e la possibilità di gestire applicazioni grafiche 3D su dispositivi mobili, che non fossero limitate all’ambito videoludico.

Molto attivi nel segmento della grafica 3D per cellulari, sviluppano una serie di chip che fanno uso di unità vettoriali di tipo floating point programmabili; alcuni di essi, la serie G, rilasciata a partire dal 2003, sono dotati di unità di pixel shading operanti a 32 bit e compatibili con D3D e OpenGL.

Ma questa è la storia recente dei Bitboys, quella, per così dire, seria e che ha spinto società importanti come nokia ed Ericsson ad avviare delle partnership con loro e che ha fruttato ad ATi un cospicuo know how nel segmento mobile quando, nel maggio del 2006, perfeziona l’acquisizione della società finlandese.

Ma c’è un’altra storia, quella per cui, inizialmente, li ho paragonati al “DUKE”. E’ la storia relativa ai chip grafici per pc, annunciati con gran clamore e promesse di prestazioni mirabolenti e, puntualmente, mai usciti. Mi riferisco alla serie nota come Glaze3D, che avrebbe dovuto vantare notevoli quantità di eDRAM e avrebbe dovuto demolire la concorrenza. Di seguito riporto l’intervista ad uno dei Bitboys, rilasciata nell’agosto del 1999, a propostito delle presunte prestazioni del Glaze3D

Voodoo 2 does 90 MPIX/s, so Voodoo 4 would do 720 MPIX/s. At true color and with a 32-bit Z this would require 8.6 GB/s of memory bandwidth. This is not available without embedded DRAM and Voodoo 4 doesn’t use embedded DRAM. So Glaze3D definitely has more better performance.Voodoo 2 does 90 MPIX/s, so Voodoo 4 would do 720 MPIX/s. At true color and with a 32-bit Z this would require 8.6 GB/s of memory bandwidth. This is not available without embedded DRAM and Voodoo 4 doesn’t use embedded DRAM. So Glaze3D definitely has more better performance. 

Da notare l’uso del verbo avere al presente indicativo che non lascia adito a dubbi: “il Glaze3D esiste ed ha prestazioni superiori a quelle del Voodoo4 e una maggiore scalabilità”.

Nel settembre del 1999 si parlava di 200 fps con Quake 3, a 800×600@32 bit, e circolavano persino immagini su quello che sarebbe stato il realismo raggiungibile con questo chip delle meraviglie e persino le specifiche tecniche, tra cui la presenza di 4 pipeline dotate, ciascuna, di 2 tmu, una frequenza di 150 MHz con 9 MB di eDRAM utilizzata come z-buffer.

E siccome qui su AD si riesce, a volte, anche ad ottenere l’impossibile, vi mostro qualche schema di un chip mai esistito. Qui sotto è riportato lo schema generale del chip

glaze3d.jpg

mentre di seguito c’è lo schema delle ROP’s con la eDRAM

glaze3d-edram.jpg

e per finire, la configurazione multichip, capace di un pixel fillrate teorico (dichiarato) pari a 2400 Mpixel/s

glaze3d-multichip.jpg

dove l’unità indicata col nome Thor è un’unità geometrica di tipo T&L. Inutile dire che facendo un paragone con il Voodoo 5, composto da 2VSA-100 (il chip della Voodoo4), se un Glaze3D è più veloce di una Voodoo4, c’è da immaginarsi cosa riuscirebbe a fare un simile mostro, con 4 Glaze3D e un’unità di T&L.

Qualcosa di concreto c’era ed erano alcuni brevetti su pipeline ocn alu di tipo vettoriale e sull’utiulizzo di eDRAM come z-buffer. Ma quello che contribuì a creare ai Bitboys la fama di “venditori di fumo” non furono tanto le esternazioni sulle presunte fantascientifiche prestazioni dei loro chip, quanto i continui annunci di GPU mai realizzate; in pratica, ad ogni nuova generazione di chip grafici si attendeva l’uscita di qualcuno di questi rivoluzionari prodotti e si restava costantemente delusi. Così,  il vaporware creato dai Bitboys non portò la rivoluzione da tutti attesa nel mondo della grafica 3D e, come detto, i ragazzi finlandesi ripiegarono sul più abbordabile settore mobile, questa volta con buoni e, soprattutto, tangibili risultati.

Così, se è ancora viva, negli appassionati del Duca, la speranza di vedere il proprio beniamino ancora all’opera, è definitivamente tramontata quella di vedere un chip prodotto dai Bitboys equipaggiare una VGA di qualsivoglia fascia.

A gennaio del 2009, i Bitboys passano da AMD a Qualcomm mentre noi, la settima prossima, passeremo a parlare delle acquisizioni di Intel.

Press ESC to close