Disclaimer: l’autore di questo pezzo lavora per una parte chiamata in causa dall’articolo che commenta, ma si esprime a titolo puramente personale.
In ogni campo dell’informazione ci sono testate che si contraddistinguono per vari gradienti di accuratezza, dalla notizia approfondita e meditata a quella più urlata e spesso basata su infondate voci di corridoio.
Nel campo dei semiconduttori Semiaccurate è una delle testate più controverse. Molti di noi lo leggono avidamente per rallegrare un po’ le lunghe e grigie giornate passate a scrivere Verilog. Come regola, personalmente non incoraggio questo genere di speculazioni semplicemente ignorandole, ma dopo che il nostro Cesare mi ha fatto notare questo recente articolo, ho capito di non potermi esimere da un commento.
Il problema dell’articolo in questione, è che sembra che sia scritto da uno che sa di quel che parla, ed è certamente in grado di convincere chi non abbia esperienza nel settore; in realtà si tratta di un’unica sequenza di fatti distorti o ahimè semplicemente inventati. Per questo motivo farò un’eccezione e ribatterò alle affermazioni più divertenti e clamorose presenti nell’articolo. Lo farò ovviamente utilizzando informazioni di pubblico dominio.
“The short story is this; the CPU is under-performing badly, missed internal clock targets, and costs too much to be financially viable.”
Fino a che non usciranno i primi test di terze parti (entro un paio di settimane, probabilmente, visto che il Transformer Prime dovrebbe uscire il primo dicembre) tutto quello che sappiamo è che Tegra3 ha il doppio di core di Tegra2 e una frequenza del 30% superiore, cioè una potenza teorica di picco di 2.6x quella del Tegra2. Aggiungendo le unità vettoriali NEON, abbiamo una potenza complessiva superiore a 5x quella di Tegra2. Perché questo sia “under-performing badly” è un mistero che solo Charlie conosce.
Quanto al costo, basta dire questo: Tegra3 ha un’area di circa 90mm^2, mentre l’Apple A5 ha un’area di circa 120mm^2, cioè il 33% in più. Visto che il costo è proporzionale all’area, e che la resa peggiora più che linearmente con la dimensione, il perché Tegra3 sia troppo costoso mentre un A5 non lo sia è un altro mistero.
“The biggest thing we missed is the so called fifth core, and that is where many of the problems lie, not to mention the costs.”
Il quinto core riduce di molto la potenza consumata in idle e occupa qualche percento in più dell’area del die. Diciamo che non sembra un grave problema.
“Several ARM vendors have done this, and the results are quite a bit better than Tegra 2′s power numbers, a whole lot better in fact. Intel and AMD do this in addition to HUGS, and the power levels they achieve are quite notable. Which way did Nvidia go for Tegra 3? Well, neither, they built a Frankenstein chip that trades die size, leakage, performance, yield, and cost for idle power savings. The trade-off is time to market.”
In effetti il livello di potenza raggiunto da Intel e AMD è “alquanto notevole”, talmente tanto che se mettessimo un loro processore dentro un tablet, questo fonderebbe. Quanto ai “compromessi”, avere più potenza di calcolo e minore consumo medio al costo di un qualche percento di area in più è un’ottima scelta di design che qualsiasi ingegnere farebbe senza esitazioni.
Da un diverso punto di vista, questi sono i numeri mostrati da Anand. Il Transformer Prime è più sottile e più leggero sia del Transformer che dell’iPad 2: questo sarebbe impossibile da ottenere se Tegra3 consumasse davvero cosi’ tanto (perché avrebbe bisogno di più batteria e di un dissipatore più grosso).
“The first “sort of” is the performance, you will take a big hit on the transfer from the LP core to the G cores”
NVidia ha rilasciato un video in cui mostra il funzionamento del Companion Core insieme agli altri 4 core ad alte prestazioni. Avete visto come scattava tutto passando da una app all’altra? No? Neanch’io :)
Per passare da un core all’altro bastano pochi millisecondi, il che significa che è possibile effettuare il passaggio prima ancora che il frame corrente abbia finito di renderizzare (a 60 Hz di refresh viene mostrato un frame ogni 16.67 ms), cioè è impossibile accorgersene.
“According to numbers shown to SemiAccurate, basically every upcoming competitor beats Tegra 3, most by wide margins.”
Cioè chip che verranno dopo Tegra3 avranno prestazioni superiori? Accidenti! Azzarderò anch’io una predizione del genere: predico che l’anno prossimo Intel farà uscire un processore più potente di quelli di adesso, e fra 2 anni uno ancora più potente! Ho vinto qualche cosa?
“Numbers seen by SemiAccurate show a dual core Qualcomm Krait SoC absolutely destroying a 1.5GHz Tegra 3”
Proviamolo a chiederlo a HTC: loro non hanno mai usato un Tegra2 ma solo chip Qualcomm perchè Qualcomm è azionista di HTC (qui , ottavo paragrafo, appena sopra la seconda immagine). Per lo stesso motivo HTC ha anche accesso alle informazioni sui nuovi chip Qualcomm prima di tutti gli altri… e a questo giro HPC ha deciso di lanciare il loro nuovo smartphone di punta, nonchè un tablet, con Tegra3 dentro. Diciamo che in HTC non la pensano come Charlie, e io tendo a credere a loro :)
“The first big problem is masks, the big skeleton in the 40LPG closet is masks, you need two sets. In order to do a 40LPG chip, you need a set of 40G masks, and a partial set of 40LP masks, and you have to swap them out for each step of the process that is applicable. The 5-10% number may be true for what TSMC adds to the bill to make up for increased tool time and their added costs, but what about the rest? Conveniently left out of the official Nvidia ‘not leaked from us’ numbers are the mask costs, likely adding $1M or more to the tab, lowered yield, clock speed headaches, and many other niggling production issues.”
Questo è completamente inventato. Servono solo poche maschere in più da aggiungere al processo, non “due set”, e quelle costano qualche centinaio di migliaia di dollari. Considerando che NVidia prevede di fatturare tra i 500 milioni e 1 miliardo di dollari con Tegra3, non credo che sia un grave problema.
I problemi di clock sono poi l’invenzione più divertente: il quinto core è fatto apposta per girare con un clock più basso (per risparmiare potenza, ricordate?) quindi è più facile da sintetizzare rispetto a tutto il resto perché i timing sono meno stretti.
“the rumors of problems there have been curiously denied through backchannels, but the reasons that Nvidia dumped most if not all of their early 28nm capacity are not worth Nvidia addressing.”
Infatti è meglio non parlarne, visto che non sa neanche lui che cosa questa frase dovrebbe significare.
Il processo a 28nm è molto più maturo del 40nm allo stesso stadio di sviluppo e infatti i wafer con su Kepler stanno sfornando molto bene, con buone rese. Un’altra delle solite invenzioni di Charlie.
Ad ogni modo, secondo i rumor il Trasformer Prime dovrebbe uscire il primo dicembre, quindi manca molto poco ad avere delle recensioni di terze parti e capire cosa questo chip è davvero in grado di fare.