Tesla svela il supercomputer che "addestra" l'intelligenza artificiale dell'Autopilot

22 Giugno 2021 71

Sappiamo che Tesla sta lavorando ad un supercomputer chiamato "Dojo" che sarà in grado di gestire enormi quantità di dati. L'obiettivo è quello di arrivare a sviluppare più rapidamente l'intelligenza artificiale del sistema Autopilot. Dojo non è ancora arrivato, il debutto sarebbe atteso per la fine dell'anno, ma anche l'attuale soluzione con cui il costruttore "allena" le reti neurali alla base del sistema Autopilot non è da meno visto che secondo il costruttore si tratta del quinto computer più potente al mondo.

Del resto, per gestire la mole di dati provenienti dalla flotta di veicoli che permettono di migliorare le capacità di guida assistita, serve una potenza di calcolo elevatissima. Andrej Karpathy, head of AI di Tesla, ha voluto raccontare qualcosa di più del supercomputer utilizzato oggi dalla sua società durante la Conference on Computer Vision and Pattern Recognition 2021.

SERVE TANTA CAPACITÀ DI CALCOLO

Elaborare i dati il più velocemente possibile è fondamentale per accelerare l'evoluzione delle funzionalità del sistema Autopilot. Ecco perché Tesla sta investendo moltissimo nella capacità di calcolo. Il futuro "Dojo" dovrebbe rappresentare un importante passo avanti da questo punto di vista. Un investimento importante, anche perché con il rapido aumento delle Tesla sulle strade, la casa automobilistica riceverà una quantità sempre maggiore di dati da elaborare.

Per arrivare all'obiettivo di Elon Musk di proporre in futuro la vera guida autonoma sulle sue autovetture elettriche, Tesla dovrà ancora lavorare a lungo sullo sviluppo dell'intelligenza artificiale. Per farlo, avrà bisogno di supercomputer sempre più potenti. In attesa dell'arrivo di Dojo, Andrej Karpathy ha condiviso qualche dato dell'ultimo cluster utilizzato dalla sua società per gestire ed elaborare i dati con cui viene "allenata" l'intelligenza artificiale.

  • 720 nodi di 8x A100 80GB (5760 GPU totali)
  • 1,8 EFLOPS (720 nodi * 312 TFLOPS-FP16-A100 * 8 GPU/nodi)
  • 10 PB di “hot tier” NVME storage @ 1,6 TBps
  • 640 Tbps di switching capacity

Numeri decisamente impressionanti. Dojo farà ancora meglio visto che è stato ottimizzato per lo sviluppo delle reti neurali ma Karpathy non è voluto scendere nei dettagli.


71

Commenti

Regolamento Commentando dichiaro di aver letto il regolamento e di essere a conoscenza delle informazioni e norme che regolano le discussioni sul sito. Clicca per info.
Caricamento in corso. Per commentare attendere...
multi.vac

Si certo, guarda negli occhi il pilota e capisce se è distratto o meno.

boosook

Ok, ho capito, mi stai supercazzolando.

Fabrizio

Il limite non è l'AI (o il software, in generale), ma gli input che gli dai.
Il principio di funzionamento di una telecamera è sempre lo stesso, fotogrammi in sequenza. E se lo cambi quell'oggetto non si chiama più telecamera

Gianluigi

Mah, io non ne sarei così sicuro. Buche e affini non sono casi rari e che una ia impari a evitarle non mi sembra troppo complicato. Il caso del tombino aperto senza segnalazione è davvero rarissimo. Se poi in quel caso su un miliardi succede che ferma il traffico, il guidatore prenderà il volante (e la ia imparerà cosa deve fare). Dovrebbe essere proprio quello che succede a livello 3. Ripeto, magari mi sbaglio

boosook

"Oggi, domani e dopodomani." -> è questo il tuo errore. ;) Ti ricordo che anni fa si diceva che nessuna AI avrebbe battuto un campione di scacchi.

non ho detto che non sono definiti i livelli per quelli vi sono specifiche chiare. Ho detto che non nessuna definizione che dice che il liv.5 non è possibile farlo solo con telecamere, i livelli rappresentano ciò che deve poter fare non con cosa deve farlo. Sul sito loro troverai lo schema.
Detto questo credo anche io che è ovvio che richieda dei sensori o meglio oramai li montano non ci vedrei un senso rimuoverli.

accakappa

Il computer prende decisioni meglio di umano se questo è programmato per fare un determinato calcolo stop. Se il computer non ha nelle sue righe di codice una programmazione tale da svolgere una situazione questo non la fa, a ri-stop. E l'intelligenza artificiale con auto apprendimento non se le inventa le situazioni se non è l'uomo a fagliele "provare". Ergo, per la tecnologia disponibile, non riuscirà mai a eguagliare quella umana anche se è passibile di errore.

Fabrizio

Il punto non è se Musk o meno abbia "ragione", il SW per quanto avanzato che sia può arrivare solo fino a un certo punto se gli metti dei limiti HW del genere in fase di perception. Oggi, domani e dopodomani.
Nessuno ha la sfera di cristallo, ma dire che fra 10 anni le telecamere riusciranno a vedere attraverso la nebbia....boh staremo a vedere.
In caso contrario si fermeranno al livello 3/4, che Musk continuerà a chiamare 5 perchè da sempre ignora le regole ufficali (ma si farò un livello tutto suo con black jack e squillo di lusso)

accakappa

Appunto, questo è un fattore fondamentale per funzionare. Ma dato che l'industria si muove diversamente ed ognuno pensa alla propria, la guida autonoma così fatta sarà un autentico aborto.

Signor Rossi

"Funzionerà solo se tutti i veicoli saranno connessi così da elaborare e decidere come procedere in una situazione o un'altra." ... questo è quello che hai scritto sopra ... se non utilizzi i stessi protocolli, la stessa identica elaborazione dei dati eccetera eccetera, il tutto non funziona ...

boosook

Allora però qui la discussione originale era se, in un futuro, una AI potrà mai guidare al livello 5 usando solo telecamere anziché telecamere + lidar/altri sensori, no?
Musk sostiene di sì. Tu sostieni di no. Ripeto, non sto parlando dei benchmark che puoi fare adesso, si parla del futuro (che poi secondo Musk sia dietro l'angolo e secondo i suoi ingegneri un po' meno è un altro discorso).
E io ho detto: siccome gli altri sostengono che non si possa fare, o comunque si sono buttati sul farlo usando sensori addizionali molto costosi, e Musk invece sta scommettendo sul fatto che non adesso, ma in un futuro prossimo, si potrà fare, io ho detto: se ha ragione, saranno ancora una volta 10 anni avanti agli altri perché avranno fatto in maniera molto meno costosa quello che gli altri fanno con hardware molto più costoso sia da produrre che da mantenere per i proprietari delle auto.
Spero di aver chiarito adesso.

Fabrizio

Si che c'è, la SAE (society of automotive engineers) ha le definizioni per ognuno dei 5 livelli....

Forse nn sono stato chiaro, la definizione è un enunciato spesso corredato da studi... Non mi risulta alcuna definizione che enuncia quello che sostieni.

Bob Malo

Una soluzione del genere non sarebbe conveniente per svariati motivi. Intanto perché non sarebbe giusto spremere l'hardware che i clienti ti hanno pagato profumatamente, in secondo luogo non avresti tutta la potenza di tutte le auto sempre a disposizione, quindi è potenza di calcolo che va e viene e questo non va bene, e anche se fosse non è detto che sia sufficiente o la soluzione più comoda, senza contare che in caso di problemi di connettività con qualche auto si potrebbero perdere dati in elaborazione e quindi dover ricominciare da capo o addirittura affidare la mole di dati a un'altra auto. Insomma, potenzialmente più problemi che benefici.

Funz

Trova tutte quelle che ci sono

Funz

eh, gli esseri umani sono capaci di guidare anche in condizioni estremamente avverse (nebbia, neve...) quando farebbero meglio a starsene a casa!

Funz

in realtà se tutte le auto fossero automatiche, i limiti potrebbero benissimo venire alzati...

Funz

cose che un computer calcola in una frazione di secondo, ben più rapidamente dei tuoi riflessi.

Funz

il cervello umano non prende decisioni meglio di un computer, anzi!
I tempi di risposta e la capacità di analisi e decisione in caso di emergenza di un computer sono enormemente superiori ad un essere umano, che tipicamente durante un incidente non è in grado di reagire adeguatamente.
Praticamente il 100% degli incidenti ha causa umana. E' chiaro qual è il fattore che va rimosso.

Fabrizio

Purtroppo o per fortuna lavoro nell'ambito, quindi i benchmark sono frequenti. Le soluzioni possono essere creative, innovative e più o meno affidabili, ma in quelle condizioni sfigate la parte di sensing e sensor fusion viene limitata, per cui ci si inventano workaround di conseguenza.
Escludendo di fatto quelle condizioni limite. E passando quindi al Liv.4

Fabrizio

La definizione sta in cosa consiste il livello 5 (che è appunto definito a livello di standard che seguono tutti tranne Musk), e la sua correlazione con i limiti tecnici delle videocamere in certe condizioni.
Se togliamo quelle condizioni sfigate passiamo automaticamente al Liv.4

pilistation

Aumenti il battery draning

Ma io non metto in dubbio "al momento" questo è poco ma sicuro.
io metto in dubbio il fatto che non si possa fare "per definizione" che ha un peso molto molto forte senza "definizione" a supporto.

Non ti ferma di colpo, intanto ci sarà un backup quindi seconda telecamera come dicevamo...

Lucasthelegend

eh ma appunto, nella mia si autodisattivano i sensori di prossimità se sono sporchi...mi immagino che bello fermarsi di colpo e accostare in autostrada. cmq si hai reso l'idea.

boosook

Se hai un muro di nebbia, l'AI non vede la strada e gli altri oggetti e agisce di conseguenza. C'è poco margine anche per il radar. Ho l'impressione che tu non abbia mai neanche guardato un video su come funziona la loro tecnologia.

Fabrizio

"Might Never", giusto per pararsi il lato B.
Il SW può fare miracoli, ma il principio di funzionamento delle telecamere la vedo dura che cambi nei prossimi anni. Se hai davanti un muro bianco di nebbia c'è poco margine per la fantasia

Fabrizio

Guarda non devo mica convincere nessuno, lavoro nel settore e al momento non esistono nemmeno radar che soddisfino i requisiti del Lev.5, ripeto funzionamento in TUTTE le condizioni. Le telecamere (ma anche i radar attuali) con nebbia e neve fitta ad esempio perdono di affidabilità.

Musk potrebbe inventarsi un suo livello/standard e lasciare in pace le norme ufficiali SAE

accakappa

Non serve avere un computer con la più alta capacità di calcolo se poi non esiste un software, o IA, che lo sappia sfruttare. Manco tu se ti dessero una Mercedes di F1 e Hamilton una semplice AMG riusciresti a batterlo. L'infotainment ? Guarda se fosse per me anche se mi dai un'auto senza le scimmiette e le ballerine sarebbe uguale. Non tutti ragionano come te, una volta che funziona se ha 1 o milioni di Gb chi se ne frega.
Poi per il fatto che nessuno abbia voluto "condividere" la tecnologia di Tesla anche un bambino lo capirebbe. Secondo te devo usare una tecnologia proprietaria di un altro e dipendere da lui ? Hai visto troppi film di fantascienza.

accakappa

Ti faccio solo un esempio semplice, il computer come fa ha stabilire se un tombino manca il tappo o è stato verniciato di nero o una buca e poco o troppo profonda ? Gli spara il laser ? o cosa fa se non pouò evitarla ferma il traffico e ci pensa ?

Fabrizio

perchè le telecamera con nebbia, neve fitta e altre condizioni avverse come si comportano? Ah già mi dimenticavo che sono tutti ingegneri AD con mille ore di test alle spalle quà dentro.
Peccato la realtà sia leggermente diversa, ma ormai gli adepti tesla sono peggio di quelli apple

Fabrizio

Non c'entra l'uomo come non c'entrano altri studi, quì si parla solo dei livelli ufficiali SAE che hanno le loro definizioni precise.
E per il livello 5 è esplicita la necessità di controllo completo in TUTTE le situazioni anche climaticamente avverse, dove le telecamera hanno dei limiti intrinsechi.
Se Musk vuole inventarsi i suoi livelli è libero di farlo.

Per fortuna invece gli ingegneri di Tesla sono più razionali del loro boss e chiariscono la situazione con le autorità

https://www.carscoops. com/2021/05/tesla-contradicts-their-boss-says-elons-statements-about-level-5-autonomous-tech-have-no-basis-in-engineering-reality/

Signor Rossi
Gianluigi

esatto

Giovanni Giorgi

Non sarebbe il caso di usare anche direttamente l'hardware delle auto?
Visto che è un lavoro parallelizzabile, di notte quando "dormono" attaccate all'alimentazione possono elaborare i dati raccolti durante l'utilizzo.
Poi si tratta giusto di inviarli all'unità centrale per una verifica dei risultati e l'aggregazione, magari analizzando comportamenti diverse in base alla zona geografica o altri fattori

Gianluigi

non capisco questo "spettro ambientale limitato". Le auto di Tesla e non solo girano già oggi. c'è per legge un autista di sicurezza, ma stanno già facendo milioni di km in molte parti del mondo, incluse alcune (Cina) dove il traffico è un vero disastro. Anche situazioni di meteo estremo mi pare sian già state vissute da queste IA. Il Dojo serve, se ho capito bene, proprio a questo: a trovare tutti i casi rari o rarissimi e permettere alla IA di copiare quanto fatto dall'autista umano.
Quindi, prima o poi - è una questione di km o di tempo - la IA avrà visto il 99% delle situazioni, poi il 99.9%, eccetera. Insomma, arriverà a trasportarci facilmente da casa al lavoro e magari ci vorrà un po' più di tempo per gestire quelle eventualità parecchio rare.
O ho capito io completamente male cosa stanno cercando di fare Tesla e concorrenti?

accakappa

Sul primo punto mi sa che non hai letto bene, io non ho detto che bisogna sviluppare differenti soluzioni. Ho fatto notare che è una gran boiata se ognuno si sviluppa la sua soluzione, il che è l'opposto. Perchè è una boiata ? Semplicemente perchè i sistemi di bordo di marche diverse parlano "lingue diverse", ergo non sono "compatibili" tra loro perchè ogni casa sviluppa sistemi ad hoc con codici sorgente proprietari, nonostante potrebbero invece "parlare" tra loro essendo dotati di sim. Un esempio lampante lo hai tra un iPhones e un Android, tutte e due fanno le stesse cose ma se dovessero idealmente incrociarsi su una strada finirebbero per fare cose assurde perchè uno non sa cosa farà e come agirà l'altro. Oltre al fatto poi che i veicoli si "parlino" tra loro non basta perchè questi si devono confrontare con l'infrastruttura fissa del territorio circostante. Quindi traffico (certo e uguale per tutti non che ognuno rilevi il suo ad mxxxxa), cambio di vie e segnaletica, cantieri stradali con limitazione/apertura/chiusura/deviazione di strade, zone a traffico limitato o limitazioni in base a orari o giorni, incidenti, semafori che non funzionano, manifestazioni, rilevamento parcheggi liberi/occupati, disposizioni di sicurezza della polizia locale, ecc.ecc. e tutto in tempo reale. Sulla IA che prende decisioni più velocemente è naturale, già un computer lo fa da anni. Quello su cui ti sbagli è che le prenderà in modo corretto più velocemente se non ne la mai provate visto che la IA si basa sull'apprendimento. Ma se una cosa ti capita una o due volte nella vita starai sicuro che la IA fallirà. Ergo l'uomo invece ha la capacità di trovare invece soluzioni alternative anche se mai sperimentate prima perchè prende le informazioni base da altre esperienze, le mette insieme, ci ragiona intersecando le similitudini e applica la soluzione. E una IA non è e non ne sarà mai capace perchè tu stai parlando di "IA Forte" ovvero la capacità in tutto e per tutto di una IA di replicare perfettamente la mente umana. Le IA sulle auto sarà quella "Debole" ovvero una intelligenza che potrà prendere si decisioni in modo veloce e sicuro ma su uno spettro ambientale delimitato. Esempio il computer, quello serio, contro cui si gioca a scacchi. Per questo tra un'auto a guida autonoma e una guidata da un umano quest'ultima sarà più agile, più intuitiva e meno elaborata di una IA pur rimanendo nei limiti del codice stradale. Pensa solo al traffico di 4 strade intasate che confluiscono in una rotonda. Se le auto non parlano e ragionano la stessa lingua traendo informazioni dall'ambiente circostante sarà un gran casino, nulla più.

Magari si ferma l'automobile... guarda che le automobili parcheggiano da sole e l'uomo è sprovvisto di sensori prossimità di frenata di emergenza in caso di ostacolo.

Lucasthelegend

se si spiaccica una bella foglia umida autunnale sulla telecamera voglio vedere se funziona ancora..magari metteranno un tergicristallo anche per le telecamere?

Gli occhi sono sensori non telecamere. Sicuramente è nel cervello la differenza, ma non mi hai convinto.... io non credo che vi sia alcun enunciato che dica che la guida con due telecamere sia impossibile.
Credo invece che la guida autonoma sia abbastanza fattibile il problema non è certo il numero di telecamere, ma negli effetti di rete...

multi.vac

il cervello umano è lento a fare moltiplicazioni in sequenza, riesce però a stimare la velocità di un veicolo e decidere se attraversare o no la strada senza dover impostare un sistema di equazioni a 12 variabili.

Sono capacità non matematiche che è difficile riportare matematicamente su un computer.

boosook

Quell'ingegnere dice solo che non ce la faranno mai nei tempi promessi da Musk, non dice assolutamente che non sarà mai possibile. Nessun ingegnere serio lo direbbe. Nessun ingegnere o scienziato competente farebbe una previsione assoluta del futuro basandosi sullo stato delle tecnologie attuali.

boosook

Ma come cosa c'entra l'uomo... l'uomo riesce a guidare autonomamente usando solo la visione, quindi non si capisce perché in futuro non potrà farlo un'intelligenza artificiale. Altrimenti, visto che sostieni che non sia possibile farlo "per definizione", porta le prove, tipo studi scientifici che dimostrino matematicamente che per arrivare al livello 5 sarà sempre necessario un lidar e non sarà mai possibile farlo con sole telecamere.

tiziano
Fabrizio

Cosa centra l'uomo? Si parla di standard ufficiali automotive non di idee di gente a caso o nomi commerciali che non significano nulla come il "full self driving"

Fabrizio

tu hai per caso delle videocamere al posto degli occhi? Pieno di robot qua dentro

Fabrizio

Guida completa in TUTTE le condizioni.
Incluse quelle climatiche avverse, tipi di strada ecc.
E per i geni quì sotto: gli occhi e gli elementi sensoriali di un uomo non sono (fortunatamente) telecamere, e le definizioni SAE non fanno alcun paragone diretto con la guida umana.

Per questo Musk può inventarsi i suoi livelli e nomi commerciali senza problemi, ma gli standard sono un'altra cosa.

Per fortuna i suoi ingegneri sono più svegli, chiarificando che le dichiarazioni di Musk non hanno senso nella "engineering reality"
https://www.carscoops. com/2021/05/tesla-contradicts-their-boss-says-elons-statements-about-level-5-autonomous-tech-have-no-basis-in-engineering-reality/

Va bene, hai ragione, motivo. Parli di sviluppare differenti soluzioni ma dimentichi che comunque tutte dovranno rispettare determinate regole già esistenti (stradali) e altre che verranno man mano introdotte dai vari stati o dall'UE. A tendere tutti i veicoli saranno connessi (in gran parte già lo sono ora, trovami un veicolo senza centralina con sim). Sulla parte del cervello umano sbagli, sai meglio di me che un calcolatore è molto più rapido dell'uomo, il punto è che ad oggi l'uomo è sicuramente più capace di prendere decisioni "corrette" ma le IA lo faranno da qui a breve. Il fine ultimo comunque non è arrivare a 0 con gli incidenti mortali o meno (è impossibile) ma ridurre di gran numero gli incidenti stradali con morti e che piaccia o no l'unica soluzione applicabile è quella di fornire all'uomo nmila sostegni e aiuti fino appunto ad evitare di farlo guidare.

Cioè? E quale sarebbe l’enunciato della definizione che rende impossibile la guida di lvl 5 impossible con due cam.
L’uomo guida co una telecamera in un Dome con sensore doppio a 180, se gira il corpo copre i 360 con sforzo.

MatitaNera

Mi fa piacere.

Auto

ABB E-mobility: in Italia il più grande impianto di stazioni di ricarica DC | Video

Auto

Lightyear 0, abbiamo guidato l'auto che si ricarica con il Sole | Video

Articolo

MiMo 2022: i numeri e le nostre interviste al pubblico | Video

Auto

MINI Cooper SD Clubman ALL4, quella diesel da 190 CV | Recensione e Video