Illustrazione dell'addestramento dei veicoli autonomi e del motore di dati di Tesla

L'idea di imparare a guidare può portarti indietro nel tempo a quando da adolescente sedevi al volante con i tuoi genitori nel sedile del passeggero. Ma per gli ingegneri che progettano i veicoli autonomi, imparare a guidare significa tuffarsi in una serie impressionante di dati, creando algoritmi di reti neurali complessi e compiendo anni di piccoli miglioramenti.

Nell'addestramento dei veicoli autonomi, grandi team di ingegneri esperti di hardware e software utilizzano dati, sistemi di simulazione e infrastrutture di addestramento per l'intelligenza artificiale (IA) all'avanguardia per preparare i veicoli autonomi per la strada.

In qualità di leader del settore dei veicoli autonomi, Tesla ha sviluppato un'infrastruttura di apprendimento automatico complessa per addestrare in maniera iterativa i propri computer per la guida autonoma completa (FSD) al fine di superare le sfide del mondo reale e allo stesso tempo migliorare i set di dati per l'addestramento di Tesla.

In questo articolo, esamineremo le basi del flusso di lavoro del motore di dati di Tesla per scoprire in che modo i dati generati dalle auto di Tesla vengono utilizzate in maniera retroattiva per addestrare nuovamente le stesse auto in futuro.

Cos'è il motore di dati di Tesla?

Il "motore di dati" Tesla è un pilastro fondamentale nella corsa all'autonomia. Questo flusso di lavoro di dati unico nel suo genere utilizza esempi di guida del mondo reale per eseguire in maniera iterativa gli algoritmi di apprendimento automatici che vengono poi impiegati per addestrare le reti neurali per la guida autonoma.

Tesla fa tutto questo in maniera egregia; ogni auto è dotata di un computer FSD che esegue di pari passo due sistemi FSD. Un computer FSD viene utilizzato per guidare il veicolo e pilotarlo quando è attivo il pilota automatico, mentre l'altro computer FSD è costantemente in funzione in "modalità nascosta".

La modalità nascosta funziona come se stesse realmente controllando l'auto. Tuttavia, quando il conducente fa qualcosa di diverso da quello che avrebbe dovuto fare o la rete neurale segnala di non saper cosa fare nello scenario che si presenta, annota tale evento come un'imprecisione. Poiché Tesla registra queste imprecisioni nella memoria, può raccoglierle in modo retroattivo.

Supponiamo che Tesla rilevi delle imprecisioni in circostanze simili. In tal caso, può cercare condizioni di guida simili che si sono verificate in altre auto della flotta Tesla, persino se l'imprecisione non è stata rilevata.

Tesla può quindi raccogliere esempi contestuali simili. Grazie a questi set di dati ben etichettati di nuova creazione, Tesla può addestrare nuovamente la propria rete neurale affinché reagisca meglio allo scenario in cui si sono presentate tali imprecisioni. Una volta che la rete neurale è stata addestrata nuovamente, può essere distribuita alla "modalità nascosta" e raccogliere nuovi esempi di dati per ulteriori imprecisioni.

Raccolta dati Tesla a livello elevato

La rappresentazione visiva nell'immagine di seguito illustra la natura ciclica della raccolta di dati Tesla e la strategia di iterazione. Innanzitutto, i dati vengono raccolti all'origine (il computer FSD di Tesla). Successivamente, il veicolo identifica un'imprecisione. Tale imprecisione entra nei test delle unità di Tesla al fine di verificarne la legittimità e che non sia il risultato di una guida scadente da parte di un conducente umano.

Se l'imprecisione viene ritenuta legittima, Tesla richiede alla propria flotta altri esempi in cui si sono verificate delle imprecisioni. Tali esempi vengono quindi etichettati correttamente da una persona fisica e quindi utilizzati per addestrare la rete neurale. La rete viene quindi ridistribuita all'origine dati per raccogliere altre imprecisioni.

Concorrenza nel settore dell'automotive

Quando Tesla ha introdotto per la prima volta il suo "motore di dati" nel corso della giornata dedicata all'autonomia organizzata da Tesla nel 2019, ovviamente ha suscitato l'invidia del resto del settore dell'automotive

In una conversazione con Reuters nel 2020, il CEO di Audi ha affermato che "Tesla è due anni avanti in termini di architettura di calcolo e software e di guida autonoma". A partire dalla nascita, questa enorme infrastruttura di generazione dei dati, raccolta di materiali di addestramento, conoscenza, iterazione dell'addestramento, distribuzione e meccanismo di riesecuzione è stata estremamente ben progettata.

Il "motore di dati" presentava integrazioni di supporto in ogni fase della catena di dati, richiedendo un'architettura iniziale di raccolta, trasferimento e calcolo dei dati. Le automobili Tesla, ad esempio, possono supportare a livello funzionale la connettività wireless al database centrale di Tesla nonché il calcolo e la raccolta dati in modalità nascosta, il tutto mentre vengono eseguiti gli algoritmi dei veicoli autonomi distribuiti in produzione. Come evidente, nessun altro produttore del settore automotive disponeva di un'infrastruttura di raccolta dati dei veicoli autonomi dello stesso grado di robustezza e maturità di Tesla.

Identificazione dei casi limite e iterazione

Una delle funzioni più importanti del motore di dati è la capacità di rilevare le imprecisioni tra la guida umana o le reti neurali di produzione rispetto alla rete neurale distribuita in modalità nascosta. Nella presentazione in occasione della giornata dell'autonomia, Tesla ha utilizzato l'esempio del rilevamento delle imprecisioni di guida in presenza di bici sulla strada per illustrare la complessità dell'infrastruttura di apprendimento automatico di Tesla e la sua capacità di identificare tali imprecisioni.

Nell sue reti neurali di produzione, Tesla riteneva che fosse fondamentale evitare le bici, dato che spesso queste sono occupante da persone che le guidano. Se fosse stato necessario che un veicolo Tesla impattasse con un oggetto, la collisione sarebbe avvenuta con un'altra automobile piuttosto che con una bici, poiché le possibilità di protezione del conducente di un'auto sono maggiori di quelle di una bici.

Tuttavia, Tesla ha notato che in alcuni casi le bici si trovavano al centro della strada, vicinissime ad altre auto, per cui si attivava la rete neurale nascosta per indicare di non sapere cosa fare rispetto al comportamento del conducente. In alternativa, Tesla poteva aver notato che quando la rete neurale del pilota automatico di produzione era in funzione e una bici veniva identificata "al centro della strada", era possibile che i conducenti fossero intervenuti per "correggere" il percorso dell'auto.

Quando Tesla riceveva la notifica, i tecnici che si occupavano di etichettare i dati controllavano l'imprecisione e scoprivano che si verificava quando le auto montavano dei portabici.

Per le persone fisiche, questo evento sarebbe stato semplicemente una nuova occorrenza, ma questi dati di addestramento hanno rivelato una difficoltà fondamentale per la rete neurale di produzione nelle auto a guida autonoma. In questo scenario, Tesla ha quindi chiesto alla propria flotta di veicoli abilitati a FSD di cercare altri eventi che potevano contenere una bici su un'auto o vicino a un'auto.

Questi esempi di dati sono stati quindi inviati ai tecnici addetti all'etichettatura dei dati che hanno identificato correttamente una bici reale, un bici montata dietro un'auto e una bici montata su un'auto oppure nessuno di questi casi. Utilizzando il set di dati appena raccolti ed etichettati, è stato possibile addestrare nuovamente la versione beta della rete neurale con i data center di apprendimento automatico di Tesla e ridistribuirla alla flotta in modo da essere eseguita in modalità nascosta e iterata.

Grazie al suo motore di dati, Tesla può creare nuove versioni software utilizzando quanto appreso dalle implementazioni della modalità nascosta e le iterazioni dell'addestramento rapide. Il genio dell'infrastruttura di raccolta dei dati di Tesla sta nel fatto che elenca esempi di dati della vita reale e usa conducenti umani per addestrare i propri modelli di apprendimento automatico. In definitiva, il motore di dati di Tesla accelera l'addestramento della rete neurale raccogliendo rapidamente dati di addestramento delle auto a guida autonoma della vita reale ben catalogati e utilizzandoli attivamente per condurre verifiche iterative dell'apprendimento automatico.

Raccolta di dati di Tesla: lo strumento vincente

Altre aziende del settore dei veicoli autonomi dispongono di metodi proprietari di addestramento dei loro veicoli autonomi, ma nessuno opera a livello di Tesla. Grazie alla presenza di auto in tutto il mondo, Tesla è in grado di raccogliere una quantità maggiore di dati sulla guida autonoma e di imprecisioni di casi limite e di utilizzarli per addestrare le proprie reti neurali.

Molte altre aziende dispongono di meccanismi estremamente robusti di simulazioni di addestramento e raccolta di dati, ma spesso, l'ambito del loro lavoro si limita a una singola città o regione. In ogni caso, i dati generati da auto autonome, a questo punto solo veicoli semi-autonomi, sono inevitabilmente la chiave che spalancherà la porta alle auto autonome.


ArrowPerks-Loyalty-Program-Signup-banner-IT


Ultime notizie

Sorry, your filter selection returned no results.

Non perderti le ultime novità sull'elettronica

Abbiamo aggiornato la nostra politica sulla privacy. Si prega di prendere un momento per rivedere questi cambiamenti. Cliccando su Accetto, l'utente accetta la Politica sulla privacy e Condizioni di utilizzo di Arrow Electronics.

Il nostro sito web mette i cookies sul vostro dispositivo per migliorare la vostra esperienza e il nostro sito. Leggete altre informazioni sui cookies che usiamo e su come disabilitarli qui. I cookies e le tecnologie di tracking possono essere usati per scopi commerciali.

Con un click su “Accept”, voi consentite l'inserimento dei cookies sul vostro dispositivo e l'uso da parte nostra di tecnologie di tracking. Per avere altre informazioni e istruzioni su come disabilitare i cookies e le tecnologie di tracking, clickate su “Read More” qui sotto. Mentre l'accettazione dei cookies e delle tecnologie di tracking è volontaria, una loro disabilitazione potrebbe determinare un funzionamento non corretto del sito web, ed alcuni messaggi di allarme potrebbero essere per voi meno importanti.

Noi rispettiamo la vostra privacy. Leggete qui la nostra politica relativa alla privacy