Veicoli autonomi: interazioni migliori con i passeggeri grazie a ChatGPT | Studio
Tutti i risultati di questa ricerca, arricchita dai test sul campo
Un team di ingegneri della Purdue University ha condotto una ricerca pionieristica sull'interazione tra passeggeri e veicoli autonomi. Lo studio, che sarà presentato alla 27a Conferenza Internazionale IEEE sui Sistemi di Trasporto Intelligenti il 25 settembre, suggerisce che l'integrazione di LLM come ChatGPT potrebbe permettere ai veicoli autonomi di interpretare e rispondere ai comandi dei passeggeri in modo più naturale e umano.
Il professor Ziran Wang, assistente presso la Lyles School of Civil and Construction Engineering della Purdue e leader dello studio, sottolinea l'importanza di questa ricerca:
"Per essere veramente autonomi, i veicoli dovranno capire tutto ciò che i loro passeggeri comandano, anche quando il comando è implicito."
Wang paragona questa capacità a quella di un tassista esperto che sa come reagire quando un passeggero dice di avere fretta, senza bisogno di specificare il percorso da seguire per evitare il traffico. L'esperimento ha coinvolto un veicolo autonomo di livello 4 (il penultimo livello prima della completa autonomia) equipaggiato con modelli linguistici accessibili tramite cloud. Quando il sistema di riconoscimento vocale del veicolo rilevava un comando da parte di un passeggero, i modelli linguistici nel cloud interpretavano il comando tenendo conto di parametri predefiniti come regole del traffico, condizioni stradali e meteo. Successivamente, generavano istruzioni per il sistema drive-by-wire del veicolo, controllando acceleratore, freni, cambio e sterzo.
I risultati sono stati sorprendenti. I partecipanti allo studio hanno espresso un tasso di disagio inferiore rispetto ai dati su come le persone tendono a sentirsi quando viaggiano su un veicolo autonomo di livello 4 senza l'assistenza di modelli linguistici. Inoltre, il veicolo ha superato tutti i valori di riferimento per una guida sicura e confortevole, anche quando rispondeva a comandi che i modelli non avevano precedentemente imparato.
Questo approccio innovativo potrebbe superare le limitazioni dei sistemi convenzionali di interfaccia utente nei veicoli, che richiedono comandi espliciti e precisi.
"Il potere dei modelli linguistici di grandi dimensioni è che possono comprendere in modo più naturale tutti i tipi di cose che dici. Non credo che nessun altro sistema esistente possa farlo."
Tuttavia, lo studio ha anche evidenziato alcune sfide. I modelli linguistici hanno impiegato in media 1,6 secondi per elaborare un comando del passeggero, un tempo considerato accettabile in scenari non critici, ma che necessita di miglioramenti per situazioni che richiedono risposte più rapide. Inoltre, come tutti i modelli linguistici di grandi dimensioni, anche quelli utilizzati nello studio sono soggetti al fenomeno delle "allucinazioni", ovvero interpretazioni errate delle informazioni apprese.