I modelli linguistici di grandi dimensioni – LLM – possono auto-migliorarsi

Grandi passi avanti verso un mondo migliore che esclude la violenza, la stupidità e idiozia della guerra, la “sostituzione etnica” e molte altre idiozie di destra e di sinistra. Dobbiamo smettere di occuparsi dei problemi delle élite e concentrarsi su quelli che la stragrande maggioranza delle persone affronta, a volte con estrema difficoltà, ogni santo giorno.

AD

Uno studio intitolato “I MODELLI LINGUISTICI DI GRANDI DIMENSIONI POSSONO AUTO-MIGLIORARSI” propone un metodo chiamato Language Model Self-Improvement (LMSI) che consente ai modelli linguistici di grandi dimensioni (LLM) di migliorare le loro prestazioni nei compiti di ragionamento senza utilizzare alcuna etichetta di verità fondamentale. Il metodo LMSI genera dati di autoformazione utilizzando l’LLM per rispondere alle domande e quindi utilizza tali risposte come etichette di formazione. Il metodo LMSI utilizza anche una tecnica di decodifica multi-percorso per generare diversi percorsi di ragionamento, che vengono utilizzati per addestrare l’LLM con autoconsistenza.

I risultati mostrano che il metodo LMSI proposto può migliorare significativamente le prestazioni del LLM su sei diversi benchmark di ragionamento, ottenendo nuovi risultati all’avanguardia su tre di essi. Il documento dimostra anche che il metodo LMSI può essere utilizzato per distillare la conoscenza da un grande LLM a quelli più piccoli. Gli autori prevedono di combinare i dati generati da LMSI con dati supervisionati in futuro per migliorare ulteriormente le prestazioni LLM.

In parole povere

La svolta in questa ricerca è che un tipo di intelligenza artificiale chiamato Large Language Model (LLM) può imparare a migliorare le proprie prestazioni su una varietà di compiti generando i propri dati di addestramento senza la necessità di fonti esterne di dati etichettati o interventi manuali di sintonizzazione da parte dell’uomo.

In altre parole, il modello può insegnare a se stesso a migliorare sempre di più in un’attività senza bisogno che gli esseri umani etichettano grandi quantità di dati o regolino manualmente i parametri del modello. Questo è importante perché può rendere molto più semplice ed efficiente lo sviluppo e il miglioramento dei modelli di intelligenza artificiale e potrebbe portare a progressi significativi in ​​un’ampia gamma di applicazioni, dalla traduzione linguistica al riconoscimento delle immagini alla diagnosi medica.

Ecco il documento completo: Here is the full paper: 2210.11610.pdf (arxiv.org)2210.11610.pdf (arxiv.org)

____________________________________________________________________________

https://www.asterios.it/catalogo/epimente