LEDOM: Reverse Language Model
Il paper introduce LEDOM, un modello linguistico autoregressivo addestrato esclusivamente da destra a sinistra che sviluppa capacità di ragionamento uniche e, combinato con modelli forward tramite il meccanismo "Reverse Reward", riduce le allucinazioni e migliora significativamente le prestazioni su compiti matematici complessi.