Rethinking the Efficiency and Effectiveness of Reinforcement Learning for Radiology Report Generation
Questo studio propone un nuovo approccio all'apprendimento per rinforzo per la generazione di referti radiologici che, combinando una strategia di campionamento basata sulla diversità diagnostica e un'ottimizzazione della politica ponderata sui token diagnostici (DiTPO), raggiunge prestazioni all'avanguardia con una frazione significativa dei dati di addestramento rispetto ai metodi esistenti.