Dynamic Adversarial Reinforcement Learning for Robust Multimodal Large Language Models
Deze paper introduceert AOT-SFT en het AOT-framework, een zelfspelend systeem dat een co-evolutie tussen een aanvallende beeldbewerker en een verdedigende multimodale taalmodel stimuleert om de perceptuele robuustheid en betrouwbaarheid van deze modellen te vergroten.