Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO
Deze paper introduceert CoIPO, een methode die gebruikmaakt van contrastief leren en inverse directe voorkeursoptimalisatie om de intrinsieke weerstand van grote taalmodellen tegen ruis in prompts te verbeteren, wat resulteert in een aanzienlijke prestatieverbetering op de nieuwe NoisyPromptBench-benchmark.