CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication
Il paper introduce CovertComBench, il primo banco di prova specifico per valutare le capacità dei Large Language Models nella comunicazione wireless covert, rivelando che, sebbene eccellano nella comprensione concettuale e nella generazione di codice, mostrano gravi carenze nelle derivazioni matematiche necessarie per garantire la sicurezza, suggerendo la necessità di un'architettura basata su strumenti esterni per sistemi affidabili.