CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication
El artículo presenta CovertComBench, un nuevo banco de pruebas especializado para evaluar las capacidades de los Grandes Modelos de Lenguaje (LLM) en comunicaciones encubiertas inalámbricas, revelando que, aunque son eficaces en tareas conceptuales y de generación de código, carecen de la fiabilidad necesaria para realizar las derivaciones matemáticas complejas exigidas por las garantías de seguridad.