CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication
本論文は、無線秘匿通信の厳格な検出理論制約下での LLM 能力を評価する新たなベンチマーク「CovertComBench」を提案し、概念理解やコード生成では高い性能を示すものの、セキュリティ保証に必要な高度な数学的導出においては大幅な性能不足があることを明らかにし、信頼性の高い無線 AI システム構築には外部ツールの活用が不可欠であると結論付けています。