Exploring Semantic Labeling Strategies for Third-Party Cybersecurity Risk Assessment Questionnaires
Este artigo investiga estratégias de rotulagem semântica para questionários de avaliação de riscos de terceiros, demonstrando que um pipeline híbrido semi-supervisionado (SSSL) que combina clustering, rotulagem por LLM em subconjuntos representativos e propagação de rótulos pode melhorar a recuperação de controles de segurança com menor custo e uso de LLM em comparação com métodos diretos.