Measuring Complexity at the Requirements Stage: Spectral Metrics as Development Effort Predictors

Este estudo demonstra que métricas espectrais extraídas de redes estruturais de requisitos, utilizando integração molecular como proxy controlado, preveem o esforço de integração com correlações superiores a 0,95, preenchendo uma lacuna crítica na quantificação da complexidade em engenharia de requisitos.

Maximilian Vierlboeck, Antonio Pugliese, Roshanak Nilchian, Paul Grogan, Rashika Sugganahalli Natesh Babu2026-03-10💬 cs.CL

Listen to the Layers: Mitigating Hallucinations with Inter-Layer Disagreement

O artigo apresenta o CoCoA, um algoritmo de decodificação sem treinamento que mitiga alucinações em Grandes Modelos de Linguagem ao penalizar gerações instáveis detectadas pela desconfiança entre camadas internas, melhorando significativamente a factualidade em diversas tarefas sem necessidade de re-treinamento do modelo.

Koduvayur Subbalakshmi, Sabbir Hossain Ujjal, Venkata Krishna Teja Mangichetty, Nastaran Jamalipour Soofi2026-03-10💬 cs.CL

Discovering Semantic Latent Structures in Psychological Scales: A Response-Free Pathway to Efficient Simplification

Este artigo apresenta um novo quadro de trabalho baseado em processamento de linguagem natural que utiliza modelagem de tópicos e agrupamento semântico para simplificar escalas psicológicas sem depender de dados de resposta, conseguindo reduzir o número de itens em cerca de 60,5% enquanto preserva a estrutura fatorial e a consistência interna das escalas originais.

Bo Wang, Yuxuan Zhang, Yueqin Hu, Hanchao Hou, Kaiping Peng, Shiguang Ni2026-03-10🤖 cs.LG

Towards interpretable models for language proficiency assessment: Predicting the CEFR level of Estonian learner texts

Este estudo desenvolveu modelos de aprendizado de máquina interpretáveis para classificar automaticamente textos de aprendizes de estoniano nos níveis do CEFR (A2-C1), utilizando seleção cuidadosa de características linguísticas e de erros para alcançar alta precisão e insights sobre o desenvolvimento da proficiência, com implementação prática em um ambiente de aprendizado de idiomas de código aberto.

Kais Allkivi2026-03-10💬 cs.CL

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

O artigo propõe uma hierarquia de cinco níveis de aprendibilidade baseada na estrutura de informação dos problemas, argumentando que a geração de código avança mais rapidamente que o aprendizado por reforço devido à sua verificação densa e local, e que o progresso futuro da IA depende mais da natureza aprendível das tarefas do que apenas do aumento do tamanho dos modelos.

Zhimin Zhao2026-03-10🤖 cs.LG

Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion

O artigo apresenta o CogitoRAG, um framework de Geração Aumentada por Recuperação (RAG) inspirado na memória episódica humana que utiliza extração de "gist" semântico, difusão global em grafos de conhecimento e um algoritmo de reclassificação cognitiva para superar as limitações de integridade semântica e melhorar o raciocínio em tarefas complexas.

Pengcheng Zhou, Haochen Li, Zhiqiang Nie, JiaLe Chen, Qing Gong, Weizhen Zhang, Chun Yu2026-03-10💬 cs.CL

Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

O artigo apresenta o Emotion Collider (EC-Net), uma estrutura baseada em hipergrafos e embeddings no espaço hiperbólico que utiliza aprendizado contrastivo e fusão bidirecional para gerar representações de emoção robustas e semanticamente coerentes, demonstrando alta eficácia em benchmarks multimodais mesmo na presença de ruído ou dados parciais.

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon Fong2026-03-10🤖 cs.LG

Condition-Gated Reasoning for Context-Dependent Biomedical Question Answering

Este artigo apresenta o CondMedQA, o primeiro benchmark para perguntas e respostas biomédicas condicionais, e propõe o framework Condition-Gated Reasoning (CGR), que utiliza grafos de conhecimento conscientes de condições para melhorar a precisão do raciocínio médico ao adaptar as respostas às características específicas dos pacientes.

Jash Rajesh Parekh, Wonbin Kweon, Joey Chan, Rezarta Islamaj, Robert Leaman, Pengcheng Jiang, Chih-Hsuan Wei, Zhizheng Wang, Zhiyong Lu, Jiawei Han2026-03-10💬 cs.CL

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

O artigo apresenta o MrBERT, uma família de codificadores multilingues modernos e eficientes, otimizados para desempenho de ponta em tarefas específicas de catalão e espanhol, bem como em domínios especializados como biomedicina e direito, com suporte a tamanhos de vetor flexíveis para reduzir custos de inferência.

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta Villegas2026-03-10🤖 cs.LG

KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging

O artigo apresenta o KVSlimmer, um método que estabelece um fundamento teórico para a assimetria do cache KV e propõe uma solução de otimização sem gradiente, eficiente em memória e tempo, que supera os métodos atuais ao reduzir custos computacionais e latência enquanto melhora o desempenho em tarefas de longo contexto.

Lianjun Liu, Hongli An, Weiqi Yan, Xin Du, Shengchuan Zhang, Huazhong Liu, Yunshan Zhong2026-03-10💬 cs.CL

No Memorization, No Detection: Output Distribution-Based Contamination Detection in Small Language Models

O artigo demonstra que, para modelos de linguagem pequenos, o método de detecção de contaminação baseado na distribuição de saída (CDD) é ineficaz e supera em desempenho métodos baseados em probabilidade, como perplexidade e Min-k% Prob, pois sua eficácia depende criticamente da memorização verbatim que raramente ocorre nesses modelos.

Omer Sela (Tel Aviv University)2026-03-10💬 cs.CL