cs.CL artigos | Gist.Science

Measuring Complexity at the Requirements Stage: Spectral Metrics as Development Effort Predictors

Este estudo demonstra que métricas espectrais extraídas de redes estruturais de requisitos, utilizando integração molecular como proxy controlado, preveem o esforço de integração com correlações superiores a 0,95, preenchendo uma lacuna crítica na quantificação da complexidade em engenharia de requisitos.

Maximilian Vierlboeck, Antonio Pugliese, Roshanak Nilchian, Paul Grogan, Rashika Sugganahalli Natesh Babu2026-03-10💬 cs.CL

Listen to the Layers: Mitigating Hallucinations with Inter-Layer Disagreement

O artigo apresenta o CoCoA, um algoritmo de decodificação sem treinamento que mitiga alucinações em Grandes Modelos de Linguagem ao penalizar gerações instáveis detectadas pela desconfiança entre camadas internas, melhorando significativamente a factualidade em diversas tarefas sem necessidade de re-treinamento do modelo.

Koduvayur Subbalakshmi, Sabbir Hossain Ujjal, Venkata Krishna Teja Mangichetty, Nastaran Jamalipour Soofi2026-03-10💬 cs.CL

Neuro-Symbolic Synergy for Interactive World Modeling

O artigo apresenta o NeSyS, um framework neuro-simbólico que integra as capacidades semânticas probabilísticas de modelos de linguagem com regras simbólicas executáveis para criar modelos de mundo interativos mais robustos e expressivos, reduzindo a necessidade de dados de treinamento em 50% sem perda de precisão.

Hongyu Zhao, Siyu Zhou, Haolin Yang, Zengyi Qin, Tianyi Zhou2026-03-10💬 cs.CL

Learning Page Order in Shuffled WOO Releases

Este artigo investiga a reordenação de páginas em documentos WOO holandeses desordenados, demonstrando que, embora modelos especializados alcancem alta precisão em documentos curtos, os transformadores seq2seq falham em generalizar para textos longos devido à necessidade de estratégias de ordenação distintas, um desafio mitigado com sucesso pelo uso de modelos especializados.

Efe Kahraman, Giulio Tosato2026-03-10🤖 cs.LG

Discovering Semantic Latent Structures in Psychological Scales: A Response-Free Pathway to Efficient Simplification

Este artigo apresenta um novo quadro de trabalho baseado em processamento de linguagem natural que utiliza modelagem de tópicos e agrupamento semântico para simplificar escalas psicológicas sem depender de dados de resposta, conseguindo reduzir o número de itens em cerca de 60,5% enquanto preserva a estrutura fatorial e a consistência interna das escalas originais.

Bo Wang, Yuxuan Zhang, Yueqin Hu, Hanchao Hou, Kaiping Peng, Shiguang Ni2026-03-10🤖 cs.LG

Towards interpretable models for language proficiency assessment: Predicting the CEFR level of Estonian learner texts

Este estudo desenvolveu modelos de aprendizado de máquina interpretáveis para classificar automaticamente textos de aprendizes de estoniano nos níveis do CEFR (A2-C1), utilizando seleção cuidadosa de características linguísticas e de erros para alcançar alta precisão e insights sobre o desenvolvimento da proficiência, com implementação prática em um ambiente de aprendizado de idiomas de código aberto.

Kais Allkivi2026-03-10💬 cs.CL

A Geometric Taxonomy of Hallucinations in LLMs

Este artigo propõe uma taxonomia geométrica de alucinações em LLMs, classificando-as em três tipos e introduzindo índices de detecção baseados em espaço de embeddings que demonstram alta eficácia na identificação de desvios de contexto e confabulações, ao mesmo tempo que expõem limitações metodológicas na detecção de erros factuais.

Javier Marín2026-03-10💬 cs.CL

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

O artigo propõe uma hierarquia de cinco níveis de aprendibilidade baseada na estrutura de informação dos problemas, argumentando que a geração de código avança mais rapidamente que o aprendizado por reforço devido à sua verificação densa e local, e que o progresso futuro da IA depende mais da natureza aprendível das tarefas do que apenas do aumento do tamanho dos modelos.

Zhimin Zhao2026-03-10🤖 cs.LG

Explainable Token-level Noise Filtering for LLM Fine-tuning Datasets

O artigo apresenta o XTF, um framework de filtragem de ruído em nível de token que melhora significativamente o desempenho de modelos de linguagem grandes (LLMs) em tarefas de ajuste fino ao decompor a contribuição dos dados em atributos explicáveis e mascarar gradientes de tokens ruidosos.

Yuchen Yang, Wenze Lin, Enhao Huang, Zhixuan Chu, Hongbin Zhou, Lan Tao, Yiming Li, Zhan Qin, Kui Ren2026-03-10💬 cs.CL

Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion

O artigo apresenta o CogitoRAG, um framework de Geração Aumentada por Recuperação (RAG) inspirado na memória episódica humana que utiliza extração de "gist" semântico, difusão global em grafos de conhecimento e um algoritmo de reclassificação cognitiva para superar as limitações de integridade semântica e melhorar o raciocínio em tarefas complexas.

Pengcheng Zhou, Haochen Li, Zhiqiang Nie, JiaLe Chen, Qing Gong, Weizhen Zhang, Chun Yu2026-03-10💬 cs.CL

Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

O artigo apresenta o Emotion Collider (EC-Net), uma estrutura baseada em hipergrafos e embeddings no espaço hiperbólico que utiliza aprendizado contrastivo e fusão bidirecional para gerar representações de emoção robustas e semanticamente coerentes, demonstrando alta eficácia em benchmarks multimodais mesmo na presença de ruído ou dados parciais.

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon Fong2026-03-10🤖 cs.LG

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

O artigo apresenta o ModalImmune, um framework de treinamento que garante imunidade a falhas em sistemas multimodais ao colapsar intencionalmente canais de entrada durante o aprendizado, resultando em representações conjuntas robustas e estáveis frente a remoções ou corrupções de modalidades.

Rong Fu, Jia Yee Tan, Zijian Zhang, Ziming Wang, Zhaolu Kang, Muge Qi, Shuning Zhang, Simon Fong2026-03-10🤖 cs.LG

Condition-Gated Reasoning for Context-Dependent Biomedical Question Answering

Este artigo apresenta o CondMedQA, o primeiro benchmark para perguntas e respostas biomédicas condicionais, e propõe o framework Condition-Gated Reasoning (CGR), que utiliza grafos de conhecimento conscientes de condições para melhorar a precisão do raciocínio médico ao adaptar as respostas às características específicas dos pacientes.

Jash Rajesh Parekh, Wonbin Kweon, Joey Chan, Rezarta Islamaj, Robert Leaman, Pengcheng Jiang, Chih-Hsuan Wei, Zhizheng Wang, Zhiyong Lu, Jiawei Han2026-03-10💬 cs.CL

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

O artigo apresenta o MrBERT, uma família de codificadores multilingues modernos e eficientes, otimizados para desempenho de ponta em tarefas específicas de catalão e espanhol, bem como em domínios especializados como biomedicina e direito, com suporte a tamanhos de vetor flexíveis para reduzir custos de inferência.

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta Villegas2026-03-10🤖 cs.LG

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

O artigo apresenta o CeRA, um adaptador paralelo que supera a limitação linear do LoRA em tarefas de raciocínio complexo ao induzir expansão de variedades via portas SiLU e dropout estrutural, permitindo alcançar desempenho superior com ranks significativamente menores.

Hung-Hsuan Chen2026-03-10🤖 cs.LG

KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging

O artigo apresenta o KVSlimmer, um método que estabelece um fundamento teórico para a assimetria do cache KV e propõe uma solução de otimização sem gradiente, eficiente em memória e tempo, que supera os métodos atuais ao reduzir custos computacionais e latência enquanto melhora o desempenho em tarefas de longo contexto.

Lianjun Liu, Hongli An, Weiqi Yan, Xin Du, Shengchuan Zhang, Huazhong Liu, Yunshan Zhong2026-03-10💬 cs.CL

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

Este artigo apresenta um framework de previsão conformal que garante cobertura estatística para a extração de entidades médicas por modelos de linguagem, demonstrando que a calibração depende do domínio clínico e da estrutura do documento, permitindo a implantação segura com taxas de rejeição gerenciáveis.

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL

CyclicJudge: Mitigating Judge Bias Efficiently in LLM-based Evaluation

O artigo apresenta o CyclicJudge, uma estratégia de atribuição rotativa de avaliadores que elimina vieses sistemáticos em avaliações de LLMs mantendo o mesmo custo computacional das avaliações de juiz único, conforme validado empiricamente em benchmarks como MT-Bench e MindEval.

Ziyi Zhu, Olivier Tieleman, Alexey Bukhtiyarov, Jinghong Chen2026-03-10💬 cs.CL

PrivMedChat: End-to-End Differentially Private RLHF for Medical Dialogue Systems

O artigo apresenta o PrivMedChat, um framework de ponta a ponta que aplica privacidade diferencial em todas as etapas do RLHF para alinhar modelos de linguagem a diálogos médicos, garantindo proteção de dados sensíveis sem depender de anotações clínicas dispendiosas.

Sudip Bhujel2026-03-10💬 cs.CL

No Memorization, No Detection: Output Distribution-Based Contamination Detection in Small Language Models

O artigo demonstra que, para modelos de linguagem pequenos, o método de detecção de contaminação baseado na distribuição de saída (CDD) é ineficaz e supera em desempenho métodos baseados em probabilidade, como perplexidade e Min-k% Prob, pois sua eficácia depende criticamente da memorização verbatim que raramente ocorre nesses modelos.

Omer Sela (Tel Aviv University)2026-03-10💬 cs.CL

← Anterior Próximo →