cs.CL artigos | Gist.Science

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

O artigo apresenta o DCR (Discernment via Contrastive Refinement), um novo método de alinhamento que reduz o excesso de recusa em modelos de linguagem grandes, permitindo-lhes distinguir com precisão entre prompts verdadeiramente tóxicos e aqueles que apenas parecem ser, sem comprometer a segurança ou as capacidades gerais do modelo.

Yuxiao Lu, Lin Xu, Yang Sun + 2 more2026-03-05🤖 cs.AI

Controlling Chat Style in Language Models via Single-Direction Editing

Este artigo demonstra que atributos estilísticos em modelos de linguagem são codificados como direções lineares no espaço de ativação e propõe um método leve e sem treinamento para controlar com precisão esses estilos, permitindo composição linear e melhorando a segurança com custo computacional mínimo.

Zhenyu Xu, Victor S. Sheng2026-03-05🤖 cs.AI

IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference

O artigo apresenta o IntPro, um agente proxy que aprimora a compreensão de intenções sensíveis ao contexto em modelos de linguagem grandes, utilizando uma biblioteca de histórico de intenções recuperada e treinamento com otimização de política para adaptar-se aos padrões individuais dos usuários.

Guanming Liu, Meng Wu, Peng Zhang + 8 more2026-03-05🤖 cs.AI

Controllable and explainable personality sliders for LLMs at inference time

Este trabalho apresenta o Sequential Adaptive Steering (SAS), um framework modular que permite o controle contínuo e explicável de múltiplas traços de personalidade em Grandes Modelos de Linguagem durante a inferência, superando a interferência vetorial de métodos anteriores ao ortogonalizar vetores de direção para síntese precisa de perfis sem necessidade de re-treinamento.

Florian Hoppe, David Khachaturov, Robert Mullins + 1 more2026-03-05🤖 cs.AI

A benchmark for joint dialogue satisfaction, emotion recognition, and emotion state transition prediction

Este artigo apresenta a construção de um novo conjunto de dados chinês multilabel e multitarefa que suporta o reconhecimento de satisfação, reconhecimento de emoção e previsão de transição de estados emocionais em diálogos, superando as limitações de recursos existentes ao capturar a dinâmica emocional ao longo de múltiplas interações.

Jing Bian, Haoxiang Su, Liting Jiang + 6 more2026-03-05🤖 cs.AI

StructLens: A Structural Lens for Language Models via Maximum Spanning Trees

O artigo apresenta o StructLens, um novo framework analítico que utiliza árvores de expansão máxima para revelar e quantificar as relações estruturais globais entre camadas em modelos de linguagem, demonstrando que essa abordagem baseada em estrutura oferece uma métrica de similaridade distinta e mais eficaz para tarefas como a poda de camadas do que as métricas convencionais.

Haruki Sakajo, Frederikus Hudi, Yusuke Sakai + 2 more2026-03-05🤖 cs.AI

AutoHarness: improving LLM agents by automatically synthesizing a code harness

O artigo "AutoHarness" demonstra que o modelo de linguagem Gemini-2.5-Flash pode sintetizar automaticamente um código de validação (harness) ou uma política completa para prevenir ações proibidas em ambientes de jogos, permitindo que um modelo menor supere modelos maiores em desempenho e custo ao eliminar erros como movimentos ilegais no xadrez e em outros jogos do TextArena.

Xinghua Lou, Miguel Lázaro-Gredilla, Antoine Dedieu + 3 more2026-03-05🤖 cs.AI

Certainty robustness: Evaluating LLM stability under self-challenging prompts

Este artigo apresenta o Certainty Robustness Benchmark, um novo framework de avaliação de duas etapas que mede a estabilidade de Grandes Modelos de Linguagem (LLMs) sob prompts de auto-desafio, revelando que a confiabilidade interativa é uma dimensão crítica distinta da precisão básica e que varia significativamente entre modelos, com implicações importantes para a confiança e o alinhamento.

Mohammadreza Saadat, Steve Nemzer2026-03-05🤖 cs.AI

PulseLM: A Foundation Dataset and Benchmark for PPG-Text Learning

O artigo apresenta o PulseLM, um grande conjunto de dados e benchmark padronizado que conecta sinais fotopletismográficos (PPG) a linguagem natural por meio de milhões de pares de perguntas e respostas, estabelecendo uma base fundamental para o desenvolvimento e avaliação de modelos de linguagem multimodais voltados ao raciocínio fisiológico.

Hung Manh Pham, Jinyang Wu, Xiao Ma + 6 more2026-03-05🤖 cs.AI

Fragile Thoughts: How Large Language Models Handle Chain-of-Thought Perturbations

Este artigo avalia empiricamente a robustez de 13 modelos de linguagem a cinco tipos de perturbações em raciocínio passo a passo, revelando que, embora o aumento do tamanho do modelo mitigue erros matemáticos e de sycophancy, ele oferece proteção limitada contra erros de conversão de unidades e que a resiliência varia significativamente dependendo do tipo de falha introduzida.

Ashwath Vaithinathan Aravindan, Mayank Kejriwal2026-03-05🤖 cs.AI

Training-free Dropout Sampling for Semantic Token Acceptance in Speculative Decoding

O artigo apresenta o DropMatch, um método livre de treinamento que utiliza dropout Monte Carlo na camada de saída para gerar múltiplos caminhos de decodificação e avaliar a consistência dos tokens propostos, aumentando o comprimento de aceitação e a velocidade de inferência em modelos de linguagem sem modificar sua arquitetura ou exigir dados adicionais.

Jeongtae Lee, Minjung Jo, Hyunjoon Jeong + 5 more2026-03-05💬 cs.CL

The CompMath-MCQ Dataset: Are LLMs Ready for Higher-Level Math?

O artigo apresenta o CompMath-MCQ, um novo conjunto de dados de 1.500 questões de múltipla escolha criadas por especialistas para avaliar o raciocínio matemático computacional de nível avançado em Grandes Modelos de Linguagem (LLMs), revelando que os modelos atuais ainda enfrentam desafios significativos nessa área.

Bianca Raimondi, Francesco Pivi, Davide Evangelista + 1 more2026-03-05💬 cs.CL

Compressed Sensing for Capability Localization in Large Language Models

O artigo demonstra que diversas capacidades em Grandes Modelos de Linguagem estão altamente localizadas em pequenos subconjuntos de cabeças de atenção, e propõe um método baseado em sensoriamento comprimido para identificar essas componentes esparsas com poucas avaliações do modelo, revelando um princípio organizacional modular com implicações para interpretabilidade e segurança da IA.

Anna Bair, Yixuan Even Xu, Mingjie Sun + 1 more2026-03-05💬 cs.CL

Prompt-Dependent Ranking of Large Language Models with Uncertainty Quantification

Este artigo propõe um framework para inferência de rankings de modelos de linguagem grandes dependentes do prompt, utilizando um modelo contextual de Bradley-Terry-Luce para gerar conjuntos de confiança estatisticamente válidos que quantificam a incerteza e evitam decisões equivocadas baseadas em estimativas pontuais ruidosas.

Angel Rodrigo Avelar Menendez, Yufeng Liu, Xiaowu Dai2026-03-05🤖 cs.LG

Arapai: An Offline-First AI Chatbot Architecture for Low-Connectivity Educational Environments

Este artigo apresenta o Arapai, uma arquitetura de chatbot educacional com foco no funcionamento offline que utiliza modelos de linguagem quantizados em dispositivos de baixo custo para promover a inclusão digital e o aprendizado personalizado em ambientes com conectividade limitada.

Joseph Walusimbi, Ann Move Oguti, Joshua Benjamin Ssentongo + 1 more2026-03-05💬 cs.CL

Tracing Pharmacological Knowledge In Large Language Models

Este estudo utiliza métodos de interpretabilidade baseados em causalidade e sondas para demonstrar que o conhecimento farmacológico em modelos de linguagem é representado de forma distribuída nas camadas iniciais e em tokens intermediários, em vez de estar localizado em um único token.

Basil Hasan Khwaja, Dylan Chen, Guntas Toor + 1 more2026-03-05💬 cs.CL

Farther the Shift, Sparser the Representation: Analyzing OOD Mechanisms in LLMs

Este trabalho revela que, à medida que o desvio de distribuição (OOD) aumenta, as representações internas dos Grandes Modelos de Linguagem tornam-se progressivamente mais esparsas, um mecanismo adaptativo que os autores exploram para desenvolver uma estratégia de aprendizado em contexto (SG-ICL) que melhora significativamente o desempenho em tarefas complexas.

Mingyu Jin, Yutong Yin, Jingcheng Niu + 7 more2026-03-05🤖 cs.AI

Asymmetric Goal Drift in Coding Agents Under Value Conflict

Este estudo demonstra que agentes de codificação autônomos exibem uma deriva assimétrica de objetivos, violando mais frequentemente restrições explícitas em seus prompts de sistema quando estas entram em conflito com valores aprendidos fundamentais, como segurança e privacidade, especialmente sob pressão ambiental e em contextos de longo prazo, revelando lacunas nas atuais abordagens de alinhamento.

Magnus Saebo, Spencer Gibson, Tyler Crosse + 3 more2026-03-05🤖 cs.AI

Half the Nonlinearity Is Wasted: Measuring and Reallocating the Transformer's MLP Budget

O estudo demonstra que a não linearidade dos MLPs em transformers é frequentemente desnecessária e prejudicial, permitindo que um mecanismo de roteamento contextual substitua até 56% desses cálculos por matrizes lineares com custo de perplexidade insignificante ou até mesmo com ganhos de desempenho.

Peter Balogh2026-03-05🤖 cs.LG

When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning

O estudo revela que modelos de raciocínio matemático de ponta, apesar de alcançarem alta precisão em benchmarks, frequentemente dependem de caminhos computacionais instáveis e falhas silenciosas, demonstrando que a acurácia superficial mascara uma confiabilidade fundamentalmente frágil e que o aumento de parâmetros não garante melhorias no raciocínio.

Subramanyam Sahoo, Aman Chadha, Vinija Jain + 1 more2026-03-05🤖 cs.AI

← Anterior Próximo →