cs.CL artigos | Gist.Science

ROSE: Reordered SparseGPT for More Accurate One-Shot Large Language Models Pruning

O artigo apresenta o ROSE, um método de poda "one-shot" para Grandes Modelos de Linguagem que reordena os pesos com base na perda de poda estimada para superar as limitações de ordem pré-definida do SparseGPT, alcançando maior precisão em modelos como LLaMA e Mistral.

Mingluo Su, Huan Wang2026-03-09🤖 cs.LG

Confidence Before Answering: A Paradigm Shift for Efficient LLM Uncertainty Estimation

O artigo propõe o paradigma "CoCA", uma estrutura de aprendizado por reforço que otimiza conjuntamente a calibração da confiança e a precisão das respostas em modelos de linguagem, permitindo que o modelo estime sua probabilidade de acerto antes de gerar a resposta, superando assim as limitações dos métodos tradicionais que avaliam a incerteza apenas após a resposta.

Changcheng Li, Jiancan Wu, Hengheng Zhang, Zhengsu Chen, Guo An, Junxiang Qiu, Xiang Wang, Qi Tian2026-03-09💬 cs.CL

VerChol -- Grammar-First Tokenization for Agglutinative Languages

O artigo apresenta o VerChol, uma abordagem de tokenização baseada em gramática projetada para preservar os limites dos morfemas em línguas aglutinantes, superando as limitações dos métodos estatísticos tradicionais como o Byte Pair Encoding (BPE).

Prabhu Raja2026-03-09💬 cs.CL

Lost in Stories: Consistency Bugs in Long Story Generation by LLMs

Este artigo apresenta o ConStory-Bench, um novo benchmark e pipeline automatizado (ConStory-Checker) projetados para avaliar e detectar erros de consistência em narrativas longas geradas por Grandes Modelos de Linguagem, identificando padrões específicos de falhas factuais e temporais que ocorrem frequentemente no meio das histórias.

Junjie Li, Xinrui Guo, Yuhao Wu, Roy Ka-Wei Lee, Hongzhi Li, Yutao Xie2026-03-09🤖 cs.AI

Building an Ensemble LLM Semantic Tagger for UN Security Council Resolutions

Este artigo apresenta uma metodologia de ensemble baseada em LLMs que utiliza as métricas de Razão de Preservação de Conteúdo (CPR) e Adequação de Tags (TWF) para selecionar automaticamente as melhores saídas de múltiplos modelos, garantindo a limpeza e o etiquetamento semântico precisos e econômicos das resoluções do Conselho de Segurança da ONU.

Hussein Ghaly2026-03-09💬 cs.CL

InfoGatherer: Principled Information Seeking via Evidence Retrieval and Strategic Questioning

O artigo apresenta o InfoGatherer, um framework que melhora a tomada de decisão em domínios de alto risco, como medicina e direito, ao combinar recuperação de documentos e perguntas estratégicas ao usuário, utilizando a teoria de Dempster-Shafer para gerenciar incertezas de forma principial e evitar respostas prematuras ou excessivamente confiantes.

Maksym Taranukhin, Shuyue Stella Li, Evangelos Milios, Geoff Pleiss, Yulia Tsvetkov, Vered Shwartz2026-03-09💬 cs.CL

Learning Next Action Predictors from Human-Computer Interaction

Este artigo apresenta o LongNAP, um modelo de IA que prevê a próxima ação do usuário analisando seu histórico completo de interações multimodais, utilizando uma abordagem inovadora de aprendizado por contexto e reforço treinada em um novo conjunto de dados massivo de uso de smartphones.

Omar Shaikh, Valentin Teutschbein, Kanishk Gandhi, Yikun Chi, Nick Haber, Thomas Robinson, Nilam Ram, Byron Reeves, Sherry Yang, Michael S. Bernstein, Diyi Yang2026-03-09💬 cs.CL

Addressing the Ecological Fallacy in Larger LMs with Human Context

Este trabalho demonstra que abordar a falácia ecológica ao modelar o contexto linguístico do autor, seja através de pré-treinamento HuLM ou de ajuste fino (HuFT) com QLoRA em um modelo Llama de 8B, resulta em melhor desempenho em diversas tarefas downstream em comparação com métodos padrão.

Nikita Soni, Dhruv Vijay Kunjadiya, Pratham Piyush Shah, Dikshya Mohanty, H. Andrew Schwartz, Niranjan Balasubramanian2026-03-09🤖 cs.AI

Implicit Style Conditioning: A Structured Style-Rewrite Framework for Low-Resource Character Modeling

O artigo propõe um framework de reescrita de estilo estruturado que, ao combinar a desentrelaçação explícita de características estilísticas com uma estratégia de condicionamento implícito via raciocínio encadeado, permite que modelos de linguagem pequenos (SLMs) gerem personagens com alta fidelidade estilística e semântica, superando modelos maiores em cenários de poucos dados.

Chanhui Zhu2026-03-09🤖 cs.LG

Who We Are, Where We Are: Mental Health at the Intersection of Person, Situation, and Large Language Models

Este artigo desenvolve modelos interpretáveis que integram traços psicológicos individuais e contextos situacionais inferidos a partir de dados de mídia social para prever o bem-estar, demonstrando que abordagens baseadas em teoria psicológica oferecem desempenho competitivo e maior transparência em comparação com embeddings de modelos de linguagem.

Nikita Soni, August Håkan Nilsson, Syeda Mahwish, Vasudha Varadarajan, H. Andrew Schwartz, Ryan L. Boyd2026-03-09🤖 cs.AI

Imagine How To Change: Explicit Procedure Modeling for Change Captioning

O artigo apresenta o ProCap, um novo framework que reformula a legendagem de mudanças ao modelar dinamicamente o procedimento de transformação entre imagens, utilizando um codificador treinado em quadros-chave e consultas aprendíveis para gerar descrições textuais que explicam não apenas o que mudou, mas também como ocorreu.

Jiayang Sun, Zixin Guo, Min Cao, Guibo Zhu, Jorma Laaksonen2026-03-09🤖 cs.AI

Track-SQL: Enhancing Generative Language Models with Dual-Extractive Modules for Schema and Context Tracking in Multi-turn Text-to-SQL

O artigo apresenta o Track-SQL, um novo framework que aprimora modelos de linguagem generativos para Text-to-SQL em múltiplas conversas através de módulos extrativos duais para rastreamento de esquema e contexto, alcançando desempenho state-of-the-art nos conjuntos de dados SparC e CoSQL.

Bingfeng Chen, Shaobin Shi, Yongqi Luo, Boyan Xu, Ruichu Cai, Zhifeng Hao2026-03-09💬 cs.CL

MASFactory: A Graph-centric Framework for Orchestrating LLM-Based Multi-Agent Systems with Vibe Graphing

O artigo apresenta o MASFactory, um framework centrado em grafos para orquestrar sistemas multiagentes baseados em LLM, que introduz a "Vibe Graphing" para converter intenções em linguagem natural em fluxos de trabalho executáveis, além de oferecer componentes reutilizáveis, integração de contexto e visualização, validados em sete benchmarks públicos.

Yang Liu, Jinxuan Cai, Yishen Li, Qi Meng, Zedi Liu, Xin Li, Chen Qian, Chuan Shi, Cheng Yang2026-03-09🤖 cs.AI

ViewFusion: Structured Spatial Thinking Chains for Multi-View Reasoning

O artigo apresenta o ViewFusion, um framework de duas etapas que separa o pré-alinhamento espacial entre múltiplas visões do raciocínio final, utilizando treinamento supervisionado e aprendizado por reforço (GRPO) para melhorar significativamente a precisão em tarefas de raciocínio espacial multiview.

Xingjian Tao, Yiwei Wang, Yujun Cai, Yifan Song, Jing Tang2026-03-09💬 cs.CL

Evaluating Austrian A-Level German Essays with Large Language Models for Automated Essay Scoring

Este estudo avalia a eficácia de modelos de linguagem de grande porte (LLMs) na correção automática de redações alemãs de nível A da Áustria com base em rubricas, concluindo que, embora os modelos consigam aplicar os critérios, sua baixa concordância com avaliadores humanos (32,8% nas notas finais) os torna inadequados para uso em ambientes reais de avaliação.

Jonas Kubesch, Lena Huber, Clemens Havas2026-03-09🤖 cs.AI

Experiences Build Characters: The Linguistic Origins and Functional Impact of LLM Personality

Este estudo demonstra que a exposição contínua a textos específicos de domínio molda a personalidade das LLMs, revelando uma vantagem na supressão de traços sociais para o raciocínio complexo e estabelecendo uma ligação causal entre características linguísticas dos dados de treinamento e o desempenho do modelo.

Xi Wang, Mengdie Zhuang, Jiqun Liu2026-03-09🤖 cs.AI

DeepSight: Bridging Depth Maps and Language with a Depth-Driven Multimodal Model

O artigo apresenta o DeepSight, o primeiro modelo multimodal focado em profundidade que supera as limitações dos modelos existentes ao utilizar mapas de profundidade monocromáticos, um novo conjunto de dados instrucional e um codificador ViT modificado para aprimorar significativamente a compreensão de cenas tridimensionais e o raciocínio espacial.

Hao Yang, Hongbo Zhang, Yanyan Zhao, Bing Qin2026-03-09💬 cs.CL

Making Implicit Premises Explicit in Logical Understanding of Enthymemes

Este artigo propõe um pipeline que integra modelos de linguagem grandes e um raciocinador neuro-simbólico para transformar argumentos implícitos (entimemas) em fórmulas lógicas, gerar premissas ocultas e verificar a validade do raciocínio, preenchendo assim a lacuna entre métodos de processamento de linguagem natural e abordagens baseadas em lógica.

Xuyao Feng, Anthony Hunter2026-03-09🤖 cs.AI

Diffusion Language Models Are Natively Length-Aware

Este artigo propõe um mecanismo zero-shot que utiliza a representação latente do prompt para estimar e ajustar dinamicamente o tamanho do contexto em Modelos de Linguagem de Difusão antes da geração, resultando em ganhos significativos de eficiência computacional sem comprometer o desempenho em diversas tarefas.

Vittorio Rossi, Giacomo Cirò, Davide Beltrame, Luca Gandolfi, Paul Röttger, Dirk Hovy2026-03-09🤖 cs.LG

A Causal Graph Approach to Oppositional Narrative Analysis

Este trabalho propõe uma abordagem baseada em grafos causais para analisar narrativas opositivas, superando métodos tradicionais ao modelar interações entre entidades e extrair subgrafos causais mínimos para classificação, resultando em desempenho superior.

Diego Revilla, Martin Fernandez-de-Retana, Lingfeng Chen, Aritz Bilbao-Jayo, Miguel Fernandez-de-Retana2026-03-09🤖 cs.AI

← Anterior Próximo →