Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention

O artigo propõe a "inferência de tempo entrópico", uma nova arquitetura de auto-organização que substitui a progressão linear de tokens por um processo termodinâmico inteligente, onde o agendamento, a esparsificação da atenção e a temperatura de amostragem são controlados unificadamente pelo fluxo de incerteza para otimizar a alocação de recursos computacionais em modelos de linguagem grandes.

Andrew Kiruluta2026-03-05🤖 cs.LG

How does fine-tuning improve sensorimotor representations in large language models?

Este estudo demonstra que o ajuste fino (fine-tuning) pode reduzir a lacuna de incorporação em Grandes Modelos de Linguagem, alinhando suas representações internas com experiências sensorimotoras humanas, embora essa melhoria seja robusta entre idiomas e dimensões relacionadas, mas dependente do objetivo de aprendizado e não generalize para formatos de tarefas distintos.

Minghua Wu, Javier Conde, Pedro Reviriego + 1 more2026-03-05🤖 cs.AI

From We to Me: Theory Informed Narrative Shift with Abductive Reasoning

Este artigo propõe uma abordagem neurosimbólica fundamentada em teoria das ciências sociais e raciocínio abdutivo para orientar modelos de linguagem na transformação eficaz de narrativas entre perspectivas coletivistas e individualistas, superando significativamente as linhas de base zero-shot ao manter a fidelidade semântica ao conteúdo original.

Jaikrishna Manojkumar Patil, Divyagna Bavikadi, Kaustuv Mukherji + 5 more2026-03-05🤖 cs.AI

Controllable and explainable personality sliders for LLMs at inference time

Este trabalho apresenta o Sequential Adaptive Steering (SAS), um framework modular que permite o controle contínuo e explicável de múltiplas traços de personalidade em Grandes Modelos de Linguagem durante a inferência, superando a interferência vetorial de métodos anteriores ao ortogonalizar vetores de direção para síntese precisa de perfis sem necessidade de re-treinamento.

Florian Hoppe, David Khachaturov, Robert Mullins + 1 more2026-03-05🤖 cs.AI

A benchmark for joint dialogue satisfaction, emotion recognition, and emotion state transition prediction

Este artigo apresenta a construção de um novo conjunto de dados chinês multilabel e multitarefa que suporta o reconhecimento de satisfação, reconhecimento de emoção e previsão de transição de estados emocionais em diálogos, superando as limitações de recursos existentes ao capturar a dinâmica emocional ao longo de múltiplas interações.

Jing Bian, Haoxiang Su, Liting Jiang + 6 more2026-03-05🤖 cs.AI

StructLens: A Structural Lens for Language Models via Maximum Spanning Trees

O artigo apresenta o StructLens, um novo framework analítico que utiliza árvores de expansão máxima para revelar e quantificar as relações estruturais globais entre camadas em modelos de linguagem, demonstrando que essa abordagem baseada em estrutura oferece uma métrica de similaridade distinta e mais eficaz para tarefas como a poda de camadas do que as métricas convencionais.

Haruki Sakajo, Frederikus Hudi, Yusuke Sakai + 2 more2026-03-05🤖 cs.AI