From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

O artigo apresenta o "Sentinel", um agente de IA autônomo que supera os médicos individuais na triagem de sinais vitais de monitoramento remoto de pacientes, alcançando alta sensibilidade e consistência a um custo mínimo, o que resolve o problema de escalabilidade que limitou estudos clínicos anteriores.

Seunghwan Kim (AnsibleHealth Inc., San Francisco, USA), Tiffany H. Kung (AnsibleHealth Inc., San Francisco, USA, Stanford School of Medicine, Stanford, USA), Heena Verma (AnsibleHealth Inc., San Francisco, USA), Dilan Edirisinghe (AnsibleHealth Inc., San Francisco, USA), Kaveh Sedehi (AnsibleHealth Inc., San Francisco, USA), Johanna Alvarez (AnsibleHealth Inc., San Francisco, USA), Diane Shilling (AnsibleHealth Inc., San Francisco, USA), Audra Lisa Doyle (AnsibleHealth Inc., San Francisco, USA), Ajit Chary (AnsibleHealth Inc., San Francisco, USA), William Borden (AnsibleHealth Inc., San Francisco, USA, George Washington University, Washington, D.C., USA), Ming Jack Po (AnsibleHealth Inc., San Francisco, USA)2026-03-11🤖 cs.AI

Reading, Not Thinking: Understanding and Bridging the Modality Gap When Text Becomes Pixels in Multimodal LLMs

Este estudo diagnostica a lacuna de desempenho entre o processamento de texto em formato de imagem e em tokens textuais em Modelos de Linguagem Multimodais, identificando que erros de leitura e formatação são os principais culpados, e propõe um método de auto-distilação que elimina essa lacuna ao treinar o modelo com seus próprios raciocínios textuais, elevando drasticamente a precisão em tarefas matemáticas e em documentos reais.

Kaiser Sun, Xiaochuang Yuan, Hongjun Liu, Chen Zhao, Cheng Zhang, Mark Dredze, Fan Bai2026-03-11💬 cs.CL

Bioalignment: Measuring and Improving LLM Disposition Toward Biological Systems for AI Safety

Este estudo apresenta o "Bioalignment", um framework de avaliação que revela que a maioria dos modelos de linguagem de grande escala (LLMs) possui viés em favor de soluções sintéticas em detrimento das biológicas, demonstrando que o ajuste fino (fine-tuning) com um corpus especializado pode reverter essa preferência sem comprometer as capacidades gerais do modelo.

Trent R Northen, Mingxun Wang2026-03-11💬 cs.CL

LooComp: Leverage Leave-One-Out Strategy to Encoder-only Transformer for Efficient Query-aware Context Compression

O artigo apresenta o LooComp, um método leve baseado em uma estratégia de "leave-one-out" e em um Transformer apenas codificador que comprime contextos de forma eficiente e orientada à consulta, mantendo a precisão na resposta e reduzindo custos computacionais para tarefas de geração aumentada por recuperação.

Thao Do, Dinh Phu Tran, An Vo, Seon Kwon Kim, Daeyoung Kim2026-03-11💬 cs.CL

How Contrastive Decoding Enhances Large Audio Language Models?

Este estudo avalia sistematicamente quatro estratégias de Decodificação Contrastiva em Modelos de Linguagem de Áudio de Grande Escala, identificando as mais eficazes e propondo uma estrutura de Matriz de Transição para explicar como essas técnicas corrigem erros específicos, como a negação falsa de áudio ou o palpite por incerteza, fornecendo diretrizes para selecionar a melhor estratégia com base no perfil de erros do modelo.

Tzu-Quan Lin, Wei-Ping Huang, Yi-Cheng Lin, Hung-yi Lee2026-03-11💬 cs.CL

TA-Mem: Tool-Augmented Autonomous Memory Retrieval for LLM in Long-Term Conversational QA

O artigo apresenta o TA-Mem, um novo quadro de recuperação de memória autônoma e aumentada por ferramentas para Grandes Modelos de Linguagem (LLMs) que supera as limitações das abordagens estáticas atuais ao permitir a extração adaptativa de informações e a seleção dinâmica de métodos de busca, resultando em melhorias significativas de desempenho em tarefas de perguntas e respostas de conversação de longo prazo.

Mengwei Yuan, Jianan Liu, Jing Yang, Xianyou Li, Weiran Yan, Yichao Wu, Penghao Liang2026-03-11💬 cs.CL

TaSR-RAG: Taxonomy-guided Structured Reasoning for Retrieval-Augmented Generation

O artigo apresenta o TaSR-RAG, um framework de raciocínio estruturado guiado por taxonomia que melhora a precisão e a atribuição de evidências em sistemas de Geração Aumentada por Recuperação (RAG) ao decompor consultas complexas em sub-consultas de triplos relacionais e realizar seleção de evidências passo a passo sem a necessidade de construção de grafos dispendiosa.

Jiashuo Sun, Yixuan Xie, Jimeng Shi, Shaowen Wang, Jiawei Han2026-03-11🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

Este estudo investiga como os Modelos de Linguagem de Grande Escala (LLMs) perpetuam estereótipos de gênero em registros de pacientes franceses ao analisar as interações entre o gênero e outros determinantes sociais da saúde, demonstrando que a avaliação dessas interações é essencial para complementar as abordagens existentes de detecção de viés.

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel Morin2026-03-11🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

Este trabalho identifica uma limitação crítica em Grandes Modelos de Linguagem (LLMs), que tendem a priorizar o raciocínio moral em detrimento do senso comum, revelando um viés de foco narrativo onde a detecção de contradições de senso comum é significativamente mais difícil quando atribuída ao personagem principal em comparação com personagens secundários.

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya Purkayastha2026-03-11🤖 cs.AI

CyberThreat-Eval: Can Large Language Models Automate Real-World Threat Research?

O artigo apresenta o CyberThreat-Eval, um novo benchmark baseado em fluxos de trabalho reais de inteligência de ameaças cibernéticas (CTI) e métricas centradas em analistas, que revela as limitações atuais dos Grandes Modelos de Linguagem (LLMs) na automação de tarefas complexas de pesquisa de ameaças e propõe um processo iterativo com feedback humano para superá-las.

Xiangsen Chen, Xuan Feng, Shuo Chen, Matthieu Maitre, Sudipto Rakshit, Diana Duvieilh, Ashley Picone, Nan Tang2026-03-11💬 cs.CL