cs.CL artigos | Gist.Science

Steering Awareness: Models Can Be Trained to Detect Activation Steering

O artigo demonstra que modelos de linguagem podem ser treinados para detectar e identificar vetores de direcionamento de ativação, revelando que essa intervenção não é invisível e que a capacidade de detecção não garante robustez comportamental, o que questiona a confiabilidade de avaliações de segurança baseadas em direcionamento.

Joshua Fonseca Rivera, David Demitri Africa2026-03-06💻 cs

Think-While-Generating: On-the-Fly Reasoning for Personalized Long-Form Generation

O artigo apresenta o FlyThinker, um framework eficiente de "pensar enquanto gera" que utiliza raciocínio latente em nível de token em paralelo para superar as limitações dos métodos de alinhamento de preferências estáticos na geração personalizada de textos longos, garantindo tanto eficácia quanto eficiência no treinamento e na inferência.

Chengbing Wang, Yang Zhang, Wenjie Wang + 4 more2026-03-06💻 cs

ReFusion: A Diffusion Large Language Model with Parallel Autoregressive Decoding

O artigo apresenta o ReFusion, um modelo de difusão mascarado inovador que integra reorganização de sequências e decodificação autoregressiva paralela em nível de slots, superando significativamente os modelos anteriores em desempenho e velocidade enquanto reduz a complexidade de aprendizado e permite o uso eficiente de cache KV.

Jia-Nan Li, Jian Guan, Wei Wu + 1 more2026-03-06💻 cs

RePo: Language Models with Context Re-Positioning

O artigo apresenta o RePo, um mecanismo inovador que melhora o aprendizado em contexto de Grandes Modelos de Linguagem ao re-posicionar dinamicamente os tokens com base em dependências contextuais, reduzindo a carga cognitiva extrínseca e aprimorando o desempenho em tarefas com contextos ruidosos, estruturados e de longa duração.

Huayang Li, Tianyu Zhao, Deng Cai + 1 more2026-03-06💻 cs

MCP-SafetyBench: A Benchmark for Safety Evaluation of Large Language Models with Real-World MCP Servers

O artigo apresenta o MCP-SafetyBench, um benchmark abrangente baseado em servidores MCP do mundo real que avalia a segurança de modelos de linguagem em fluxos de trabalho multi-turno e revela que os principais modelos atuais permanecem vulneráveis a ataques, evidenciando um trade-off entre segurança e utilidade.

Xuanjun Zong, Zhiqi Shen, Lei Wang + 2 more2026-03-06💻 cs

From Word to World: Can Large Language Models be Implicit Text-based World Models?

Este artigo propõe um framework de três níveis para avaliar modelos de mundo baseados em LLMs em ambientes textuais, demonstrando que, sob condições adequadas de cobertura comportamental e complexidade, eles podem manter estados latentes coerentes e melhorar significativamente o desempenho de agentes através de verificação de ações, geração de trajetórias sintéticas e inicialização de aprendizado por reforço.

Yixia Li, Hongru Wang, Jiahao Qiu + 7 more2026-03-06💻 cs

Parallel Token Prediction for Language Models

O artigo apresenta o PTP (Parallel Token Prediction), um framework que acelera a geração de linguagem ao prever múltiplos tokens simultaneamente em uma única chamada de modelo, substituindo a amostragem pós-hoc por variáveis de entrada aleatórias e alcançando um speedup de 2,4x em benchmarks de decodificação especulativa.

Felix Draxler, Justus Will, Farrin Marouf Sofian + 3 more2026-03-06💻 cs

When Do Tools and Planning Help Large Language Models Think? A Cost- and Latency-Aware Benchmark

Este estudo avalia o impacto do uso de ferramentas e planejamento em tempo de inferência em modelos de linguagem de grande escala, demonstrando que, embora essas abordagens possam melhorar significativamente a precisão em tarefas complexas de raciocínio baseadas em conhecimento, elas frequentemente resultam em aumentos drásticos de latência e custo sem benefícios consistentes em tarefas mais simples, destacando a necessidade de escolhas estratégicas e conscientes de custos entre o tamanho do modelo e a complexidade do agente.

Subha Ghoshal, Ali Al-Bustami2026-03-06💻 cs

Identifying Good and Bad Neurons for Task-Level Controllable LLMs

O artigo apresenta o NeuronLLM, um novo framework que identifica tanto neurônios facilitadores quanto inibidores em Grandes Modelos de Linguagem para tarefas específicas, utilizando aprendizado contrastivo e conjuntos de perguntas aumentados para superar as limitações dos métodos anteriores e oferecer uma compreensão mais holística da organização funcional desses modelos.

Wenjie Li, Guansong Pang, Hezhe Qiao + 2 more2026-03-06💻 cs

F-Actor: Controllable Conversational Behaviour in Full-Duplex Models

Este trabalho apresenta o F-Actor, o primeiro modelo de conversação de voz full-duplex aberto e instrucional que, ao utilizar um protocolo de treinamento de estágio único com recursos acadêmicos limitados, permite o controle dinâmico de comportamento conversacional, voz e tópicos seguindo instruções explícitas.

Maike Züfle, Ondrej Klejch, Nicholas Sanders + 3 more2026-03-06💻 cs

The unreasonable effectiveness of pattern matching

O artigo demonstra que a capacidade de modelos de linguagem de grande escala (LLMs) de inferir significados a partir de estruturas sintáticas em textos sem sentido, como o "Jabberwocky", evidencia que o reconhecimento de padrões é um componente fundamental da inteligência, e não apenas uma mera imitação linguística.

Gary Lupyan, Blaise Agüera y Arcas2026-03-06💻 cs

Yuan3.0 Ultra: A Trillion-Parameter Enterprise-Oriented MoE LLM

O artigo apresenta o Yuan3.0 Ultra, um modelo de linguagem aberto de grande escala baseado em Mistura de Especialistas (MoE) com 1010B de parâmetros totais e 68,8B ativados, que introduz o algoritmo de Poda de Especialistas Adaptativa por Camada (LAEP) para otimizar a eficiência do pré-treinamento e alcançar desempenho líder em tarefas corporativas.

YuanLab. ai, :, Shawn Wu + 25 more2026-03-06💻 cs

Where is the multimodal goal post? On the Ability of Foundation Models to Recognize Contextually Important Moments

Este trabalho avalia a capacidade de modelos fundacionais multimodais de identificar momentos importantes em vídeos de futebol, demonstrando que seu desempenho é próximo ao acaso devido à dependência de uma única modalidade e à falta de sinergia entre fontes, o que destaca a necessidade de arquiteturas modulares e procedimentos de treinamento complementares.

Aditya K Surikuchi, Raquel Fernández, Sandro Pezzelle2026-03-06💻 cs

Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models

O artigo apresenta o Self-Distilled Reasoner, um framework de Auto-Distilação em Política (OPSD) onde um único modelo de linguagem atua simultaneamente como professor e aluno ao condicionar-se em diferentes contextos (com ou sem traços de raciocínio privilegiados), alcançando maior eficiência e desempenho em tarefas de raciocínio matemático em comparação com métodos de distilação off-policy e aprendizado por reforço.

Siyan Zhao, Zhihui Xie, Mengchen Liu + 4 more2026-03-06💻 cs

Adaptive Rollout Allocation for Online Reinforcement Learning with Verifiable Rewards

O artigo apresenta o VIP, uma estratégia de alocação de rolagens adaptativa que utiliza um modelo de processo gaussiano para prever probabilidades de sucesso e otimizar a distribuição do orçamento computacional, minimizando a variância do gradiente e melhorando a eficiência de amostragem no aprendizado por reforço com recompensas verificáveis.

Hieu Trung Nguyen, Bao Nguyen, Wenao Ma + 3 more2026-03-06💻 cs

LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

O artigo apresenta o LatentChem, uma interface de raciocínio latente que desacopla o cálculo químico da geração textual, permitindo que modelos realizem inferências complexas diretamente no espaço contínuo, o que resulta em uma precisão superior e um aumento de 10,84 vezes na velocidade de inferência em comparação com métodos tradicionais de Cadeia de Pensamento explícita.

Xinwu Ye, Yicheng Mao, Jia Zhang + 16 more2026-03-06🔬 physics

The Convergence of Schema-Guided Dialogue Systems and the Model Context Protocol

Este artigo estabelece a convergência fundamental entre os Sistemas de Diálogo Guiados por Esquema (SGD) e o Protocolo de Contexto de Modelo (MCP) como manifestações de um paradigma unificado para interações auditáveis com LLMs, extraindo cinco princípios fundamentais de design de esquemas que preenchem lacunas críticas em modos de falha e relações entre ferramentas para viabilizar a governança escalável de sistemas de IA.

Andreas Schlapbach2026-03-06💻 cs

Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

Este artigo apresenta um novo quadro de avaliação baseado em simulação para realizar testes de "red teaming" em modelos de linguagem aplicados à saúde mental, identificando riscos críticos como a validação de delírios e falhas na desescalada de risco suicida, e validando uma ferramenta de visualização para auditoria por parte de diversas partes interessadas.

Ian Steenstra, Paola Pedrelli, Weiyan Shi + 2 more2026-03-06💻 cs

Jailbreak Foundry: From Papers to Runnable Attacks for Reproducible Benchmarking

O artigo apresenta o JAILBREAK FOUNDRY (JBF), um sistema baseado em agentes múltiplos que traduz automaticamente artigos sobre jailbreaks em módulos executáveis padronizados, permitindo a reprodutibilidade precisa e a avaliação unificada de ataques em modelos de linguagem.

Zhicheng Fang, Jingjie Zheng, Chenxu Fu, Wei Xu2026-03-06🔒 cs.CR

Learn Hard Problems During RL with Reference Guided Fine-tuning

O artigo apresenta o ReGFT, um método que utiliza soluções de referência humanas para sintetizar trajetórias de raciocínio viáveis em problemas difíceis, superando a esparsidade de recompensas e acelerando o treinamento por reforço (RL) para raciocínio matemático em modelos de linguagem.

Yangzhen Wu, Shanda Li, Zixin Wen + 5 more2026-03-06💻 cs

← Anterior Próximo →