cs.AI artigos | Gist.Science

PlaneCycle: Training-Free 2D-to-3D Lifting of Foundation Models Without Adapters

O artigo apresenta o PlaneCycle, um operador livre de treinamento e adaptadores que permite a elevação de modelos de base 2D para tarefas 3D, reutilizando backbones pré-treinados através de uma agregação espacial cíclica em planos ortogonais para alcançar desempenho competitivo sem modificar a arquitetura ou re-treinar o modelo.

Yinghong Yu, Guangyuan Li, Jiancheng Yang2026-03-05🤖 cs.AI

CodeTaste: Can LLMs Generate Human-Level Code Refactorings?

O artigo apresenta o CodeTaste, um benchmark que avalia a capacidade de agentes de LLMs em realizar refatorações de código realistas, revelando que, embora os modelos executem bem tarefas detalhadas, eles frequentemente falham em identificar as escolhas humanas de refatoração sem uma decomposição proposta-antes-de-implementar.

Alex Thillen, Niels Mündler, Veselin Raychev + 1 more2026-03-05🤖 cs.AI

Architectural Proprioception in State Space Models: Thermodynamic Training Induces Anticipatory Halt Detection

O artigo apresenta o framework PNA, que demonstra que modelos de espaço de estado (SSMs) treinados com princípios termodinâmicos desenvolvem uma "propriocepção arquitetônica" única, permitindo a detecção antecipada de parada e autoconsciência computacional, fenômeno que não é observado em Transformers sob as mesmas condições.

Jay Noon2026-03-05🤖 cs.AI

CAM-LDS: Cyber Attack Manifestations for Automatic Interpretation of System Logs and Security Alerts

Este artigo apresenta o CAM-LDS, um novo conjunto de dados de logs de ataques cibernéticos gerado em um ambiente de teste reprodutível para superar a escassez de dados rotulados e demonstrar a eficácia de Modelos de Linguagem Grandes (LLMs) na interpretação automática e semântica de logs de segurança e alertas de intrusão.

Max Landauer, Wolfgang Hotwagner, Thorina Boenke + 2 more2026-03-05🤖 cs.AI

Towards Realistic Personalization: Evaluating Long-Horizon Preference Following in Personalized User-LLM Interactions

Este trabalho apresenta o RealPref, um novo benchmark projetado para avaliar a capacidade de modelos de linguagem de seguir preferências de usuários em interações personalizadas de longo prazo, revelando que o desempenho desses modelos diminui significativamente à medida que o contexto se expande e as preferências se tornam mais implícitas.

Qianyun Guo, Yibo Li, Yue Liu + 1 more2026-03-05🤖 cs.AI

Noise-aware Client Selection for carbon-efficient Federated Learning via Gradient Norm Thresholding

Este artigo propõe uma abordagem modular para a Aprendizagem Federada eficiente em carbono que utiliza um mecanismo de thresholding de norma de gradiente em rodadas de sondagem para filtrar dados ruidosos dos clientes, melhorando assim o desempenho do modelo e a sustentabilidade em cenários onde a qualidade dos dados é desconhecida.

Patrick Wilhelm, Inese Yilmaz, Odej Kao2026-03-05🤖 cs.AI

ZeSTA: Zero-Shot TTS Augmentation with Domain-Conditioned Training for Data-Efficient Personalized Speech Synthesis

O artigo propõe o ZeSTA, um framework de treinamento condicionado a domínios que utiliza embeddings leves e superamostragem de dados reais para melhorar a similaridade do locutor na síntese de voz personalizada com poucos recursos, mitigando a degradação causada pela mistura ingênua de dados sintéticos e reais.

Youngwon Choi, Jinwoo Oh, Hwayeon Kim + 1 more2026-03-05🤖 cs.AI

PRAM-R: A Perception-Reasoning-Action-Memory Framework with LLM-Guided Modality Routing for Adaptive Autonomous Driving

Este artigo apresenta o PRAM-R, um framework unificado de percepção, raciocínio, ação e memória que utiliza roteamento de modalidades guiado por LLM e um design de duplo loop assíncrono para otimizar a eficiência computacional e a adaptação na condução autônoma, reduzindo significativamente o uso de sensores e oscilações de roteamento sem comprometer a precisão em cenários urbanos complexos.

Yi Zhang, Xian Zhang, Saisi Zhao + 4 more2026-03-05🤖 cs.AI

Agentics 2.0: Logical Transduction Algebra for Agentic Data Workflows

O artigo apresenta o Agentics 2.0, um framework nativo em Python que utiliza uma álgebra de transdução lógica para criar fluxos de trabalho de dados agênticos tipados, escaláveis e observáveis, demonstrando desempenho de ponta em benchmarks de descoberta de dados e conversão de linguagem natural para SQL.

Alfio Massimiliano Gliozzo, Junkyu Lee, Nahuel Defosse2026-03-05🤖 cs.AI

FeedAIde: Guiding App Users to Submit Rich Feedback Reports by Asking Context-Aware Follow-Up Questions

O artigo apresenta o FeedAIde, um sistema baseado em Modelos de Linguagem Multimodais que guia os usuários a fornecerem relatórios de feedback mais ricos e completos por meio de perguntas de acompanhamento adaptativas ao contexto, demonstrando em um estudo de caso que essa abordagem melhora tanto a experiência do usuário quanto a qualidade das informações recebidas pelos desenvolvedores.

Ali Ebrahimi Pourasad, Meyssam Saghiri, Walid Maalej2026-03-05🤖 cs.AI

LikeThis! Empowering App Users to Submit UI Improvement Suggestions Instead of Complaints

O artigo apresenta o LikeThis!, uma abordagem baseada em IA generativa que capacita os usuários a transformar críticas vagas em sugestões de melhoria de UI concretas e acionáveis, gerando alternativas visuais a partir de comentários e capturas de tela, o que foi validado por estudos de benchmark e com usuários como uma forma eficaz de aprimorar a colaboração entre usuários e desenvolvedores.

Jialiang Wei, Ali Ebrahimi Pourasad, Walid Maalej2026-03-05🤖 cs.AI

Online Learning for Multi-Layer Hierarchical Inference under Partial and Policy-Dependent Feedback

Este artigo propõe um algoritmo online com redução de variância e otimização de Lyapunov para inferência hierárquica multicamada, resolvendo o desafio de feedback parcial e dependente da política que instabiliza métodos tradicionais de aprendizado de roteamento.

Haoran Zhang, Seohyeon Cha, Hasan Burhan Beytur + 3 more2026-03-05🤖 cs.AI

When AI Fails, What Works? A Data-Driven Taxonomy of Real-World AI Risk Mitigation Strategies

Este artigo apresenta uma taxonomia empiricamente fundamentada de estratégias de mitigação de riscos de IA, derivada da análise de 9.705 incidentes reais, que expande significativamente o conhecimento existente ao identificar novos padrões de resposta e fortalecer a orientação para a prevenção de falhas sistêmicas em fluxos de trabalho de alto risco.

Evgenija Popchanovska, Ana Gjorgjevikj, Maryan Rizinski + 3 more2026-03-05🤖 cs.AI

Causality Elicitation from Large Language Models

O artigo propõe um pipeline para extrair hipóteses causais plausíveis de Grandes Modelos de Linguagem (LLMs), mapeando documentos gerados em eventos canônicos e aplicando métodos de descoberta causal para construir grafos candidatos que representam o conhecimento causal implícito nos modelos, sem garantir a causalidade no mundo real.

Takashi Kameyama, Masahiro Kato, Yasuko Hio + 2 more2026-03-05🤖 cs.AI

VANGUARD: Vehicle-Anchored Ground Sample Distance Estimation for UAVs in GPS-Denied Environments

O artigo apresenta o VANGUARD, uma ferramenta de percepção geométrica leve e determinística que permite a agentes autônomos baseados em LLMs recuperar a escala métrica em ambientes sem GPS ao estimar a Distância de Amostragem do Solo (GSD) a partir de veículos detectados, superando as alucinações espaciais de modelos de visão-linguagem e reduzindo significativamente erros e falhas catastróficas na medição de áreas.

Yifei Chen, Xupeng Chen, Feng Wang + 2 more2026-03-05🤖 cs.AI

IPD: Boosting Sequential Policy with Imaginary Planning Distillation in Offline Reinforcement Learning

O artigo propõe o Imaginary Planning Distillation (IPD), um novo framework de aprendizado por reforço offline que integra planejamento imaginário e um modelo de mundo para enriquecer dados subótimos e treinar políticas sequenciais baseadas em transformadores, superando métodos existentes no benchmark D4RL.

Yihao Qin, Yuanfei Wang, Hang Zhou + 3 more2026-03-05🤖 cs.AI

CubeComposer: Spatio-Temporal Autoregressive 4K 360° Video Generation from Perspective Video

O artigo apresenta o CubeComposer, um modelo de difusão autoregressivo espaço-temporal inovador que gera nativamente vídeos 360° em resolução 4K a partir de vídeos em perspectiva, superando as limitações de resolução e eficiência computacional dos métodos existentes para aplicações de realidade virtual.

Lingen Li, Guangzhi Wang, Xiaoyu Li + 5 more2026-03-05🤖 cs.AI

LabelBuddy: An Open Source Music and Audio Language Annotation Tagging Tool Using AI Assistance

Este artigo apresenta o LabelBuddy, uma ferramenta de código aberto para anotação colaborativa de áudio que utiliza assistência de IA e modelos containerizados para superar a escassez de infraestrutura capaz de capturar nuances subjetivas na recuperação de informações musicais.

Ioannis Prokopiou, Ioannis Sina, Agisilaos Kounelis + 2 more2026-03-05🤖 cs.AI

Activation Outliers in Transformer Quantization: Reproduction, Statistical Analysis, and Deployment Tradeoffs

Este artigo demonstra que a degradação severa na quantização pós-treinamento de transformers é causada por outliers de ativação estruturados, e que estratégias de alocação de precisão por canal, como a quantização mista, são essenciais para recuperar a acurácia, enquanto o ajuste baseado apenas em percentis falha e não impacta significativamente o desempenho de hardware.

Pranav Kumar Kaliaperumal2026-03-05🤖 cs.AI

CRESTomics: Analyzing Carotid Plaques in the CREST-2 Trial with a New Additive Classification Model

Este estudo apresenta o modelo CRESTomics, uma nova classificação aditiva baseada em kernel que analisa imagens de ultrassom de placas carotídeas do ensaio clínico CREST-2 para identificar marcadores radiômicos interpretáveis associados a riscos clínicos elevados de AVC.

Pranav Kulkarni, Brajesh K. Lal, Georges Jreij + 11 more2026-03-05🤖 cs.AI

← Anterior Próximo →