cs.LG artigos | Gist.Science

Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing

Este artigo demonstra teoricamente e valida empiricamente que as alucinações em modelos de linguagem são uma consequência inevitável da otimização de memória sob capacidade limitada, onde a estratégia informacionalmente ótima para testes de associação em dados esparsos exige a atribuição de alta confiança a alguns fatos incorretos como resultado da compressão com perdas.

Anxin Guo, Jingwei Li2026-03-12💬 cs.CL

Grounding Generated Videos in Feasible Plans via World Models

O artigo apresenta o GVP-WM, um método que utiliza modelos de mundo para corrigir planos gerados por vídeo, transformando-os em sequências de ações viáveis e fisicamente consistentes por meio de otimização no espaço latente.

Christos Ziakas, Amir Bar, Alessandra Russo2026-03-12🤖 cs.LG

Expert-Data Alignment Governs Generation Quality in Decentralized Diffusion Models

O estudo demonstra que a qualidade da geração em Modelos de Difusão Descentralizados é governada pelo alinhamento entre os especialistas e os dados, e não pela estabilidade numérica, pois o roteamento que prioriza especialistas treinados em distribuições de dados próximas ao estado atual de remoção de ruído produz resultados superiores, mesmo que isso resulte em dinâmicas de amostragem menos estáveis.

Marcos Villagra, Bidhan Roy, Raihan Seraj, Zhiying Jiang2026-03-12🤖 cs.LG

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

Este artigo apresenta uma abordagem baseada em bandit contextual, utilizando amostragem de Thompson, para otimizar a sequência personalizada de exercícios em sistemas de recomendação educacional, demonstrando que tal método maximiza o ganho de habilidades dos alunos em plataformas de tutoria online em larga escala.

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

Universality of General Spiked Tensor Models

Este artigo estabelece um princípio de universalidade para modelos de tensores espigados assimétricos, demonstrando que, sob condições de momento finito, o comportamento espectral e os limites estatísticos do estimador de máxima verossimilhança selecionado são robustos e idênticos aos do caso gaussiano, mesmo na presença de ruído não gaussiano.

Yanjin Xiang, Zhihua Zhang2026-03-12📊 stat

BLITZRANK: Principled Zero-shot Ranking Agents with Tournament Graphs

O artigo apresenta o BLITZRANK, um framework baseado em grafos de torneio que permite a agentes de classificação zero-shot identificar os melhores itens com maior precisão e eficiência, reduzindo significativamente o custo computacional ao extrair e agregar preferências implícitas de comparações múltiplas.

Sheshansh Agrawal, Thien Hang Nguyen, Douwe Kiela2026-03-12🤖 cs.LG

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization

Este artigo propõe o Fine-grained Group Policy Optimization (FGO), um algoritmo de Aprendizado por Reforço que comprime de forma eficiente o raciocínio passo a passo (Chain-of-Thought) de Grandes Modelos de Linguagem, superando limitações de eficiência de dados e colapso de entropia do GRPO sem degradar o desempenho em benchmarks de raciocínio.

Xinchen Han, Hossam Afifi, Michel Marot, Xilu Wang, Lu Yin2026-03-12🤖 cs.LG

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

O artigo propõe o GOT-JEPA, um framework de pré-treinamento que adapta a arquitetura JEPA para prever modelos de rastreamento em vez de apenas características visuais, combinando-o com o módulo OccuSolver para melhorar a percepção de oclusão e a generalização em ambientes dinâmicos.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-12🤖 cs.AI

LexiSafe: Offline Safe Reinforcement Learning with Lexicographic Safety-Reward Hierarchy

O artigo apresenta o LexiSafe, um framework de aprendizado por reforço offline seguro que utiliza uma hierarquia lexicográfica para priorizar a segurança sobre a recompensa, oferecendo garantias teóricas e desempenho superior em sistemas ciber-físicos críticos.

Hsin-Jung Yang, Zhanhong Jiang, Prajwal Koirala, Qisai Liu, Cody Fleming, Soumik Sarkar2026-03-12⚡ eess

ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging

O artigo apresenta o ZACH-ViT, uma arquitetura compacta de Vision Transformer que elimina embeddings posicionais e o token [CLS] para processamento invariante a permutações, demonstrando que essa abordagem adaptativa supera ou compete com modelos tradicionais em cenários de poucos dados e imagens médicas onde a estrutura espacial é menos informativa.

Athanasios Angelakis2026-03-12⚡ eess

Benchmarking Graph Neural Networks in Solving Hard Constraint Satisfaction Problems

Este artigo propõe novos benchmarks baseados em problemas aleatórios sob uma perspectiva de física estatística para avaliar Redes Neurais de Grafos em problemas de satisfação de restrições difíceis, demonstrando que, em uma comparação justa, os algoritmos clássicos ainda superam as redes neurais.

Geri Skenderi, Lorenzo Buffoni, Francesco D'Amico, David Machado, Raffaele Marino, Matteo Negri, Federico Ricci-Tersenghi, Carlo Lucibello, Maria Chiara Angelini2026-03-12🔬 cond-mat

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

Este artigo demonstra que analistas de IA autônomos podem replicar a diversidade analítica observada em estudos humanos, gerando resultados dispersos e "steeráveis" que evidenciam a necessidade de novas normas de transparência, como a divulgação de prompts e a adoção de relatórios estilo multiverso, para lidar com a incerteza analítica na ciência automatizada.

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

Active Value Querying to Minimize Additive Error in Subadditive Set Function Learning

Este artigo propõe e avalia métodos de consulta ativa para minimizar o erro aditivo na aprendizagem de funções de conjunto subaditivas com valores faltantes, focando na redução da distância entre as conclusões mínima e máxima dessas funções em cenários offline e online.

Martin Černý, David Sychrovský, Filip Úradník, Jakub Černý2026-03-12🤖 cs.LG

How Large Language Models Get Stuck: Early structure with persistent errors

Este artigo investiga como modelos de linguagem como o OPT podem desenvolver erros persistentes durante o treinamento ao estabelecerem cedo vieses estatísticos equivocados (especialmente baseados em bigramas) que se tornam difíceis de reverter, sugerindo que insights linguísticos são essenciais para otimizar esse processo.

Alokesh Manna, William Snyder, Whitney Tabor2026-03-12💬 cs.CL

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

O artigo apresenta o CARE, um framework agêntico que aprimora a responsabilidade clínica no raciocínio médico multimodal ao decompor a tarefa em módulos especializados com fundamentação em evidências visuais e verificação iterativa, superando significativamente os modelos de ponta em benchmarks de VQA médica.

Yuexi Du, Jinglu Wang, Shujie Liu, Nicha C. Dvornek, Yan Lu2026-03-12🤖 cs.AI

CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance

O artigo apresenta o CFG-Ctrl, um quadro unificado que reinterpreta a Orientação Livre de Classificador (CFG) como um controle de fluxo, propondo especificamente o método SMC-CFG baseado em Controle por Modo Deslizante para superar a instabilidade e a perda de fidelidade semântica dos métodos existentes, garantindo convergência estável e superior em modelos de geração de imagens.

Hanyang Wang, Yiyang Liu, Jiawei Chi, Fangfu Liu, Ran Xue, Yueqi Duan2026-03-12🤖 cs.LG

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

Este artigo apresenta a primeira avaliação abrangente do ajuste fino eficiente em parâmetros (PEFT) para análise de código multitarefa, demonstrando que um único módulo PEFT compartilhado pode igualar ou superar o ajuste fino completo e o ajuste de tarefas únicas, oferecendo um excelente equilíbrio entre desempenho e eficiência enquanto revela que o sucesso depende de fatores como estabilidade da tarefa, arquitetura do modelo e complementaridade.

Amal Akli, Maxime Cordy, Mike Papadakis, Yves Le Traon2026-03-12💻 cs

Explainable LLM Unlearning Through Reasoning

O artigo propõe o "Targeted Reasoning Unlearning" (TRU), uma nova abordagem que utiliza alvos de raciocínio explícitos para guiar a remoção precisa de conhecimento indesejado em Grandes Modelos de Linguagem, garantindo ao mesmo tempo a preservação das capacidades gerais do modelo e a robustez contra ataques.

Junfeng Liao, Qizhou Wang, Shanshan Ye, Xin Yu, Ling Chen, Zhen Fang2026-03-12🤖 cs.LG

MoE-SpAc: Efficient MoE Inference Based on Speculative Activation Utility in Heterogeneous Edge Scenarios

O artigo apresenta o MoE-SpAc, um framework de inferência para modelos MoE em dispositivos de borda heterogêneos que utiliza a Decodificação Especulativa como sensor de previsão de demanda de memória, resultando em um aumento de 42% na taxa de tokens por segundo em comparação com a linha de base mais avançada.

Shuhuai Li, Jianghao Lin, Dongdong Ge, Yinyu Ye2026-03-12🤖 cs.LG

Evolving Demonstration Optimization for Chain-of-Thought Feature Transformation

Este artigo apresenta um framework que otimiza a transformação de características impulsionada por Grandes Modelos de Linguagem (LLMs) através de um ciclo fechado de evolução de demonstrações e seleção diversificada de experiências, superando métodos existentes em desempenho, estabilidade e cobertura em benchmarks tabulares.

Xinyuan Wang, Kunpeng Liu, Arun Vignesh Malarkkan, Yanjie Fu2026-03-12💬 cs.CL

← Anterior Próximo →