Breaking the Stochasticity Barrier: An Adaptive Variance-Reduced Method for Variational Inequalities

Este artigo apresenta o VR-SDA-A, um método inovador de redução de variância que combina momentum recursivo com verificação de curvatura por mesma amostra para superar a barreira da estocasticidade em desigualdades variacionais estocásticas, alcançando complexidade de oráculo ótima de O(ε⁻³) e permitindo adaptação automática da taxa de aprendizado em cenários não convexos e não côncavos.

Yungi Jeong, Takumi Otsuka2026-03-12🤖 cs.LG

Emergence of Distortions in High-Dimensional Guided Diffusion Models

Este artigo formaliza a perda de diversidade em modelos de difusão guiados por classificação (CFG) como uma distorção generativa, demonstrando através de análise de física estatística que esse fenômeno surge em um regime de alta dimensão e propondo um novo cronograma de orientação com janela de orientação negativa para mitigar a redução de variância sem comprometer a separabilidade das classes.

Enrico Ventura, Beatrice Achilli, Luca Ambrogioni, Carlo Lucibello2026-03-12📊 stat

Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing

Este artigo demonstra teoricamente e valida empiricamente que as alucinações em modelos de linguagem são uma consequência inevitável da otimização de memória sob capacidade limitada, onde a estratégia informacionalmente ótima para testes de associação em dados esparsos exige a atribuição de alta confiança a alguns fatos incorretos como resultado da compressão com perdas.

Anxin Guo, Jingwei Li2026-03-12💬 cs.CL

Expert-Data Alignment Governs Generation Quality in Decentralized Diffusion Models

O estudo demonstra que a qualidade da geração em Modelos de Difusão Descentralizados é governada pelo alinhamento entre os especialistas e os dados, e não pela estabilidade numérica, pois o roteamento que prioriza especialistas treinados em distribuições de dados próximas ao estado atual de remoção de ruído produz resultados superiores, mesmo que isso resulte em dinâmicas de amostragem menos estáveis.

Marcos Villagra, Bidhan Roy, Raihan Seraj, Zhiying Jiang2026-03-12🤖 cs.LG

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

Este artigo apresenta uma abordagem baseada em bandit contextual, utilizando amostragem de Thompson, para otimizar a sequência personalizada de exercícios em sistemas de recomendação educacional, demonstrando que tal método maximiza o ganho de habilidades dos alunos em plataformas de tutoria online em larga escala.

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization

Este artigo propõe o Fine-grained Group Policy Optimization (FGO), um algoritmo de Aprendizado por Reforço que comprime de forma eficiente o raciocínio passo a passo (Chain-of-Thought) de Grandes Modelos de Linguagem, superando limitações de eficiência de dados e colapso de entropia do GRPO sem degradar o desempenho em benchmarks de raciocínio.

Xinchen Han, Hossam Afifi, Michel Marot, Xilu Wang, Lu Yin2026-03-12🤖 cs.LG

Benchmarking Graph Neural Networks in Solving Hard Constraint Satisfaction Problems

Este artigo propõe novos benchmarks baseados em problemas aleatórios sob uma perspectiva de física estatística para avaliar Redes Neurais de Grafos em problemas de satisfação de restrições difíceis, demonstrando que, em uma comparação justa, os algoritmos clássicos ainda superam as redes neurais.

Geri Skenderi, Lorenzo Buffoni, Francesco D'Amico, David Machado, Raffaele Marino, Matteo Negri, Federico Ricci-Tersenghi, Carlo Lucibello, Maria Chiara Angelini2026-03-12🔬 cond-mat

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

Este artigo demonstra que analistas de IA autônomos podem replicar a diversidade analítica observada em estudos humanos, gerando resultados dispersos e "steeráveis" que evidenciam a necessidade de novas normas de transparência, como a divulgação de prompts e a adoção de relatórios estilo multiverso, para lidar com a incerteza analítica na ciência automatizada.

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

O artigo apresenta o CARE, um framework agêntico que aprimora a responsabilidade clínica no raciocínio médico multimodal ao decompor a tarefa em módulos especializados com fundamentação em evidências visuais e verificação iterativa, superando significativamente os modelos de ponta em benchmarks de VQA médica.

Yuexi Du, Jinglu Wang, Shujie Liu, Nicha C. Dvornek, Yan Lu2026-03-12🤖 cs.AI

CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance

O artigo apresenta o CFG-Ctrl, um quadro unificado que reinterpreta a Orientação Livre de Classificador (CFG) como um controle de fluxo, propondo especificamente o método SMC-CFG baseado em Controle por Modo Deslizante para superar a instabilidade e a perda de fidelidade semântica dos métodos existentes, garantindo convergência estável e superior em modelos de geração de imagens.

Hanyang Wang, Yiyang Liu, Jiawei Chi, Fangfu Liu, Ran Xue, Yueqi Duan2026-03-12🤖 cs.LG