ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

O artigo apresenta o framework ORIC e o benchmark ORIC-Bench para avaliar e mitigar as falhas de reconhecimento de objetos em Modelos Visuais-Linguísticos de Grande Escala (LVLMs) causadas por incongruências contextuais, demonstrando que o ajuste fino com reforço visual em dados incongruentes melhora significativamente a robustez e reduz alucinações nesses modelos.

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

Este trabalho propõe o método ORN-CBF, que utiliza redes neurais condicionadas a observações e uma arquitetura de hiperrede baseada em análise de alcançabilidade de Hamilton-Jacobi para garantir segurança rigorosa e recuperar conjuntos seguros máximos em ambientes parcialmente observáveis, demonstrando superioridade em simulações e experimentos com robôs terrestres e quadricópteros.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

O artigo apresenta o Aurora, um modelo fundamental multimodal para previsão de séries temporais que, ao integrar conhecimento de domínios específicos extraído de textos e imagens por meio de mecanismos de atenção e correspondência de fluxo guiada por protótipos, alcança generalização zero-shot e desempenho superior em cenários unimodais e multimodais.

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

O artigo apresenta o CLAD-Net, um framework que combina um transformador auto-supervisionado para memória de longo prazo e uma CNN com distilação de conhecimento para mitigar o esquecimento catastrófico e lidar com a escassez de dados rotulados em sistemas de reconhecimento de atividades contínuas baseados em sensores vestíveis.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

O artigo apresenta o GEMS, um framework de aprendizado por reforço multiagente escalável e sem substitutos que supera as ineficiências de memória e computação do PSRO ao substituir populações explícitas por geradores amortizados e rolagens de Monte Carlo, alcançando maior velocidade e eficiência em diversos jogos.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Este trabalho apresenta a Regularização Adaptativa à Sobreposição (OAR), uma nova abordagem que melhora a estimativa do Efeito Médio de Tratamento Condicional (CATE) em regiões de baixa sobreposição ao regularizar os modelos-alvo proporcionalmente aos pesos de sobreposição, sendo compatível com qualquer meta-aprendiz existente e oferecendo versões viesadas para inferência robusta.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Este artigo introduz o conceito de "misevolução" como um risco emergente em agentes de LLM autoevolutivos, demonstrando empiricamente que a evolução autônoma pode levar a resultados indesejados ou prejudiciais em modelos, memória, ferramentas e fluxos de trabalho, e propõe novas estratégias de mitigação para garantir a segurança desses sistemas.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Este artigo apresenta o DRQ-learner, um novo meta-aprendizado que prevê resultados individuais em processos de decisão de Markov com dados observacionais, oferecendo garantias teóricas robustas como dupla robustez, ortogonalidade de Neyman e eficiência quasi-órcula, enquanto supera os métodos existentes em experimentos numéricos.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

O artigo apresenta o SelfOrg, um framework de auto-organização estocástica para sistemas multiagentes baseados em LLMs que otimiza dinamicamente a comunicação entre agentes sem supervisão externa, utilizando valores de Shapley para construir grafos direcionados que garantem a propagação eficiente de respostas de alta qualidade e demonstram ganhos significativos de desempenho, especialmente com modelos mais fracos.

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

O artigo apresenta o CroSTAta, um Transformer que utiliza um mecanismo de Atenção à Transição de Estados (STA) e mascaramento temporal para melhorar a robustez e o desempenho de políticas de manipulação robótica ao modelar explicitamente padrões de evolução temporal, como falhas e recuperações, superando abordagens convencionais em tarefas críticas.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

O artigo propõe um novo método de dupla projeção baseado em autoencoders variacionais dinâmicos para reconstruir sistemas dinâmicos a partir de dados observados, permitindo a estimação simultânea de trajetórias de estado e séries temporais de ruído, o que facilita a evolução multietapa e a aprendizagem de modelos com espaço de estado de baixa dimensão, sendo validado em diversos problemas de benchmark e comparado a modelos determinísticos.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG