Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

O artigo propõe o método SGV (Self-Grounded Verification) para mitigar o viés de concordância em Verificadores de LLMs Multimodais, permitindo que eles gerem priores independentes antes de avaliar trajetórias, o que resulta em detectores de falhas mais precisos e alinhados com humanos, melhorando significativamente o desempenho de agentes em tarefas de navegação web, uso de computador e robótica.

Moises Andrade, Joonhyuk Cha, Brandon Ho, Vriksha Srihari, Karmesh Yadav, Zsolt Kira2026-03-10🤖 cs.LG

Flow Matching Meets Biology and Life Science: A Survey

Este artigo apresenta o primeiro levantamento abrangente sobre o *flow matching* e suas aplicações emergentes em biologia e ciências da vida, revisando suas fundações, categorizando usos em modelagem de sequências, geração de moléculas e proteínas, e discutindo recursos e direções futuras.

Zihao Li, Zhichen Zeng, Xiao Lin, Feihao Fang, Yanru Qu, Zhe Xu, Zhining Liu, Xuying Ning, Tianxin Wei, Ge Liu, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

Weak-to-Strong Generalization with Failure Trajectories: A Tree-based Approach to Elicit Optimal Policy in Strong Models

Este artigo propõe uma abordagem baseada em árvores que utiliza trajetórias de falha e sucesso de modelos fracos, organizadas em "árvores de trajetória" e otimizadas via Monte Carlo Tree Search, para aprimorar a generalização de fraco para forte e elicitar políticas ótimas em modelos fortes para tarefas complexas de tomada de decisão.

Ruimeng Ye, Zihan Wang, Yang Xiao, Zinan Ling, Manling Li, Bo Hui2026-03-10🤖 cs.LG

Exposing the Illusion of Fairness: Auditing Vulnerabilities to Distributional Manipulation Attacks

Este trabalho demonstra que um auditor malicioso pode manipular amostras de dados para parecerem justas e representativas, satisfazendo métricas de equidade regulatórias sem alterar significativamente a distribuição original, e propõe métodos estatísticos baseados em distância de distribuição para detectar tais ataques.

Valentin Lafargue, Adriana Laurindo Monteiro, Emmanuelle Claeys, Laurent Risser, Jean-Michel Loubes2026-03-10🤖 cs.LG

Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models

O artigo apresenta o framework DAS (Dinâmico, Automático e Sistemático), uma abordagem de red-teaming que revela uma "lacuna de benchmarking" crítica, demonstrando que, apesar de altos desempenhos em testes estáticos, a maioria dos modelos de linguagem médica falha em testes de segurança dinâmicos devido a vulnerabilidades generalizadas em robustez, privacidade, viés e alucinações.

Jiazhen Pan (Cherise), Bailiang Jian (Cherise), Paul Hager (Cherise), Yundi Zhang (Cherise), Che Liu (Cherise), Friedrike Jungmann (Cherise), Hongwei Bran Li (Cherise), Chenyu You (Cherise), Junde Wu (Cherise), Jiayuan Zhu (Cherise), Fenglin Liu (Cherise), Yuyuan Liu (Cherise), Niklas Bubeck (Cherise), Christian Wachinger (Cherise), Chen (Cherise), Chen (Cherise), Zhenyu Gong, Cheng Ouyang, Georgios Kaissis, Benedikt Wiestler, Daniel Rueckert2026-03-10🤖 cs.LG

CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data

O artigo apresenta o CauKer, um algoritmo inovador que utiliza a composição de kernels de Processos Gaussianos e Modelos Causais Estruturais para gerar séries temporais sintéticas causalmente coerentes, permitindo o pré-treinamento eficiente e escalável de modelos fundamentais de classificação de séries temporais com desempenho superior ao observado em conjuntos de dados reais.

Shifeng Xie, Vasilii Feofanov, Ambroise Odonnat, Lei Zan, Marius Alonso, Jianfeng Zhang, Themis Palpanas, Lujia Pan, Keli Zhang, Ievgen Redko2026-03-10🤖 cs.LG

GraphProp: Training the Graph Foundation Models using Graph Properties

O artigo apresenta o GraphProp, um método de treinamento para modelos fundamentais de grafos que prioriza a generalização estrutural ao prever invariantes gráficos, superando abordagens anteriores ao capturar informações consistentes entre domínios e alcançar desempenho superior em tarefas de classificação, especialmente em cenários com poucos dados ou ausência de atributos de nós.

Ziheng Sun, Qi Feng, Lehao Lin, Chris Ding, Jicong Fan2026-03-10🤖 cs.LG

Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions

Este artigo apresenta um algoritmo baseado em jogos dinâmicos inversos que utiliza programas lineares inteiros mistos para aprender restrições paramétricas a partir de demonstrações de interações de equilíbrio de Nash local entre múltiplos agentes, garantindo teoricamente a recuperação de aproximações internas dos conjuntos seguros e inseguros para o planejamento de movimentos robusto.

Zhouyu Zhang, Chih-Yuan Chiu, Glen Chou2026-03-10🤖 cs.LG

CbLDM: A Diffusion Model for recovering nanostructure from atomic pair distribution function

Este estudo propõe o modelo CbLDM, uma abordagem baseada em difusão latente condicional que utiliza matrizes Laplacianas para recuperar de forma estável e fisicamente significativa a nanoestrutura de nanopartículas metálicas a partir de suas funções de distribuição de pares atômicos.

Jiarui Cao, Zhiyang Zhang, Heming Wang, Jun Xu, Ling Lan, Simon J. L. Billinge, Ran Gu2026-03-10🔬 cond-mat.mtrl-sci

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

Este estudo estabelece limites empíricos para a inferência comportamental em escala, revelando uma assimetria fundamental onde as motivações são inferidas com precisão quase total, enquanto os sistemas de crenças atingem um teto de desempenho limitado pela arquitetura e pela ambiguidade inerente dos comportamentos, mesmo com o uso de agentes LLM e aprendizado curricular.

Jason Starace, Terence Soule2026-03-10🤖 cs.LG

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

Este artigo apresenta um pipeline modular multimodal baseado em Inteligência Artificial generativa para sintetizar dados acessíveis e realistas de edifícios residenciais a partir de imagens públicas, reduzindo a dependência de fontes de dados restritas ou custosas para pesquisas em simulação energética e aprendizado de máquina.

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

O artigo apresenta o PANO, um operador neural consciente da física que realiza a inversão direta e em tempo real de dados brutos para imagens volumétricas 3D em tomografia fotoacústica, superando significativamente os algoritmos tradicionais e permitindo sistemas de aquisição mais acessíveis.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima Anandkumar2026-03-10🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

Este artigo apresenta um método que combina aprendizado profundo e Condutâncias de Entrada Dinâmicas (DICs) para reconstruir rapidamente populações degeneradas de modelos neuronais baseados em condutância a partir de tempos de disparo, permitindo a inferência eficiente de parâmetros biofísicos e a exploração da variabilidade de condutâncias que garantem a computação neuronal confiável.

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur Fyon2026-03-10🤖 cs.LG

MICA: Multi-Agent Industrial Coordination Assistant

Este artigo apresenta o MICA, um assistente de coordenação multiagente baseado em percepção e interação por voz, projetado para oferecer suporte confiável e adaptável a fluxos de trabalho industriais em hardware offline com restrições de privacidade, utilizando uma arquitetura de cinco agentes especializados supervisionados por um verificador de segurança e uma nova técnica de fusão adaptativa de etapas.

Di Wen, Kunyu Peng, Junwei Zheng, Yufan Chen, Yitian Shi, Jiale Wei, Ruiping Liu, Kailun Yang, Rainer Stiefelhagen2026-03-10🤖 cs.LG