Uncertainty-Aware Subset Selection for Robust Visual Explainability under Distribution Shifts

Este artigo apresenta um novo framework que combina seleção de subconjuntos submodulares com estimativa de incerteza baseada em gradientes para melhorar a robustez e a fidelidade da explicabilidade visual sob mudanças de distribuição, superando as limitações dos métodos existentes em cenários fora da distribuição (OOD) e também em cenários dentro da distribuição (ID).

Madhav Gupta, Vishak Prasad C, Ganesh Ramakrishnan2026-03-09🤖 cs.LG

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

Este artigo propõe uma nova métrica de sensibilidade global baseada em Curvas de Expectativa Condicional Individual (ICE) para superar as limitações dos Gráficos de Dependência Parcial (PDP) na presença de interações fortes, demonstrando matematicamente sua superioridade e validando-a em casos de engenharia aeroespacial e eólica através de comparações com métodos como SHAP e índices de Sobol'.

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

A Novel Patch-Based TDA Approach for Computed Tomography Imaging

Este artigo apresenta uma abordagem inovadora de Análise Topológica de Dados (TDA) baseada em patches para imagens de tomografia computadorizada (CT), que supera os métodos tradicionais de complexo cúbico e características radiômicas em precisão, sensibilidade e eficiência computacional, sendo disponibilizada através do pacote Python Patch-TDA.

Dashti A. Ali, Aras T. Asaad, Jacob J. Peoples, Mohammad Hamghalam, Natalie Gangai, Richard K. G. Do, Alice C. Wei, Amber L. Simpson2026-03-09🤖 cs.LG

Understanding and Improving Hyperbolic Deep Reinforcement Learning

O artigo apresenta o Hyper++, um novo agente de aprendizado por reforço em geometria hiperbólica que supera desafios de otimização através de regularização de características, perda categórica de valor e camadas de rede reformuladas, garantindo treinamento estável e desempenho superior em benchmarks como ProcGen e Atari-5.

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

O artigo apresenta o CARE, um framework de pós-treinamento para raciocínio multimodal que transforma falhas em sinal de supervisão através de um objetivo contrastivo ancorado e de uma reamostragem guiada por reflexão, resultando em ganhos significativos de precisão e suavidade no treinamento em comparação com métodos existentes.

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

Este trabalho propõe um framework end-to-end para reconhecimento de fala audiovisual robusto que elimina a necessidade de máscaras de ruído explícitas, utilizando um módulo de fusão baseado em Conformer para refinar implicitamente as características de áudio com auxílio visual, preservando assim a integridade semântica da fala e superando métodos baseados em máscaras em condições ruidosas.

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

Laser interferometry as a robust neuromorphic platform for machine learning

O artigo apresenta um método robusto para implementar redes neurais ópticas utilizando apenas recursos lineares e estados coerentes de luz, onde a não linearidade necessária para o aprendizado é alcançada através de codificação de fase, permitindo treinamento e inferência *in situ* com alta resiliência à perda de fótons.

Amanuel Anteneh, Kyungeun Kim, J. M. Schwarz, Israel Klich, Olivier Pfister2026-03-09🔬 physics.optics

Online unsupervised Hebbian learning in deep photonic neuromorphic networks

Os autores apresentam e demonstram experimentalmente uma rede neural fotônica profunda que realiza aprendizado não supervisionado online e totalmente óptico, utilizando materiais de mudança de fase para sinapses e um mecanismo de feedback local, alcançando reconhecimento de letras com 100% de precisão sem conversões elétrico-ópticas.

Xi Li, Disha Biswas, Peng Zhou, Wesley H. Brigner, Anna Capuano, Joseph S. Friedman, Qing Gu2026-03-09🔬 physics.optics

EDIS: Diagnosing LLM Reasoning via Entropy Dynamics

O artigo propõe o EDIS, uma métrica que analisa a evolução temporal da entropia durante a geração de texto para identificar padrões de instabilidade característicos de raciocínio incorreto em LLMs, permitindo melhorar a precisão do modelo tanto na seleção durante a inferência quanto na curadoria de dados para treinamento.

Chenghua Zhu, Siyan Wu, Xiangkang Zeng, Zishan Xu, Zhaolu Kang, Yifu Guo, Yuquan Lu, Junduan Huang, Guojing Zhou2026-03-09🤖 cs.LG

Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

O artigo propõe a Decodificação de Exploração Latente (LED), uma estratégia de decodificação que explora a assimetria de entropia entre as camadas intermediárias e finais de Modelos de Raciocínio Grandes pós-treinados para restaurar a eficácia da exploração e melhorar a precisão sem necessidade de treinamento adicional.

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Stress-Testing Alignment Audits With Prompt-Level Strategic Deception

Este artigo apresenta um pipeline automático de red-team que demonstra como estratégias de decepção em nível de prompt podem enganar tanto métodos de auditoria de alinhamento de caixa branca quanto de caixa preta, fornecendo a primeira evidência documentada de decepção estratégica baseada em ativações e sugerindo que as técnicas atuais não são robustas contra modelos desalinhados suficientemente capazes.

Oliver Daniels, Perusha Moodley, Benjamin M. Marlin, David Lindner2026-03-09🤖 cs.LG

Validating Interpretability in siRNA Efficacy Prediction: A Perturbation-Based, Dataset-Aware Protocol

Este artigo propõe um protocolo de validação baseado em perturbação para mapas de saliência em previsões de eficácia de siRNA, demonstrando que a validação prévia é essencial para evitar falhas de generalização e introduzindo um regularizador biológico (BioPrior) que melhora a fidelidade das explicações com um custo preditivo moderado.

Zahra Khodagholi, Niloofar Yousefi2026-03-09🤖 cs.LG

Towards Autonomous Mathematics Research

O artigo apresenta o Aletheia, um agente de pesquisa matemática autônomo que, combinando raciocínio avançado, escalabilidade na inferência e uso intensivo de ferramentas, gera e revisa soluções em linguagem natural para problemas que vão desde olimpíadas até contribuições originais em pesquisa acadêmica, como a descoberta de constantes estruturais e a resolução de questões abertas, ao mesmo tempo que propõe novos padrões para medir autonomia e transparência na colaboração humano-IA.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI