Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

Dit paper toont aan dat Sharpness-Aware Minimization (SAM) bij diepe lineaire netwerken een dieptegedreven impliciete bias vertoont die fundamenteel verschilt van gradient descent, waarbij \ell_\infty-SAM gevoelig is voor initialisatie en 2\ell_2-SAM een uniek fenomeen van sequentiële kenversterking vertoont dat de beperkingen van onbeperkte impliciete-biasanalyses blootlegt.

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

Dit artikel introduceert een algemeen framework voor het evalueren van de kwaliteit van warmtekaarten in multiple instance learning-modellen voor histopathologie, waarbij wordt aangetoond dat methoden zoals perturbation en LRP betrouwbaardere verklaringen bieden dan traditionele attention-mechanismen, wat leidt tot betere modelvalidatie en biologische inzichten.

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

Dit paper introduceert een efficiëntere Transformer-architectuur die de dichte output-projectie in multi-head attention vervangt door een vaste Walsh-Hadamard-transformatie gecombineerd met een lichte affiene herschaling, wat resulteert in een aanzienlijke vermindering van parameters, geheugengebruik en inferentiekosten zonder in te leveren op prestaties.

Shubham Aggarwal, Lokendra Kumar2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Deze paper introduceert een nieuwe methode voor het genereren van plausibele tegenfeitelijke verklaringen voor tijdreeksclassificatie door middel van gradiëntgebaseerde optimalisatie en soft-DTW-alignment, wat resulteert in verklaringen die niet alleen geldig zijn maar ook een realistische temporele structuur behouden die beter aansluit bij de doelklasse dan bestaande methoden.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

Deze paper introduceert ToCoRL, een framework dat de inherente gedragsplasticiteit van grote taalmodellen benut door middel van token-voorwaardelijke generatie en versterkingslering, waardoor modellen hun gedrag (zoals het schakelen tussen stap-voor-stap redeneren en direct antwoorden) stabiel kunnen aanpassen zonder hun oorspronkelijke vaardigheden te verliezen.

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Deze prospectieve haalbaarheidsstudie toont aan dat een conversational AI (AMIE) in een echte huisartsenpraktijk veilig en effectief kan worden ingezet voor het verzamelen van anamnese en het formuleren van differentiaaldiagnoses, waarbij de kwaliteit vergelijkbaar was met die van huisartsen, hoewel de huisartsen nog steeds beter scoorden op praktische uitvoerbaarheid en kosten-effectiviteit.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG