FLoC: Facility Location-Based Efficient Visual Token Compression for Long Video Understanding

Il paper presenta FLoC, un framework di compressione efficiente e senza addestramento per i token visivi nei modelli multimodali su video lunghi, che utilizza una funzione di localizzazione delle strutture per selezionare in modo rapido e ottimale un sottoinsieme rappresentativo di token, migliorando significativamente le prestazioni su vari benchmark.

Janghoon Cho, Jungsoo Lee, Munawar Hayat + 3 more2026-03-06💻 cs

CycleChemist: A Dual-Pronged Machine Learning Framework for Organic Photovoltaic Discovery

Il paper presenta "CycleChemist", un innovativo framework di machine learning dualistico che, sfruttando il nuovo dataset OPV2D, combina modelli predittivi per le proprietà elettroniche e delle prestazioni delle celle solari organiche con un generatore di molecole basato su MatGPT per accelerare la scoperta di materiali donatori e accettori ad alta efficienza.

Hou Hei Lam, Jiangjie Qiu, Xiuyuan Hu + 5 more2026-03-06🔬 cond-mat.mtrl-sci

Deep FlexQP: Accelerated Nonlinear Programming via Deep Unfolding

Il paper propone Deep FlexQP, un risolutore di programmazione quadratica convessa basato su un'architettura di deep unfolding che garantisce la fattibilità e accelera significativamente la risoluzione di problemi di ottimizzazione non lineare, superando gli stati dell'arte in termini di velocità e successo in applicazioni come l'ottimizzazione di traiettorie e i filtri di sicurezza predittivi.

Alex Oshin, Rahul Vodeb Ghosh, Augustinos D. Saravanos + 1 more2026-03-06🔢 math

Bootstrapped Mixed Rewards for RL Post-Training: Injecting Canonical Action Order

Questo studio dimostra che l'aggiunta di un segnale di ricompensa per l'ordine canonico delle azioni, combinato con una ricompensa di compito durante il post-training con RL su indovinelli Zebra, migliora le prestazioni del modello rispetto all'ottimizzazione basata solo sul compito, guidando il modello verso traiettorie canoniche senza modificare i dati supervisionati o l'architettura.

Prakhar Gupta, Vaibhav Gupta2026-03-06💻 cs

ClinNoteAgents: An LLM Multi-Agent System for Predicting and Interpreting Heart Failure 30-Day Readmission from Clinical Notes

Il paper presenta ClinNoteAgents, un sistema multi-agente basato su LLM che trasforma le note cliniche non strutturate in rappresentazioni interpretabili per prevedere con alta accuratezza il rischio di riammissione ospedaliera a 30 giorni per insufficienza cardiaca, riducendo al contempo la dipendenza da dati strutturati e annotazioni manuali.

Rongjia Zhou, Chengzhuo Li, Carl Yang + 1 more2026-03-06💻 cs

Achieving Olympia-Level Geometry Large Language Model Agent via Complexity Boosting Reinforcement Learning

Il paper presenta InternGeometry, un agente basato su un modello linguistico potenziato da un meccanismo di memoria dinamica e da un'apprendimento per rinforzo a complessità crescente (CBRL), che risolve il 88% dei problemi di geometria delle Olimpiadi Internazionali di Matematica con una frazione minima dei dati di addestramento rispetto agli approcci precedenti, superando anche la media dei vincitori di medaglia d'oro.

Haiteng Zhao, Junhao Shen, Yiming Zhang + 7 more2026-03-06💻 cs