cs.LG articoli | Gist.Science

Identifying and Characterising Response in Clinical Trials: Development and Validation of a Machine Learning Approach in Colorectal Cancer

Questo studio presenta e convalida un nuovo approccio basato sull'apprendimento automatico che combina la modellazione parzialmente condizionata e il metodo Virtual Twins per identificare e caratterizzare dinamicamente la risposta ai trattamenti nei pazienti con cancro colorettale metastatico, ottenendo risultati coerenti con la letteratura e superiori ai metodi statici esistenti.

Adam Marcus, Paul Agapow2026-03-03🤖 cs.LG

Initialization-Aware Score-Based Diffusion Sampling

Questo lavoro propone una strategia di campionamento teoricamente fondata per i modelli generativi basati su score che, analizzando la convergenza KL dei diffusori a varianza esplosiva, impara un'inizializzazione del processo inverso per ridurre significativamente il numero di passaggi di campionamento necessari mantenendo o migliorando la qualità generativa.

Tiziano Fassina, Gabriel Cardoso, Sylvan Le Corff + 1 more2026-03-03📊 stat

Interpretable Cross-Network Attention for Resting-State fMRI Representation Learning

Il paper presenta BrainInterNet, un framework auto-supervisionato interpretabile basato su attenzione incrociata che, analizzando dati rs-fMRI multi-coorte, quantifica le interazioni tra reti cerebrali per caratterizzare la riorganizzazione funzionale nell'Alzheimer e supportare la classificazione della malattia.

Karanpartap Singh, Adam Turnbull, Mohammad Abbasi + 3 more2026-03-03🤖 cs.LG

Identifying the Geographic Foci of US Local News

Questo studio propone un modello innovativo basato su LLM e caratteristiche spaziali-sematiche per identificare con alta precisione i foci geografici negli articoli di notizie locali statunitensi, permettendo di analizzare le pressioni economiche sul giornalismo locale e lo spostamento verso narrazioni nazionali.

Gangani Ariyarathne, Isuru Ariyarathne, Greatness Emmanuel-King + 2 more2026-03-03🤖 cs.LG

Neural Latent Arbitrary Lagrangian-Eulerian Grids for Fluid-Solid Interaction

Il paper presenta Fisale, un framework basato sull'apprendimento profondo che risolve complessi problemi di interazione fluido-solido bidirezionali modellando esplicitamente l'interfaccia di accoppiamento e utilizzando griglie latenti ALE multiscale per gestire dinamiche non lineari in scenari 2D e 3D.

Shilong Tao, Zhe Feng, Shaohan Chen + 3 more2026-03-03🤖 cs.LG

Efficient Conformal Volumetry for Template-Based Segmentation

Il paper introduce ConVOLT, un framework di previsione conforme che migliora l'efficienza della quantificazione dell'incertezza volumetrica nella segmentazione basata su template sfruttando le proprietà del campo di deformazione per generare intervalli più stretti rispetto ai metodi tradizionali nello spazio di output.

Matt Y. Cheung, Ashok Veeraraghavan, Guha Balakrishnan2026-03-03🧬 q-bio

Lookahead identification in adversarial bandits: accuracy and memory bounds

Questo lavoro introduce l'identificazione con anticipazione nei banditi avversari, dimostrando che è possibile identificare un braccio quasi ottimale per finestre future con un errore limitato e analizzando i compromessi tra accuratezza e risorse di memoria necessarie.

Nataly Brukhim, Nicolò Cesa-Bianchi, Carlo Ciliberto2026-03-03🤖 cs.LG

Curation Leaks: Membership Inference Attacks against Data Curation for Machine Learning

Questo lavoro dimostra che i processi di curazione dei dati per il machine learning, anche quando utilizzati per selezionare dati pubblici basandosi su dati privati senza addestramento diretto, sono vulnerabili ad attacchi di inferenza dell'appartenenza che rivelano informazioni sensibili, ma che tali rischi possono essere mitigati applicando garanzie di privacy differenziale.

Dariush Wahdany, Matthew Jagielski, Adam Dziedzic + 1 more2026-03-03🤖 cs.LG

Wave-Attractor-Tree: A Hierarchical Binary Tree Reduction Architecture for Efficient Sequence Modeling

Il paper presenta Wave-Attractor-Tree, un'architettura di riduzione gerarchica basata su un albero binario che sostituisce l'attenzione self-attention con un'operazione di fusione ricorsiva a unità lineari gating, ottenendo complessità lineare e superando i Transformer standard nella modellazione di dipendenze strutturali a lungo raggio.

Igor Berezkin2026-03-03🤖 cs.LG

A short tour of operator learning theory: Convergence rates, statistical limits, and open questions

Questo articolo esamina le recenti intersezioni tra apprendimento di operatori, teoria statistica e approssimazione, analizzando i limiti di convergenza, le barriere statistiche fondamentali e le questioni aperte attraverso una prospettiva minimax.

Simone Brugiapaglia, Nicola Rares Franco, Nicholas H. Nelsen2026-03-03📊 stat

Constitutional Black-Box Monitoring for Scheming in LLM Agents

Questo studio dimostra che monitori basati su LLM, ottimizzati su dati sintetici generati da specifiche comportamentali naturali, riescono a generalizzare l'individuazione di schemi di inganno in ambienti realistici, sebbene le prestazioni raggiungano rapidamente un plateau oltre il quale un'ulteriore ottimizzazione porta solo a un sovradattamento.

Simon Storf, Rich Barton-Cooper, James Peters-Gill + 1 more2026-03-03💬 cs.CL

Tiny-Critic RAG: Empowering Agentic Fallback with Parameter-Efficient Small Language Models

Il paper propone Tiny-Critic RAG, un approccio che utilizza un piccolo modello linguistico efficiente in parametri come gatekeeper per il routing binario nei sistemi RAG agentici, riducendo significativamente la latenza e i costi rispetto all'uso di grandi modelli per la valutazione.

Yichao Wu, Penghao Liang, Yafei Xiang + 5 more2026-03-03🤖 cs.LG

GeMi: A Graph-based, Multimodal Recommendation System for Narrative Scroll Paintings

Il paper presenta GeMi, un sistema di raccomandazione basato su reti neurali grafiche e dati multimodali progettato per conservare e promuovere le antiche pitture narrate a rotolo, un'arte performativa a rischio di estinzione.

Haimonti Dutta, Pruthvi Moluguri, Jin Dai + 1 more2026-03-03🤖 cs.LG

Navigating Time's Possibilities: Plausible Counterfactual Explanations for Multivariate Time-Series Forecast through Genetic Algorithms

Questo articolo presenta un metodo innovativo che integra algoritmi genetici, regressione quantile e test di causalità di Granger per generare spiegazioni controfattuali plausibili e proiettare scenari futuri nell'analisi e nella previsione di serie temporali multivariate.

Gianlucca Zuin, Adriano Veloso2026-03-03🤖 cs.LG

MultiPUFFIN: A Multimodal Domain-Constrained Foundation Model for Molecular Property Prediction of Small Molecules

Il paper presenta MultiPUFFIN, un modello fondazionale multimodale vincolato da principi termodinamici che, integrando diverse rappresentazioni molecolari e equazioni fisiche, supera le prestazioni dei modelli pre-addestrati su larga scala nella previsione simultanea di nove proprietà fisico-chimiche, pur richiedendo una frazione minima dei dati e della potenza computazionale.

Idelfonso B. R. Nogueira, Carine M. Rebelloa, Mumin Enis Leblebici + 1 more2026-03-03🤖 cs.LG

Active Flow Matching

Il paper introduce l'Active Flow Matching (AFM), un nuovo metodo che riformula gli obiettivi variazionali per guidare i modelli di flusso verso regioni ad alta fitness in contesti di ottimizzazione black-box online, dimostrando prestazioni competitive in compiti di progettazione di proteine e piccole molecole.

Yashvir S. Grewal, Daniel M. Steinberg, Thang D. Bui + 2 more2026-03-03🤖 cs.LG

Knowledge without Wisdom: Measuring Misalignment between LLMs and Intended Impact

Questo studio dimostra che i principali modelli linguistici fondazionali, pur eccellendo nei benchmark, mostrano un'allineamento negativo con gli esiti di apprendimento degli studenti e che le loro prestazioni su compiti educativi sono più correlate tra loro che con il comportamento umano esperto, suggerendo che la pre-addestramento comune è una fonte significativa di questo disallineamento.

Michael Hardy, Yunsung Kim2026-03-03📊 stat

Evaluating AI Grading on Real-World Handwritten College Mathematics: A Large-Scale Study Toward a Benchmark

Questo studio presenta una valutazione su larga scala di un sistema di grading AI basato su LLM e OCR per compiti di calcolo a mano scritti da studenti universitari, dimostrando un forte allineamento con le valutazioni dei tutor e proponendo un nuovo benchmark standardizzato per la ricerca futura.

Zhiqi Yu, Xingping Liu, Haobin Mao + 4 more2026-03-03🤖 cs.LG

Principled Fast and Meta Knowledge Learners for Continual Reinforcement Learning

Questo studio propone un framework a doppio apprendista, ispirato al sistema di memoria umano, che combina un apprendista veloce per il trasferimento di conoscenze e un meta-apprendista per l'integrazione incrementale e la prevenzione dell'oblio catastrofico, dimostrando prestazioni superiori nell'apprendimento per rinforzo continuo su diversi benchmark.

Ke Sun, Hongming Zhang, Jun Jin + 4 more2026-03-03🤖 cs.LG

Curvature-Weighted Capacity Allocation: A Minimum Description Length Framework for Layer-Adaptive Large Language Model Optimization

Questo lavoro propone un framework teorico basato sul principio della Lunghezza Minima di Descrizione (MDL) che utilizza il guadagno aggiustato per la curvatura per allocare in modo ottimale le capacità computazionali o eseguire il pruning negli strati dei grandi modelli linguistici, garantendo soluzioni a forma chiusa, complessità computazionale efficiente e limiti di rimpianto trasferibili.

Theophilus Amaefuna, Hitesh Vaidya, Anshuman Chhabra + 1 more2026-03-03🤖 cs.LG

← Precedente Successivo →