stat.ML articoli | Gist.Science

ContextBench: Modifying Contexts for Targeted Latent Activation

Il paper introduce ContextBench, un benchmark per valutare metodi di modifica del contesto volti ad attivare specifiche caratteristiche latenti nei modelli linguistici, e dimostra che varianti avanzate dell'ottimizzazione evolutiva dei prompt riescono a bilanciare efficacemente forza di attivazione e fluidità linguistica.

Robert Graham, Edward Stevinson, Leo Richter, Alexander Chia, Joseph Miller, Joseph Isaac BloomMon, 09 Ma🤖 cs.AI

Iterative Quantum Feature Maps

Il documento propone le Iterative Quantum Feature Maps (IQFMs), un framework ibrido quantistico-classico che costruisce architetture profonde collegando iterativamente mappe di feature quantistiche superficiali con pesi di aumento calcolati classicamente, riducendo così i tempi di esecuzione quantistica e mitigando gli effetti del rumore senza richiedere l'ottimizzazione di parametri quantistici variazionali.

Nasa Matsumoto, Quoc Hoan Tran, Koki Chinzei, Yasuhiro Endo, Hirotaka OshimaMon, 09 Ma⚛️ quant-ph

Learning the action for long-time-step simulations of molecular dynamics

Il paper propone un metodo di apprendimento automatico che, imparando l'azione meccanica del sistema tramite mappe che preservano la struttura (simpattiche e reversibili nel tempo), permette di eseguire simulazioni di dinamica molecolare con passi temporali molto lunghi eliminando le instabilità energetiche tipiche dei predittori non strutturati.

Filippo Bigi, Johannes Spies, Michele CeriottiMon, 09 Ma🔬 cond-mat.mtrl-sci

Kernel VICReg for Self-Supervised Learning in Reproducing Kernel Hilbert Space

Il paper propone Kernel VICReg, un nuovo framework di apprendimento auto-supervisionato che trasporta l'obiettivo VICReg in uno Spazio di Hilbert a Nucleo Riproducente (RKHS) per catturare dipendenze non lineari e migliorare le prestazioni su dati con strutture complesse o campioni limitati, superando i limiti dei metodi basati su spazio euclideo.

M. Hadi Sepanj, Benyamin Ghojogh, Saed Moradi, Paul FieguthMon, 09 Ma🤖 cs.LG

Spectral/Spatial Tensor Atomic Cluster Expansion with Universal Embeddings in Cartesian Space

Il paper introduce il Tensor Atomic Cluster Expansion (TACE), un modello di apprendimento automatico equivariante che unifica la modellazione scalare e tensoriale nello spazio cartesiano mediante tensori cartesiani irriducibili, offrendo un'alternativa efficiente e priva di accoppiamenti di Clebsch-Gordan che garantisce accuratezza, stabilità ed efficienza su una vasta gamma di sistemi, dalle molecole finite ai materiali estesi, inclusi dati reattivi e multi-fiducia.

Zemin Xu, Wenbo Xie, P. HuMon, 09 Ma🔬 cond-mat.mtrl-sci

Learning Centre Partitions from Summaries

Questo articolo propone un algoritmo sequenziale basato su test multivariati di tipo Cochran e una procedura bootstrap multi-round per identificare e aggregare gruppi di centri omogenei in studi multicentrici distribuiti, garantendo il recupero della partizione vera in condizioni asintotiche e dimostrando efficacia sia nelle simulazioni che nell'analisi dei dati reali.

Zinsou Max Debaly, Jean-Francois Ethier, Michael H. Neumann, Félix Camirand-LemyreMon, 09 Ma🔢 math

Self-Speculative Masked Diffusions

Il paper presenta le "Self-Speculative Masked Diffusions", un nuovo modello generativo per dati discreti che riduce il carico computazionale di circa il 50% rispetto ai modelli standard, generando distribuzioni predittive non fattorizzate in un singolo passaggio tramite un meccanismo di campionamento speculativo integrato.

Andrew Campbell, Valentin De Bortoli, Jiaxin Shi, Arnaud DoucetMon, 09 Ma🤖 cs.LG

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

Questo studio dimostra che l'iniezione di informazioni tramite un verificatore esterno di dati sintetici può prevenire il collasso del modello e migliorare le prestazioni a breve termine, guidando tuttavia i parametri verso il "centro di conoscenza" del verificatore nel lungo periodo.

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng XuMon, 09 Ma🤖 cs.LG

CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering

Il paper propone il CADM, un metodo innovativo per il clustering di dati categorici e misti che utilizza una metrica di distanza adattiva e personalizzata per ciascun cluster, aggiornando dinamicamente le distanze in base alle diverse distribuzioni degli attributi e ottenendo prestazioni superiori su quattordici dataset.

Taixi Chen, Yiu-ming Cheung, Yiqun ZhangMon, 09 Ma🤖 cs.LG

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

Il paper introduce DAISI, un algoritmo di assimilazione dei dati scalabile basato su modelli generativi a flusso che, sfruttando un prior pre-addestrato e un'inversione di campionamento, supera le limitazioni delle approssimazioni gaussiane nei sistemi dinamici complessi e non lineari.

Martin Andrae, Erik Larsson, So Takao, Tomas Landelius, Fredrik LindstenMon, 09 Ma🤖 cs.LG

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

Questo articolo propone una nuova metrica di sensibilità globale basata sulle curve di aspettativa condizionata individuale (ICE) per superare i limiti dei Partial Dependence Plots nell'analisi delle interazioni tra variabili nei modelli di apprendimento automatico applicati al design ingegneristico, dimostrando la sua superiorità attraverso prove matematiche e valutazioni comparative su casi di studio aerospaziali.

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph MorlierMon, 09 Ma🤖 cs.AI

Learning Optimal Distributionally Robust Individualized Treatment Rules Integrating Multi-Source Data

Il documento propone un metodo di regole di trattamento individualizzate robuste distribuzionalmente (PDRO-ITR) che integra dati multipli per gestire lo spostamento posteriore, garantendo prestazioni ottimali nel caso peggiore attraverso un insieme di incertezza adattivo e una soluzione in forma chiusa.

Wenhai Cui, Wen Su, Xingqiu ZhaoMon, 09 Ma🤖 cs.LG

Prediction-Powered Conditional Inference

Questo lavoro propone un metodo di inferenza condizionale che combina localizzazione tramite kernel e correzione basata su previsioni machine learning per stimare funzionali condizionali in scenari con dati etichettati scarsi, garantendo intervalli di confidenza validi e a varianza ridotta senza assumere modelli parametrici.

Yang Sui, Jin Zhou, Hua Zhou, Xiaowu DaiMon, 09 Ma🤖 cs.LG

Behavior-dLDS: A decomposed linear dynamical systems model for neural activity partially constrained by behavior

Il paper presenta behavior-dLDS, un modello di sistemi dinamici lineari decomposti che disentangla le dinamiche neurali latenti correlate al comportamento da quelle computazionali interne, dimostrando efficacia su dati simulati e su registrazioni su larga scala di zebrafish.

Eva Yezerets, En Yang, Misha B. Ahrens, Adam S. CharlesMon, 09 Ma🤖 cs.LG

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

Questo articolo dimostra che, nell'ambito della regressione ridge a caratteristiche casuali, un modello "forte" addestrato su etichette imperfette generate da un modello "debole" può superare significativamente le leggi di scala del proprio insegnante, raggiungendo persino il tasso ottimale minimax indipendentemente dalle prestazioni del teacher.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco MondelliMon, 09 Ma🤖 cs.LG

Design Experiments to Compare Multi-armed Bandit Algorithms

Il paper propone "Artificial Replay", un nuovo disegno sperimentale che permette di confrontare algoritmi a bandito multi-braccio riutilizzando le traiettorie registrate per ridurre drasticamente i costi di interazione e la varianza dell' stimatore rispetto ai metodi tradizionali.

Huiling Meng, Ningyuan Chen, Xuefeng GaoMon, 09 Ma🤖 cs.LG

Large deviation principles for convolutional Bayesian neural networks

Questo lavoro stabilisce il primo principio di grandi deviazioni per le reti neurali convoluzionali nel regime a canali infiniti, fornendo risultati rigorosi sulle matrici di covarianza condizionale e sulla distribuzione a posteriori, oltre a offrire una dimostrazione semplificata della loro convergenza verso processi gaussiani.

Federico Bassetti, Vassili De Palma, Lucia LadelliMon, 09 Ma🔢 math

Agnostic learning in (almost) optimal time via Gaussian surface area

Questo lavoro migliora i limiti superiori noti per l'apprendimento agnostico di classi di concetti rispetto alla misura gaussiana, dimostrando che un'approssimazione polinomiale di grado $\tilde O(\Gamma^2 / \varepsilon^2)$ è sufficiente per ottenere una precisione $\varepsilon$ , ottenendo così limiti (quasi) ottimali per l'apprendimento di funzioni soglia polinomiali nel modello delle query statistiche.

Lucas Pesenti, Lucas Slot, Manuel WiedmerMon, 09 Ma🤖 cs.LG

Predictive Coding Graphs are a Superset of Feedforward Neural Networks

Il documento dimostra che i grafi di codifica predittiva costituiscono un insieme matematico sovrastante delle reti neurali feedforward, rafforzando così il loro ruolo nel machine learning moderno e la rilevanza della topologia nelle reti neurali.

Björn van ZwolMon, 09 Ma🤖 cs.AI

Gradient Flow Polarizes Softmax Outputs towards Low-Entropy Solutions

Il paper dimostra che il flusso gradiente nei modelli softmax basati su valori spinge intrinsecamente l'ottimizzazione verso soluzioni a bassa entropia, fornendo una spiegazione teorica per fenomeni empirici come i "attention sinks" e le massive activations nei transformer.

Aditya Varre, Mark Rofin, Nicolas FlammarionMon, 09 Ma🤖 cs.LG

← Precedente Successivo →