cs.LG articoli | Gist.Science

Agnostics: Learning to Code in Any Programming Language via Reinforcement with a Universal Learning Environment

Il paper presenta Agnostics, una pipeline di post-addestramento basata sul reinforcement learning che, valutando il codice esclusivamente tramite il suo comportamento osservabile esterno, permette di insegnare efficacemente a modelli linguistici di diverse dimensioni a programmare in lingue a risorse limitate senza richiedere infrastrutture specifiche per ogni linguaggio.

Aleksander Boruch-Gruszecki, Yangtian Zi, Zixuan Wu + 4 more2026-03-03🤖 cs.LG

Semantic-Enhanced Time-Series Forecasting via Large Language Models

Il paper propone SE-LLM, un nuovo approccio che potenzia i Large Language Models per la previsione delle serie temporali integrando le caratteristiche intrinseche dei dati nel loro spazio semantico e aggiungendo un modulo plugin per modellare sia le dipendenze a lungo termine che le anomalie a breve termine, ottenendo prestazioni superiori con un ridotto consumo computazionale.

Hao Liu, Xiaoxing Zhang, Chun Yang + 1 more2026-03-03🤖 cs.LG

Causal Structure Learning in Hawkes Processes with Complex Latent Confounder Networks

Il paper propone un algoritmo iterativo a due fasi che, sfruttando la rappresentazione discreta delle sequenze di eventi continui, identifica le strutture causali nei processi di Hawkes multivariati anche in presenza di sottoprocessi latenti non osservati.

Songyao Jin, Biwei Huang2026-03-03📊 stat

MOON: Generative MLLM-based Multimodal Representation Learning for E-commerce Product Understanding

Il paper presenta MOON, il primo modello generativo basato su MLLM per l'apprendimento di rappresentazioni multimodali nel commercio elettronico, che supera i limiti delle architetture discriminative esistenti attraverso un modulo MoE guidato, il rilevamento di regioni semantiche chiave e una strategia di campionamento negativo specializzata, supportato dal nuovo benchmark MBE.

Daoze Zhang, Chenghan Fu, Zhanheng Nie + 7 more2026-03-03🤖 cs.AI

Next Visual Granularity Generation

Il paper propone un nuovo framework chiamato Next Visual Granularity (NVG) che genera immagini decomponendole in una sequenza strutturata di granularità visiva crescente, dai layout globali ai dettagli fini, ottenendo risultati superiori rispetto alla serie VAR sul dataset ImageNet.

Yikai Wang, Zhouxia Wang, Zhonghua Wu + 3 more2026-03-03🤖 cs.AI

Federated Nonlinear System Identification

Questo lavoro dimostra teoricamente e valida sperimentalmente che l'identificazione federata di sistemi non lineari supera gli approcci centralizzati, garantendo un tasso di convergenza che migliora all'aumentare del numero di client grazie a una scelta accurata delle funzioni di base e a una strategia di esplorazione non attiva.

Omkar Tupe, Max Hartman, Lav R. Varshney + 1 more2026-03-03⚡ eess

MMQ: Multimodal Mixture-of-Quantization Tokenization for Semantic ID Generation and User Behavioral Adaptation

Il paper propone MMQ, un framework a due stadi che genera ID semantici scalabili e adattivi tramite un tokenizzatore multimodale a misto di quantizzazione, risolvendo le sfide di sinergia tra modalità e allineamento comportamentale nei sistemi di raccomandazione.

Yi Xu, Moyu Zhang, Chenxuan Li + 7 more2026-03-03🤖 cs.LG

Modeling User Preferences as Distributions for Optimal Transport-Based Cross-Domain Recommendation under Non-Overlapping Settings

Il paper propone DUP-OT, un nuovo framework per la raccomandazione cross-dominio in scenari senza sovrapposizioni che modella le preferenze degli utenti come distribuzioni Gaussiane Miste e le allinea tramite trasporto ottimo per migliorare le previsioni di rating e mitigare il problema del cold-start.

Ziyin Xiao, Toyotaro Suzumura2026-03-03🤖 cs.LG

Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks

Lo studio dimostra che per i modelli linguistici Mixture-of-Experts, l'ottimizzazione delle capacità di ragionamento richiede un bilanciamento congiunto tra i FLOPs attivi e il rapporto tra token totali e parametri, superando le tradizionali leggi di scalabilità basate solo sulla perdita di pre-addestramento.

Taishi Nakamura, Satoki Ishikawa, Masaki Kawamura + 4 more2026-03-03💬 cs.CL

Implementing Pearl's $\mathcal{DO}$ -Calculus on Quantum Circuits: A Simpson-Type Case Study on NISQ Hardware

Questo articolo presenta un metodo per implementare il calcolo $\mathcal{DO}$ di Pearl sui circuiti quantistici attraverso una "chirurgia del circuito", dimostrando sperimentalmente su hardware NISQ che tale approccio riproduce con precisione le distribuzioni interventive classiche, inclusa una variante del paradosso di Simpson, senza però garantire un vantaggio computazionale quantistico.

Pilsung Kang2026-03-03⚛️ quant-ph

Optimal information injection and transfer mechanisms for active matter reservoir computing

Lo studio dimostra che l'iniezione di informazioni tramite forze attrattive non lineari in sistemi di materia attiva, in particolare nelle gocce liquide, ottimizza le prestazioni del reservoir computing attivando meccanismi regolatori emergenti che migliorano la diversità morfologica e dinamica, la memoria e la non linearità del sistema.

Mario U. Gaimann, Miriam Klopotek2026-03-03🌀 nlin

EigenBench: A Comparative Behavioral Measure of Value Alignment

Il paper propone EigenBench, un metodo di benchmarking "black-box" che valuta l'allineamento ai valori dei modelli linguistici aggregando i loro giudizi reciproci tramite EigenTrust, ottenendo risultati coerenti con le valutazioni umane e senza richiedere etichette di verità fondamentale.

Jonathn Chang, Leonhard Piff, Suvadip Sana + 2 more2026-03-03💬 cs.CL

Gaming and Cooperation in Federated Learning: What Can Happen and How to Monitor It

Questo paper propone un quadro analitico e un toolkit di progettazione per distinguere la cooperazione benefica dal gioco delle metriche nel federated learning, offrendo principi operativi e algoritmi di audit per garantire un'interazione stabile e ad alto benessere tra i partecipanti strategici.

Dongseok Kim, Hyoungsun Choi, Mohamed Jismy Aashik Rasool + 1 more2026-03-03📊 stat

BinaryShield: Cross-Service Threat Intelligence in LLM Services using Privacy-Preserving Fingerprints

Il paper presenta BinaryShield, il primo sistema di intelligence sulle minacce che preserva la privacy, permettendo la condivisione sicura di impronte digitali degli attacchi tra servizi LLM separati da confini normativi tramite una pipeline innovativa che combina redazione PII, embedding semantico, quantizzazione binaria e risposta randomizzata, ottenendo prestazioni superiori rispetto alle soluzioni esistenti.

Waris Gill, Natalie Isak, Matthew Dressman2026-03-03💬 cs.CL

AISSISTANT: Human-AI Collaborative Review and Perspective Research Workflows in Data Science

Il paper presenta AIssistant, il primo framework open-source agentic per la collaborazione tra umani e intelligenza artificiale nella generazione di revisioni e prospettive scientifiche nel campo della data science, che riduce significativamente il tempo di ricerca mantenendo l'integrità scientifica attraverso un flusso di lavoro multi-agente con supervisione umana.

Sasi Kiran Gaddipati, Farhana Keya, Gollam Rabby + 1 more2026-03-03🤖 cs.AI

SamudrACE: Fast and Accurate Coupled Climate Modeling with 3D Ocean and Atmosphere Emulators

Il paper presenta SamudrACE, un emulatore di modelli climatici globali accoppiati basato su machine learning che, integrando emulatori 3D per oceano e atmosfera, genera simulazioni stabili e ad alta risoluzione di secoli con una variabilità realistica dei fenomeni climatici accoppiati come ENSO.

James P. C. Duncan, Elynn Wu, Surya Dheeshjith + 15 more2026-03-03🤖 cs.LG

Person Identification from Egocentric Human-Object Interactions using 3D Hand Pose

Il paper presenta I2S, un framework leggero e in tempo reale per l'identificazione degli utenti tramite l'analisi delle pose 3D delle mani durante le interazioni uomo-oggetto in video egocentrici, ottenendo un'accuratezza del 97,52% e risultando ideale per sistemi di realtà aumentata in ambienti critici.

Muhammad Hamza, Danish Hamid, Muhammad Tahir Akram2026-03-03🤖 cs.LG

A Study on Stabilizer Rényi Entropy Estimation using Machine Learning

Questo studio propone un approccio di apprendimento automatico supervisionato, basato su modelli come la Regressione a Vettori di Supporto (SVR) e caratteristiche di circuito, per stimare in modo efficiente l'entropia di Rényi stabilizzatrice, dimostrando che tale metodo raggiunge stime accurate su circuiti casuali e generalizza bene su circuiti strutturati derivati dal modello di Ising trasverso.

Vincenzo Lipardi, Domenica Dibenedetto, Georgios Stamoulis + 1 more2026-03-03⚛️ quant-ph

Advancing Universal Deep Learning for Electronic-Structure Hamiltonian Prediction of Materials

Questo lavoro introduce NextHAM, un metodo di deep learning basato su Transformer con simmetria E(3) e correzioni esplicative, e il dataset Materials-HAM-SOC per predire con elevata accuratezza ed efficienza gli Hamiltoniani elettronici di materiali complessi includendo effetti di spin-orbita.

Shi Yin, Zujian Dai, Xinyang Pan + 1 more2026-03-03🔬 cond-mat.mtrl-sci

A Recovery Guarantee for Sparse Neural Networks

Questo articolo presenta la prima garanzia teorica di recupero esatto dei pesi di reti neurali ReLU sparse tramite un algoritmo di soglia iterativa, validata sperimentalmente su compiti di classificazione e rappresentazioni neurali con un'efficienza di memoria superiore rispetto alle tecniche esistenti.

Sara Fridovich-Keil, Mert Pilanci2026-03-03📊 stat

← Precedente Successivo →

cs.LG