cs.LG articoli | Gist.Science

A Reinforcement Learning Approach in Multi-Phase Second-Price Auction Design

Il paper propone l'algoritmo CLUB, un approccio di apprendimento per rinforzo che risolve le sfide dell'ottimizzazione delle riserve d'asta in ambienti multi-fase con bidders potenzialmente non veritieri e distribuzioni di rumore sconosciute, garantendo un rimpianto di ricavo sub-lineare attraverso l'uso di periodi tampone e una variante estesa di LSVI-UCB.

Rui Ai, Boxiang Lyu, Zhaoran Wang + 2 more2026-03-04📊 stat

A Global Optimization Algorithm for K-Center Clustering of One Billion Samples

Questo articolo presenta un algoritmo di ottimizzazione globale basato su un metodo branch-and-bound a spazio ridotto, dotato di un limite inferiore decomponibile e tecniche di accelerazione, in grado di risolvere il problema del clustering K-center per un miliardo di campioni garantendo l'ottimalità globale e riducendo significativamente la funzione obiettivo rispetto ai metodi euristici.

Jiayang Ren, Ningning You, Kaixun Hua + 2 more2026-03-04🤖 cs.LG

SPARLING: Learning Latent Representations with Extremely Sparse Activations

Il paper presenta SPARLING, un algoritmo che dimostra come sia possibile identificare con precisione variabili latenti intermedie estremamente sparse (motivi) riducendo solo l'errore end-to-end, senza richiedere l'identificabilità dei parametri del modello.

Kavi Gupta, Osbert Bastani, Armando Solar-Lezama2026-03-04🤖 cs.LG

Verifying the Robustness of Automatic Credibility Assessment

Questo studio valuta la robustezza dei classificatori testuali contro attacchi avversariali, introducendo il benchmark BODEGA per quattro compiti di rilevamento della disinformazione e dimostrando che i modelli linguistici moderni sono spesso più vulnerabili rispetto alle soluzioni precedenti.

Piotr Przybyła, Alexander Shvets, Horacio Saggion2026-03-04💬 cs.CL

(Un)fair devices: Moving beyond AI accuracy in personal sensing

Questa revisione della letteratura evidenzia i rischi di bias nascosti nei modelli di apprendimento automatico dei dispositivi personali e promuove un approccio centrato sull'uomo, con linee guida specifiche per garantire equità e affidabilità nelle applicazioni di salute e benessere.

Sofia Yfantidou, Marios Constantinides, Dimitris Spathis + 3 more2026-03-04🤖 cs.LG

A Normal Map-Based Proximal Stochastic Gradient Method: Convergence and Identification Properties

Questo articolo presenta un metodo di gradiente stocastico prossimale basato sulla mappa normale di Robinson (NSGD) che, in un contesto non convesso generale, garantisce la convergenza globale ai punti stazionari e l'identificazione quasi certa delle varietà attive in tempo finito, superando le limitazioni del metodo PSGD standard.

Junwen Qiu, Li Jiang, Andre Milzarek2026-03-04🤖 cs.LG

Dynamic Deep-Reinforcement-Learning Algorithm in Partially Observable Markov Decision Processes

Questo studio presenta tre nuovi algoritmi di apprendimento per rinforzo profondo dinamico per processi decisionali di Markov parzialmente osservabili, dimostrando che l'inclusione delle traiettorie delle azioni e l'uso di stati nascosti generati dalla rete attore per addestrare la rete critica (come nell'algoritmo H-TD3) migliorano l'efficienza computazionale mantenendo alte prestazioni.

Saki Omi, Hyo-Sang Shin, Namhoon Cho + 1 more2026-03-04🤖 cs.LG

Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

Questo studio propone l'uso di BERTimbau per prevedere i pittogrammi nei sistemi di comunicazione aumentativa e alternativa per il portoghese brasiliano, dimostrando che la rappresentazione dei pittogrammi tramite didascalie, sinonimi o definizioni offre prestazioni simili, con le didascalie che garantiscono la massima accuratezza.

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Making informed decisions in cutting tool maintenance in milling: A KNN-based model agnostic approach

Questo studio presenta un approccio basato sul modello KNN per il monitoraggio delle condizioni degli utensili nella fresatura, che combina l'analisi dei segnali di forza in tempo reale con tecniche di interpretabilità per supportare decisioni di manutenzione informate e trasparenti.

Revati M. Wahul, Aditya M. Rahalkar, Om M. Khare + 2 more2026-03-04🤖 cs.LG

Part-of-Speech Tagger for Bodo Language using Deep Learning approach

Questo studio introduce BodoBERT, il primo modello linguistico per la lingua Bodo, e un modello di tagging delle parti del discorso basato su deep learning che combina BiLSTM-CRF e BodoBERT, raggiungendo un punteggio F1 di 0,8041.

Dhrubajyoti Pathak, Sanjib Narzary, Sukumar Nandi + 1 more2026-03-04🤖 cs.AI

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Questo studio presenta un modello statistico per stimare la frazione di testo generato o modificato da LLM nelle revisioni paritarie di conferenze sull'intelligenza artificiale, rivelando che tra il 6,5% e il 16,9% del contenuto potrebbe essere influenzato da ChatGPT, con una correlazione significativa tra l'uso di tali strumenti e fattori come la bassa confidenza, la vicinanza alla scadenza e la riluttanza a rispondere alle obiezioni degli autori.

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

Topic-Based Watermarks for Large Language Models

Il paper propone uno schema di watermarking leggero e guidato dal tema per i grandi modelli linguistici che, partizionando il vocabolario in sottoinsiemi allineati semanticamente, garantisce robustezza contro gli attacchi e mantiene la qualità del testo senza richiedere framework aggiuntivi.

Alexander Nemecek, Yuzhou Jiang, Erman Ayday2026-03-04💬 cs.CL

Accelerating Ensemble Error Bar Prediction with Single Models Fits

Questo lavoro propone un metodo efficiente per la quantificazione dell'incertezza che, addestrando un singolo modello su dati sintetici derivati da un ensemble, permette di stimare gli intervalli di errore con un costo computazionale quasi pari a quello di un modello singolo, evitando la necessità di eseguire un intero ensemble durante l'inferenza.

Vidit Agrawal, Shixin Zhang, Lane E. Schultz + 1 more2026-03-04🔬 cond-mat.mtrl-sci

Absolute abstraction: a renormalisation group approach

Il paper sostiene che l'astrazione assoluta nelle reti neurali richiede sia profondità che un ampio set di dati, dimostrando tramite un approccio di gruppo di rinormalizzazione e esperimenti numerici che le rappresentazioni si avvicinano al "Modello di Caratteristiche Gerarchiche" all'aumentare della profondità e della varietà dei dati.

Carlo Orientale Caputo, Elias Seiffert, Enrico Frausin + 1 more2026-03-04🧬 q-bio

Learning Lagrangian Interaction Dynamics with Sampling-Based Model Order Reduction

Il paper presenta GIOROM, un framework di riduzione d'ordine basato sul campionamento che evolve sistemi lagrangiani direttamente nello spazio fisico utilizzando operatori neurali e una parametrizzazione di kernel apprendibile, ottenendo una significativa riduzione della dimensionalità mantenendo un'alta fedeltà nella simulazione di fluidi, mezzi granulari e dinamiche elastoplastiche.

Hrishikesh Viswanath, Yue Chang, Aleksey Panas + 3 more2026-03-04🤖 cs.LG

Proper losses regret at least 1/2-order

Questo lavoro dimostra che la stretta proprietà di una funzione di perdita è necessaria e sufficiente per garantire un limite non vacuo sul rimpianto surrogato, risolvendo una questione aperta confermando che la convergenza nella norma p non può essere più veloce dell'ordine 1/2 rispetto al rimpianto surrogato per una vasta classe di funzioni di perdita strettamente proprie.

Han Bao, Asuka Takatsu2026-03-04📊 stat

BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models

Il paper introduce BA-LoRA, un metodo di adattamento a basso rango che mitiga l'eredità catastrofica nei grandi modelli linguistici attraverso regolarizzatori mirati, migliorando al contempo le prestazioni, la stabilità e l'equità rispetto alle varianti LoRA esistenti.

Yupeng Chang, Yi Chang, Yuan Wu2026-03-04💬 cs.CL

Quantifying User Coherence: A Unified Framework for Analyzing Recommender Systems Across Domains

Questo articolo presenta un quadro unificato che quantifica la coerenza degli utenti attraverso due nuove misure di teoria dell'informazione, dimostrando che tali metriche spiegano le variazioni di performance dei sistemi di raccomandazione e guidano la progettazione di modelli più robusti ed efficienti.

Michaël Soumm, Alexandre Fournier-Montgieux, Adrian Popescu + 1 more2026-03-04🤖 cs.LG

Covering Numbers for Deep ReLU Networks with Applications to Function Approximation and Nonparametric Regression

Questo lavoro colma una lacuna nella letteratura derivando limiti superiori e inferiori stretti per i numeri di copertura delle reti neurali ReLU, permettendo di comprendere l'impatto di sparsità e quantizzazione, ottimizzare la compressione delle reti e migliorare i tassi di convergenza nella regressione non parametrica rimuovendo un fattore logaritmico superfluo.

Weigutian Ou, Helmut Bölcskei2026-03-04📊 stat

Prediction of Multiscale Features Using Deep Learning-based Preconditioner-Solver Architecture for Darcy Equation in High-Contrast Media

Il paper presenta la FP-HMsNet, un'architettura di deep learning basata su un precondizionatore Fourier che supera gli stati dell'arte nella ricostruzione efficiente e accurata dei flussi di fluidi sotterranei in mezzi ad alto contrasto risolvendo le sfide della loro eterogeneità multiscala.

Jie Chen, Peiqi Li, Zhengkang He + 1 more2026-03-04🤖 cs.LG

← Precedente Successivo →