cs.LG articoli | Gist.Science

GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification

Il paper presenta l'approccio di GATech alla sfida AbjadGenEval per il rilevamento di testi arabi generati dall'IA, dimostrando che un semplice pooling medio su un encoder multilingue E5-large, unito all'osservazione che i testi umani sono significativamente più lunghi di quelli generati, ha ottenuto prestazioni superiori rispetto a strategie di pooling più complesse.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

GATech at AbjadMed: Bidirectional Encoders vs. Causal Decoders: Insights from 82-Class Arabic Medical Classification

Questo articolo dimostra che i codificatori bidirezionali specializzati, come AraBERTv2, superano i decoder causali nel compito di classificazione del testo medico arabo su 82 categorie, grazie alla loro capacità di catturare un contesto globale più preciso rispetto alla natura sequenziale dei decoder.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

Il paper introduce P-GRPO, un nuovo framework di allineamento che supera i limiti del GRPO standard nella gestione delle preferenze eterogenee normalizzando i vantaggi rispetto a storie di reward specifiche per gruppo, consentendo così ai modelli linguistici di adattarsi più efficacemente e rapidamente a diverse preferenze individuali senza sacrificare le capacità generali.

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

Defining AI Models and AI Systems: A Framework to Resolve the Boundary Problem

Questo articolo propone un quadro concettuale e operativo che definisce i modelli AI come parametri e architetture addestrati, e i sistemi AI come l'insieme di tali modelli più componenti aggiuntive, al fine di risolvere le ambiguità normative e chiarire la ripartizione delle responsabilità tra i diversi attori della catena del valore.

Yuanyuan Sun, Timothy Parker, Lara Gierschmann, Sana Shams, Teo Canmetin, Mathieu Duteil, Rokas Gipiškis, Ze Shen Chin2026-03-12🤖 cs.AI

LWM-Temporal: Sparse Spatio-Temporal Attention for Wireless Channel Representation Learning

LWM-Temporal è un nuovo modello fondazionale per le comunicazioni wireless che utilizza un meccanismo di attenzione spaziotemporale sparsa allineata alla propagazione e un preaddestramento auto-supervisionato basato sulla fisica per apprendere rappresentazioni universali dei canali, migliorando significativamente le prestazioni nelle previsioni a lungo termine anche con dati di addestramento limitati.

Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb2026-03-12🤖 cs.LG

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

Il paper introduce HTM-EAR, un sistema di memoria gerarchica che combina memoria di lavoro basata su HNSW e archiviazione a lungo termine con un routing ibrido e meccanismi di evizione consapevoli dell'importanza, dimostrando di preservare l'accuratezza delle query attive e di gestire efficacemente il contesto limitato anche in condizioni di saturazione estrema.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Il paper presenta Tureis, un metodo auto-supervisionato basato su Transformer che rileva e localizza con precisione i guasti dei sensori in ambienti domestici intelligenti complessi, offrendo un'implementazione efficiente ed edge-friendly senza richiedere dati etichettati.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Questo studio valuta la capacità di generalizzazione di agenti di attacco informatico autonomi di fronte a cambiamenti imprevisti negli indirizzi IP, rivelando che, sebbene gli agenti basati su LLM ottenano i migliori risultati di adattamento, lo fanno a scapito di costi computazionali elevati, ridotta trasparenza e nuove vulnerabilità operative.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Questo studio dimostra che le condizioni di valutazione, in particolare il formato delle domande, influenzano le misurazioni di sicurezza dei modelli linguistici più delle architetture di scaffolding stesse, rivelando che i ranking di sicurezza non sono generalizzabili e richiedono test specifici per ogni modello e configurazione.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Il paper propone un framework di apprendimento continuo efficiente per il riconoscimento delle attività umane su dispositivi IoT, basato su una modulazione a gate diagonale delle rappresentazioni pre-addestrate che riduce drasticamente l'oblio catastrofico e migliora l'accuratezza adattandosi a nuovi soggetti senza trasmettere dati sensibili al cloud.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Il paper propone XSAM, una nuova implementazione della Sharpness-Aware Minimization che supera le limitazioni delle versioni attuali offrendo una stima più accurata della direzione di massima curvatura e un migliore sfruttamento delle informazioni di gradino multi-step, garantendo così prestazioni superiori con un costo computazionale trascurabile.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Il documento introduce InFusionLayer, un nuovo strumento Python open-source basato sull'analisi di fusione combinatoria (CFA) che integra funzioni di caratteristiche punteggio-rank e diversità cognitiva per ottimizzare l'apprendimento di ensemble in problemi di classificazione multiclasse, dimostrando la sua efficacia su vari dataset di visione artificiale e la compatibilità con framework come PyTorch, TensorFlow e Scikit-learn.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Il paper propone FlowSem-MAE, un paradigma di pre-addestramento tabulare nativo dei protocolli che supera i limiti dei modelli basati su byte sequenziali per la classificazione del traffico cifrato, preservando le semantiche dei campi del protocollo e ottenendo prestazioni superiori con meno dati etichettati.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

Il paper presenta OmniGuide, un framework universale che migliora le prestazioni dei modelli generalisti robotici (VLA) su compiti complessi integrando diverse fonti di guida come modelli fondazionali 3D e VLM semantici tramite funzioni di energia differenziabili che influenzano l'azione del robot.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

Il paper propone CAADRL, un framework di apprendimento per rinforzo profondo che sfrutta esplicitamente la struttura a cluster dei problemi di prelievo e consegna tramite codifica attentiva e decodifica gerarchica, ottenendo prestazioni competitive rispetto allo stato dell'arte con tempi di inferenza significativamente ridotti.

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

Questo articolo risolve una congettura ventennale sulla quantizzazione della curvatura di Ricci nella geometria dell'informazione, dimostrando che il valore medio è quantizzato in semi-interi positivi per le reti bayesiane binarie ad albero o complete, ma smentendo l'universalità della congettura tramite controesempi con cicli e generalizzando il risultato alle reti DAG gaussiane con una dicotomia di segno tra curvature positive e negative.

Carlos C. Rodriguez2026-03-12🔢 math

Training Language Models via Neural Cellular Automata

Questo lavoro propone l'uso di automi cellulari neurali per generare dati sintetici non linguistici che, utilizzati in una fase di pre-pre-addestramento, migliorano l'efficienza e le prestazioni dei modelli linguistici su compiti di ragionamento, superando anche l'addestramento su grandi quantità di testo naturale.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

Il paper introduce HTMuon, un metodo di ottimizzazione basato sulla teoria della regolarizzazione auto-organizzata a code pesanti che migliora l'algoritmo Muon correggendo spettri pesanti e riducendo la perplessità nel pre-addestramento di LLM e nella classificazione di immagini.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Improving Search Agent with One Line of Code

Il paper propone SAPO, un metodo che risolve l'instabilità dell'addestramento negli agenti di ricerca basati su TARL tramite una semplice modifica a una riga di codice che applica un vincolo KL condizionale, ottenendo miglioramenti significativi rispetto agli algoritmi esistenti.

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Questo studio applica per la prima volta autoencoder sparsi al modello Chronos-T5, rivelando una gerarchia causale delle caratteristiche temporali in cui i livelli intermedi, dedicati alla rilevazione di cambiamenti bruschi, sono più critici per le previsioni rispetto ai livelli finali ricchi di concetti semantici.

Anurag Mishra2026-03-12🤖 cs.LG

← Precedente Successivo →