cs.LG articoli | Gist.Science

Adopting a human developmental visual diet yields robust, shape-based AI vision

Il paper dimostra che adottare una dieta visiva ispirata allo sviluppo umano, che guida l'apprendimento dei modelli AI attraverso un curriculum progressivo di acuità, sensibilità al contrasto e colore, permette di ottenere sistemi di visione artificiale più robusti, resilienti e basati sulla forma, colmando il divario tra intelligenza artificiale e percezione umana.

Zejin Lu, Sushrut Thorat, Radoslaw M Cichy, Tim C Kietzmann2026-03-10🤖 cs.LG

Noisy PDE Training Requires Bigger PINNs

Lo studio dimostra che l'addestramento efficace delle PINN in presenza di dati rumorosi richiede una dimensione della rete superiore a una soglia critica, poiché l'errore empirico non può scendere sotto la varianza del rumore senza un numero sufficiente di parametri, indipendentemente dall'aumento del volume dei dati.

Sebastien Andre-Sloan, Anirbit Mukherjee, Matthew Colbrook2026-03-10🤖 cs.LG

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

Il paper introduce TableEG, un framework basato su modelli linguistici di grandi dimensioni e strategie di fine-tuning che genera errori sintetici autentici nei dati tabellari, colmando il divario tra dati reali e artificiali per fornire un benchmark robusto e affidabile per la valutazione delle tecniche di rilevamento e correzione degli errori.

Xinyuan Liu, Jiahui Chen, Bocheng Hu, Yu Sun, Xinyang Chen, Shaoxu Song, Yongxin Tong2026-03-10🤖 cs.LG

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

Il paper propone MCULoRA, un nuovo framework basato su un adattamento a basso rango decoupled e dinamico che risolve i conflitti di gradiente nell'addestramento di modelli per il riconoscimento delle emozioni con modalità incomplete, ottenendo prestazioni superiori rispetto agli approcci esistenti.

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

Questo paper introduce SGV, un metodo di verifica auto-fondato che mitiga il bias di accordo nei modelli linguistici multimodali, migliorando significativamente l'individuazione degli errori e le prestazioni dei agenti in compiti di navigazione web, uso del computer e robotica.

Moises Andrade, Joonhyuk Cha, Brandon Ho, Vriksha Srihari, Karmesh Yadav, Zsolt Kira2026-03-10🤖 cs.LG

Flow Matching Meets Biology and Life Science: A Survey

Questo articolo presenta la prima survey completa sullo sviluppo recente del flow matching e sulle sue applicazioni nei domini biologici, coprendo la modellazione delle sequenze, la generazione di molecole e la sintesi di peptidi e proteine.

Zihao Li, Zhichen Zeng, Xiao Lin, Feihao Fang, Yanru Qu, Zhe Xu, Zhining Liu, Xuying Ning, Tianxin Wei, Ge Liu, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

Weak-to-Strong Generalization with Failure Trajectories: A Tree-based Approach to Elicit Optimal Policy in Strong Models

Questo articolo propone un approccio basato su "alberi di traiettoria" e ricerca ad albero Monte Carlo per estendere la generalizzazione da modello debole a forte (W2SG) ai complessi ambienti decisionali, permettendo ai modelli avanzati di apprendere sia dai successi che dai fallimenti dei modelli più semplici per migliorare le proprie capacità di ragionamento e decisione.

Ruimeng Ye, Zihan Wang, Yang Xiao, Zinan Ling, Manling Li, Bo Hui2026-03-10🤖 cs.LG

Exposing the Illusion of Fairness: Auditing Vulnerabilities to Distributional Manipulation Attacks

Questo lavoro dimostra come un'entità malintenzionata possa ingannare le verifiche di conformità al regolamento UE sull'IA manipolando i dati per apparire equi, analizzando le vulnerabilità di tali attacchi e proponendo metodi statistici per rilevare queste distorsioni distribuzionali.

Valentin Lafargue, Adriana Laurindo Monteiro, Emmanuelle Claeys, Laurent Risser, Jean-Michel Loubes2026-03-10🤖 cs.LG

Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models

Questo studio introduce un framework di "red-teaming" dinamico, automatico e sistematico (DAS) che, stressando i modelli linguistici medici su assi di sicurezza critici, rivela un profondo divario tra le alte prestazioni sui benchmark statici e la bassa affidabilità in scenari reali, evidenziando come i punteggi elevati possano riflettere una memorizzazione superficiale piuttosto che una vera competenza clinica.

Jiazhen Pan (Cherise), Bailiang Jian (Cherise), Paul Hager (Cherise), Yundi Zhang (Cherise), Che Liu (Cherise), Friedrike Jungmann (Cherise), Hongwei Bran Li (Cherise), Chenyu You (Cherise), Junde Wu (Cherise), Jiayuan Zhu (Cherise), Fenglin Liu (Cherise), Yuyuan Liu (Cherise), Niklas Bubeck (Cherise), Christian Wachinger (Cherise), Chen (Cherise), Chen (Cherise), Zhenyu Gong, Cheng Ouyang, Georgios Kaissis, Benedikt Wiestler, Daniel Rueckert2026-03-10🤖 cs.LG

CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data

Il paper presenta CauKer, un algoritmo innovativo che genera serie temporali sintetiche causalmente coerenti per pre-addestrare in modo efficiente modelli foundation per la classificazione, dimostrando leggi di scalabilità superiori rispetto ai dataset reali.

Shifeng Xie, Vasilii Feofanov, Ambroise Odonnat, Lei Zan, Marius Alonso, Jianfeng Zhang, Themis Palpanas, Lujia Pan, Keli Zhang, Ievgen Redko2026-03-10🤖 cs.LG

GraphProp: Training the Graph Foundation Models using Graph Properties

Il paper presenta GraphProp, un metodo per addestrare modelli fondazionali su grafi che migliora la generalizzazione cross-dominio attraverso due fasi: prima l'apprendimento di rappresentazioni strutturali basate su invarianti grafici, poi l'integrazione di attributi specifici del dominio per ottenere prestazioni superiori nelle attività di classificazione, specialmente in contesti privi di attributi nodali.

Ziheng Sun, Qi Feng, Lehao Lin, Chris Ding, Jicong Fan2026-03-10🤖 cs.LG

Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks

Questo lavoro dimostra che i meccanismi di gating nelle reti neurali ricorrenti agiscono come precondizionatori adattivi basati sui dati, accoppiando le scale temporali dello stato con la dinamica dei parametri per generare tassi di apprendimento efficaci dipendenti dal ritardo e dall'orientamento, spiegando così la robusta trainabilità di tali architetture.

Lorenzo Livi2026-03-10🤖 cs.LG

ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signals

Il paper presenta ECHO, un modello fondazionale innovativo che integra un'architettura a bande divise e embedding posizionali frequenziali per elaborare segnali macchina di lunghezza variabile e a diversi tassi di campionamento, ottenendo prestazioni all'avanguardia nell'individuazione di anomalie e nella classificazione dei guasti.

Yucong Zhang, Juan Liu, Ming Li2026-03-10🤖 cs.LG

Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions

Questo articolo presenta un algoritmo basato su giochi dinamici inversi che, sfruttando programmi lineari interi-misti per codificare le condizioni KKT, apprende vincoli parametrici da dimostrazioni di interazioni multi-agente per garantire la sicurezza e pianificare traiettorie robuste.

Zhouyu Zhang, Chih-Yuan Chiu, Glen Chou2026-03-10🤖 cs.LG

CbLDM: A Diffusion Model for recovering nanostructure from atomic pair distribution function

Questo studio presenta il CbLDM, un modello di diffusione latente basato su condizioni che risolve il problema inverso della nanostruttura recuperando nanoparticelle metalliche monometalliche dalla loro funzione di distribuzione delle coppie (PDF) utilizzando matrici di Laplace per garantire stabilità e risultati fisicamente significativi.

Jiarui Cao, Zhiyang Zhang, Heming Wang, Jun Xu, Ling Lan, Simon J. L. Billinge, Ran Gu2026-03-10🔬 cond-mat.mtrl-sci

Entropy-Driven Curriculum for Multi-Task Training in Human Mobility Prediction

Questo articolo presenta un framework di addestramento unificato che combina un curriculum guidato dall'entropia e l'apprendimento multi-task per migliorare la previsione della mobilità umana, ottenendo prestazioni all'avanguardia e una convergenza più rapida rispetto ai metodi esistenti.

Tianye Fang, Xuanshu Luo, Martin Werner2026-03-10🤖 cs.LG

Synthetic data for ratemaking: imputation-based methods vs adversarial networks and autoencoders

Questo studio dimostra che i metodi di imputazione basati su MICE offrono un'alternativa efficace e più semplice da implementare rispetto alle reti avversarie e agli autoencoder per la generazione di dati sintetici nella taratura assicurativa, preservando fedelmente le distribuzioni originali e migliorando le prestazioni dei modelli GLM.

Yevhen Havrylenko, Meelis Käärik, Artur Tuttar2026-03-10🤖 cs.LG

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

Questo articolo propone la classe di metodi F²SA-p, che utilizza differenze finite di ordine p per approssimare il gradiente iperbolico nell'ottimizzazione bilevel stocastica, migliorando il limite superiore di complessità fino a $\tilde{\mathcal{O}}(p \epsilon^{-4-p/2})$ per problemi altamente lisci e dimostrando la quasi-ottimalità di tale approccio rispetto al limite inferiore $\Omega(\epsilon^{-4})$ .

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao Zhang2026-03-10🤖 cs.LG

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

Lo studio dimostra che, sebbene le motivazioni degli agenti LLM siano inferibili con quasi assoluta precisione, i sistemi di credenze presentano un limite fondamentale di asimmetria informativa che ne impedisce l'identificazione accurata, indipendentemente dall'architettura o dalla quantità di dati.

Jason Starace, Terence Soule2026-03-10🤖 cs.LG

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

Questo lavoro presenta un framework modulare multimodale basato sull'intelligenza artificiale generativa per produrre dati sintetici realistici sugli edifici residenziali a partire da immagini e informazioni pubbliche, riducendo la dipendenza da fonti dati costose o riservate e facilitando la ricerca sulla simulazione energetica.

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

← Precedente Successivo →