cs.LG articoli | Gist.Science

When Machine Learning Gets Personal: Evaluating Prediction and Explanation

Questo studio propone un quadro unificato per valutare come la personalizzazione dei modelli di machine learning influenzi simultaneamente previsioni e spiegazioni, rivelando che tali impatti possono divergere e fornendo limiti teorici per determinare la fattibilità statistica di rilevare tali effetti in contesti reali ad alto rischio.

Louisa Cornelis, Guillermo Bernárdez, Haewon Jeong, Nina MiolaneWed, 11 Ma🤖 cs.LG

On the Impact of the Utility in Semivalue-based Data Valuation

Il paper introduce il concetto di "firma spaziale" per mappare i punti dati in uno spazio geometrico che semplifica l'analisi della robustezza delle valutazioni basate sui semivalori rispetto alle variazioni della funzione di utilità, proponendo una metrica pratica per quantificare tale stabilità.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

Il paper presenta un framework end-to-end che utilizza l'inferenza senza verosimiglianza per stimare le distribuzioni posteriori dei parametri fisici degli oggetti deformabili lineari (DLO), permettendo l'addestramento in simulazione di politiche visuomotorie specifiche per oggetto che vengono poi deployate con successo nel mondo reale in modalità zero-shot.

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

Il paper introduce il metodo Feature Importance Rescaling (FIR), una tecnica teoricamente fondata che migliora l'affidabilità della valutazione della qualità del clustering in presenza di rumore e feature irrilevanti, aumentando la correlazione tra gli indici di validità e la verità fondamentale.

Renato Cordeiro de Amorim, Vladimir MakarenkovWed, 11 Ma🤖 cs.LG

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Il paper introduce HyConEx, un classificatore basato su hypernetwork progettato per dati tabulari che combina previsioni accurate e spiegazioni locali sotto forma di esempi controfattuali in un'unica rete neurale.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

Experiments with Optimal Model Trees

Questo studio presenta formulazioni di programmazione lineare intera mista per costruire alberi modello globalmente ottimali con macchine a vettori di supporto lineari nelle foglie, dimostrando che tali alberi raggiungono un'accuratezza competitiva con strutture molto più compatte rispetto agli algoritmi greedy e ad altri metodi standard.

Sabino Francesco Roselli, Eibe FrankWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Questo articolo propone una critica consequenzialista alle pratiche di valutazione della classificazione binaria, sostenendo l'adozione di regole di scoring adeguate come il punteggio Brier attraverso un nuovo framework decisionale e il pacchetto Python `briertools`, che colmano il divario tra teoria e pratica dominata da metriche a soglia fissa.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Concept Drift Guided LayerNorm Tuning for Efficient Multimodal Metaphor Identification

Il paper introduce CDGLT, un framework efficiente e all'avanguardia per l'identificazione di metafore multimodali che combina l'adattamento del LayerNorm con una strategia di "Concept Drift" basata su SLERP per colmare il divario tra significati letterali e figurativi riducendo drasticamente i costi computazionali.

Wenhao Qian, Zhenzhen Hu, Zijie Song, Jia LiWed, 11 Ma🤖 cs.LG

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

Il paper introduce SGPO, un framework che risolve il limite di GRPO di non aggiornare la politica quando tutti i campioni di un gruppo sono errati, migliorando l'apprendimento per rinforzo nei modelli linguistici attraverso una diversificazione guidata da un modello giudice passo-passo che permette di apprendere anche dagli errori senza richiedere soluzioni corrette.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi LinWed, 11 Ma🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Il documento introduce la GM-RBM, un modello generativo che estende l'RBG a unità nascoste categoriche q-ali (Potts) per migliorare la rappresentazione di concetti multivalore e le prestazioni di inferenza discreta rispetto alle controparti binarie a capacità equivalente.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke TheogarajanWed, 11 Ma🤖 cs.LG

JULI: Jailbreak Large Language Models by Self-Introspection

Il paper propone JULI, un nuovo metodo che sfrutta l'introspezione delle probabilità dei token tramite un piccolo blocco BiasNet per aggirare le misure di sicurezza dei modelli linguistici di grandi dimensioni in un contesto black-box, superando le tecniche esistenti senza richiedere l'accesso ai pesi del modello.

Jesson Wang, Zhanhao Hu, David WagnerWed, 11 Ma🤖 cs.LG

Discovering Symbolic Differential Equations with Symmetry Invariants

Questo lavoro introduce un metodo innovativo per la scoperta di equazioni differenziali simboliche che utilizza invarianti di simmetria come entità atomiche, garantendo che le leggi dinamiche identificate rispettino i principi fisici e migliorando l'efficienza e l'accuratezza delle tecniche esistenti.

Jianke Yang, Manu Bhat, Bryan Hu, Yadi Cao, Nima Dehmamy, Robin Walters, Rose YuWed, 11 Ma🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Il paper presenta UltraEdit, un metodo innovativo per l'editing continuo dei modelli linguistici che, eliminando la necessità di addestramento, soggetti specifici o memoria esterna, raggiunge velocità e efficienza superiori rispetto agli stati dell'arte, permettendo di eseguire fino a 2 milioni di modifiche su modelli da 7B con risorse hardware limitate.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Questo studio presenta una metodologia sistematica per valutare i modelli linguistici su dispositivi edge, dimostrando che i modelli grandi fortemente quantizzati superano quelli più piccoli ad alta precisione al di sotto di una soglia di circa 3,5 bit per peso, fornendo linee guida per ottimizzare capacità ed efficienza in ambienti con risorse limitate.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong XuWed, 11 Ma🤖 cs.LG

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

Il paper presenta SATURN, un framework di apprendimento per rinforzo basato su problemi di soddisfacibilità booleana (SAT) che supera le limitazioni di scalabilità, verificabilità e controllo della difficoltà delle attività esistenti, permettendo di potenziare significativamente le capacità di ragionamento dei modelli linguistici su compiti matematici e di programmazione attraverso un curriculum learning progressivo.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong DongWed, 11 Ma🤖 cs.AI

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

Il paper presenta FrontierCO, un benchmark su larga scala che valuta le prestazioni dei solver di ottimizzazione combinatoria basati su machine learning su dati reali e di dimensioni estreme, rivelando un divario significativo rispetto ai solver classici ma anche casi di superiorità in scenari specifici.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming YangWed, 11 Ma🤖 cs.LG

Semi-Supervised Conformal Prediction With Unlabeled Nonconformity Score

Il paper propone SemiCP, un nuovo paradigma di previsione conformale semi-supervisionato che utilizza un punteggio di non-conformità basato sull'abbinamento dei vicini più prossimi (NNM) per sfruttare dati non etichettati durante la calibrazione, riducendo significativamente il divario di copertura rispetto ai metodi tradizionali quando i dati etichettati sono scarsi.

Xuanning Zhou, Zihao Shi, Hao Zeng, Xiaobo Xia, Bingyi Jing, Hongxin WeiWed, 11 Ma🤖 cs.LG

Pure Exploration with Infinite Answers

Questo articolo affronta i problemi di esplorazione pura con risposte infinite, derivando un limite inferiore dipendente dall'istanza, spiegando il fallimento dei metodi esistenti per l'ottimalità asintotica e proponendo un nuovo quadro generale, "Sticky-Sequence Track-and-Stop", che garantisce tale ottimalità.

Riccardo Poiani, Martino Bernasconi, Andrea CelliWed, 11 Ma🤖 cs.LG

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

Il paper propone TSRating, un framework unificato che sfrutta il giudizio dei modelli linguistici su larga scala (LLM) e l'apprendimento meta per valutare in modo efficiente e adattabile la qualità di serie temporali provenienti da domini diversi, superando i limiti delle metodologie esistenti.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong NgWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Il lavoro propone CORA, un metodo di assegnazione del credito per l'apprendimento per rinforzo multi-agente cooperativo che utilizza il nucleo della teoria dei giochi cooperativi e il campionamento casuale delle coalizioni per allocare in modo più efficace i vantaggi globali e promuovere comportamenti coordinati ottimali.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

← Precedente Successivo →