cs.LG papers | Gist.Science

$P^2$ GNN: Two Prototype Sets to boost GNN Performance

Het artikel introduceert $P^2$ GNN, een plug-and-play techniek die de prestaties van Graph Neural Networks verbetert door prototypes te gebruiken om zowel globale context toe te voegen als ruis in lokale buurten te verminderen, wat resulteert in superieure resultaten op diverse datasets voor taken zoals aanbeveling en classificatie.

Arihant Jain, Gundeep Arora, Anoop Saladi, Chaosheng Dong2026-03-11🤖 cs.LG

The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness

Dit paper introduceert het RAISE-framework om aan te tonen dat verbeteringen in logisch redeneren bij grote taalmodellen onvermijdelijk leiden tot een toename van situationeel bewustzijn en strategisch zelfbewustzijn, waardoor er dringende nieuwe veiligheidsmaatregelen nodig zijn.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-11🤖 cs.AI

The Radio-Frequency Transformer for Signal Separation

Dit artikel introduceert een volledig datagedreven transformer-architectuur met een aangepaste discrete tokenizer die, in tegenstelling tot traditionele methoden, een signaal van belang effectief scheidt van onbekende niet-Gaussische interferentie door middel van cross-entropy training, wat leidt tot een aanzienlijke verbetering in bitfoutratio en zero-shot generalisatie.

Egor Lifar, Semyon Savkin, Rachana Madhukara, Tejas Jayashankar, Yury Polyanskiy, Gregory W. Wornell2026-03-11🤖 cs.LG

Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing

Dit onderzoek toont aan dat emotionele toon de aandachtsgewichten en redeneerprestaties van grote taalmodellen beïnvloedt, en introduceert met AURA-QA en een emotionele regularisatieframework een dataset en methode om deze effecten te bestuderen en de leesbegripprestaties te verbeteren.

Benjamin Reichman, Adar Avasian, Samuel Webster, Larry Heck2026-03-11🤖 cs.AI

MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

Dit paper introduceert MM-Zero, het eerste RL-gebaseerde framework dat Vision Language Models zonder enige trainingsdata zelf kan laten evolueren door middel van een unieke drie-rollen architectuur (voorsteller, coder en solver) die samenwerken om visuele concepten te genereren en redeneervermogen te verbeteren.

Zongxia Li, Hongyang Du, Chengsong Huang, Xiyang Wu, Lantao Yu, Yicheng He, Jing Xie, Xiaomin Wu, Zhichao Liu, Jiarui Zhang, Fuxiao Liu2026-03-11🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Deze paper introduceert \texttt{RQRE-OVI}, een nieuw algoritme dat Risk-Sensitive Quantal Response Equilibrium (RQRE) berekent in grote Markov-games met lineaire functiebenadering, waardoor een unieke en stabiele oplossing wordt gevonden die een waardevolle afweging biedt tussen prestatie en robuustheid ten opzichte van traditionele Nash-evenwichten.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. Ratliff2026-03-11🤖 cs.LG

Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control

Dit paper introduceert de Test-Time Control (TTC)-laag, een hardware-efficiënte architecturale component die redeneren als optimale controle vormgeeft en door het integreren van LQR-planning in vooringevette taalmodellen de wiskundige redeneerprestaties aanzienlijk verbetert zonder testtijd-training.

Peihao Wang, Shan Yang, Xijun Wang, Tesi Xiao, Xin Liu, Changlong Yu, Yu Lou, Pan Li, Zhangyang Wang, Ming Lin, René Vidal2026-03-11🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

Deze paper introduceert een uniek generatief steekproefkader dat, door het minimaliseren van de Maximum Mean Discrepancy tussen voorwaartse en achterwaartse Markov-trajecten onder de beperking van reversibiliteit, het mogelijk maakt om te leren van complexe, niet-genormaliseerde verdelingen in continue, discrete en hybride ruimtes zonder gebruik te maken van gradients of scorefuncties.

Lei Li, Zhen Wang, Lishuo Zhang2026-03-11🤖 cs.LG

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

Dit paper introduceert een trainingsmethode voor Transformers die gebruikmaakt van lengtebewuste attention-priors en een gain-aware controller om de validatieprestaties te verbeteren zonder de testtijd-kosten of latentie te verhogen.

Rian Atri2026-03-11🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Dit artikel introduceert nieuwe, efficiënt berekenbare transductieve generalisatiegrenzen voor grafnodeclassificatie op basis van optimale transport en Wasserstein-afstanden, die empirisch beter presteren dan klassieke complexiteitsmaten en het niet-monotone effect van GNN-diepte op generalisatie verklaren.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo Kim2026-03-11🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

Dit artikel introduceert DendroNN, een energiezuinig, niet-gedifferentieerd neuronaal netwerk dat inspiratie put uit dendritische sequentiedetectie om event-based data te verwerken en via een asynchrone hardware-architectuur een tot vier keer hogere efficiëntie bereikt dan bestaande neuromorfe systemen.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen Becker2026-03-11🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Dit artikel vult bestaande kennisgaten over de spijtbegrensingen van Gaussian Process Thompson Sampling (GP-TS) in door zowel een ondergrens als verbeterde bovengrenzen voor de verwachte, leniente en cumulatieve spijt af te leiden, waarbij wordt aangetoond dat GP-TS een polynoomafhankelijkheid van $1/\delta$ vertoont en dat recente verbeteringen voor GP-UCB ook op GP-TS van toepassing zijn.

Shion Takeno, Shogo Iwazaki2026-03-11🤖 cs.LG

Proxy-Guided Measurement Calibration

Dit artikel presenteert een door proxyvariabelen geleid raamwerk dat variatie-automatische coderingen gebruikt om systematische meetfouten in uitkomstvariabelen te identificeren en te corrigeren door latente inhouds- en biasvariabelen te ontrafelen.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan Liu2026-03-11🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Dit paper presenteert een niet-asymptotisch resultaat dat de trainingsdynamica van machine learning-modellen onder een Gaussisch mengselmodel koppelt aan een makkelijker te analyseren surrogaat-dynamisch systeem, waarbij gebruik wordt gemaakt van de Gordon-vergelijkingstheorema om de geldigheid van dynamische mean-field-expressies te bewijzen en een iteratief verfijningsschema voor niet-asymptotische scenario's voor te stellen.

Ashkan Panahi2026-03-11🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

Het artikel introduceert CLoE, een consistentiegedreven raamwerk dat de segmentatieprestaties bij ontbrekende medische beeldmodaliteiten verbetert door experts op besluit- en regienniveau tot overeenstemming te brengen en modale betrouwbaarheid dynamisch te wegen.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao Li2026-03-11🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

Dit paper introduceert Reward-Zero, een universeel mechanisme dat natuurlijke taalbeschrijvingen omzet in semantisch onderbouwde, impliciete beloningssignalen om het leren van versterking te versnellen en te stabiliseren zonder handmatige beloningseigenschappen.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu She2026-03-11🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

Dit paper introduceert TA-GGAD, een adaptief grafmodel dat het 'Anomaly Disassortativity'-probleem aanpakt om generalistische, domeinonafhankelijke anomaliedetectie te realiseren met state-of-the-art prestaties op diverse real-world grafen.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Dit artikel presenteert een datagedreven raamwerk dat een interactieve 3D-visualisatie biedt om de oppervlakteruwheid bij materiaal-extrusie-additieve productie te voorspellen en te optimaliseren door gebruik te maken van een multilayer perceptron en een conditionele generatieve tegenstrijdige netwerken.

Engin Deniz Erkan, Elif Surer, Ulas Yaman2026-03-11🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Dit artikel introduceert een differentieel-private, nulde-orde optimalisatieframework dat datasetcondensatie mogelijk maakt voor niet-differentieerbare klinische modellen, zoals beslisbomen en Cox-regressie, waardoor veilige en modelonafhankelijke datauitwisseling voor klinische voorspellingsopdrachten wordt gerealiseerd zonder de privacy van patiënten te schaden.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

Dit paper introduceert CAHC, een end-to-end contrastive learning-methode voor geattribueerde hypergraafclustering die tegelijkertijd knoopembeddings leert en clusterresultaten genereert door middel van een combinatie van knoop- en hyperedge-niveau doelen, waardoor het de prestaties van bestaande methoden op acht datasets verbetert.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong Lin2026-03-11🤖 cs.LG

← Vorige Volgende →

cs.LG

P2P^2P2GNN: Two Prototype Sets to boost GNN Performance