cs.LG papers | Gist.Science

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

Dit artikel introduceert MAcPNN, een decentrale leerparadigma voor IoT-datastromen dat gebaseerd is op Vygotsky's socioculturele theorie en waarbij autonome apparaten alleen bij prestatieverlies om hulp vragen aan elkaar via quantized Continuous Progressive Neural Networks, waardoor concept drift en vergeten effectief worden aangepakt met minder communicatie dan federated learning.

Federico Giannini, Emanuele Della ValleWed, 11 Ma🤖 cs.LG

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

Dit artikel presenteert een axioma-benadering voor datagedreven robuuste Markov-beslissingsprocessen op Borel-ruimten, waarbij wordt aangetoond dat empirische verdelingen gecombineerd met een afstandsfunctie leiden tot sterke prestatiegaranties en convergentiebewijzen die ontbreken bij traditionele empirische MDP's.

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment

Dit paper introduceert MAPLE, een nieuw trainingsparadigma dat Test-Time Reinforcement Learning combineert met medische procesbeloningsmodellen om de betrouwbaarheid van medische AI te verbeteren door te schakelen van onbetrouwbare meerderheidsstemming naar expert-gealigneerde, stapsgewijze beloningen.

Kailong Fan, Anqi Pu, Yichen Wu, Wanhua Li, Yicong Li, Hanspeter Pfister, Huafeng Liu, Xiang Li, Quanzheng Li, Ning GuoWed, 11 Ma🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

Dit boek herinterpreteert generatieve AI, met name flow matching, als een statistisch raamwerk voor het niet-parametrisch leren van hoogdimensionale verdelingen, waardoor methoden zoals imputatie en causale inferentie worden onderbouwd door orthogonalisatie en cross-fitting.

Shinto EguchiWed, 11 Ma🤖 cs.LG

The Coupling Within: Flow Matching via Distilled Normalizing Flows

Dit paper introduceert Normalized Flow Matching (NFM), een methode die de quasi-bepaalde koppelingsstrategie van een voorgeïntegreerd autoregressief normaliserend stroommodel distilleert om een student-model te trainen dat zowel de prestaties van onafhankelijke en optimale transport-koppelingen overtreft als die van de leraar zelf verbetert.

David Berthelot, Tianrong Chen, Jiatao Gu, Marco Cuturi, Laurent Dinh, Bhavik Chandna, Michal Klein, Josh Susskind, Shuangfei ZhaiWed, 11 Ma🤖 cs.LG

An accurate flatness measure to estimate the generalization performance of CNN models

Deze paper introduceert een exacte en architectuurgetrouwe maatstaf voor de vlakheid van CNN-modellen, gebaseerd op een gesloten vorm voor de Hessiaanse trace, die een robuuste voorspelling biedt voor het generalisatievermogen en de ontwerpkeuzes van deze netwerken.

Rahman Taleghani, Maryam Mohammadi, Francesco MarchettiWed, 11 Ma🤖 cs.LG

When to Retrain after Drift: A Data-Only Test of Post-Drift Data Size Sufficiency

Dit paper introduceert CALIPER, een detector- en modelonafhankelijke test die uitsluitend op data gebaseerd bepaalt of er na conceptdrift voldoende post-drift data beschikbaar is voor stabiel hertrainen door een monotoon dalende trend in een foutproxy te monitoren.

Ren Fujiwara, Yasuko Matsubara, Yasushi SakuraiWed, 11 Ma🤖 cs.LG

Two Teachers Better Than One: Hardware-Physics Co-Guided Distributed Scientific Machine Learning

Dit paper introduceert EPIC, een gedistribueerd SciML-framework dat hardware- en fysica-gestuurde technieken combineert om communicatiekosten en latentie aanzienlijk te verminderen terwijl de fysieke nauwkeurigheid behouden blijft.

Yuchen Yuan, Junhuan Yang, Hao Wan, Yipei Liu, Hanhan Wu, Youzuo Lin, Lei YangWed, 11 Ma🤖 cs.LG

SCALAR: Learning and Composing Skills through LLM Guided Symbolic Planning and Deep RL Grounding

Het paper introduceert SCALAR, een bidirectioneel raamwerk dat LLM-planning koppelt aan Deep RL via een geleerde vaardigheidsbibliotheek, waarbij RL-uitkomsten worden gebruikt om de LLM-specificaties iteratief te verfijnen, wat resulteert in aanzienlijk betere prestaties in complexe omgevingen zoals Craftax.

Renos Zabounidis, Yue Wu, Simon Stepputtis, Woojun Kim, Yuanzhi Li, Tom Mitchell, Katia SycaraWed, 11 Ma🤖 cs.LG

FlexServe: A Fast and Secure LLM Serving System for Mobile Devices with Flexible Resource Isolation

Dit paper introduceert FlexServe, een snel en veilig systeem voor het uitvoeren van Large Language Models op mobiele apparaten dat via flexibele resource-isolatie in ARM TrustZone de prestaties aanzienlijk verbetert ten opzichte van bestaande beveiligde ontwerpen.

Yinpeng Wu, Yitong Chen, Lixiang Wang, Jinyu Gu, Zhichao Hua, Yubin XiaWed, 11 Ma🤖 cs.LG

From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

Het onderzoek presenteert Sentinel, een autonoom AI-agent dat remote patient monitoring-data met een hogere gevoeligheid voor noodgevallen dan individuele clinici triageert, waardoor schaalbare en kosteneffectieve monitoring mogelijk wordt die de beperkingen van eerdere trials overbrugt.

Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation

Het paper introduceert Sim2Act, een robuust kader voor simulatie-naar-beslissingen dat via adversariele kalibratie en groepsrelatieve perturbatie de stabiliteit en betrouwbaarheid van beleidsleer verbetert in kritieke domeinen zoals toeleveringsketens.

Hongyu Cao, Jinghan Zhang, Kunpeng Liu, Dongjie Wang, Feng Xia, Haifeng Chen, Xiaohua Hu, Yanjie FuWed, 11 Ma🤖 cs.AI

Quality over Quantity: Demonstration Curation via Influence Functions for Data-Centric Robot Learning

Dit artikel introduceert Quality over Quantity (QoQ), een systematische methode die invloedfuncties gebruikt om hoogwaardige demonstraties te selecteren voor robotleren, waardoor de prestaties van beleidsmodellen in zowel gesimuleerde als realistische omgevingen worden verbeterd.

Haeone Lee, Taywon Min, Junsu Kim, Sinjae Kang, Fangchen Liu, Lerrel Pinto, Kimin LeeWed, 11 Ma🤖 cs.LG

Adaptive Active Learning for Online Reliability Prediction of Satellite Electronics

Dit artikel introduceert een geïntegreerd raamwerk voor online betrouwbaarheidsvoorspelling van satellietelektronica dat een Wiener-procesdegradatiemodel combineert met een adaptieve actieve leerverstappen om nauwkeurige voorspellingen te mogelijk maken ondanks beperkte data en variabiliteit.

Shixiang Li, Yubin Tian, Dianpeng Wang, Piao Chen, Mengying RenWed, 11 Ma🤖 cs.LG

Dynamic Multi-period Experts for Online Time Series Forecasting

Dit paper introduceert DynaME, een hybride raamwerk voor online tijdreeksvoorspelling dat conceptdrift onderscheidt in terugkerende en emergente types en deze respectievelijk adresseert door dynamisch gebruik te maken van gespecialiseerde experts voor historische patronen en een stabiele algemene expert voor nieuwe patronen.

Seungha Hong, Sukang Chae, Suyeon Kim, Sanghwan Jang, Hwanjo YuWed, 11 Ma🤖 cs.LG

Learning Adaptive LLM Decoding

Deze paper introduceert lichtgewicht adaptieve decoderingsadapters die, getraind met versterkingslering, dynamisch samplingstrategieën selecteren op basis van taakmoeilijkheid en beschikbare rekenkracht, waardoor de nauwkeurigheid binnen een vast token- of parallelle sampling-budget aanzienlijk verbetert zonder het taalmodel zelf te finetunen.

Chloe H. Su, Zhe Ye, Samuel Tenka, Aidan Yang, Soonho Kong, Udaya GhaiWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

Dit artikel verifieert dat persistente waarnemers in hypergraafsubstraten voldoen aan de Conant-Ashby Good Regulator-theorema, waardoor natuurlijke gradiëntafstijging als unieke leerregel wordt afgeleid en een verband wordt gelegd tussen Wolfram's hypergrafen en Vanchurin's kosmologie via een modelafhankelijke afleiding van de regimeparameter alpha.

Max ZhuravlevWed, 11 Ma🤖 cs.LG

Exclusive Self Attention

Dit paper introduceert 'Exclusive Self Attention' (XSA), een eenvoudige aanpassing van self-attention die de prestaties van Transformers verbetert door informatie van de token zelf uit te sluiten, waardoor contextmodelleren effectiever wordt, vooral bij langere sequenties.

Shuangfei ZhaiWed, 11 Ma🤖 cs.LG

PPO-Based Hybrid Optimization for RIS-Assisted Semantic Vehicular Edge Computing

Dit artikel presenteert een hybride optimalisatieframework dat Proximal Policy Optimization (PPO) en Lineaire Programmering combineert in een door RIS ondersteunde semantische voertuig-edge computing-omgeving, waardoor de eind-tot-eind latentie met 40% tot 50% wordt verlaagd ten opzichte van bestaande methoden.

Wei Feng, Jingbo Zhang, Qiong Wu, Pingyi Fan, Qiang FanWed, 11 Ma🤖 cs.LG

Not All News Is Equal: Topic- and Event-Conditional Sentiment from Finetuned LLMs for Aluminum Price Forecasting

Deze studie toont aan dat het integreren van sentimentanalyse van nieuwsberichten, gegenereerd door een op Qwen3 gefinetuned LLM, in combinatie met traditionele tabulair data, de voorspellende nauwkeurigheid en economische meerwaarde van aluminiumprijzen aanzienlijk verbetert, vooral tijdens periodes van hoge volatiliteit.

Alvaro Paredes Amorin, Andre Python, Christoph WeisserWed, 11 Ma🤖 cs.AI

← Vorige Volgende →