MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

Dit artikel introduceert MAcPNN, een decentrale leerparadigma voor IoT-datastromen dat gebaseerd is op Vygotsky's socioculturele theorie en waarbij autonome apparaten alleen bij prestatieverlies om hulp vragen aan elkaar via quantized Continuous Progressive Neural Networks, waardoor concept drift en vergeten effectief worden aangepakt met minder communicatie dan federated learning.

Federico Giannini, Emanuele Della ValleWed, 11 Ma🤖 cs.LG

MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment

Dit paper introduceert MAPLE, een nieuw trainingsparadigma dat Test-Time Reinforcement Learning combineert met medische procesbeloningsmodellen om de betrouwbaarheid van medische AI te verbeteren door te schakelen van onbetrouwbare meerderheidsstemming naar expert-gealigneerde, stapsgewijze beloningen.

Kailong Fan, Anqi Pu, Yichen Wu, Wanhua Li, Yicong Li, Hanspeter Pfister, Huafeng Liu, Xiang Li, Quanzheng Li, Ning GuoWed, 11 Ma🤖 cs.LG

The Coupling Within: Flow Matching via Distilled Normalizing Flows

Dit paper introduceert Normalized Flow Matching (NFM), een methode die de quasi-bepaalde koppelingsstrategie van een voorgeïntegreerd autoregressief normaliserend stroommodel distilleert om een student-model te trainen dat zowel de prestaties van onafhankelijke en optimale transport-koppelingen overtreft als die van de leraar zelf verbetert.

David Berthelot, Tianrong Chen, Jiatao Gu, Marco Cuturi, Laurent Dinh, Bhavik Chandna, Michal Klein, Josh Susskind, Shuangfei ZhaiWed, 11 Ma🤖 cs.LG

SCALAR: Learning and Composing Skills through LLM Guided Symbolic Planning and Deep RL Grounding

Het paper introduceert SCALAR, een bidirectioneel raamwerk dat LLM-planning koppelt aan Deep RL via een geleerde vaardigheidsbibliotheek, waarbij RL-uitkomsten worden gebruikt om de LLM-specificaties iteratief te verfijnen, wat resulteert in aanzienlijk betere prestaties in complexe omgevingen zoals Craftax.

Renos Zabounidis, Yue Wu, Simon Stepputtis, Woojun Kim, Yuanzhi Li, Tom Mitchell, Katia SycaraWed, 11 Ma🤖 cs.LG

From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

Het onderzoek presenteert Sentinel, een autonoom AI-agent dat remote patient monitoring-data met een hogere gevoeligheid voor noodgevallen dan individuele clinici triageert, waardoor schaalbare en kosteneffectieve monitoring mogelijk wordt die de beperkingen van eerdere trials overbrugt.

Seunghwan Kim (AnsibleHealth Inc., San Francisco, USA), Tiffany H. Kung (AnsibleHealth Inc., San Francisco, USA, Stanford School of Medicine, Stanford, USA), Heena Verma (AnsibleHealth Inc., San Francisco, USA), Dilan Edirisinghe (AnsibleHealth Inc., San Francisco, USA), Kaveh Sedehi (AnsibleHealth Inc., San Francisco, USA), Johanna Alvarez (AnsibleHealth Inc., San Francisco, USA), Diane Shilling (AnsibleHealth Inc., San Francisco, USA), Audra Lisa Doyle (AnsibleHealth Inc., San Francisco, USA), Ajit Chary (AnsibleHealth Inc., San Francisco, USA), William Borden (AnsibleHealth Inc., San Francisco, USA, George Washington University, Washington, D.C., USA), Ming Jack Po (AnsibleHealth Inc., San Francisco, USA)Wed, 11 Ma🤖 cs.AI

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

Dit artikel verifieert dat persistente waarnemers in hypergraafsubstraten voldoen aan de Conant-Ashby Good Regulator-theorema, waardoor natuurlijke gradiëntafstijging als unieke leerregel wordt afgeleid en een verband wordt gelegd tussen Wolfram's hypergrafen en Vanchurin's kosmologie via een modelafhankelijke afleiding van de regimeparameter alpha.

Max ZhuravlevWed, 11 Ma🤖 cs.LG

Not All News Is Equal: Topic- and Event-Conditional Sentiment from Finetuned LLMs for Aluminum Price Forecasting

Deze studie toont aan dat het integreren van sentimentanalyse van nieuwsberichten, gegenereerd door een op Qwen3 gefinetuned LLM, in combinatie met traditionele tabulair data, de voorspellende nauwkeurigheid en economische meerwaarde van aluminiumprijzen aanzienlijk verbetert, vooral tijdens periodes van hoge volatiliteit.

Alvaro Paredes Amorin, Andre Python, Christoph WeisserWed, 11 Ma🤖 cs.AI