MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

Die Arbeit stellt MAcPNN vor, ein dezentrales Lernparadigma für IoT-Datenströme, das auf Vygotskys soziokultureller Theorie basiert und autonome Geräte durch bedarfsgesteuerte gegenseitige Unterstützung sowie kontinuierliche progressive neuronale Netze (cPNN) befähigt, Konzeptdrifts zu bewältigen und Vergessen zu vermeiden, ohne einen zentralen Koordinator zu benötigen.

Federico Giannini, Emanuele Della ValleWed, 11 Ma🤖 cs.LG

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

Diese Arbeit entwickelt einen axiomatischen Ansatz für datengetriebene, robuste Markov-Entscheidungsprozesse auf Borel-Räumen, der mittels empirischer Verteilungen und Ambiguitätsmengen, die auf Distanzfunktionen basieren, Konvergenzgarantien, Stichprobenkomplexitätsgrenzen und Wahrscheinlichkeitsaussagen für die Out-of-Sample-Leistung liefert, während sie gleichzeitig die mangelnde Robustheit rein empirischer MDPs aufzeigt.

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment

Die Arbeit stellt MAPLE vor, ein neues Trainingsparadigma, das Test-Time Reinforcement Learning mit einem medizinischen Prozess-Reward-Modell kombiniert, um die Zuverlässigkeit medizinischer KI durch den Ersatz von Mehrheitsvoting durch expertenbasierte, schrittweise Belohnungen zu verbessern.

Kailong Fan, Anqi Pu, Yichen Wu, Wanhua Li, Yicong Li, Hanspeter Pfister, Huafeng Liu, Xiang Li, Quanzheng Li, Ning GuoWed, 11 Ma🤖 cs.LG

The Coupling Within: Flow Matching via Distilled Normalizing Flows

Die Arbeit stellt Normalized Flow Matching (NFM) vor, eine Methode, die die quasi-deterministischen Kopplungen von vortrainierten autoregressiven Normalizing-Flow-Modellen destilliert, um Student-Flow-Modelle zu trainieren, die sowohl ihre Lehrer als auch herkömmliche Flow-Matching-Ansätze mit unabhängigen oder optimalen Transport-Kopplungen übertreffen.

David Berthelot, Tianrong Chen, Jiatao Gu, Marco Cuturi, Laurent Dinh, Bhavik Chandna, Michal Klein, Josh Susskind, Shuangfei ZhaiWed, 11 Ma🤖 cs.LG

SCALAR: Learning and Composing Skills through LLM Guided Symbolic Planning and Deep RL Grounding

Das Paper stellt SCALAR vor, ein bidirektionales Framework, das die symbolische Planung von LLMs mit Deep RL kombiniert, um durch iteratives Feedback und Trajektorienanalyse robuste Skills zu lernen und so die Leistung bei komplexen Aufgaben wie dem Sammeln von Diamanten in Craftax signifikant zu verbessern.

Renos Zabounidis, Yue Wu, Simon Stepputtis, Woojun Kim, Yuanzhi Li, Tom Mitchell, Katia SycaraWed, 11 Ma🤖 cs.LG

FlexServe: A Fast and Secure LLM Serving System for Mobile Devices with Flexible Resource Isolation

Das Paper stellt FlexServe vor, ein schnelles und sicheres System für die Inferenz von Large Language Models auf mobilen Geräten, das durch flexible Ressourcenisolierung und spezialisierte Managementmechanismen innerhalb von ARM TrustZone die erheblichen Leistungsnachteile herkömmlicher Ansätze überwindet.

Yinpeng Wu, Yitong Chen, Lixiang Wang, Jinyu Gu, Zhichao Hua, Yubin XiaWed, 11 Ma🤖 cs.LG

From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

Die Studie stellt vor, dass der autonome KI-Agent „Sentinel" durch die Verwendung des Model Context Protocol (MCP) klinische Triage-Daten aus der Fernüberwachung von Patienten mit höherer Sensitivität und Konsistenz als menschliche Ärzte klassifiziert und dabei eine skalierbare, kosteneffiziente Lösung für die Überlastung des medizinischen Personals bietet.

Seunghwan Kim (AnsibleHealth Inc., San Francisco, USA), Tiffany H. Kung (AnsibleHealth Inc., San Francisco, USA, Stanford School of Medicine, Stanford, USA), Heena Verma (AnsibleHealth Inc., San Francisco, USA), Dilan Edirisinghe (AnsibleHealth Inc., San Francisco, USA), Kaveh Sedehi (AnsibleHealth Inc., San Francisco, USA), Johanna Alvarez (AnsibleHealth Inc., San Francisco, USA), Diane Shilling (AnsibleHealth Inc., San Francisco, USA), Audra Lisa Doyle (AnsibleHealth Inc., San Francisco, USA), Ajit Chary (AnsibleHealth Inc., San Francisco, USA), William Borden (AnsibleHealth Inc., San Francisco, USA, George Washington University, Washington, D.C., USA), Ming Jack Po (AnsibleHealth Inc., San Francisco, USA)Wed, 11 Ma🤖 cs.AI

Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation

Der vorgestellte Sim2Act-Rahmenwerk verbessert das robuste Simulations-zu-Entscheidungs-Lernen für kritische Domänen wie Lieferketten, indem es durch eine adversarische Kalibrierung und eine gruppenrelative Perturbationsstrategie die Zuverlässigkeit von Policies trotz simulierter Unsicherheiten und Datenverzerrungen sicherstellt.

Hongyu Cao, Jinghan Zhang, Kunpeng Liu, Dongjie Wang, Feng Xia, Haifeng Chen, Xiaohua Hu, Yanjie FuWed, 11 Ma🤖 cs.AI

Adaptive Active Learning for Online Reliability Prediction of Satellite Electronics

Diese Arbeit stellt ein integriertes Online-Framework zur Vorhersage der Zuverlässigkeit von Satellitenelektronik vor, das ein Wiener-Prozess-Degradationsmodell mit räumlichen Korrelationen und eine adaptive zweistufige Active-Learning-Strategie kombiniert, um trotz begrenzter Daten und variierender Betriebsbedingungen eine hohe Vorhersagegenauigkeit zu erreichen.

Shixiang Li, Yubin Tian, Dianpeng Wang, Piao Chen, Mengying RenWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

Diese Arbeit verifiziert, dass persistente Beobachter in kausal invarianten Hypergraphen die Bedingungen des Good-Regulator-Theorems erfüllen, wodurch sich natürliche Gradientenabstiegsverfahren als einzig zulässige Lernregel ergeben und eine modellabhängige Verbindung zwischen Wolframs und Vanchurins Theorien mit einem quanten-klassischen Schwellenwert bei κ(F)=2 hergestellt wird.

Max ZhuravlevWed, 11 Ma🤖 cs.LG