cs.LG Arbeiten | Gist.Science

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

Die Arbeit stellt MAcPNN vor, ein dezentrales Lernparadigma für IoT-Datenströme, das auf Vygotskys soziokultureller Theorie basiert und autonome Geräte durch bedarfsgesteuerte gegenseitige Unterstützung sowie kontinuierliche progressive neuronale Netze (cPNN) befähigt, Konzeptdrifts zu bewältigen und Vergessen zu vermeiden, ohne einen zentralen Koordinator zu benötigen.

Federico Giannini, Emanuele Della ValleWed, 11 Ma🤖 cs.LG

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

Diese Arbeit entwickelt einen axiomatischen Ansatz für datengetriebene, robuste Markov-Entscheidungsprozesse auf Borel-Räumen, der mittels empirischer Verteilungen und Ambiguitätsmengen, die auf Distanzfunktionen basieren, Konvergenzgarantien, Stichprobenkomplexitätsgrenzen und Wahrscheinlichkeitsaussagen für die Out-of-Sample-Leistung liefert, während sie gleichzeitig die mangelnde Robustheit rein empirischer MDPs aufzeigt.

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment

Die Arbeit stellt MAPLE vor, ein neues Trainingsparadigma, das Test-Time Reinforcement Learning mit einem medizinischen Prozess-Reward-Modell kombiniert, um die Zuverlässigkeit medizinischer KI durch den Ersatz von Mehrheitsvoting durch expertenbasierte, schrittweise Belohnungen zu verbessern.

Kailong Fan, Anqi Pu, Yichen Wu, Wanhua Li, Yicong Li, Hanspeter Pfister, Huafeng Liu, Xiang Li, Quanzheng Li, Ning GuoWed, 11 Ma🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

Dieses Buch interpretiert generative KI-Modelle, insbesondere Flow Matching, als statistische Werkzeuge zur nichtparametrischen Verteilungslernung und integriert sie durch Orthogonalisierung und Cross-Fitting in ein robustes Inferenzframework für Anwendungen wie kausale Analyse, Survival-Analyse und Imputation.

Shinto EguchiWed, 11 Ma🤖 cs.LG

The Coupling Within: Flow Matching via Distilled Normalizing Flows

Die Arbeit stellt Normalized Flow Matching (NFM) vor, eine Methode, die die quasi-deterministischen Kopplungen von vortrainierten autoregressiven Normalizing-Flow-Modellen destilliert, um Student-Flow-Modelle zu trainieren, die sowohl ihre Lehrer als auch herkömmliche Flow-Matching-Ansätze mit unabhängigen oder optimalen Transport-Kopplungen übertreffen.

David Berthelot, Tianrong Chen, Jiatao Gu, Marco Cuturi, Laurent Dinh, Bhavik Chandna, Michal Klein, Josh Susskind, Shuangfei ZhaiWed, 11 Ma🤖 cs.LG

An accurate flatness measure to estimate the generalization performance of CNN models

Diese Arbeit stellt einen exakten und architekturgetreuen Flachheitsmaßstab für CNNs vor, der durch eine geschlossene Formel für die Spur der Hesse-Matrix die Generalisierungsfähigkeit präziser schätzt als bisherige Methoden, die oft die spezifische Geometrie von Faltungsschichten vernachlässigen.

Rahman Taleghani, Maryam Mohammadi, Francesco MarchettiWed, 11 Ma🤖 cs.LG

When to Retrain after Drift: A Data-Only Test of Post-Drift Data Size Sufficiency

Die Arbeit stellt CALIPER vor, einen datenbasierten Test, der ohne Modell- oder Detektorabhängigkeit die für eine stabile Nachschulung nach Konzeptdrift ausreichende Datenmenge ermittelt, indem sie einen einstufigen Proxy-Fehler über eine gewichtete lokale Regression analysiert.

Ren Fujiwara, Yasuko Matsubara, Yasushi SakuraiWed, 11 Ma🤖 cs.LG

Two Teachers Better Than One: Hardware-Physics Co-Guided Distributed Scientific Machine Learning

Das Paper stellt EPIC vor, ein verteiltes wissenschaftliches Lernframework, das durch hardware- und physikgesteuerte Kodierung und Dekodierung die Kommunikationskosten und Latenz bei der Full-Waveform-Inversion drastisch senkt, ohne dabei die physikalische Genauigkeit zu beeinträchtigen.

Yuchen Yuan, Junhuan Yang, Hao Wan, Yipei Liu, Hanhan Wu, Youzuo Lin, Lei YangWed, 11 Ma🤖 cs.LG

SCALAR: Learning and Composing Skills through LLM Guided Symbolic Planning and Deep RL Grounding

Das Paper stellt SCALAR vor, ein bidirektionales Framework, das die symbolische Planung von LLMs mit Deep RL kombiniert, um durch iteratives Feedback und Trajektorienanalyse robuste Skills zu lernen und so die Leistung bei komplexen Aufgaben wie dem Sammeln von Diamanten in Craftax signifikant zu verbessern.

Renos Zabounidis, Yue Wu, Simon Stepputtis, Woojun Kim, Yuanzhi Li, Tom Mitchell, Katia SycaraWed, 11 Ma🤖 cs.LG

FlexServe: A Fast and Secure LLM Serving System for Mobile Devices with Flexible Resource Isolation

Das Paper stellt FlexServe vor, ein schnelles und sicheres System für die Inferenz von Large Language Models auf mobilen Geräten, das durch flexible Ressourcenisolierung und spezialisierte Managementmechanismen innerhalb von ARM TrustZone die erheblichen Leistungsnachteile herkömmlicher Ansätze überwindet.

Yinpeng Wu, Yitong Chen, Lixiang Wang, Jinyu Gu, Zhichao Hua, Yubin XiaWed, 11 Ma🤖 cs.LG

From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

Die Studie stellt vor, dass der autonome KI-Agent „Sentinel" durch die Verwendung des Model Context Protocol (MCP) klinische Triage-Daten aus der Fernüberwachung von Patienten mit höherer Sensitivität und Konsistenz als menschliche Ärzte klassifiziert und dabei eine skalierbare, kosteneffiziente Lösung für die Überlastung des medizinischen Personals bietet.

Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation

Der vorgestellte Sim2Act-Rahmenwerk verbessert das robuste Simulations-zu-Entscheidungs-Lernen für kritische Domänen wie Lieferketten, indem es durch eine adversarische Kalibrierung und eine gruppenrelative Perturbationsstrategie die Zuverlässigkeit von Policies trotz simulierter Unsicherheiten und Datenverzerrungen sicherstellt.

Hongyu Cao, Jinghan Zhang, Kunpeng Liu, Dongjie Wang, Feng Xia, Haifeng Chen, Xiaohua Hu, Yanjie FuWed, 11 Ma🤖 cs.AI

Quality over Quantity: Demonstration Curation via Influence Functions for Data-Centric Robot Learning

Die Arbeit stellt „Quality over Quantity" (QoQ) vor, eine systematische Methode zur automatischen Kuratierung hochwertiger Roboterdemonstrationsdaten mittels Einflussfunktionen, die nachweislich die Leistung von Lernpolitiken in simulierten und realen Umgebungen verbessert.

Haeone Lee, Taywon Min, Junsu Kim, Sinjae Kang, Fangchen Liu, Lerrel Pinto, Kimin LeeWed, 11 Ma🤖 cs.LG

Adaptive Active Learning for Online Reliability Prediction of Satellite Electronics

Diese Arbeit stellt ein integriertes Online-Framework zur Vorhersage der Zuverlässigkeit von Satellitenelektronik vor, das ein Wiener-Prozess-Degradationsmodell mit räumlichen Korrelationen und eine adaptive zweistufige Active-Learning-Strategie kombiniert, um trotz begrenzter Daten und variierender Betriebsbedingungen eine hohe Vorhersagegenauigkeit zu erreichen.

Shixiang Li, Yubin Tian, Dianpeng Wang, Piao Chen, Mengying RenWed, 11 Ma🤖 cs.LG

Dynamic Multi-period Experts for Online Time Series Forecasting

Die Arbeit stellt DynaME vor, ein hybrides Framework für das Online-Training von Zeitreihen, das Konzeptdrift in wiederkehrende und emergente Drift unterteilt und durch eine Kombination aus spezialisierten Experten für historische Muster sowie einem stabilen Generalisten für neue Muster eine überlegene Anpassungsfähigkeit erreicht.

Seungha Hong, Sukang Chae, Suyeon Kim, Sanghwan Jang, Hwanjo YuWed, 11 Ma🤖 cs.LG

Learning Adaptive LLM Decoding

Die vorgestellte Arbeit schlägt leichte, mit Reinforcement Learning trainierte Decoding-Adapter vor, die dynamisch Sampling-Strategien an die jeweilige Aufgabenkomplexität und verfügbare Rechenressourcen anpassen, um die Genauigkeit von Large Language Models bei Mathematik- und Codierungsaufgaben im Vergleich zu statischen Baselines signifikant zu verbessern.

Chloe H. Su, Zhe Ye, Samuel Tenka, Aidan Yang, Soonho Kong, Udaya GhaiWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

Diese Arbeit verifiziert, dass persistente Beobachter in kausal invarianten Hypergraphen die Bedingungen des Good-Regulator-Theorems erfüllen, wodurch sich natürliche Gradientenabstiegsverfahren als einzig zulässige Lernregel ergeben und eine modellabhängige Verbindung zwischen Wolframs und Vanchurins Theorien mit einem quanten-klassischen Schwellenwert bei κ(F)=2 hergestellt wird.

Max ZhuravlevWed, 11 Ma🤖 cs.LG

Exclusive Self Attention

Die Arbeit stellt die „Exclusive Self Attention" (XSA) vor, eine einfache Modifikation des Self-Attention-Mechanismus, die durch den Ausschluss der eigenen Token-Information die Kontextmodellierung verbessert und bei Sprachmodellierungsaufgaben konsistent bessere Ergebnisse als das Standardverfahren erzielt.

Shuangfei ZhaiWed, 11 Ma🤖 cs.LG

PPO-Based Hybrid Optimization for RIS-Assisted Semantic Vehicular Edge Computing

Diese Arbeit stellt ein hybrides, auf Proximal Policy Optimization (PPO) und Linearer Programmierung basierendes Optimierungsverfahren für ein semantikbasiertes, RIS-gestütztes Fahrzeug-Edge-Computing-System vor, das die End-to-End-Latenz im Vergleich zu bestehenden Methoden um 40–50 % reduziert.

Wei Feng, Jingbo Zhang, Qiong Wu, Pingyi Fan, Qiang FanWed, 11 Ma🤖 cs.LG

Not All News Is Equal: Topic- and Event-Conditional Sentiment from Finetuned LLMs for Aluminum Price Forecasting

Diese Studie zeigt, dass die Integration von Sentiment-Daten aus feinabgestimmten LLMs (Qwen3) mit traditionellen tabellarischen Marktdaten die Vorhersagegenauigkeit und den wirtschaftlichen Nutzen für Aluminiumpreise, insbesondere in volatilen Phasen, signifikant verbessert.

Alvaro Paredes Amorin, Andre Python, Christoph WeisserWed, 11 Ma🤖 cs.AI

← Zurück Weiter →