AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery

Die Arbeit stellt AutoResearch-RL vor, ein Framework für selbstbewertende Reinforcement-Learning-Agenten, die ohne menschliches Eingreifen autonom und kontinuierlich neuronale Architekturen und Hyperparameter optimieren, um durch iterative Code-Modifikationen und PPO-Updates nach etwa 300 Durchläufen handoptimierte Baseline-Ergebnisse zu erreichen oder zu übertreffen.

Nilesh Jain, Rohit Yadav, Sagar Kotian, Claude AI2026-03-10🤖 cs.LG

Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

Diese Arbeit stellt ein neues retrieval-basiertes Multi-Scale-Framework vor, das durch die Kombination von kurz- und langfristigen zeitlichen Mustern sowie einer adaptiven Anpassung an räumliche Variabilität die Genauigkeit und Robustheit der Ertragsvorhersage auf County-Ebene über große Regionen hinweg verbessert.

Yiming Sun, Qi Cheng, Licheng Liu, Runlong Yu, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

Die Arbeit stellt StructSAM vor, ein neuartiges Token-Merging-Framework, das durch die Erhaltung von Struktur- und Spektraleigenschaften die Effizienz von Segment-Anything-Modellen (SAM) steigert, ohne dabei die Präzision der Randvorhersage oder Prompt-Informationen zu beeinträchtigen.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Diese Studie stellt eine hardware-effiziente und erklärbare Störungserkennung für 5G-Netze vor, die auf dem Convolutional Tsetlin Machine (CTM) basiert und im Vergleich zu herkömmlichen neuronalen Netzen eine deutlich geringere Speichernutzung sowie schnellere Trainingszeiten bei vergleichbarer Genauigkeit auf realen SSB-Daten bietet.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

Learning Clinical Representations Under Systematic Distribution Shift

Diese Arbeit stellt ein Rahmenwerk für das Erlernen praxisinvarianter Repräsentationen in der klinischen KI vor, das durch die Kombination von überwachtem Lernen mit adversarieller Regularisierung und invarianter Risikostrafen systematische Verteilungsverschiebungen zwischen Institutionen adressiert und so die Robustheit sowie die Übertragbarkeit multimodaler Vorhersagemodelle signifikant verbessert.

Yuanyun Zhang, Shi Li2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

Die AgrI Challenge stellt ein datenzentriertes Wettbewerbsframework mit einem neuartigen Cross-Team-Validierungsansatz vor, der durch unabhängige Datensammlung und kollaboratives Training die Generalisierungsfähigkeit von landwirtschaftlichen Vision-Modellen unter realen Feldbedingungen signifikant verbessert.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Die Studie zeigt, dass im Tiny-Regime unter 20 Millionen Parametern die Skalierungsgesetze für Fehlerquoten steiler verlaufen als bei großen Modellen, sich jedoch die Fehlerstruktur grundlegend ändert, indem kleine Modelle ihre Kapazität auf einfache Klassen konzentrieren und dabei überraschend besser kalibriert sind, was die Notwendigkeit einer Validierung direkt am Zielmodell für Edge-Deployment unterstreicht.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Dieser Beitrag stellt einen hierarchischen Multi-Agenten-Verstärkungslernansatz vor, der durch den Verzicht auf Kanalzustandsinformationen zugunsten von Lokalisierungsdaten und eine dezentrale Steuerung die Effizienz und Skalierbarkeit von mmWave-Strahlbündelungssystemen mit rekonfigurierbaren intelligenten Oberflächen signifikant verbessert.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Diese Studie untersucht die domänenspezifische Qualitätsschätzung für die maschinelle Übersetzung in ressourcenarmen Szenarien zwischen Englisch und indischen Sprachen und zeigt, dass die Anpassung von Transformer-Zwischenschichten mittels Low-Rank-Methoden die Robustheit und Genauigkeit von Open-Weight-Modellen signifikant verbessert.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG