Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Diese Studie untersucht die domänenspezifische Qualitätsschätzung für die maschinelle Übersetzung in ressourcenarmen Szenarien zwischen Englisch und indischen Sprachen und zeigt, dass die Anpassung von Transformer-Zwischenschichten mittels Low-Rank-Methoden die Robustheit und Genauigkeit von Open-Weight-Modellen signifikant verbessert.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Scheduling Parallel Optical Circuit Switches for AI Training

Die Arbeit stellt den Algorithmus „Spectra" vor, der durch eine dreistufige Strategie aus Zerlegung, lastbewusster Zuweisung und Lastausgleich die Scheduling-Zeit für parallele optische Schaltkreise in KI-Trainings-Netzwerken unter Berücksichtigung von Rekonfigurationsverzögerungen signifikant reduziert und dabei die Leistung bestehender Methoden um den Faktor 1,4 bis 2,4 verbessert.

Kevin Liang, Litao Qiao, Isaac Keslassy, Bill Lin2026-03-10💻 cs

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Diese Systematisierung des Wissens (SoK) stellt das erste einheitliche Rahmenwerk für autonome Retrieval-Augmented-Generation-Systeme vor, indem sie diese als sequenzielle Entscheidungsprozesse formalisiert, eine umfassende Taxonomie und Architekturdekomposition entwickelt, kritische Evaluierungslücken und systemische Risiken analysiert sowie einen Fahrplan für zukünftige Forschungsrichtungen zur Steigerung von Zuverlässigkeit und Skalierbarkeit aufzeigt.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

Das Paper stellt UnSCAR vor, eine skalierbare und kontrollierbare Architektur für die universelle Bildrestauration, die durch einen Multi-Branch-Mixture-of-Experts-Ansatz das Problem des katastrophalen Vergessens bei der gemeinsamen Verarbeitung zahlreicher Degradationen löst und gleichzeitig robuste Generalisierung sowie benutzersteuerbare Ergebnisse ermöglicht.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Dieser Tutorial-Überblick fasst die Anwendung von Machine-Learning-Methoden im Internet der Unterwasser-Dinge zusammen, indem er deren Potenzial zur Bewältigung spezifischer Herausforderungen wie akustischer Dämpfung und begrenzter Energie über alle Netzwerkschichten hinweg analysiert, signifikante Leistungssteigerungen dokumentiert und eine Roadmap für die zukünftige Implementierung sowie offene Forschungsfragen aufzeigt.

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Diese Arbeit stellt ein neues dynamisches Fahrzeugrouting-Verfahren vor, das durch die Kombination einer schnellen Einfügesuche für die sofortige Auftragsbestätigung und eines Reinforcement-Learning-gesteuerten Anytime-Algorithmus zur kontinuierlichen Routenoptimierung sowohl die Echtzeitbestätigung als auch die maximale Auslastung von Vorbestellungen in On-Demand-Verkehrsdiensten gewährleistet.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

Die Arbeit stellt AutoControl Arena vor, ein automatisiertes Framework zur Evaluierung von KI-Risiken, das durch die Entkopplung deterministischen Codes von generativen LLM-Dynamiken Halluzinationen vermeidet und dabei verborgene Sicherheitslücken sowie divergierende Fehlausrichtungs-Muster bei fortschrittlichen Modellen unter Stress aufdeckt.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

Das Paper stellt OrthoFormer vor, eine kausal fundierte Transformer-Architektur, die Instrumentalvariablenschätzung durch neuronale Kontrollfunktionen integriert, um durch die Trennung statischer Hintergrundfaktoren von dynamischen kausalen Flüssen die Anfälligkeit für konfundierende Verzerrungen zu überwinden und robuste Vorhersagen unter Verteilungsverschiebungen zu ermöglichen.

Charles Luo2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Die Arbeit stellt Dial vor, ein wissensbasiertes Framework für dialektspezifische NL2SQL-Übersetzungen, das durch eine dialektsensible logische Abfrageplanung, eine hierarchische Wissensdatenbank und einen ausführungsbasierten Debugging-Prozess die Genauigkeit und Abdeckung von Datenbankdialekten im Vergleich zu bestehenden Methoden signifikant verbessert.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

Die Arbeit stellt Backdoor4Good (B4G) vor, ein einheitliches Benchmark-Framework, das Backdoor-Mechanismen in großen Sprachmodellen nicht als Bedrohung, sondern als kontrollierbare Schnittstellen für vertrauenswürdige Anwendungen wie Sicherheit, Steuerbarkeit und Rechenschaftspflicht neu definiert und deren Wirksamkeit in umfangreichen Experimenten nachweist.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Diese Studie zeigt, dass im Freelance-Bereich eine Diskrepanz zwischen der passiven Offenlegungspraxis von Arbeitnehmern und dem Wunsch der Kunden nach proaktiver Transparenz bezüglich KI-Nutzung besteht, was durch unklare Richtlinien zu Missverständnissen führt und die Notwendigkeit klarerer Richtlinien unterstreicht.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Diese Arbeit stellt ein zielgerichtetes Risikoanalyse-Rahmenwerk für LLM-basierte Systeme vor, das Systemmodellierung mit Attack-Defense-Bäumen und CVSS-Werten kombiniert, um in einem Gesundheitswesen-Fallbeispiel zu zeigen, dass sich diverse Bedrohungen auf wenige kritische Systemengpässe konzentrieren, die durch gezielte Abwehrmaßnahmen effektiv gemindert werden können.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs