cs.AI Arbeiten | Gist.Science

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Diese Studie untersucht die domänenspezifische Qualitätsschätzung für die maschinelle Übersetzung in ressourcenarmen Szenarien zwischen Englisch und indischen Sprachen und zeigt, dass die Anpassung von Transformer-Zwischenschichten mittels Low-Rank-Methoden die Robustheit und Genauigkeit von Open-Weight-Modellen signifikant verbessert.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Scheduling Parallel Optical Circuit Switches for AI Training

Die Arbeit stellt den Algorithmus „Spectra" vor, der durch eine dreistufige Strategie aus Zerlegung, lastbewusster Zuweisung und Lastausgleich die Scheduling-Zeit für parallele optische Schaltkreise in KI-Trainings-Netzwerken unter Berücksichtigung von Rekonfigurationsverzögerungen signifikant reduziert und dabei die Leistung bestehender Methoden um den Faktor 1,4 bis 2,4 verbessert.

Kevin Liang, Litao Qiao, Isaac Keslassy, Bill Lin2026-03-10💻 cs

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Diese Systematisierung des Wissens (SoK) stellt das erste einheitliche Rahmenwerk für autonome Retrieval-Augmented-Generation-Systeme vor, indem sie diese als sequenzielle Entscheidungsprozesse formalisiert, eine umfassende Taxonomie und Architekturdekomposition entwickelt, kritische Evaluierungslücken und systemische Risiken analysiert sowie einen Fahrplan für zukünftige Forschungsrichtungen zur Steigerung von Zuverlässigkeit und Skalierbarkeit aufzeigt.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Sparsity and Out-of-Distribution Generalization

Diese Arbeit bietet ein prinzipiell begründetes theoretisches Rahmenwerk für Out-of-Distribution-Generalisierung, das auf der Annahme beruht, dass spärliche Hypothesen, die sich auf wenige, durch Erfahrung hervorgehobene Merkmale stützen, auch bei Verteilungsverschiebungen robust generalisieren, sofern eine ausreichende Überlappung in den relevanten Merkmalsbereichen besteht.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

AQuA: Toward Strategic Response Generation for Ambiguous Visual Questions

Die Studie stellt AQuA vor, einen feinabgestuften Datensatz zur Klassifizierung von Ambiguitätsstufen in visuellen Fragen, der es Vision-Language-Modellen ermöglicht, durch Feinabstimmung adaptive und kontextangemessene Antwortstrategien zu entwickeln, anstatt bei Mehrdeutigkeiten übermäßig selbstbewusste Antworten zu geben.

Jihyoung Jang, Hyounghun Kim2026-03-10💬 cs.CL

Adaptive Capacity Allocation for Vision Language Action Fine-tuning

Die Arbeit stellt LoRA-SP vor, eine adaptive Feinabstimmungsmethode für Vision-Language-Action-Modelle, die durch eine dynamische, energiegesteuerte Kapazitätszuweisung die Übertragbarkeit und Multi-Task-Leistung von Robotern im Vergleich zu herkömmlichen LoRA-Ansätzen signifikant verbessert.

Donghoon Kim, Minji Bae, Unghui Nam, Gyeonghun Kim, Suyun Lee, Kyuhong Shim, Byonghyo Shim2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

Das Paper stellt UnSCAR vor, eine skalierbare und kontrollierbare Architektur für die universelle Bildrestauration, die durch einen Multi-Branch-Mixture-of-Experts-Ansatz das Problem des katastrophalen Vergessens bei der gemeinsamen Verarbeitung zahlreicher Degradationen löst und gleichzeitig robuste Generalisierung sowie benutzersteuerbare Ergebnisse ermöglicht.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Dieser Tutorial-Überblick fasst die Anwendung von Machine-Learning-Methoden im Internet der Unterwasser-Dinge zusammen, indem er deren Potenzial zur Bewältigung spezifischer Herausforderungen wie akustischer Dämpfung und begrenzter Energie über alle Netzwerkschichten hinweg analysiert, signifikante Leistungssteigerungen dokumentiert und eine Roadmap für die zukünftige Implementierung sowie offene Forschungsfragen aufzeigt.

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Diese Arbeit führt den informations-theoretischen Begriff der Kontext-Kanal-Kapazität ein, um zu beweisen, dass katastrophales Vergessen in kontinuierlichem Lernen unvermeidbar ist, es sei denn, die Architektur strukturell eine unbypassbare Kontextpfad-Kapazität gewährleistet, die die Entropie der Aufgabenidentität übersteigt.

Ran Cheng2026-03-10🤖 cs.LG

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Diese Arbeit stellt ein neues dynamisches Fahrzeugrouting-Verfahren vor, das durch die Kombination einer schnellen Einfügesuche für die sofortige Auftragsbestätigung und eines Reinforcement-Learning-gesteuerten Anytime-Algorithmus zur kontinuierlichen Routenoptimierung sowohl die Echtzeitbestätigung als auch die maximale Auslastung von Vorbestellungen in On-Demand-Verkehrsdiensten gewährleistet.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

Die Arbeit stellt AutoControl Arena vor, ein automatisiertes Framework zur Evaluierung von KI-Risiken, das durch die Entkopplung deterministischen Codes von generativen LLM-Dynamiken Halluzinationen vermeidet und dabei verborgene Sicherheitslücken sowie divergierende Fehlausrichtungs-Muster bei fortschrittlichen Modellen unter Stress aufdeckt.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

Das Paper stellt OrthoFormer vor, eine kausal fundierte Transformer-Architektur, die Instrumentalvariablenschätzung durch neuronale Kontrollfunktionen integriert, um durch die Trennung statischer Hintergrundfaktoren von dynamischen kausalen Flüssen die Anfälligkeit für konfundierende Verzerrungen zu überwinden und robuste Vorhersagen unter Verteilungsverschiebungen zu ermöglichen.

Charles Luo2026-03-10🤖 cs.LG

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

Dieses Papier stellt ein Rahmenwerk für kausale Panelvorhersagen im regulatorischen Stresstesting vor, das durch vier Komponenten eine transparente Zerlegung der Unsicherheit in Schätz- und Konfundierungsunsicherheit ermöglicht, um robuste Gegenfaktische unter hypothetischen makroökonomischen Szenarien zu inferieren.

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

Das Paper stellt HLER vor, ein Multi-Agenten-System für die empirische Wirtschaftsforschung, das durch datensatzbewusste Hypothesengenerierung und menschliche Eingriffe in einem mehrstufigen Workflow die Automatisierung von Forschungsprozessen mit notwendiger menschlicher Aufsicht verbindet.

Chen Zhu, Xiaolu Wang2026-03-10💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Die Arbeit stellt Dial vor, ein wissensbasiertes Framework für dialektspezifische NL2SQL-Übersetzungen, das durch eine dialektsensible logische Abfrageplanung, eine hierarchische Wissensdatenbank und einen ausführungsbasierten Debugging-Prozess die Genauigkeit und Abdeckung von Datenbankdialekten im Vergleich zu bestehenden Methoden signifikant verbessert.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

Die Arbeit stellt Backdoor4Good (B4G) vor, ein einheitliches Benchmark-Framework, das Backdoor-Mechanismen in großen Sprachmodellen nicht als Bedrohung, sondern als kontrollierbare Schnittstellen für vertrauenswürdige Anwendungen wie Sicherheit, Steuerbarkeit und Rechenschaftspflicht neu definiert und deren Wirksamkeit in umfangreichen Experimenten nachweist.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

Image Generation Models: A Technical History

Dieser Artikel bietet eine umfassende technische Übersicht über die Entwicklung von Bildgenerierungsmodellen – von VAEs und GANs bis hin zu Diffusionsverfahren – und behandelt dabei deren Architekturen, Trainingsmethoden, Grenzen sowie aktuelle Fortschritte in der Videogenerierung und die Notwendigkeit einer verantwortungsvollen Nutzung.

Rouzbeh Shirvani2026-03-10💬 cs.CL

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Diese Studie zeigt, dass im Freelance-Bereich eine Diskrepanz zwischen der passiven Offenlegungspraxis von Arbeitnehmern und dem Wunsch der Kunden nach proaktiver Transparenz bezüglich KI-Nutzung besteht, was durch unklare Richtlinien zu Missverständnissen führt und die Notwendigkeit klarerer Richtlinien unterstreicht.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Diese Arbeit stellt ein zielgerichtetes Risikoanalyse-Rahmenwerk für LLM-basierte Systeme vor, das Systemmodellierung mit Attack-Defense-Bäumen und CVSS-Werten kombiniert, um in einem Gesundheitswesen-Fallbeispiel zu zeigen, dass sich diverse Bedrohungen auf wenige kritische Systemengpässe konzentrieren, die durch gezielte Abwehrmaßnahmen effektiv gemindert werden können.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Die vorgestellte Dual-Stream-Transformer-Architektur entkoppelt den Residual-Stream in einen durch Attention aktualisierten Token-Stream und einen durch Feed-Forward-Netzwerke aktualisierten Kontext-Stream, um durch skalierbare Mischstrategien eine nachweisbare Balance zwischen Interpretierbarkeit und Leistungsfähigkeit zu ermöglichen.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

← Zurück Weiter →