LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

Die Arbeit stellt LEPA vor, eine Architektur, die durch das direkte Vorhersagen transformierter Embeddings unter Berücksichtigung geometrischer Augmentierungen die Unzuverlässigkeit herkömmlicher Interpolationsverfahren in Geospatial-Grundmodellen überwindet und so präzise geometrische Anpassungen ohne Neu-Encoding ermöglicht.

Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro2026-03-10💻 cs

Seeing the Context: Rich Visual Context-Aware Speech Recognition via Multimodal Reasoning

Die Arbeit stellt VASR vor, ein multimodales System, das durch einen Audio-Visuellen Chain-of-Thought (AV-CoT) reiche visuelle Kontextinformationen wie Szenen und Bildschirmtext nutzt, um die Spracherkennung zu verbessern und das Problem der einseitigen Abhängigkeit von einer einzelnen Modalität zu lösen.

Wenjie Tian, Mingchen Shao, Bingshen Mu, Xuelong Geng, Chengyou Wang, Yujie Liao, Zhixian Zhao, Ziyu Zhang, Jingbin Hu, Mengqi Wei, Lei Xie2026-03-10💻 cs

AutoDataset: A Lightweight System for Continuous Dataset Discovery and Search

Das Paper stellt AutoDataset vor, ein leichtgewichtiges, automatisiertes System, das durch kontinuierliche Überwachung von arXiv und den Einsatz einer mehrstufigen Pipeline neue Datensätze aus Forschungsarbeiten extrahiert und indiziert, um die Entdeckung und Suche nach aktuellen Datensätzen für Forscher erheblich zu beschleunigen.

Junzhe Yang, Xinghao Chen, Yunuo Liu, Zhijing Sun, Wenjin Guo, Xiaoyu Shen2026-03-10💻 cs

LLM-FK: Multi-Agent LLM Reasoning for Foreign Key Detection in Large-Scale Complex Databases

Die Arbeit stellt LLM-FK vor, ein vollständig automatisiertes Multi-Agenten-Framework, das mithilfe spezialisierter Agenten die Erkennung fehlender Fremdschlüssel in großen, komplexen Datenbanken durch effiziente Suchraumreduktion und konsistente mehrstufige Schlussfolgerung revolutioniert und dabei signifikant höhere Genauigkeit als bestehende Methoden erreicht.

Zijian Tang, Ying Zhang, Sibo Cai, Ruoxuan Wang2026-03-10💻 cs

Complexity Lower Bounds of Small Matrix Multiplication over Finite Fields via Backtracking and Substitution

Diese Arbeit stellt eine neue Methode zur Bestimmung unterer Schranken für die bilineare Komplexität der Matrixmultiplikation über endlichen Körpern vor, die durch eine Kombination aus Substitutionsmethode und systematischer Backtracking-Suche mit dynamischer Programmierung erstmals beweist, dass die Komplexität der Multiplikation von 3×33 \times 3-Matrizen über F2\mathbb{F}_2 mindestens 20 beträgt.

Chengu Wang2026-03-10💻 cs

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

Eine empirische Studie an vier Modellen und fünf Prompting-Regimen zeigt, dass deploymentbedingte Einschränkungen die Halluzination von Zitaten in geschlossenen Umgebungen nicht verhindern, sondern die Verifizierbarkeit von Referenzen drastisch senken, was eine nachträgliche Überprüfung vor der Nutzung in der Softwaretechnik zwingend erforderlich macht.

Chen Zhao, Yuan Tang, Yitian Qian2026-03-10💻 cs

TopRank-Based Delivery Rate Optimization for Coded Caching under Non-Uniform Demands

Dieser Artikel stellt eine neue Methode zur Optimierung der Auslieferungsrate bei codiertem Caching unter nicht-uniformen Nachfragemustern vor, die auf einem Ranking-Algorithmus aus dem Bereich der Empfehlungssysteme basiert und insbesondere in Szenarien mit geringer Nutzerzahl, begrenztem Cache-Speicher oder verzerrten Beobachtungsdaten eine sublineare Reue sowie eine signifikant bessere Leistung als frühere Ansätze erzielt.

Mohammadsaber Bahadori, Seyed Pooya Shariatpanahi, Behnam Bahrak2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

Die Arbeit stellt MAviS vor, ein multimodales KI-System, das auf einem umfassenden Datensatz für über 1.000 Vogelarten basiert, um durch die Integration von Bild-, Audio- und Textdaten präzise artspezifische Fragen zu beantworten und so den Fortschritt im Bereich des Naturschutzes und der ökologischen Überwachung zu fördern.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

Training for Trustworthy Saliency Maps: Adversarial Training Meets Feature-Map Smoothing

Die vorgestellte Arbeit zeigt, dass die Kombination von adversariellem Training mit einem leichtgewichtigen Feature-Map-Glättungsblock stabile, spärliche und vertrauenswürdige Saliency-Karten erzeugt, indem sie die Stabilitätsnachteile des adversariellen Trainings ausgleicht und gleichzeitig die menschliche Wahrnehmung der Erklärungen verbessert.

Dipkamal Bhusal, Md Tanvirul Alam, Nidhi Rastogi2026-03-10💻 cs