cs Arbeiten | Gist.Science

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

Die Arbeit stellt LEPA vor, eine Architektur, die durch das direkte Vorhersagen transformierter Embeddings unter Berücksichtigung geometrischer Augmentierungen die Unzuverlässigkeit herkömmlicher Interpolationsverfahren in Geospatial-Grundmodellen überwindet und so präzise geometrische Anpassungen ohne Neu-Encoding ermöglicht.

Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro2026-03-10💻 cs

Learning When to Cooperate Under Heterogeneous Goals

Die Studie stellt einen neuen hierarchischen Ansatz vor, der Imitations- und Verstärkungslernen kombiniert, um Agenten mit heterogenen Zielen zu befähigen, situationsabhängig zu entscheiden, ob sie kooperieren oder allein handeln, und zeigt dabei eine Überlegenheit gegenüber bestehenden Methoden.

Max Taylor-Davies, Neil Bramley, Christopher G. Lucas2026-03-10💻 cs

Seeing the Context: Rich Visual Context-Aware Speech Recognition via Multimodal Reasoning

Die Arbeit stellt VASR vor, ein multimodales System, das durch einen Audio-Visuellen Chain-of-Thought (AV-CoT) reiche visuelle Kontextinformationen wie Szenen und Bildschirmtext nutzt, um die Spracherkennung zu verbessern und das Problem der einseitigen Abhängigkeit von einer einzelnen Modalität zu lösen.

Wenjie Tian, Mingchen Shao, Bingshen Mu, Xuelong Geng, Chengyou Wang, Yujie Liao, Zhixian Zhao, Ziyu Zhang, Jingbin Hu, Mengqi Wei, Lei Xie2026-03-10💻 cs

Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving

Die Arbeit stellt ein kinematikbewusstes latentes Weltmodell vor, das durch die Integration von Fahrzeugkinematik und geometrischer Überwachung die Dateneffizienz und Fahrleistung beim autonomen Fahren im Vergleich zu bestehenden Methoden verbessert.

Jiazhuo Li, Linjiang Cao, Qi Liu, Xi Xiong2026-03-10💻 cs

Towards Network-Aware Operation of Integrated Energy Systems: A Comprehensive Review

Diese umfassende Übersicht analysiert netzwerkbewusste Modellierungs-, Optimierungs- und Steuerungsmethoden für integrierte Energiesysteme, identifiziert methodische Grenzen hinsichtlich Skalierbarkeit und Garantien und leitet daraus Forschungsrichtungen für effiziente, koordinierte Betriebskonzepte ab.

Alessandra Parisio2026-03-10💻 cs

How to Steal Reasoning Without Reasoning Traces

Die Studie zeigt, dass „Trace-Inversion"-Modelle detaillierte synthetische Denkprozesse allein aus Eingaben, Antworten und kurzen Zusammenfassungen rekonstruieren können, wodurch sich das Reasoning-Verständnis von Schülermodellen durch Feinabstimmung auf diese abgeleiteten Spuren erheblich verbessern lässt, selbst bei kommerziellen Black-Box-Modellen.

Tingwei Zhang, John X. Morris, Vitaly Shmatikov2026-03-10💻 cs

Sketch-Oriented Databases

Diese Arbeit stellt einen kategorischen Rahmen für skizzenorientierte Datenbanken vor, der Datenbankparadigmen als endliche Limit-Skizzen und Datenbanken als mengentheoretische Modelle formalisiert, um Graphenfeatures einheitlich zu erfassen, Pfade über lokale Inferenzregeln zu berechnen und durch „Stuttering-Skizzen" eine modulare Komposition sowie skalierbares Modellwachstum zu ermöglichen.

Dominique Duval, Rachid Echahed2026-03-10💻 cs

AutoDataset: A Lightweight System for Continuous Dataset Discovery and Search

Das Paper stellt AutoDataset vor, ein leichtgewichtiges, automatisiertes System, das durch kontinuierliche Überwachung von arXiv und den Einsatz einer mehrstufigen Pipeline neue Datensätze aus Forschungsarbeiten extrahiert und indiziert, um die Entdeckung und Suche nach aktuellen Datensätzen für Forscher erheblich zu beschleunigen.

Junzhe Yang, Xinghao Chen, Yunuo Liu, Zhijing Sun, Wenjin Guo, Xiaoyu Shen2026-03-10💻 cs

VisualDeltas: Learning Preferences from Visual Quality Perturbations

Das Paper stellt VisualDeltas vor, ein leichtgewichtiges Rahmenwerk zum Lernen von Präferenzen aus visuellen Qualitätsveränderungen, das ohne menschliche Annotationen auskommt und durch die Ausnutzung systematischer Bildqualitätsunterschiede die Generalisierung multimodaler Modelle verbessert.

Hailiang Huang, Yihao Liu, Shengyue Guan, Haoze Li, Sujian Li2026-03-10💻 cs

Worst--Case to Average--Case Reductions for SIS over integers

Diese Arbeit zeigt, dass ein Algorithmus zur Lösung zufälliger Instanzen einer nicht-modularen Variante des Short Integer Solution-Problems über den ganzen Zahlen auch zur worst-case-Approximation des Shortest Independent Vectors Problem (SIVP) in ganzzahligen Gittern verwendet werden kann.

Konstantinos A. Draziotis, Myrto Eleftheria Gkogkou2026-03-10💻 cs

From Passive Consumption to Active Interaction: Exploring Interactive LLM Scaffolding to Support Learning Engagement

Die Studie zeigt, dass die Einbettung leichter interaktiver Komponenten in von LLMs generierte Lernscaffolding-Antworten im Vergleich zur passiven Konsumption die wahrgenommene Engagement, den Fokus und die kurzfristigen Lernergebnisse bei Lernenden verbessert.

Zixin Chen, Haotian Li, Zhe Liu, Huamin Qu, Xing Xie2026-03-10💻 cs

LLM-FK: Multi-Agent LLM Reasoning for Foreign Key Detection in Large-Scale Complex Databases

Die Arbeit stellt LLM-FK vor, ein vollständig automatisiertes Multi-Agenten-Framework, das mithilfe spezialisierter Agenten die Erkennung fehlender Fremdschlüssel in großen, komplexen Datenbanken durch effiziente Suchraumreduktion und konsistente mehrstufige Schlussfolgerung revolutioniert und dabei signifikant höhere Genauigkeit als bestehende Methoden erreicht.

Zijian Tang, Ying Zhang, Sibo Cai, Ruoxuan Wang2026-03-10💻 cs

Complexity Lower Bounds of Small Matrix Multiplication over Finite Fields via Backtracking and Substitution

Diese Arbeit stellt eine neue Methode zur Bestimmung unterer Schranken für die bilineare Komplexität der Matrixmultiplikation über endlichen Körpern vor, die durch eine Kombination aus Substitutionsmethode und systematischer Backtracking-Suche mit dynamischer Programmierung erstmals beweist, dass die Komplexität der Multiplikation von $3 \times 3$ -Matrizen über $\mathbb{F}_2$ mindestens 20 beträgt.

Chengu Wang2026-03-10💻 cs

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

Eine empirische Studie an vier Modellen und fünf Prompting-Regimen zeigt, dass deploymentbedingte Einschränkungen die Halluzination von Zitaten in geschlossenen Umgebungen nicht verhindern, sondern die Verifizierbarkeit von Referenzen drastisch senken, was eine nachträgliche Überprüfung vor der Nutzung in der Softwaretechnik zwingend erforderlich macht.

Chen Zhao, Yuan Tang, Yitian Qian2026-03-10💻 cs

Virtual Try-On for Cultural Clothing: A Benchmarking Study

Diese Arbeit stellt den BD-VITON-Datensatz für traditionelle bangladeschische Kleidung vor, um die Generalisierungsfähigkeit von virtuellen Anprobe-Modellen über westliche Standards hinaus zu verbessern, und evaluiert verschiedene State-of-the-Art-Modelle auf diesem neuen Benchmark.

Muhammad Tausif Ul Islam, Shahir Awlad, Sameen Yeaser Adib, Md. Atiqur Rahman, Sabbir Ahmed, Md. Hasanul Kabir2026-03-10💻 cs

TopRank-Based Delivery Rate Optimization for Coded Caching under Non-Uniform Demands

Dieser Artikel stellt eine neue Methode zur Optimierung der Auslieferungsrate bei codiertem Caching unter nicht-uniformen Nachfragemustern vor, die auf einem Ranking-Algorithmus aus dem Bereich der Empfehlungssysteme basiert und insbesondere in Szenarien mit geringer Nutzerzahl, begrenztem Cache-Speicher oder verzerrten Beobachtungsdaten eine sublineare Reue sowie eine signifikant bessere Leistung als frühere Ansätze erzielt.

Mohammadsaber Bahadori, Seyed Pooya Shariatpanahi, Behnam Bahrak2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

Die Arbeit stellt MAviS vor, ein multimodales KI-System, das auf einem umfassenden Datensatz für über 1.000 Vogelarten basiert, um durch die Integration von Bild-, Audio- und Textdaten präzise artspezifische Fragen zu beantworten und so den Fortschritt im Bereich des Naturschutzes und der ökologischen Überwachung zu fördern.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

A Cortically Inspired Architecture for Modular Perceptual AI

Diese Arbeit schlägt eine durch die Neurobiologie inspirierte, modulare Architektur für perceptuelle KI vor, die durch hierarchische prädiktive Schleifen und geteilte latente Räume interpretierbares, zusammengesetztes Generalisieren und adaptive Robustheit gegenüber monolithischen Modellen wie GPT-4V ermöglicht.

Prerna Luthra2026-03-10💻 cs

Training for Trustworthy Saliency Maps: Adversarial Training Meets Feature-Map Smoothing

Die vorgestellte Arbeit zeigt, dass die Kombination von adversariellem Training mit einem leichtgewichtigen Feature-Map-Glättungsblock stabile, spärliche und vertrauenswürdige Saliency-Karten erzeugt, indem sie die Stabilitätsnachteile des adversariellen Trainings ausgleicht und gleichzeitig die menschliche Wahrnehmung der Erklärungen verbessert.

Dipkamal Bhusal, Md Tanvirul Alam, Nidhi Rastogi2026-03-10💻 cs

Tursio for Credit Unions: Powering Structured Data Search with Automated Context Graph

Das Paper stellt Tursio vor, eine sichere, lokale Plattform für Kreditgenossenschaften, die mithilfe von Large Language Models und einem automatisch generierten semantischen Wissensgraphen natürliche Sprachabfragen in präzise, konforme Datenbankabfragen umwandelt, um komplexe Datenstrukturen für Geschäftsanwender zugänglich zu machen.

Shivani Tripathi, Ravi Shetye, Shi Qiao, Alekh Jindal2026-03-10💻 cs

← Zurück Weiter →