cs.AI Arbeiten | Gist.Science

PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

Die Arbeit stellt PromptDLA vor, ein domainspezifisches Prompting-Framework für die Dokumentenlayoutanalyse, das deskriptives Wissen nutzt, um Domänenwissen effektiv zu integrieren und so durch maßgeschneiderte Prompts die Generalisierungsfähigkeit über verschiedene Datensätze hinweg zu verbessern und state-of-the-art-Ergebnisse zu erzielen.

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing ZongWed, 11 Ma🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Die Autoren stellen einen Echtzeit-Rahmen vor, der durch Implizite Maximum-Likelihood-Schätzung und bidirektionale Chamfer-Distanz ein Conditional-Flow-Matching-Modell in einen schnellen, einstufigen Schüler-Algorithmus destilliert, um latenzfreie, multimodale Trajektorien für die robotische Manipulation zu ermöglichen.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

Diese Studie untersucht, wie Large Language Models in französischen Patientenakten geschlechtsspezifische Stereotype im Kontext sozialer Gesundheitsdeterminanten reproduzieren und schlägt vor, Wechselwirkungen zwischen diesen Faktoren in die Bias-Bewertung aufzunehmen.

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel MorinWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Diese Arbeit stellt Open-World Motion Forecasting vor, ein neuartiges Szenario für autonomes Fahren, das durch ein end-to-end Framework mit Pseudo-Labeling und einem neuen Replay-Sampling-Verfahren die Herausforderung des katastrophalen Vergessens beim sequenziellen Erlernen neuer Objektklassen direkt aus Kamerabildern bewältigt.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

CERES: A Probabilistic Early Warning System for Acute Food Insecurity

Das Papier stellt CERES vor, ein automatisiertes, probabilistisches Frühwarnsystem, das wöchentlich aktualisierte, öffentlich verifizierbare Wahrscheinlichkeitsprognosen für akute Nahrungsmittelunsicherheit in 43 Hochrisikoländern erstellt und dabei sechs Datenströme mittels eines logistischen Bewertungsmodells kombiniert.

Tom Danny S. PedersenWed, 11 Ma🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

Die Studie CoMoral zeigt, dass aktuelle Large Language Models moralisches Denken oft über das gesunden Menschenverstand stellen und dabei eine narrative Verzerrung aufweisen, bei der sie logische Widersprüche eher bei Nebenfiguren als bei der Hauptfigur erkennen.

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya PurkayasthaWed, 11 Ma🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

Dieses Paper stellt einen offenen, transparenten und reproduzierbaren Datensatz vor, der mithilfe von Large Language Models und domänenspezifischem Wissen entwickelt wurde, um die Compliance von NLP- und RAG-Systemen mit der EU-KI-Verordnung durch Aufgaben wie Risikoklassifizierung und Artikelretrieval automatisiert zu evaluieren.

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis KarkaletsisWed, 11 Ma🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

Die Studie stellt OncoAgent vor, ein neuartiges, guideline-bewusstes KI-Framework, das klinische Leitlinien ohne Neutrainieren direkt in dreidimensionale Zielvolumen für die Strahlentherapie umwandelt und dabei in einer blinden klinischen Bewertung von Ärzten eine höhere Leitlinienkonformität sowie Akzeptanz als ein überwachtes nnU-Net-Modell erreicht.

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung KimWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Die Arbeit stellt VMoER vor, einen skalierbaren bayesschen Ansatz, der die Unsicherheitsquantifizierung in Mixture-of-Experts-Transformern durch eine strukturierte Inferenz im Routing-Mechanismus ermöglicht und dabei die Kalibrierung sowie die Stabilität bei gleichzeitiger Minimierung des Rechenaufwards erheblich verbessert.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

Declarative Scenario-based Testing with RoadLogic

Die Arbeit stellt RoadLogic vor, ein Open-Source-System, das deklarative OpenSCENARIO-Spezifikationen mithilfe von Answer Set Programming, Bewegungsplanung und Überwachung in ausführbare, realistische Simulationen für das systematische Testen autonomer Fahrzeuge übersetzt.

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan NičkovicWed, 11 Ma🤖 cs.AI

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

Diese Studie identifiziert und erklärt das Phänomen des „Task-Level Model-Merging Collapse", bei dem bestimmte Aufgabenkombinationen zu katastrophalem Leistungsabfall führen, und zeigt durch empirische Analysen sowie eine theoretische Herleitung mittels Rate-Distortion-Theorie auf, dass diese Inkompatibilität primär auf Repräsentationskonflikte und nicht auf Parameterkonflikte zurückzuführen ist.

Yuan Cao, Dezhi Ran, Yuzhe Guo, Mengzhou Wu, Simin Chen, Linyi Li, Wei Yang, Tao XieWed, 11 Ma🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

Das Paper stellt EvoDriveVLA vor, ein neuartiges Framework zur kollaborativen Destillation von Wahrnehmung und Planung, das durch selbstverankerte visuelle Einschränkungen und oracle-gesteuerte Trajektorienoptimierung die Stabilität und Leistung von autonomen Fahrzeugen in Vision-Language-Action-Modellen verbessert.

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang ZhangWed, 11 Ma🤖 cs.AI

Telogenesis: Goal Is All U Need

Die Studie „Telogenesis" zeigt, dass ein Agent durch die endogene Generierung von Prioritäten basierend auf epistemischen Lücken (Unwissenheit, Überraschung und Veraltetheit) ohne externe Belohnung adaptive Aufmerksamkeitsstrategien entwickeln kann, die feste Ansätze übertreffen und latente Umweltstrukturen selbstständig rekonstruieren.

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan ShenWed, 11 Ma🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

Das Paper stellt GenePlan vor, ein Framework, das große Sprachmodelle mit evolutionären Algorithmen kombiniert, um effiziente und generalisierbare PDDL-Planer zu entwickeln, die in Benchmarks mit dem Stand der Technik mithalten und deutlich besser abschneiden als andere LLM-basierte Ansätze.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael CashmoreWed, 11 Ma🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Der Artikel argumentiert, dass die Interaktion zwischen menschlicher Vernunft und generativer KI eine neue kognitive Entität, das „Third Entity", hervorbringt, die durch den präreflexiven Modus der „Vibe-Creation" und asymmetrische Emergenz gekennzeichnet ist und damit fundamentale Implikationen für Erkenntnistheorie, Philosophie des Geistes und Bildungstheorie hat.

Ilya LevinWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Diese Arbeit stellt Temporal-Conditioned Normalizing Flows (tcNF) vor, ein neues Framework zur Anomalieerkennung in multivariaten Zeitreihen, das durch die Bedingungung normalisierender Flüsse auf vorherige Beobachtungen komplexe zeitliche Abhängigkeiten modelliert und robuste Wahrscheinlichkeitsverteilungen für die Identifizierung von Anomalien liefert.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

Das Paper stellt EvoPrompt vor, ein neuartiges Framework für Vision-Language-Modelle, das durch einen modality-geteilten Prompt-Projektor, eine evolutionäre Trainingsstrategie zur Entkopplung von Richtungs- und Magnituden-Updates sowie eine geometrische Feature-Regularisierung eine stabile Anpassung an Downstream-Aufgaben mit wenigen gelabelten Daten ermöglicht, ohne dabei das vorgelernte Wissen zu vergessen.

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang LiWed, 11 Ma🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Die vorgestellte Arbeit stellt EDA vor, einen parameter- und dateneffizienten Rahmen zur Anpassung von Draft-Modellen, der durch eine entkoppelte Architektur, eine Strategie zur Datenregeneration und eine Stichprobenauswahl die Leistung des spekulativen Decodings bei feinabgestimmten Zielmodellen mit geringeren Trainingskosten wiederherstellt.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong JiWed, 11 Ma🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Diese Studie stellt eine Methode vor, bei der Large Language Models genutzt werden, um Fakenews-Entlarvungen basierend auf den Big-Five-Persönlichkeitseigenschaften zu personalisieren und deren Wirksamkeit durch automatische Evaluierung zu bestätigen, wobei sich zeigt, dass solche maßgeschneiderten Botschaften überzeugender sind, gleichzeitig aber ethische Bedenken aufwerfen.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. PassaroWed, 11 Ma🤖 cs.AI

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Diese Arbeit demonstriert, dass sich Mamba-2 durch compilerbasierte XLA-Optimierungen ohne handgeschriebene CUDA-Kernels effizient auf CPU, NVIDIA-GPUs und TPUs portieren lässt, wodurch eine theoretische $O(1)$ -Zustandsverwaltung und hardwareunabhängige Inferenz mit hoher Leistung erreicht werden.

Cosmo SantoniWed, 11 Ma🤖 cs.AI

← Zurück Weiter →

cs.AI