cs.AI papers | Gist.Science

PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

Dit paper introduceert PromptDLA, een domeinbewust raamwerk voor documentlay-outanalyse dat beschrijvende kennis gebruikt als aanwijzingen om domeinspecifieke priors te integreren en zo de generalisatie en prestaties op diverse datasets te verbeteren.

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing ZongWed, 11 Ma🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Dit artikel introduceert een framework dat een Conditional Flow Matching-expert distilleert naar een snelle, single-step student via Implicit Maximum Likelihood Estimation, waardoor real-time, multi-modale robotcontrole met behoud van multi-modaal gedrag mogelijk wordt zonder de latentie van iteratieve integratie.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

Deze studie toont aan dat Large Language Models in het Frans gebaseerde gezondheidsdomein genderstereotypen vertonen die worden versterkt door interacties met andere sociale determinanten van gezondheid, wat aangeeft dat het evalueren van deze interacties essentieel is voor een nauwkeurige bias-analyse.

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel MorinWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Dit paper introduceert 'open-world motion forecasting', een nieuw kader dat autonome voertuigen in staat stelt om continu nieuwe objectklassen te leren en hun bewegingen te voorspellen vanuit camera-beelden zonder vergeten van eerder geleerde kennis, door middel van een end-to-end class-incremental framework met pseudo-labeling en een innovatieve replay-samplingstrategie.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

CERES: A Probabilistic Early Warning System for Acute Food Insecurity

Dit artikel presenteert CERES, een geautomatiseerd, openbaar en continu werkend probabilistisch systeem dat wekelijks 90-daagse voorspellingen genereert voor acute voedselonzekerheid in 43 risicolanden door zes datastromen te combineren en elke voorspelling cryptografisch te archiveren voor openbare verificatie.

Tom Danny S. PedersenWed, 11 Ma🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

Dit onderzoek onthult dat grote taalmodellen morele redenering vaak boven gezond verstand plaatsen en een vooroordelen vertonen waarbij ze tegenstrijdigheden in gezond verstand makkelijker herkennen bij secundaire personages dan bij de hoofdpersoon, wat wijst op de noodzaak van verbeterde trainingsmethoden.

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya PurkayasthaWed, 11 Ma🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

Dit paper introduceert een open en reproduceerbare dataset voor het evalueren van NLP- en RAG-systemen op naleving van de EU-AI-wet, die door middel van een combinatie van domeinkennis en grote taalmodellen is opgezet om taken zoals risicoclassificatie en artikelretrieval te ondersteunen.

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis KarkaletsisWed, 11 Ma🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

Dit paper introduceert OncoAgent, een nieuw AI-agentkader dat klinische richtlijnen direct omzet in 3D-stralingsvolumes zonder training, waardoor het in een zero-shot setting presteert die vergelijkbaar is met toezichtmodellen en door artsen wordt geprefereerd vanwege zijn superioriteit in richtlijncompliance en aanpasbaarheid.

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung KimWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Dit paper introduceert VMoER, een schaalbaar Bayesiaans framework dat variational inference toepast op de routering in Mixture-of-Experts Transformers om zo met minimale rekentijd gecalibreerde onzekerheidsschattingen te bieden voor foundation modellen.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

Declarative Scenario-based Testing with RoadLogic

Dit paper introduceert RoadLogic, een open-source tool die declaratieve OpenSCENARIO-specificaties omzet in uitvoerbare simulaties voor het testen van autonome voertuigen door middel van Answer Set Programming, bewegingsplanning en specificatiegebaseerde monitoring.

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan NičkovicWed, 11 Ma🤖 cs.AI

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

Deze studie identificeert en verklaart het fenomeen van 'task-level merging collapse', waarbij bepaalde taakcombinaties leiden tot catastrofale prestatiedalingen door fundamentele representatieve incompatibiliteit in plaats van parameterconflict, wat wordt onderbouwd door zowel empirische analyses als een theoretisch bewijs op basis van rate-distortion-theorie.

Yuan Cao, Dezhi Ran, Yuzhe Guo, Mengzhou Wu, Simin Chen, Linyi Li, Wei Yang, Tao XieWed, 11 Ma🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

EvoDriveVLA is een nieuw kader voor autonoom rijden dat de prestaties van Vision-Language-Action-modellen verbetert door een collaboratieve distillatie van waarneming en planning te gebruiken, wat leidt tot state-of-the-art resultaten in zowel open- als gesloten-lus evaluaties.

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang ZhangWed, 11 Ma🤖 cs.AI

Telogenesis: Goal Is All U Need

Dit artikel toont aan dat endogene prioriteiten, gegenereerd door epistemische gaten zoals onwetendheid, verrassing en veroudering, voldoende zijn om adaptieve waarnemingsstrategieën te ontwikkelen die presteren boven vaste methoden en zonder externe beloning de onderliggende structuur van de omgeving kunnen herontdekken.

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan ShenWed, 11 Ma🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

GenePlan is een nieuw raamwerk dat grote taalmodellen combineert met evolutionaire algoritmen om interpreteerbare, domein-specifieke PDDL-planners te genereren die presteren op het niveau van de state-of-the-art en aanzienlijk beter zijn dan andere LLM-baselines.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael CashmoreWed, 11 Ma🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Dit artikel betoogt dat de interactie tussen menselijke redenering en generatieve AI leidt tot een emergente 'derde entiteit' die via 'vibe-creatie' tacit knowledge automatiseert, wat fundamentele implicaties heeft voor epistemologie, bewustzijn en onderwijs.

Ilya LevinWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Dit paper introduceert Temporal-Conditioned Normalizing Flows (tcNF), een nieuw raamwerk voor het detecteren van anomalieën in multivariate tijdsreeksen door complexe temporele afhankelijkheden en onzekerheid nauwkeurig te modelleren via autoregressieve conditionering op eerdere waarnemingen.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

Het artikel introduceert EvoPrompt, een nieuw raamwerk dat de adaptatie van vision-language modellen naar downstream-taken verbetert door een evolutionaire trainingsstrategie en geometrische regularisatie te gebruiken om prestaties te maximaliseren zonder de oorspronkelijke zero-shot-kennis te verliezen.

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang LiWed, 11 Ma🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Dit paper introduceert EDA, een parameter- en data-efficiënt framework dat de prestaties van speculatieve decoding op fijngetrainde LLM's herstelt door een ontkoppelde architectuur, data-regeneratie en selectieve steekproefneming te combineren, waardoor volledige hertraining overbodig wordt.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong JiWed, 11 Ma🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Deze studie presenteert een methode om nepnieuwsontkrachting te personaliseren op basis van de Big Five-persoonlijkheidstrekken met behulp van LLM's, waarbij geautomatiseerde evaluatie aantoont dat dergelijke gepersonaliseerde boodschappen over het algemeen overtuigender zijn dan generieke versies.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. PassaroWed, 11 Ma🤖 cs.AI

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Dit artikel introduceert een compiler-gebaseerde implementatie van Mamba-2 in JAX die, dankzij het gebruik van standaard XLA-primitieven in plaats van aangepaste CUDA-kernels, portabele autoregressieve inferentie met $O(1)$ caching mogelijk maakt op CPU, NVIDIA GPU en Google TPU zonder host-synchronisatie.

Cosmo SantoniWed, 11 Ma🤖 cs.AI

← Vorige Volgende →

cs.AI