cs.AI articoli | Gist.Science

PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

Il paper introduce PromptDLA, un framework di analisi del layout documentale consapevole del dominio che utilizza prompt descrittivi come indizi per integrare conoscenze specifiche del settore, superando le limitazioni dei metodi attuali e ottenendo prestazioni all'avanguardia su diversi dataset pubblici.

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing ZongWed, 11 Ma🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Il paper propone un framework che distilla una politica esperta Conditional Flow Matching in una politica studentessa a singolo passo tramite Implicit Maximum Likelihood Estimation e una distanza di Chamfer bi-direzionale, permettendo di generare in tempo reale traiettorie multi-modali ad alta frequenza per il controllo robotico senza subire il collasso della distribuzione tipico dei metodi di accelerazione esistenti.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

Questo studio esamina come i modelli linguistici di grandi dimensioni (LLM) perpetuino stereotipi di genere nel contesto dei determinanti sociali della salute, dimostrando che l'analisi delle interazioni tra questi fattori, specialmente nei dati sanitari francesi, è fondamentale per una valutazione più completa dei pregiudizi nei modelli.

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel MorinWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Questo lavoro introduce l'Open-World Motion Forecasting, un nuovo paradigma che supera i limiti degli approcci chiusi permettendo ai veicoli autonomi di prevedere le traiettorie direttamente dalle immagini e di adattarsi continuamente a nuove classi di oggetti senza dimenticare quelle apprese in precedenza, grazie a un framework end-to-end che combina pseudo-etichettatura, modelli visione-linguaggio e strategie di replay innovative.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

CERES: A Probabilistic Early Warning System for Acute Food Insecurity

Il documento presenta CERES, un sistema di allerta precoce probabilistico, open-source e automatizzato che genera stime settimanali a 90 giorni sull'insicurezza alimentare acuta in 43 paesi ad alto rischio, integrando sei flussi di dati e impegnandosi nella verifica pubblica prospettica di ogni previsione.

Tom Danny S. PedersenWed, 11 Ma🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

Questo studio introduce il benchmark CoMoral per evidenziare come i grandi modelli linguistici tendano a privilegiare il ragionamento morale rispetto alla comprensione del senso comune, mostrando inoltre un pregiudizio narrativo che li porta a rilevare più facilmente contraddizioni attribuite a personaggi secondari rispetto al narratore.

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya PurkayasthaWed, 11 Ma🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

Questo articolo presenta un dataset aperto, trasparente e riproducibile per valutare la conformità dei sistemi NLP e RAG al Regolamento UE sull'IA, combinando conoscenze giuridiche e modelli linguistici per generare scenari e compiti di classificazione del rischio, recupero di articoli e generazione di obblighi.

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis KarkaletsisWed, 11 Ma🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

Il paper presenta OncoAgent, un agente AI innovativo che traduce le linee guida cliniche testuali in volumi target tridimensionali per la radioterapia in modo zero-shot e senza riaddestramento, ottenendo prestazioni superiori e una maggiore conformità alle linee guida rispetto ai modelli supervisionati tradizionali.

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung KimWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Il paper introduce VMoER, un approccio bayesiano strutturato che applica l'inferenza variazionale alla fase di routing nelle architetture Mixture-of-Experts, consentendo una quantificazione dell'incertezza calibrata e scalabile per i modelli foundation con un costo computazionale trascurabile.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

Declarative Scenario-based Testing with RoadLogic

RoadLogic è un sistema open-source che colma il divario tra le specifiche dichiarative OpenSCENARIO e le simulazioni eseguibili per i veicoli autonomi, utilizzando la programmazione logica a insiemi di risposte e la pianificazione del movimento per generare automaticamente scenari realistici e conformi alle specifiche.

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan NičkovicWed, 11 Ma🤖 cs.AI

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

Questo studio identifica e spiega teoricamente il "crollo" nel merging di modelli, dimostrando attraverso analisi empiriche che l'incompatibilità rappresentazionale tra compiti, e non il conflitto nello spazio dei parametri, è la causa principale del degrado delle prestazioni quando si uniscono modelli LLM specializzati.

Yuan Cao, Dezhi Ran, Yuzhe Guo, Mengzhou Wu, Simin Chen, Linyi Li, Wei Yang, Tao XieWed, 11 Ma🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

Il paper propone EvoDriveVLA, un innovativo framework di distillazione collaborativa percezione-pianificazione che risolve le instabilità dei modelli Vision-Language-Action per la guida autonoma integrando vincoli percettivi auto-ancorati e ottimizzazione delle traiettorie guidata da un "oracle", ottenendo prestazioni all'avanguardia nelle valutazioni open-loop e closed-loop.

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang ZhangWed, 11 Ma🤖 cs.AI

Telogenesis: Goal Is All U Need

Il paper "Telogenesis" dimostra che le priorità attentive possono emergere endogenamente da un agente basandosi esclusivamente su tre lacune epistemiche (ignoranza, sorpresa e obsolescenza), permettendo di generare strategie adattive che superano quelle fisse e ricostruiscono la struttura ambientale latente senza ricompense esterne.

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan ShenWed, 11 Ma🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

Il paper presenta GenePlan, un nuovo framework che utilizza algoritmi evolutivi assistiti da modelli linguistici di grandi dimensioni per generare pianificatori generalizzati interpretabili in Python, i quali dimostrano prestazioni superiori rispetto ai metodi basati su prompt e paragonabili agli stati dell'arte nel risolvere compiti di pianificazione classica.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael CashmoreWed, 11 Ma🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Questo articolo teorizza che l'interazione tra ragionamento umano e intelligenza artificiale generativa genera una "Terza Entità" emergente, caratterizzata da un'asimmetria di agency e da un processo di "vibe-creation" che automatizza la conoscenza tacita, sfidando così i paradigmi epistemologici tradizionali e ridefinendo la competenza intellettuale nell'era dell'IA.

Ilya LevinWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Il paper introduce i flussi di normalizzazione condizionati temporalmente (tcNF), un nuovo framework autoregressivo che migliora il rilevamento di anomalie nelle serie temporali multivariate modellando con precisione le dipendenze temporali e le incertezze per generare distribuzioni probabilistiche affidabili.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

Il paper propone EvoPrompt, un nuovo framework che utilizza un proiettore di prompt condiviso tra modalità e una strategia di addestramento evolutiva con regolarizzazione geometrica per guidare l'adattamento dei modelli visione-linguaggio su compiti con pochi dati, garantendo alte prestazioni few-shot senza dimenticare le capacità zero-shot pre-addestrate.

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang LiWed, 11 Ma🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Il paper presenta EDA, un framework efficiente in termini di parametri e dati che utilizza un'architettura decoppiata, una strategia di rigenerazione dei dati e un meccanismo di selezione dei campioni per adattare rapidamente i modelli bozzetto a modelli target finemente sintonizzati, ripristinando così le prestazioni del decoding speculativo con costi di addestramento ridotti.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong JiWed, 11 Ma🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Questo studio propone un metodo innovativo che utilizza i Large Language Models per generare messaggi di debunking delle fake news personalizzati in base ai tratti della personalità, dimostrando che tali messaggi sono generalmente più persuasivi di quelli generici e sollevando al contempo importanti questioni etiche.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. PassaroWed, 11 Ma🤖 cs.AI

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Questo lavoro dimostra che l'implementazione di Mamba-2 utilizzando esclusivamente primitive standard XLA, senza kernel personalizzati, abilita un caching autoregressivo portatile e a complessità $O(1)$ che raggiunge prestazioni elevate su CPU, GPU NVIDIA e TPU mantenendo la compatibilità numerica con le implementazioni CUDA di riferimento.

Cosmo SantoniWed, 11 Ma🤖 cs.AI

← Precedente Successivo →

cs.AI