Using Vision Language Foundation Models to Generate Plant Simulation Configurations via In-Context Learning

Questo studio introduce un benchmark sintetico e propone un approccio innovativo che utilizza modelli visione-linguaggio fondazionali (Gemma 3 e Qwen3-VL) per generare automaticamente configurazioni JSON per simulazioni di piante da immagini di droni, offrendo un framework scalabile per la creazione di gemelli digitali in agricoltura.

Heesup Yun, Isaac Kazuo Uyehara, Earl Ranario, Lars Lundqvist, Christine H. Diepenbrock, Brian N. Bailey, J. Mason EarlesWed, 11 Ma🤖 cs.AI

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

Il paper presenta PathoScribe, un framework unificato basato su modelli linguistici di grandi dimensioni (LLM) che trasforma gli archivi di patologia statici in una "biblioteca vivente" interattiva, abilitando il recupero semantico, il ragionamento clinico e la costruzione automatizzata di coorti di ricerca con elevata precisione ed efficienza.

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem

Il paper propone l'AgentOS, un nuovo paradigma di sistema operativo basato su un kernel di agenti e un'interfaccia naturale che trasforma le applicazioni tradizionali in moduli componibili, affrontando le sfide di frammentazione e gestione dei permessi come un problema di scoperta della conoscenza e data mining in tempo reale.

Rui Liu, Tao Zhe, Dongjie Wang, Zijun Yao, Kunpeng Liu, Yanjie Fu, Huan Liu, Jian PeiWed, 11 Ma🤖 cs.AI

Security Considerations for Multi-agent Systems

Questo studio caratterizza sistematicamente il panorama delle minacce dei sistemi multi-agente (MAS) e valuta quantitativamente 16 framework di sicurezza, rivelando che nessuno di essi copre la maggior parte delle categorie di rischio, in particolare la non deterministica e la perdita di dati, con l'iniziativa OWASP Agentic Security Initiative che ottiene la copertura complessiva più elevata.

Tam Nguyen, Moses Ndebugre, Dheeraj ArremsettyWed, 11 Ma🤖 cs.AI

Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

Questo lavoro propone l'algoritmo CMA-ES-IG, che migliora l'apprendimento delle preferenze degli utenti non esperti per i robot incorporando considerazioni sull'esperienza utente nella generazione di query, ottenendo risultati superiori rispetto alle tecniche esistenti in termini di scalabilità, robustezza al rumore e gradimento degli utenti.

Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja MataricWed, 11 Ma🤖 cs.AI

AI Phenomenology for Understanding Human-AI Experiences Across Eras

Il paper propone l'"AI fenomenologia" come quadro di ricerca per comprendere l'esperienza vissuta e in evoluzione tra umani e intelligenza artificiale, offrendo strumenti metodologici e concetti di progettazione basati su studi longitudinali per superare le tradizionali metriche di performance e cogliere la complessità soggettiva di tale interazione.

Bhada Yun, Evgenia Taranova, Dana Feng, Renn Su, April Yi WangWed, 11 Ma🤖 cs.AI

MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games

Il paper introduce MEMO, un framework di auto-gioco che ottimizza il contesto di inferenza tramite un sistema di memoria persistente e un'esplorazione guidata da TrueSkill, riducendo significativamente la variabilità e migliorando le prestazioni nei giochi multi-agente LLM a più turni.

Yunfei Xie, Kevin Wang, Bobby Cheng, Jianzhu Yao, Zhizhou Sha, Alexander Duffy, Yihan Xi, Hongyuan Mei, Cheston Tan, Chen Wei, Pramod Viswanath, Zhangyang WangWed, 11 Ma🤖 cs.AI