Enhancing Tree Species Classification: Insights from YOLOv8 and Explainable AI Applied to TLS Point Cloud Projections

Questo studio presenta un quadro innovativo che combina YOLOv8 e Finer-CAM per analizzare la classificazione delle specie arboree tramite nuvole di punti TLS, dimostrando un'accuratezza del 96% e rivelando come il modello utilizzi in modo interpretabile diverse caratteristiche strutturali, come chiome e fusti, a seconda della specie.

Adrian Straker, Paul Magdon, Marco Zullich, Maximilian Freudenberg, Christoph Kleinn, Johannes Breidenbach, Stefano Puliti, Nils Noelke2026-03-12🤖 cs.AI

Over-Searching in Search-Augmented Large Language Models

Questo lavoro analizza sistematicamente il fenomeno dell'"over-searching" nei modelli linguistici potenziati dalla ricerca, evidenziando come l'invocazione eccessiva degli strumenti di ricerca comprometta l'efficienza e la qualità delle risposte, proponendo al contempo una nuova metrica di valutazione (TPC), strategie di mitigazione e un nuovo dataset (OverSearchQA) per promuovere lo sviluppo di sistemi più efficienti.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

Burn-After-Use for Preventing Data Leakage through a Secure Multi-Tenant Architecture in Enterprise LLM

Questo studio presenta un'architettura multi-tenant sicura (SMTA) combinata con un meccanismo "Burn-After-Use" (BAU) per prevenire la fuoriuscita di dati negli ambienti aziendali di LLM, garantendo l'isolamento dei contesti conversazionali e la loro distruzione automatica dopo l'uso, come dimostrato da valutazioni sperimentali che conferiscono elevate percentuali di successo nella difesa da attacchi di perdita dati.

Qiang Zhang, Elena Emma Wang, Jiaming Li, Xichun Wang2026-03-12🤖 cs.AI

MemOCR: Layout-Aware Visual Memory for Efficient Long-Horizon Reasoning

Il paper introduce MemOCR, un agente multimodale che ottimizza il ragionamento a lungo termine sotto vincoli di contesto limitati trasformando la memoria strutturata in un'immagine visiva che priorizza le informazioni cruciali e comprime i dettagli superflui, superando così i metodi basati esclusivamente sul testo.

Yaorui Shi, Shugui Liu, Yu Yang, Wenyu Mao, Yuxin Chen, Qi GU, Hui Su, Xunliang Cai, Xiang Wang, An Zhang2026-03-12🤖 cs.AI

Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing

Questo lavoro teorizza che l'allucinazione nei modelli linguistici è una conseguenza inevitabile dell'ottimizzazione dello spazio di memoria, dimostrando attraverso un teorema di rate-distorsione che, in condizioni di capacità limitata, la strategia informazionalmente ottimale richiede di assegnare alta confidenza a fatti non veri piuttosto che astenersi o dimenticare.

Anxin Guo, Jingwei Li2026-03-12💬 cs.CL

Evaluating Long-Horizon Memory for Multi-Party Collaborative Dialogues

Il paper introduce EverMemBench, il primo benchmark progettato per valutare la memoria a lungo termine nei dialoghi collaborativi multi-attore, rivelando le limitazioni fondamentali dei sistemi attuali nell'attribuzione multi-attore, nel ragionamento temporale e nella consapevolezza della memoria in contesti realistici complessi.

Chuanrui Hu, Tong Li, Xingze Gao, Hongda Chen, Yi Bai, Dannong Xu, Tianwei Lin, Xiaohong Li, Yunyun Han, Jian Pei, Yafeng Deng2026-03-12💬 cs.CL

Moving On, Even When You're Broken: Fail-Active Trajectory Generation via Diffusion Policies Conditioned on Embodiment and Task

Il paper presenta DEFT, un generatore di traiettorie basato su diffusione che permette ai robot di completare i compiti in modo sicuro anche in caso di guasti agli attuatori, superando significativamente i metodi classici sia in simulazione che nel mondo reale grazie alla sua capacità di generalizzare a condizioni di malfunzionamento non viste durante l'addestramento.

Gilberto G. Briscoe-Martinez, Yaashia Gautam, Rahul Shetty, Anuj Pasricha, Marco M. Nicotra, Alessandro Roncone2026-03-12🤖 cs.AI

UniWeTok: An Unified Binary Tokenizer with Codebook Size 2128\mathit{2^{128}} for Unified Multimodal Large Language Model

Il paper presenta UniWeTok, un tokenizzatore binario unificato con un codice di dimensione $2^{128}$ e un'architettura ibrida che, grazie a nuove tecniche di distillazione e formazione, supera lo stato dell'arte nella ricostruzione ad alta fedeltà, nell'estrazione semantica e nella generazione di immagini con un costo computazionale significativamente inferiore.

Shaobin Zhuang, Yuang Ai, Jiaming Han, Weijia Mao, Xiaohui Li, Fangyikang Wang, Xiao Wang, Yan Li, Shanchuan Lin, Kun Xu, Zhenheng Yang, Huaibo Huang, Xiangyu Yue, Hao Chen, Yali Wang2026-03-12🤖 cs.AI

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

Il paper presenta GOT-JEPA, un framework di pre-addestramento basato su un'architettura predittiva a embedding congiunto che migliora la generalizzazione e la gestione delle occlusioni nel tracciamento generico di oggetti, integrando un modulo chiamato OccuSolver per stimare la visibilità e affinare i modelli di tracciamento in ambienti dinamici.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-12🤖 cs.AI