cs articoli | Gist.Science

A dataset of medication images with instance segmentation masks for preventing adverse drug events

Il paper presenta MEDISEG, un nuovo dataset di immagini di farmaci con maschere di segmentazione istanza progettato per migliorare il riconoscimento dei medicinali in scenari reali complessi e prevenire errori terapeutici, dimostrando attraverso l'addestramento di modelli YOLOv8 e YOLOv9 la sua efficacia nel supportare sia l'addestramento supervisionato robusto che l'apprendimento con pochi esempi.

W. I. Chu, S. Hirani, G. Tarroni, L. Li2026-03-12💻 cs

Spatially conditioned dynamics between population and built form

Questo studio sviluppa un framework spazialmente esplicito in Repubblica Ceca che, integrando classificazioni dettagliate dell'ambiente costruito con indicatori socio-demografici, dimostra come le caratteristiche della popolazione presentino relazioni lineari ma spazialmente condizionate con la forma urbana, evidenziando il ruolo cruciale di quest'ultima nel riprodurre le disuguaglianze socio-spaziali.

Anna Brazdova, Martin Fleischmann2026-03-12💻 cs

Evaluating Few-Shot Pill Recognition Under Visual Domain Shift

Questo studio valuta la capacità di sistemi di riconoscimento dei farmaci di adattarsi a scenari reali complessi tramite apprendimento few-shot, evidenziando come, sebbene la classificazione semantica sia efficace anche con pochi esempi, la localizzazione e il richiamo risentano significativamente di sovrapposizioni e occlusioni, sottolineando l'importanza cruciale di dati di addestramento realistici per il dispiegamento pratico.

W. I. Chu, G. Tarroni, L. Li2026-03-12💻 cs

MAD: Memory Allocation meets Software Diversity

Il paper presenta MAD, un approccio innovativo che combina l'allocazione della memoria con i principi della diversità software per contrastare le vulnerabilità DRAM e gli attacchi RowHammer, offrendo una soluzione agnostica rispetto all'hardware e al software con impatto trascurabile sulle prestazioni.

Manuel Wiesinger, Daniel Dorfmeister, Stefan Brunthaler2026-03-12💻 cs

Topological Analysis for Identifying Anomalies in Serverless Platforms

Questo paper introduce un modello topologico basato sulla decomposizione di Hodge per analizzare i flussi operativi nelle piattaforme serverless, distinguendo tra errori locali e armoniche strutturali, e propone strategie di mitigazione come l'effetto "dumping" per gestire le inefficienze senza dover ristrutturare completamente l'architettura.

Gianluca Reali, Mauro Femminella2026-03-12💻 cs

UltrasoundAgents: Hierarchical Multi-Agent Evidence-Chain Reasoning for Breast Ultrasound Diagnosis

Il paper presenta UltrasoundAgents, un framework gerarchico multi-agente che allinea il processo diagnostico ecografico al flusso di lavoro clinico attraverso una catena di ragionamento basata su evidenze strutturate e una strategia di addestramento progressivo decoupled, migliorando sia l'accuratezza diagnostica che la tracciabilità delle decisioni rispetto ai metodi esistenti.

Yali Zhu, Kang Zhou, Dingbang Wu, Gaofeng Meng2026-03-12💻 cs

OSUM-Pangu: An Open-Source Multidimension Speech Understanding Foundation Model Built upon OpenPangu on Ascend NPUs

Il paper presenta OSUM-Pangu, un modello fondazionale open-source per la comprensione del parlato sviluppato interamente su hardware Ascend NPU e software non-CUDA, che integra un encoder audio con il modello linguistico OpenPangu-7B per ottenere prestazioni comparabili alle soluzioni basate su GPU.

Yujie Liao, Xuelong Geng, Hongfei Xue, Shuiyuan Wang, Lei Xie2026-03-12💻 cs

Beyond Sequential Distance: Inter-Modal Distance Invariant Position Encoding

Il paper propone DIPE, un nuovo metodo di codifica posizionale che risolve il problema del "visual fading" nei modelli multimodali a lungo contesto, eliminando la penalità delle distanze inter-modali tipica del Multimodal RoPE e garantendo così una stabilità nel grounding visivo senza compromettere le prestazioni su contesti brevi.

Lin Chen, Bolin Ni, Qi Yang, Zili Wang, Kun Ding, Ying Wang, Houwen Peng, Shiming Xiang2026-03-12💻 cs

Exploring Indicators of Developers' Sentiment Perceptions in Student Software Projects

Questo studio indaga come fattori individuali, contestuali e di gruppo influenzino la percezione del sentiment nelle comunicazioni software, rivelando che tale percezione è instabile, fortemente dipendente dall'ambiguità del messaggio e scarsamente correlata a variabili esterne, suggerendo cautela nell'interpretazione dei risultati dell'analisi del sentiment.

Martin Obaidi, Marc Herrmann, Jendrik Martensen, Jil Klünder, Kurt Schneider2026-03-12💻 cs

FG-CLTP: Fine-Grained Contrastive Language Tactile Pretraining for Robotic Manipulation

Il paper propone FG-CLTP, un framework di pre-addestramento contrastivo che integra rappresentazioni tattili 3D quantitative con il linguaggio per migliorare la percezione e il controllo nella manipolazione robotica, superando i limiti delle descrizioni qualitative tradizionali.

Wenxuan Ma, Chaofan Zhang, Yinghao Cai, Guocai Yao, Shaowei Cui, Shuo Wang2026-03-12💻 cs

Bilevel Layer-Positioning LoRA for Real Image Dehazing

Il paper propone BiLaLoRA, un metodo di de-abbagliamento per immagini reali che combina una perdita guidata dal testo basata su CLIP per l'adattamento non supervisionato e una strategia di posizionamento a due livelli dei parametri LoRA per ottimizzare automaticamente gli strati critici della rete, superando così le tecniche più avanzate su diversi benchmark.

Yan Zhang, Long Ma, Yuxin Feng, Zhe Huang, Fan Zhou, Zhuo Su2026-03-12💻 cs

RL-Augmented MPC for Non-Gaited Legged and Hybrid Locomotion

Gli autori propongono un'architettura gerarchica che combina apprendimento per rinforzo e controllo predittivo del modello per gestire la locomozione su piattaforme ibride e non gaitate, dimostrando con successo il trasferimento zero-shot dalla simulazione alla realtà su un robot umanoide di 120 kg.

Andrea Patrizi, Carlo Rizzardo, Arturo Laurenzi, Francesco Ruscelli, Luca Rossini, Nikos G. Tsagarakis2026-03-12💻 cs

VoxCare: Studying Natural Communication Behaviors of Hospital Caregivers through Wearable Sensing of Egocentric Audio

Il paper presenta VoxCare, un sistema indossabile scalabile che analizza in tempo reale i comportamenti comunicativi naturali degli operatori sanitari negli ospedali tramite l'estrazione di caratteristiche acustiche senza memorizzare l'audio grezzo, rivelando come tali pattern riflettano il carico di lavoro e lo stress per migliorare l'erogazione delle cure.

Tiantian Feng, Kleanthis Avramidis, Anfeng Xu, Deqi Wang, Brandon M Booth, Shrikanth Narayanan2026-03-12💻 cs

S2D: Sparse to Dense Lifting for 3D Reconstruction with Minimal Inputs

Il paper introduce S2D, una pipeline innovativa che combina un modello di diffusione per la correzione delle immagini sparse e una strategia di ricostruzione robusta per generare rappresentazioni 3D di alta qualità con il minimo numero di input necessari.

Yuzhou Ji, Qijian Tian, He Zhu, Xiaoqi Jiang, Guangzhi Cao, Lizhuang Ma, Yuan Xie, Xin Tan2026-03-12💻 cs

Expressive Boundedness of Authoritative DNS Response Selection

Questo articolo formalizza la selezione delle risposte DNS autorevoli come un dominio semantico limitato dai vincoli del protocollo, dimostrando che ogni meccanismo di selezione ammissibile può essere ridotto a una forma normale finita e dotato di una struttura algebrica intrinseca che ne permette un ragionamento rigoroso su equivalenza e composizione.

Chris Bertinato2026-03-12💻 cs

Data Augmentation and Convolutional Network Architecture Influence on Distributed Learning

Questo studio analizza come le architetture delle reti neurali convoluzionali influenzino l'accuratezza del modello e l'efficienza computazionale nell'apprendimento distribuito, fornendo indicazioni per ottimizzare il loro dispiegamento in scenari ad alta intensità di risorse.

Victor Forattini Jansen, Emanuel Teixeira Martins, Yasmin Souza Lima, Flavio de Oliveira Silva, Rodrigo Moreira, Larissa Ferreira Rodrigues Moreira2026-03-12💻 cs

Training-Free Multi-Step Inference for Target Speaker Extraction

Il paper propone un metodo di inferenza multi-step privo di addestramento per l'estrazione della voce del parlante target, che affina iterativamente la stima utilizzando un modello preaddestrato congelato e ottimizzando metriche intrusive o non intrusive per bilanciare le prestazioni in scenari pratici.

Zhenghai You, Ying Shi, Lantian Li, Dong Wang2026-03-12💻 cs

Novel Architecture of RPA In Oral Cancer Lesion Detection

Questo studio presenta un'architettura innovativa per il rilevamento delle lesioni del cancro orale, dimostrando che l'uso di pattern di progettazione come il Singleton e l'elaborazione in batch nelle implementazioni OC-RPAv1 e OC-RPAv2 riduce drasticamente i tempi di previsione da 0,29 a 0,06 secondi per immagine, ottenendo un miglioramento dell'efficienza fino a 100 volte rispetto ai metodi RPA standard.

Revana Magdy, Joy Naoum, Ali Hamdi2026-03-12💻 cs

Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment

Questo lavoro presenta un nuovo framework di apprendimento per imitazione a vita che, operando in uno spazio latente multimodale e integrando un meccanismo di aggiustamento incrementale dei feature, supera lo stato dell'arte sui benchmark LIBERO riducendo significativamente l'oblio e migliorando le prestazioni.

Fanqi Yu, Matteo Tiezzi, Tommaso Apicella, Cigdem Beyan, Vittorio Murino2026-03-12💻 cs

Huffman-Bucket Sketch: A Simple $O(m)$ Algorithm for Cardinality Estimation

Il paper introduce l'Huffman-Bucket Sketch (HBS), una struttura dati semplice e unibile che comprime losslessly gli sketch HyperLogLog in uno spazio ottimale di $O(m+\log n)$ bit mantenendo aggiornamenti a tempo costante e riducendo significativamente i requisiti di memoria.

Matti Karppa2026-03-12💻 cs

← Precedente Successivo →

cs