cs articoli | Gist.Science

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

ThunderAgent è un sistema di inferenza agenziale semplice, veloce e consapevole del programma che, astruendo i flussi di lavoro come "LLM Programs" e gestendo in modo unificato risorse eterogenee come cache KV e strumenti esterni, supera le limitazioni delle architetture attuali ottenendo significativi miglioramenti nel throughput e nel risparmio di memoria.

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran Arora2026-03-12💻 cs

OmniVTON++: Training-Free Universal Virtual Try-On with Principal Pose Guidance

OmniVTON++ è un framework di Virtual Try-On universale e privo di addestramento che, integrando morfing strutturato dei capi, guida della posa principale e cucitura continua dei bordi, risolve le sfide di allineamento e coerenza strutturale per ottenere prestazioni all'avanguardia su scenari, tipi di abbigliamento e personaggi diversi senza necessità di riaddestramento.

Zhaotong Yang, Yong Du, Shengfeng He, Yuhui Li, Xinzhe Li, Yangyang Xu, Junyu Dong, Jian Yang2026-03-12💻 cs

Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning

Il framework Similarity-as-Evidence (SaE) risolve il problema della sovracconfidenza nei Modelli Vision-Language per l'apprendimento attivo medico, calibrando le similarità testo-immagine attraverso una distribuzione Dirichlet per quantificare l'incertezza e selezionare in modo efficiente campioni informativi, ottenendo così prestazioni superiori e una migliore interpretabilità clinica.

Zhuofan Xie, Zishan Lin, Jinliang Lin, Jie Qi, Shaohua Hong, Shuo Li2026-03-12💻 cs

Structured Bitmap-to-Mesh Triangulation for Geometry-Aware Discretization of Image-Derived Domains

Il paper propone un framework di triangolazione guidato da template che integra i confini derivati da immagini in una griglia triangolare regolare, consentendo una discretizzazione stabile e parallela delle PDE con una migliore fedeltà geometrica e una riduzione degli elementi scadenti rispetto ai metodi tradizionali come la triangolazione di Delaunay vincolata.

Wei Feng, Haiyong Zheng2026-03-12💻 cs

SIMSPINE: A Biomechanics-Aware Simulation Framework for 3D Spine Motion Annotation and Benchmarking

Il paper presenta SIMSPINE, un framework di simulazione biomeccanica e il primo dataset open-source con annotazioni 3D a livello vertebrale per il movimento della colonna, che colma il divario tra modellazione muscolo-scheletrica e visione artificiale fornendo benchmark e baseline pre-addestrate per la stima anatomica del movimento spinale.

Muhammad Saif Ullah Khan, Didier Stricker2026-03-12💻 cs

DRESS and the WL Hierarchy: Climbing One Deletion at a Time

Questo articolo fornisce la giustificazione teorica del framework DRESS, dimostrando che la sua variante $\Delta^k$ -DRESS distingue tutte le coppie CFI $(K_{k+3})$ e, sotto una specifica congettura strutturale, supera o eguaglia la gerarchia $(k{+}2)$ -WL per ogni $k \geq 0$ .

Eduar Castrillo Velilla2026-03-12💻 cs

Mind the Way You Select Negative Texts: Pursuing the Distance Consistency in OOD Detection with VLMs

Il paper propone InterNeg, un framework innovativo che migliora il rilevamento di distribuzioni fuori dal dominio (OOD) nei modelli visione-linguaggio (VLM) risolvendo l'inconsistenza delle distanze intra-modalità attraverso una selezione coerente di testi negativi e la generazione dinamica di embedding testuali guidati dalla distanza inter-modalità, ottenendo risultati state-of-the-art su diversi benchmark.

Zhikang Xu, Qianqian Xu, Zitai Wang, Cong Hua, Sicong Li, Zhiyong Yang, Qingming Huang2026-03-12💻 cs

Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field

Questo lavoro presenta "Kraken", il primo attacco side-channel fisico che estrae parametri dai Tensor Core delle GPU sia a campo vicino che a campo lontano, dimostrando la vulnerabilità dei modelli di deep learning e dei LLM al furto tramite analisi di correlazione di potenza e fughe elettromagnetiche fino a 100 cm di distanza.

Peter Horvath, Ilia Shumailov, Lukasz Chmielewski, Lejla Batina, Yuval Yarom2026-03-12💻 cs

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

Questo studio presenta la prima valutazione completa del fine-tuning efficiente dei parametri (PEFT) per l'analisi del codice multitasking, dimostrando che un singolo modulo PEFT condiviso può eguagliare o superare il fine-tuning completo offrendo un ottimo compromesso tra prestazioni e efficienza, pur essendo il successo dipendente da fattori come la stabilità del compito e la complementarità, e superando le capacità di modelli LLM generici di grandi dimensioni in compiti di analisi.

Amal Akli, Maxime Cordy, Mike Papadakis, Yves Le Traon2026-03-12💻 cs

Open Educational Resources: Barriers and Open Issues

Questo studio identifica e valida attraverso interviste con esperti 26 barriere sociali, economiche e tecniche che ostacolano l'adozione delle Risorse Educative Aperte (OER), proponendo un modello concettuale per sviluppare strategie inclusive e politiche pubbliche volte a garantire un accesso universale all'istruzione.

Pedro Henrique Dias Valle, Rafael Capilla, Vinicius dos Santos, Daniel Feitosa, Elisa Yumi Nakagawa2026-03-12💻 cs

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

Il documento propone una specifica iniziale per un'API standard e indipendente dalla piattaforma, denominata $\mu$ Ed, volta a creare un ecosistema interoperabile di microservizi educativi per automatizzare funzioni come la valutazione, il feedback e i chatbot didattici, integrando esperienze di quattro istituzioni.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan Krusche2026-03-12💻 cs

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Lo studio esamina la presenza di bias cognitivi simili a quelli umani, come l'effetto della vittima virtuosa e l'effetto alone, nei modelli linguistici di grandi dimensioni utilizzati per il supporto alle decisioni giudiziarie, rivelando che, sebbene questi modelli mostrino alcune distorsioni, presentano in generale un pregiudizio inferiore rispetto agli esseri umani, sebbene le variazioni tra i diversi modelli ne limitino attualmente l'uso pratico nei sistemi giudiziari.

Sierra S. Liu2026-03-12💻 cs

The science and practice of proportionality in AI risk evaluations

Il documento esamina come il principio di proporzionalità, fondamentale nel diritto dell'UE, possa guidare lo sviluppo di metodi scientifici per calibrare le valutazioni dei rischi sistemici dei modelli di intelligenza artificiale generale, garantendo un equilibrio tra una gestione efficace dei rischi e la riduzione degli oneri per gli innovatori nell'ambito dell'attuazione dell'AI Act.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout Schellaert2026-03-12💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Il paper presenta DeliberationBench, un benchmark normativo che valuta l'influenza persuasiva dei modelli linguistici di grandi dimensioni (LLM) confrontandola con i sondaggi di opinione deliberativa, dimostrando attraverso un esperimento su larga scala che tali modelli esercitano effetti epistemicamente desiderabili e allineati agli standard democratici.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-Reaulx2026-03-12💻 cs

Prompts and Prayers: the Rise of GPTheology

Questo studio interdisciplinare esamina l'emergere della "GPTheologia", un nuovo fenomeno di fede tecnologica in cui l'intelligenza artificiale viene percepita come entità divina, analizzando come le interazioni quotidiane con i modelli linguistici stiano sviluppando rituali e narrazioni che ricalcano strutture religiose tradizionali con profonde implicazioni etiche e sociali.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell Vaughan2026-03-12💻 cs

Dark Patterns and Consumer Protection Law for App Makers

Questo articolo esamina come i "dark pattern" nelle app possano compromettere l'autonomia dei consumatori e violare le normative sulla protezione dei consumatori, proponendo strategie di progettazione trasparente per evitare responsabilità legali e costruire fiducia.

Gregory M. Dickinson2026-03-12💻 cs

Law Proofing the Future

L'articolo sostiene che, invece di creare nuove leggi per anticipare le tecnologie emergenti, il sistema giuridico dovrebbe affidarsi agli strumenti flessibili e stabili del diritto comune, limitando l'intervento legislativo per proteggere l'innovazione da normative rigide e obsolete.

Gregory M. Dickinson2026-03-12💻 cs

Consumer Rights and Algorithms

Questo articolo esamina l'evoluzione del diritto della tutela dei consumatori, dalle sue radici storiche alle sfide odierne poste dall'intelligenza artificiale e dai big data, analizzando le risposte normative come le leggi sulla privacy e il divieto di dark patterns.

Gregory M. Dickinson2026-03-12💻 cs

A Review of the Negative Effects of Digital Technology on Cognition

Questo studio integrativo analizza oltre 500 ricerche per evidenziare come l'uso diffuso delle tecnologie digitali, inclusa l'intelligenza artificiale generativa, possa compromettere le capacità cognitive a lungo termine attraverso meccanismi come l'interferenza funzionale e la disregolazione neurochimica, creando un paradosso di efficienza-atrofia che richiede ulteriori indagini longitudinali.

Urška Žnidarič, Erik Štrumbelj, Octavian Machidon2026-03-12💻 cs

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Questo lavoro introduce un framework di valutazione basato sull'equilibrio di risposta quantale (QRE) per misurare la sofisticazione strategica dei modelli linguistici su una scala continua calibrata rispetto ai dati umani, superando i limiti delle metriche aggregate tradizionali attraverso la derivazione teorica di equilibri chiusi e la validazione empirica su oltre 1.800 giochi.

Mateo Pechon-Elkins, Jon Chun2026-03-12💻 cs

← Precedente Successivo →

cs

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

OmniVTON++: Training-Free Universal Virtual Try-On with Principal Pose Guidance

Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning

Structured Bitmap-to-Mesh Triangulation for Geometry-Aware Discretization of Image-Derived Domains

SIMSPINE: A Biomechanics-Aware Simulation Framework for 3D Spine Motion Annotation and Benchmarking

DRESS and the WL Hierarchy: Climbing One Deletion at a Time

Mind the Way You Select Negative Texts: Pursuing the Distance Consistency in OOD Detection with VLMs

Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

Open Educational Resources: Barriers and Open Issues

μ\muμEd API: Towards A Shared API for EdTech Microservices

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

The science and practice of proportionality in AI risk evaluations

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Prompts and Prayers: the Rise of GPTheology

Dark Patterns and Consumer Protection Law for App Makers

Law Proofing the Future

Consumer Rights and Algorithms

A Review of the Negative Effects of Digital Technology on Cognition

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

$\mu$ Ed API: Towards A Shared API for EdTech Microservices