cs articoli | Gist.Science

Vulnerability-Amplifying Interaction Loops: a systematic failure mode in AI chatbot mental-health interactions

Il documento presenta SIM-VAIL, un quadro di valutazione che rivela come i chatbot di intelligenza artificiale possano involontariamente amplificare le vulnerabilità psicologiche degli utenti attraverso cicli di interazione dannosi, evidenziando la necessità di approcci di sicurezza multidimensionali e specifici per il contesto clinico.

Veith Weilnhammer, Kevin YC Hou, Lennart Luettgau, Christopher Summerfield, Raymond Dolan, Matthew M Nour2026-03-10💻 cs

AgenticLab: A Real-World Robot Agent Platform that Can See, Think, and Act

Il paper presenta AgenticLab, una piattaforma e un benchmark agnostici rispetto al modello che abilitano la valutazione di agenti robotici basati su modelli visione-linguaggio in ambienti reali e non strutturati, rivelando limiti critici nelle capacità di manipolazione a lungo termine che i test offline non riescono a cogliere.

Pengyuan Guo, Zhonghao Mai, Zhengtong Xu, Kaidi Zhang, Heng Zhang, Zichen Miao, Arash Ajoudani, Zachary Kingston, Qiang Qiu, Yu She2026-03-10💻 cs

Six Times to Spare: Characterizing GPU-Accelerated 5G LDPC Decoding for Edge-RSU Communications

Questo articolo dimostra che l'offloading su GPU per la decodifica LDPC nelle comunicazioni 5G URLLC aumenta significativamente l'efficienza e riduce la latenza, rendendo fattibile il rispetto dei vincoli temporali e di potenza nelle unità stradali (RSU) al bordo della rete.

Ryan Barker, Julia Boone, Tolunay Seyfi, Alireza Ebrahimi Dorcheh, Fatemeh Afghah, Joseph Boccuzzi2026-03-10💻 cs

Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software

Questo studio introduce FSTab, un metodo per identificare e valutare le vulnerabilità ricorrenti nei software generati da LLM tramite un attacco in black-box che prevede le falle nel backend basandosi sulle funzionalità frontend, rivelando così rischi di sicurezza significativi e trasferibili tra diversi domini applicativi.

Tomer Kordonsky, Maayan Yamin, Noam Benzimra, Amit LeVi, Avi Mendelson2026-03-10💻 cs

LMMRec: LLM-driven Motivation-aware Multimodal Recommendation

Il paper propone LMMRec, un framework agnostico che utilizza i Large Language Models per estrarre e allineare motivazioni utente e item da dati testuali e di interazione, migliorando significativamente le prestazioni dei sistemi di raccomandazione multimodali.

Yicheng Di, Zhanjie Zhang, Yun Wang, Jinren Liu, Jiaqi Yan, Jiyu Wei, Xiangyu Chen, Yuan Liu2026-03-10💻 cs

Assessing Problem-Solving in HR Contexts: A Comparison Between Game-Based and Self-Report Measures

Questo studio dimostra che, sebbene non vi sia una significativa convergenza tra le valutazioni auto-riferite e quelle comportamentali basate su giochi per misurare la capacità di problem-solving, i due metodi forniscono informazioni complementari che giustificano l'integrazione di entrambi nei processi di selezione del personale.

Fabrizio Fornari, Eleonora Cova, Niccolò Vito Vacca, Francesco Bocci, Marcello Sarini, Luigi Caputo2026-03-10💻 cs

Conditional Diffusion Guidance under Hard Constraint: A Stochastic Analysis Approach

Questo lavoro propone un quadro teorico e pratico per la generazione condizionata tramite modelli di diffusione sotto vincoli rigidi, basato sulla trasformata h di Doob e su algoritmi di apprendimento off-policy che garantiscono il rispetto dei vincoli con probabilità uno senza modificare la rete di score preaddestrata.

Zhengyi Guo, Wenpin Tang, Renyuan Xu2026-03-10💻 cs

Beyond Judgment: Exploring Large Language Models as Non-Judgmental Support for Maternal Mental Health

Questo studio esplora come le madri utilizzino i modelli linguistici su larga scala come risorsa non giudicante per il supporto emotivo e la rassicurazione, evidenziando che, sebbene molte preferiscano ancora il calore umano, queste tecnologie offrono un'alternativa a basso rischio per evitare il giudizio sociale, specialmente in contesti familiari complessi.

Shayla Sharmin, Sadia Afrin Ratna2026-03-10💻 cs

NAAMSE: Framework for Evolutionary Security Evaluation of Agents

Il paper presenta NAAMSE, un framework evolutivo che automatizza la valutazione della sicurezza degli agenti AI tramite mutazione genetica dei prompt e scoring comportamentale asimmetrico, superando i limiti dei metodi statici per identificare vulnerabilità adattive mantenendo al contempo la correttezza funzionale.

Kunal Pai, Parth Shah, Harshil Patel2026-03-10💻 cs

PhysDrape: Learning Explicit Forces and Collision Constraints for Physically Realistic Garment Draping

Il paper presenta PhysDrape, un solver ibrido neurale-fisico che risolve il problema del drappeggio dei tessuti integrando una rete neurale con un solver differenziabile a due stadi per garantire l'equilibrio delle forze e il rispetto rigoroso dei vincoli di collisione, ottenendo così risultati fisicamente realistici con intersezioni trascurabili.

Minghai Chen, Mingyuan Liu, Ning Ma, Jianqing Li, Yuxiang Huan2026-03-10💻 cs

LLM4PQC - Accurate and Efficient Synthesis of PQC Cores by Feedback-Driven LLMs

Il paper propone LLM4PQC, un framework basato su modelli linguistici che automatizza la conversione e la verifica del codice C di crittografia post-quantistica in specifiche HLS sintetizzabili, riducendo l'impegno manuale e accelerando l'esplorazione del design rispetto ai flussi tradizionali.

Buddhi Perera, Zeng Wang, Weihua Xiao, Mohammed Nabeel, Ozgur Sinanoglu, Johann Knechtel, Ramesh Karri2026-03-10💻 cs

Move What Matters: Parameter-Efficient Domain Adaptation via Optimal Transport Flow for Collaborative Perception

Il paper presenta FlowAdapt, un framework efficiente in termini di parametri basato sulla teoria del trasporto ottimo che risolve le sfide dell'adattamento di dominio nella percezione collaborativa V2X riducendo la ridondanza dei dati e preservando le semantica dettagliate, ottenendo prestazioni all'avanguardia con solo l'1% di parametri addestrabili.

Zesheng Jia, Jin Wang, Siao Liu, Lingzhi Li, Ziyao Huang, Yunjiang Xu, Jianping Wang2026-03-10💻 cs

SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

Il paper propone SToRM, un innovativo framework di riduzione supervisionata dei token per modelli linguistici multi-modali che, mediante un predittore di importanza, un addestramento supervisionato e un modulo di fusione contestuale, abilita sistemi di guida autonoma end-to-end efficienti riducendo i costi computazionali fino a 30 volte senza compromettere le prestazioni rispetto all'uso di tutti i token.

Seo Hyun Kim, Jin Bok Park, Do Yeon Koo, Hogun Park, Il Yong Chun2026-03-10💻 cs

Accelerating Robotic Reinforcement Learning with Agent Guidance

Il paper presenta AGPS, un framework che accelera l'apprendimento per rinforzo nei robot sostituendo la supervisione umana con un agente multimodale che funge da modello del mondo semantico, migliorando così l'efficienza del campione e la scalabilità attraverso la guida automatica e la riduzione dello spazio di esplorazione.

Haojun Chen, Zili Zou, Chengdong Ma, Yaoxiang Pu, Haotong Zhang, Yuanpei Chen, Yaodong Yang2026-03-10💻 cs

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

Il paper M2RL analizza e confronta le strategie di addestramento misto e di fusione dei modelli per l'apprendimento per rinforzo con ricompense verificabili (RLVR) nei grandi modelli linguistici, dimostrando che i domini basati sul ragionamento mostrano effetti sinergici e che le due approcci possono essere integrati efficacemente per ottenere esperti multi-dominio.

Haoqing Wang, Xiang Long, Ziheng Li, Yilong Xu, Tingguang Li, Yehui Tang2026-03-10💻 cs

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Il paper introduce SkillsBench, un benchmark che dimostra come le competenze curate migliorino significativamente le prestazioni degli agenti LLM su compiti diversificati, mentre le competenze auto-generate risultano inefficaci e una documentazione focalizzata si rivela superiore a quella esaustiva.

Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Binxu Li, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Yizhuo He, Liqiang Jing, Luyang Kong, Xin Lan, Jiachen Li, Songlin Li, Yijiang Li, Yueqian Lin, Xinyi Liu, Xuanqing Liu, Haoran Lyu, Ze Ma, Bowei Wang, Runhui Wang, Tianyu Wang, Wengao Ye, Yue Zhang, Hanwen Xing, Yiqi Xue, Steven Dillmann, Han-chung Lee2026-03-10💻 cs

State Feedback Control of State-Delayed LPV Systems using Dynamic IQCs

Questo articolo propone un nuovo quadro di controllo a retroazione di stato per sistemi LPV con ritardi variabili nel tempo, integrando funzioni di Lyapunoo dipendenti dai parametri e vincoli quadratici integrali (IQC) dinamici per ottenere condizioni di sintesi convessive che garantiscono stabilità e prestazioni con ridotta conservatività.

Fen Wu2026-03-10💻 cs

Social Life of Code: Modeling Evolution through Code Embedding and Opinion Dynamics

Questo studio propone un approccio innovativo che integra embedding semantici del codice e modelli di dinamica delle opinioni per quantificare l'evoluzione dei progetti software, rivelando modelli di collaborazione e formazione del consenso nelle comunità open source.

Yulong He, Nikita Verbin, Sergey Kovalchuk2026-03-10💻 cs

RIS Control through the Lens of Stochastic Network Calculus: An O-RAN Framework for Delay-Sensitive 6G Applications

Questo lavoro propone DARIO, un framework conforme a O-RAN basato sul Calcolo Stocastico delle Reti che ottimizza l'orchestrazione dinamica delle Superfici Intelligenti Ricontrollabili (RIS) per minimizzare la latenza e garantire l'affidabilità nelle applicazioni 6G sensibili ai ritardi.

Oscar Adamuz-Hinojosa, Lanfranco Zanzi, Vincenzo Sciancalepore, Marco Di Renzo, Xavier Costa-Pérez2026-03-10💻 cs

Graph Neural Model Predictive Control for High-Dimensional Systems

Questo lavoro presenta un framework di controllo predittivo basato su reti neurali grafiche che, sfruttando l'architettura a grafo e un algoritmo di condensazione ottimizzato per GPU, permette il controllo in tempo reale di sistemi ad alta dimensionalità come i robot soffici, garantendo precisione sub-centimetrica e un'efficace evitazione degli ostacoli.

Patrick Benito Eberhard, Luis Pabon, Daniele Gammelli, Hugo Buurmeijer, Amon Lahr, Mark Leone, Andrea Carron, Marco Pavone2026-03-10💻 cs

← Precedente Successivo →