cs.AI articoli | Gist.Science

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

Il paper presenta OrthoFormer, un'architettura Transformer basata su variabili strumentali e funzioni di controllo neurale che integra l'identificazione causale direttamente nei blocchi del modello per superare i limiti dell'apprendimento correlazionale e garantire robustezza nei confronti di cambiamenti nella distribuzione dei dati.

Charles Luo2026-03-10🤖 cs.LG

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

Questo articolo propone un quadro metodologico per lo stress testing regolamentare che, decomponendo l'incertezza in componenti di stima e confondimento, permette inferenze controfattuali trasparenti su percorsi macroeconomici ipotetici e quantifica la robustezza delle previsioni di perdita creditizia.

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

Il paper presenta HLER, un'architettura multi-agente che automatizza la ricerca empirica in economia integrando un controllo umano critico e una generazione di ipotesi consapevole dei dati, ottenendo così la produzione di manoscritti completi a costi ridotti con un alto tasso di fattibilità delle domande di ricerca.

Chen Zhu, Xiaolu Wang2026-03-10💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Il paper presenta Dial, un sistema NL2SQL basato sulla conoscenza che supera le limitazioni dei metodi esistenti nel gestire diversi dialetti SQL attraverso una pianificazione logica consapevole del dialetto, una base di conoscenza gerarchica e un ciclo di verifica semantica, dimostrando miglioramenti significativi nell'accuratezza e nella copertura delle funzionalità su un nuovo benchmark multi-database.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

Il paper presenta Backdoor4Good (B4G), un nuovo framework e benchmark che ripropone i meccanismi di backdoor nei grandi modelli linguistici come strumenti controllabili e auditabili per migliorare la sicurezza, l'accountability e la controllabilità dei sistemi di intelligenza artificiale.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

Image Generation Models: A Technical History

Questo articolo offre un'analisi tecnica completa dell'evoluzione dei modelli di generazione delle immagini, esaminando le architetture fondamentali, le tecniche di ottimizzazione, le limitazioni e le recenti applicazioni nella generazione video, con un focus particolare sulla sicurezza e sulla responsabilità nel loro utilizzo.

Rouzbeh Shirvani2026-03-10💬 cs.CL

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Questo studio evidenzia un divario nelle aspettative tra lavoratori freelance e clienti riguardo all'uso dell'IA, rivelando che i lavoratori tendono a una disclosure passiva basata su una falsa percezione di rilevabilità, mentre i clienti preferiscono una comunicazione proattiva, situazione aggravata dalla mancanza di politiche chiare che mina la fiducia e richiede linee guida più definite.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Questo lavoro presenta un framework di valutazione del rischio a livello di sistema per le applicazioni basate su LLM, che combina modellazione sistemica, alberi di attacco-difesa e scoring CVSS per identificare punti critici condivisi e ottimizzare le difese in scenari complessi come quelli sanitari.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Questo lavoro introduce il Dual-Stream Transformer, un'architettura che scompone il flusso residuo in due componenti funzionalmente distinte per bilanciare interpretabilità e prestazioni, dimostrando che strategie di mixing controllate permettono di mantenere una generazione robusta pur esponendo la struttura interna del modello.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

Il paper propone un nuovo framework centrato sull'uomo che ridefinisce la distribuzione fuori dal dominio (OOD) come uno spettro di difficoltà percettiva umana, rivelando come l'allineamento tra modelli di intelligenza artificiale e umani vari in modo significativo a seconda del livello di sfida percettiva e dell'architettura del modello.

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Questo lavoro propone un framework di adattamento leggero per modelli di potenziamento vocale che, aggiornando meno dell'1% dei parametri tramite adattatori a basso rango e apprendimento auto-supervisionato, migliora significativamente la robustezza in scenari acustici reali dinamici con costi computazionali ridotti.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Questo studio presenta un framework condizionale basato su trasformatori di diffusione che genera ensemble eterogenei di strutture genomiche tridimensionali di *E. coli*, guidati da mappe di contatto Hi-C, superando i limiti dei modelli deterministici per ricostruire la diversità conformazionale del genoma.

Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin2026-03-10🤖 cs.LG

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Questo studio evidenzia come la mancanza di autenticazione dell'identità del chiamante nei sistemi MCP basati su LLM crei gravi vulnerabilità di sicurezza, permettendo l'accesso non autorizzato a strumenti sensibili a causa della fiducia implicita nelle autorizzazioni persistenti.

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs

Cross-Modal Taxonomic Generalization in (Vision-) Language Models

Lo studio dimostra che i modelli linguistici pre-addestrati possono recuperare e generalizzare la conoscenza tassonomica (iperonimi) in modelli visione-linguaggio anche in assenza di evidenze esplicite durante l'addestramento, grazie alla sinergia tra coerenza degli input visivi e indizi derivati dal linguaggio.

Tianyang Xu, Marcelo Sandoval-Castaneda, Karen Livescu, Greg Shakhnarovich, Kanishka Misra2026-03-10💬 cs.CL

Interpretable-by-Design Transformers via Architectural Stream Independence

Il paper propone e valida l'architettura LFA, che garantisce l'interpretabilità per progettazione mantenendo separati i flussi di struttura simbolica e semantica contestuale fino all'output, dimostrando così una maggiore stabilità e modularità funzionale rispetto ai transformer standard.

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

A Joint Neural Baseline for Concept, Assertion, and Relation Extraction from Clinical Text

Questo lavoro propone un sistema end-to-end innovativo che ottimizza congiuntamente il riconoscimento dei concetti, la classificazione dell'asserzione e l'estrazione delle relazioni nei testi clinici, superando significativamente le prestazioni dei metodi a pipeline tradizionali e stabilendo una nuova baseline per la ricerca futura.

Fei Cheng, Ribeka Tanaka, Sadao Kurohashi2026-03-10💬 cs.CL

From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents

Il documento presenta il framework HAE, che organizza la sicurezza degli agenti AI in tre livelli gerarchici (cognitivo, esecutivo e collettivo) per affrontare le nuove vulnerabilità introdotte dall'autonomia decisionale e guidare lo sviluppo di architetture difensive multilivello.

Xiaolei Zhang, Lu Zhou, Xiaogang Xu, Jiafei Wu, Tianyu Du, Heqing Huang, Hao Peng, Zhe Liu2026-03-10💻 cs

SeDa: A Unified System for Dataset Discovery and Multi-Entity Augmented Semantic Exploration

Il paper introduce SeDa, un sistema unificato che aggrega oltre 7,6 milioni di dataset da più di 200 piattaforme per abilitare la scoperta, l'annotazione semantica e la navigazione contestuale basata su entità, superando i limiti delle attuali soluzioni di ricerca in termini di copertura, tempestività e tracciabilità.

Kan Ling, Zhen Qin, Yichi Zhu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-10💻 cs

A Unified View of Drifting and Score-Based Models

Questo articolo stabilisce un legame preciso tra i modelli di "drifting" e quelli basati sul punteggio (score-based), dimostrando che il campo di spostamento medio con kernel Gaussiano coincide con la differenza dei punteggi su distribuzioni smussate e fornendo una decomposizione esatta e limiti di errore per kernel radiali generali, incluso il kernel Laplace.

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG

InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills

Il paper presenta InterReal, un framework unificato di apprendimento per imitazione basato sulla fisica che permette ai robot umanoidi di apprendere e eseguire in modo robusto complesse interazioni uomo-oggetto nel mondo reale, superando i limiti delle soluzioni esistenti grazie a tecniche di augmentazione dei dati e un apprenditore automatico delle ricompense.

Dayang Liang, Yuhang Lin, Xinzhe Liu, Jiyuan Shi, Yunlong Liu, Chenjia Bai2026-03-10💻 cs

← Precedente Successivo →