cs.AI articoli | Gist.Science

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Il paper propone un sistema di rilevamento delle allucinazioni visive strutturali in immagini di personaggi cartonesi generati da modelli Text-to-Image, che utilizza un modello Vision-Language potenziato dall'apprendimento in contesto con informazioni sulla posa (PA-ICVL) per ottenere miglioramenti significativi rispetto ai metodi basati solo su immagini RGB.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

Algorithmic Collusion by Large Language Models

Lo studio dimostra che gli agenti di pricing basati su modelli linguistici di grandi dimensioni (LLM) possono autonomamente raggiungere prezzi e profitti supracompetitivi in contesti oligopolistici, influenzati significativamente dalle istruzioni (prompt) e presentando nuove sfide per la regolamentazione futura.

Sara Fish, Yannai A. Gonczarowski, Ran I. Shorrer2026-03-09🤖 cs.AI

Computational lexical analysis of Flamenco genres

Questo studio presenta un'analisi computazionale di oltre 2000 testi di flamenco utilizzando l'elaborazione del linguaggio naturale e l'apprendimento automatico per classificare i generi musicali (palos), identificare i loro campi semantici caratteristici e rivelare connessioni storiche ed evolutive attraverso l'analisi di rete delle distanze inter-genere.

Pablo Rosillo-Rodes, Maxi San Miguel, David Sanchez2026-03-09💬 cs.CL

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Questo articolo presenta un innovativo pipeline di apprendimento attivo a due stadi per il riconoscimento automatico del parlato che combina il clustering degli x-vector per la diversità dei campioni e un metodo bayesiano basato sul dropout Monte Carlo per l'incertezza, ottimizzando significativamente l'efficienza del labeling e le prestazioni del modello.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

My part is bigger than yours -- assessment within a group of peers

Il paper presenta modelli semplici per aggregare le valutazioni dei contributi individuali in un progetto di gruppo, collegando l'importanza dell'opinione di ciascun esperto alla sua effettiva partecipazione per raggiungere un consenso equo.

Konrad Kułakowski, Jacek Szybowski2026-03-09🤖 cs.AI

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Questo lavoro offre una revisione completa e una specifica formale dettagliata delle reti di codifica predittiva, presentandole come un quadro neurale ispirato e biologicamente plausibile che supera i limiti della retropropagazione tradizionale e si posiziona come una soluzione promettente per l'innovazione futura nel machine learning.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek2026-03-09🤖 cs.AI

Transforming Agency. On the mode of existence of Large Language Models

Il paper sostiene che i Large Language Models, pur non possedendo un'agenzia autonoma secondo le teorie della mente incarnata a causa della mancanza di individualità, normatività e asimmetria interazionale, agiscono come interlocutori linguistici che, attraverso un'incarnazione testuale e computazionale, trasformano radicalmente l'agenzia umana generando forme ibride di "agenzia di mezzo".

Xabier E. Barandiaran, Lola S. Almendros2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

Il paper introduce FALCON, un approccio di preaddestramento auto-supervisionato unificato per il riconoscimento delle azioni dei droni che, integrando la mascheratura orientata agli oggetti e la ricostruzione futura a doppio orizzonte, risolve lo squilibrio spaziale tipico dei video aerei migliorando significativamente l'accuratezza e riducendo i tempi di inferenza rispetto ai metodi supervisionati.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction

Il paper presenta UniHR, un framework di apprendimento di rappresentazioni gerarchiche unificate che integra diversi tipi di fatti (iper-relazionali, temporali e nidificati) in rappresentazioni basate su triple per migliorare la previsione dei link nei grafi di conoscenza complessi.

Zhiqiang Liu, Yin Hua, Mingyang Chen + 4 more2026-03-09💬 cs.CL

SpecFuse: Ensembling Large Language Models via Next-Segment Prediction

Il paper presenta SpecEM, un framework di ensemble per modelli linguistici di grandi dimensioni (LLM) senza addestramento che combina la previsione di segmenti successivi ispirata allo speculative decoding con un meccanismo di feedback online per adattare dinamicamente i pesi dei modelli, ottenendo così prestazioni superiori rispetto ai metodi esistenti su diverse famiglie di LLM e benchmark.

Bo Lv, Nayu Liu, Chen Tang, Xin Liu, Yue Yu, Ping Luo2026-03-09🤖 cs.AI

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Questo sondaggio offre una panoramica strutturata delle tecniche, dei dataset e delle sfide etiche legate all'uso dei modelli linguistici su larga scala per assistere i ricercatori in tutte le fasi del ciclo di vita scientifico, dalla scoperta alla valutazione.

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

Conditioning LLMs to Generate Code-Switched Text

Questo lavoro propone un metodo per addestrare modelli linguistici a generare testi in codice-switching inglese-spagnolo tramite back-translation e fine-tuning, dimostrando che tale approccio produce output fluenti e che le valutazioni basate su LLM si allineano meglio al giudizio umano rispetto alle metriche tradizionali.

Maite Heredia, Gorka Labaka, Jeremy Barnes, Aitor Soroa2026-03-09🤖 cs.AI

Generative Predictive Control: Flow Matching Policies for Dynamic and Difficult-to-Demonstrate Tasks

Questo articolo introduce il controllo predittivo generativo, un framework di apprendimento supervisionato che combina il controllo predittivo basato su campionamento e la modellazione generativa per addestrare politiche di flusso di matching su compiti dinamici difficili da dimostrare, permettendo l'uso di dati simulati e garantendo feedback ad alta frequenza.

Vince Kurtz, Joel W. Burdick2026-03-09🤖 cs.AI

FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching

Il paper introduce FragFM, un nuovo framework gerarchico basato sul flow matching discreto a livello di frammenti che, grazie a un autoencoder da grossolano a fine e a una strategia stocastica, genera molecole in modo efficiente e scalabile con un migliore controllo delle proprietà, validato anche su un nuovo benchmark per prodotti naturali chiamato NPGen.

Joongwon Lee, Seonghwan Kim, Seokhyun Moon, Hyunwoo Kim, Woo Youn Kim2026-03-09🤖 cs.AI

Aligning Compound AI Systems via System-level DPO

Il paper introduce SysDPO, un framework che estende l'ottimizzazione diretta delle preferenze (DPO) per allineare i sistemi di intelligenza artificiale composti a livello di sistema, superando le sfide poste dalle interazioni non differenziabili e dalle preferenze non direttamente trasformabili a livello di componente.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi Koyejo2026-03-09🤖 cs.AI

Adversarial Robustness of Partitioned Quantum Classifiers

Questo studio esamina la robustezza avversaria dei classificatori quantistici partizionati, dimostrando che le perturbazioni mirate alle tecniche di suddivisione dei circuiti (come il taglio dei fili o la teletrasmissione) sono equivalenti all'implementazione di porte avversarie negli strati intermedi e analizzando tale fenomeno sia teoricamente che sperimentalmente.

Pouya Kananian, Hans-Arno Jacobsen2026-03-09⚛️ quant-ph

A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives

Questo articolo offre una panoramica sulla generazione musicale esaminando approcci mono-modali, cross-modali e multi-modali, affrontando sfide attuali come l'integrazione dei dati e la valutazione sistematica, e delineando le direzioni future della ricerca.

Shuyu Li, Shulei Ji, Zihao Wang + 3 more2026-03-09🤖 cs.AI

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

Il paper presenta FindAnything, un framework di mappatura open-vocabulary che integra informazioni visive e linguistiche in sottomappe volumetriche centrate sugli oggetti, consentendo una comprensione semantica efficiente e scalabile in tempo reale anche su dispositivi con risorse limitate come i MAV.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

From Tokenizer Bias to Backbone Capability: A Controlled Study of LLMs for Time Series Forecasting

Questo studio controllato rivela che, sebbene i modelli linguistici di grandi dimensioni (LLM) mostrino una certa promessa per le previsioni delle serie temporali, le loro prestazioni rimangono limitate e non superano costantemente quelle di modelli specificamente addestrati su grandi dataset temporali, specialmente quando si utilizzano coppie di tokenizzatori e detokenizzatori non distorti ottenuti tramite pre-addestramento su larga scala.

Xinyu Zhang, Shanshan Feng, Xutao Li, Kenghong Lin, Fan Li, Pengfei Jia2026-03-09🤖 cs.AI

Position: Stop Anthropomorphizing Intermediate Tokens as Reasoning/Thinking Traces!

Questo articolo di posizione sostiene che l'antropomorfizzazione dei token intermedi generati dai modelli linguistici come "tracce di ragionamento" è un concetto pericoloso che confonde la natura di questi sistemi e porta a ricerche fuorvianti, invitando la comunità a evitare tale terminologia.

Subbarao Kambhampati, Karthik Valmeekam, Siddhant Bhambri, Vardhan Palod, Lucas Saldyt, Kaya Stechly, Soumya Rani Samineni, Durgesh Kalwar, Upasana Biswas2026-03-09🤖 cs.AI

← Precedente Successivo →