cs.CL articoli | Gist.Science

HumanLM: Simulating Users with State Alignment Beats Response Imitation

Il paper propone HumanLM, un nuovo framework di addestramento che supera la semplice imitazione linguistica allineando gli stati latenti psicologici dei modelli con le risposte reali degli utenti, ottenendo risultati superiori rispetto ai metodi esistenti sia su un ampio benchmark (Humanual) che in uno studio con partecipanti umani.

Shirley Wu, Evelyn Choi, Arpandeep Khatua + 7 more2026-03-05🤖 cs.AI

Draft-Conditioned Constrained Decoding for Structured Generation in LLMs

Il paper propone la Draft-Conditioned Constrained Decoding (DCCD), un metodo di inferenza senza addestramento che separa la pianificazione semantica dal vincolo strutturale tramite una generazione preliminare libera, migliorando significativamente l'accuratezza nella generazione di output strutturati e l'efficienza parametrica rispetto alle tecniche di decodifica vincolata tradizionali.

Avinash Reddy, Thayne T. Walker, James S. Ide + 1 more2026-03-05🤖 cs.AI

Token-Oriented Object Notation vs JSON: A Benchmark of Plain and Constrained Decoding Generation

Lo studio dimostra che, sebbene TOON offra un potenziale risparmio di token significativo per strutture complesse, il suo vantaggio è spesso annullato dall'overhead del prompt e che la generazione JSON standard, anche senza vincoli, mantiene attualmente la migliore accuratezza e un rapporto efficienza-affidabilità superiore rispetto all'apprendimento in contesto one-shot di TOON.

Ivan Matveev2026-03-05🤖 cs.AI

TopicENA: Enabling Epistemic Network Analysis at Scale through Automated Topic-Based Coding

Il paper introduce TopicENA, un framework che integra BERTopic con l'Analisi delle Reti Epistemiche (ENA) per automatizzare la codifica dei concetti e abilitare l'analisi strutturale su larga scala, fornendo inoltre linee guida pratiche sulla granularità dei topic e sulle soglie di inclusione per ottimizzare i risultati.

Owen H. T. Lu, Tiffany T. Y. Hsu2026-03-05🤖 cs.AI

Old Habits Die Hard: How Conversational History Geometrically Traps LLMs

Il paper introduce il framework History-Echoes per dimostrare come la storia conversazionale intrappoli geometricamente i grandi modelli linguistici, creando un forte legame tra la persistenza comportamentale e la coerenza delle rappresentazioni latenti.

Adi Simhi, Fazl Barez, Martin Tutek + 2 more2026-03-05🤖 cs.AI

Combating data scarcity in recommendation services: Integrating cognitive types of VARK and neural network technologies (LLM)

Questa ricerca propone un framework ibrido che integra modelli linguistici di grandi dimensioni (LLM) e il profilo cognitivo VARK per superare il problema del cold start nei sistemi di raccomandazione, generando suggerimenti personalizzati e spiegabili anche in assenza di dati storici sugli utenti.

Nikita Zmanovskii2026-03-05💬 cs.CL

Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention

Il paper propone un nuovo paradigma di inferenza per i grandi modelli linguistici, denominato "inferenza a tempo entropico", che sostituisce la progressione lineare dei token con un flusso guidato dall'incertezza, integrando pianificazione, sparsificazione dell'attenzione e controllo adattivo della temperatura in un unico obiettivo termodinamico per ottimizzare l'allocazione delle risorse computazionali.

Andrew Kiruluta2026-03-05🤖 cs.LG

The Logovista English-Japanese Machine Translation System

Questo documento descrive l'architettura, le pratiche di sviluppo e gli artefatti preservati del sistema di traduzione automatica Logovista inglese-giapponese, un sistema basato su regole che è stato commercializzato e mantenuto con successo dal 1990 fino al 2012, fungendo da registro tecnico e storico della sua evoluzione pratica.

Barton D. Wright2026-03-05💬 cs.CL

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

Il paper presenta SemKey, un nuovo framework che supera i limiti delle attuali tecniche di decodifica EEG-testo, come il bias semantico e l'inganno delle metriche BLEU, integrando obiettivi semantici disaccoppiati e un meccanismo di attenzione guidato dai segnali neurali per garantire una generazione di testo fedele e priva di allucinazioni.

Yuchen Wang, Haonan Wang, Yu Guo + 2 more2026-03-05🤖 cs.AI

How does fine-tuning improve sensorimotor representations in large language models?

Lo studio dimostra che il fine-tuning su compiti specifici può colmare il divario di incarnazione nei grandi modelli linguistici, allineando le loro rappresentazioni interne all'esperienza sensorimotoria umana, sebbene tale miglioramento sia sensibile all'obiettivo di apprendimento e non si trasferisca tra formati di compito disparati.

Minghua Wu, Javier Conde, Pedro Reviriego + 1 more2026-03-05🤖 cs.AI

Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO

Il paper propone CoIPO, un metodo basato sull'apprendimento contrastivo e l'ottimizzazione diretta delle preferenze inversa che migliora la robustezza intrinseca dei grandi modelli linguistici al rumore nei prompt, superando i metodi esistenti grazie a un nuovo benchmark e dataset appositamente creati.

Xin Yang, Letian Li, Abudukelimu Wuerkaixi + 5 more2026-03-05🤖 cs.AI

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

Il paper presenta M-QUEST, un framework semantico e un benchmark di 609 coppie domanda-risposta su 307 meme, progettati per valutare la capacità dei modelli linguistici di interpretare la tossicità e il significato multimodale dei meme attraverso l'analisi di dimensioni specifiche e il ragionamento di senso comune.

Stefano De Giorgis, Ting-Chih Chen, Filip Ilievski2026-03-05🤖 cs.AI

The Influence of Iconicity in Transfer Learning for Sign Language Recognition

Questo studio dimostra che il trasferimento di apprendimento basato sull'iconicità tra lingue dei segni diverse (cinese-arabo e greco-fiammingo) migliora le prestazioni del riconoscimento, ottenendo incrementi rispettivamente del 7,02% e dell'1,07% grazie all'uso di Google MediaPipe, un MLP e un'unità ricorrente a cancellazione controllata.

Keren Artiaga, Conor Lynch, Haithem Afli + 1 more2026-03-05🤖 cs.AI

Retcon -- a Prompt-Based Technique for Precise Control of LLMs in Conversations

Questo articolo presenta Retcon, una tecnica di prompting con pochi esempi progettata per garantire un controllo preciso a livello di turno nelle conversazioni con i modelli linguistici su larga scala, dimostrando prestazioni superiori rispetto ai metodi zero-shot e few-shot tradizionali.

David Kogan, Sam Nguyen, Masanori Suzuki + 1 more2026-03-05💬 cs.CL

Quantum-Inspired Self-Attention in a Large Language Model

Il paper propone l'integrazione di un meccanismo di auto-attenzione ispirato alla meccanica quantistica (QISA) nel modello linguistico autoregressivo GPT-1, dimostrando che, pur richiedendo un tempo di inferenza leggermente superiore, questo approccio supera significativamente l'auto-attenzione standard riducendo drasticamente il tasso di errore sui caratteri, sulle parole e la perdita di entropia incrociata.

Nikita Kuznetsov, Niyaz Ismagilov, Ernesto Campos2026-03-05⚛️ quant-ph

Automated Concept Discovery for LLM-as-a-Judge Preference Analysis

Questo studio propone un metodo automatizzato basato su autoencoder sparsi per scoprire concetti latenti nei giudizi dei modelli linguistici, rivelando bias sistematici rispetto alle valutazioni umane e permettendo un'analisi approfondita delle preferenze degli LLM senza dipendere da tassonomie predefinite.

James Wedgwood, Chhavi Yadav, Virginia Smith2026-03-05🤖 cs.AI

From We to Me: Theory Informed Narrative Shift with Abductive Reasoning

Questo articolo presenta un approccio neurosimbolico basato sulla teoria delle scienze sociali e sul ragionamento abduttivo che, estraendo automaticamente regole per guidare i modelli linguistici, riesce a trasformare con successo i testi da una narrativa collettivista a una individualista (e viceversa) mantenendo una fedeltà semantica superiore rispetto ai metodi zero-shot.

Jaikrishna Manojkumar Patil, Divyagna Bavikadi, Kaustuv Mukherji + 5 more2026-03-05🤖 cs.AI

DIALEVAL: Automated Type-Theoretic Evaluation of LLM Instruction Following

Il paper presenta DIALEVAL, un framework basato sulla teoria dei tipi che utilizza agenti LLM duali per automatizzare la valutazione del rispetto delle istruzioni, ottenendo un'accuratezza del 90,38% e una correlazione superiore con il giudizio umano rispetto ai metodi esistenti.

Nardine Basta, Dali Kaafar2026-03-05🤖 cs.AI

Can Large Language Models Derive New Knowledge? A Dynamic Benchmark for Biological Knowledge Discovery

Il paper presenta DBench-Bio, un benchmark dinamico e automatizzato che supera i limiti delle valutazioni statiche per misurare la capacità dei modelli linguistici di scoprire nuove conoscenze biologiche attraverso un processo mensile di aggiornamento basato su abstract scientifici autorevoli.

Chaoqun Yang, Xinyu Lin, Shulin Li + 4 more2026-03-05🤖 cs.AI

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

Il paper introduce DCR, un metodo di allineamento basato sulla raffinazione contrastiva che riduce il rifiuto eccessivo nei modelli linguistici migliorando la loro capacità di distinguere tra contenuti realmente tossici e quelli apparentemente tossici, preservando al contempo la sicurezza e le capacità generali.

Yuxiao Lu, Lin Xu, Yang Sun + 2 more2026-03-05🤖 cs.AI

← Precedente Successivo →