Knowledge Graphs are Implicit Reward Models: Path-Derived Signals Enable Compositional Reasoning

Questo lavoro propone un paradigma di apprendimento post-addestramento in cui i grafi di conoscenza fungono da modelli di ricompensa impliciti, permettendo a un modello da 14B di eccellere nel ragionamento compositivo multi-hop in ambito medico e superare sistemi frontieri molto più grandi grazie a segnali di ricompensa derivati dai percorsi che favoriscono la composizione di assiomi intermedi.

Yuval Kansal, Niraj K. Jha2026-03-05✓ Author reviewed 🤖 cs.AI

To Think or Not To Think, That is The Question for Large Reasoning Models in Theory of Mind Tasks

Questo studio dimostra che i modelli di ragionamento avanzati (LRM) non migliorano necessariamente le prestazioni nei compiti di Teoria della Mente rispetto ai modelli non ragionanti, rivelando invece tendenze al collasso del ragionamento prolungato, alla dipendenza da scorciatoie di abbinamento delle opzioni e la necessità di strategie adattive e specifiche per il ragionamento sociale.

Nanxu Gong, Haotian Li, Sixun Dong + 3 more2026-03-05🤖 cs.AI

Prompt Sensitivity and Answer Consistency of Small Open-Source Large Language Models on Clinical Question Answering: Implications for Low-Resource Healthcare Deployment

Lo studio evidenzia che, per l'implementazione clinica in contesti a risorse limitate, i modelli open-source di piccole dimensioni come Llama 3.2 offrono il miglior compromesso tra accuratezza e coerenza, dimostrando al contempo che un'elevata coerenza nelle risposte non garantisce la correttezza e che il pre-addestramento settoriale da solo è insufficiente senza un'adeguata istruzione.

Shravani Hariprasad2026-03-05🤖 cs.AI

From Variance to Invariance: Qualitative Content Analysis for Narrative Graph Annotation

Questo lavoro presenta un framework di annotazione basato su grafi per le narrazioni economiche che integra l'analisi qualitativa dei contenuti per ridurre gli errori, dimostrando attraverso un esperimento fattoriale che le rappresentazioni localmente vincolate e le metriche di distanza appropriate migliorano l'accordo tra annotatori e la gestione della variazione umana nell'etichettatura.

Junbo Huang, Max Weinig, Ulrich Fritsche + 1 more2026-03-05🤖 cs.AI

Learning to Generate and Extract: A Multi-Agent Collaboration Framework For Zero-shot Document-level Event Arguments Extraction

Il paper propone un framework di collaborazione multi-agente basato sul processo "Proposta-Valutazione-Rivisione" e sull'apprendimento per rinforzo per migliorare l'estrazione degli argomenti degli eventi a livello di documento in scenari zero-shot, superando i limiti dei metodi attuali nella generazione e valutazione di dati sintetici.

Guangjun Zhang, Hu Zhang, Yazhou Han + 4 more2026-03-05🤖 cs.AI