cs.CL articoli | Gist.Science

Analyzing the Performance of ChatGPT in Cardiology and Vascular Pathologies

Lo studio analizza le prestazioni di ChatGPT in cardiologia e patologie vascolari, dimostrando che il modello ha superato due studenti di medicina nel rispondere correttamente a un set di 190 domande a scelta multipla, ottenendo un punteggio del 92,10%.

Walid Hariri2026-03-09💬 cs.CL

The Generative AI Paradox on Evaluation: What It Can Solve, It May Not Evaluate

Questo studio dimostra che, nonostante l'eccellenza nella generazione, i modelli linguistici di grandi dimensioni (LLM) mostrano prestazioni inferiori e inaffidabili nei compiti di valutazione, rivelando un "paradosso" che richiede una maggiore attenzione alla loro affidabilità come giudici.

Juhyun Oh, Eunsu Kim, Inha Cha, Alice Oh2026-03-09💻 cs

Sentiment Analysis of Citations in Scientific Articles Using ChatGPT: Identifying Potential Biases and Conflicts of Interest

Questo studio presenta l'uso innovativo di ChatGPT per analizzare il sentiment delle citazioni negli articoli scientifici, al fine di identificare potenziali bias e conflitti di interesse e migliorare l'integrità della valutazione della letteratura accademica.

Walid Hariri2026-03-09💬 cs.CL

Computational lexical analysis of Flamenco genres

Questo studio presenta un'analisi computazionale di oltre 2000 testi di flamenco utilizzando l'elaborazione del linguaggio naturale e l'apprendimento automatico per classificare i generi musicali (palos), identificare i loro campi semantici caratteristici e rivelare connessioni storiche ed evolutive attraverso l'analisi di rete delle distanze inter-genere.

Pablo Rosillo-Rodes, Maxi San Miguel, David Sanchez2026-03-09💬 cs.CL

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Questo articolo presenta un innovativo pipeline di apprendimento attivo a due stadi per il riconoscimento automatico del parlato che combina il clustering degli x-vector per la diversità dei campioni e un metodo bayesiano basato sul dropout Monte Carlo per l'incertezza, ottimizzando significativamente l'efficienza del labeling e le prestazioni del modello.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

Transforming Agency. On the mode of existence of Large Language Models

Il paper sostiene che i Large Language Models, pur non possedendo un'agenzia autonoma secondo le teorie della mente incarnata a causa della mancanza di individualità, normatività e asimmetria interazionale, agiscono come interlocutori linguistici che, attraverso un'incarnazione testuale e computazionale, trasformano radicalmente l'agenzia umana generando forme ibride di "agenzia di mezzo".

Xabier E. Barandiaran, Lola S. Almendros2026-03-09🤖 cs.AI

Do Prevalent Bias Metrics Capture Allocational Harms from LLMs?

Lo studio dimostra che le metriche di bias attualmente utilizzate non riescono a catturare in modo affidabile i danni allocativi derivanti dalle previsioni dei grandi modelli linguistici, evidenziando la necessità di considerare come tali previsioni influenzino le decisioni reali nell'assegnazione di risorse limitate.

Hannah Cyberey, Yangfeng Ji, David Evans2026-03-09💬 cs.CL

Goldfish: Monolingual Language Models for 350 Languages

Il paper introduce Goldfish, una suite di oltre 1.000 piccoli modelli linguistici monolingue addestrati su 350 lingue che, nonostante le dimensioni ridotte, superano i grandi modelli multilingue nella generazione grammaticale e nella perplessoità, offrendo per la prima volta risorse monolingue pubbliche per 215 di queste lingue.

Tyler A. Chang, Catherine Arnett, Zhuowen Tu, Benjamin K. Bergen2026-03-09💬 cs.CL

UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction

Il paper presenta UniHR, un framework di apprendimento di rappresentazioni gerarchiche unificate che integra diversi tipi di fatti (iper-relazionali, temporali e nidificati) in rappresentazioni basate su triple per migliorare la previsione dei link nei grafi di conoscenza complessi.

Zhiqiang Liu, Yin Hua, Mingyang Chen + 4 more2026-03-09💬 cs.CL

Towards Resource Efficient and Interpretable Bias Mitigation in Large Language Models

Questo articolo propone un metodo efficiente e interpretabile per mitigare i pregiudizi nei grandi modelli linguistici, utilizzando piccoli modelli esperti per generare un segnale di debiasing aggiunto durante la decodifica, riducendo così i bias legati a genere, razza e religione senza compromettere le prestazioni del modello.

Schrasing Tong, Eliott Zemour, Jessica Lu, Rawisara Lohanimit, Lalana Kagal2026-03-09💬 cs.CL

SpecFuse: Ensembling Large Language Models via Next-Segment Prediction

Il paper presenta SpecEM, un framework di ensemble per modelli linguistici di grandi dimensioni (LLM) senza addestramento che combina la previsione di segmenti successivi ispirata allo speculative decoding con un meccanismo di feedback online per adattare dinamicamente i pesi dei modelli, ottenendo così prestazioni superiori rispetto ai metodi esistenti su diverse famiglie di LLM e benchmark.

Bo Lv, Nayu Liu, Chen Tang, Xin Liu, Yue Yu, Ping Luo2026-03-09🤖 cs.AI

Rethinking the Mixture of Vision Encoders Paradigm for Enhanced Visual Understanding in Multimodal LLMs

Il paper presenta LEO, un'architettura semplice ed efficace che ottimizza la fusione di diversi encoder visivi tramite un approccio leggero basato su proiezioni indipendenti e intercalamento di sequenze, ottenendo prestazioni superiori su numerosi benchmark e una forte capacità di generalizzazione nel dominio della guida autonoma.

Mozhgan Nasr Azadani, James Riddell, Sean Sedwards, Krzysztof Czarnecki2026-03-09💬 cs.CL

Who is the root in a syntactic dependency structure?

Questo articolo dimostra che l'individuazione della radice in una struttura di dipendenza sintattica può essere efficacemente risolta applicando un insieme di misure di centralità, in particolare quelle basate sulla posizione dei vertici e dei loro vicini, confermando l'ipotesi che la radice corrisponda a un nodo centrale nella rete.

Ramon Ferrer-i-Cancho, Marta Arias2026-03-09💬 cs.CL

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Questo sondaggio offre una panoramica strutturata delle tecniche, dei dataset e delle sfide etiche legate all'uso dei modelli linguistici su larga scala per assistere i ricercatori in tutte le fasi del ciclo di vita scientifico, dalla scoperta alla valutazione.

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

Conditioning LLMs to Generate Code-Switched Text

Questo lavoro propone un metodo per addestrare modelli linguistici a generare testi in codice-switching inglese-spagnolo tramite back-translation e fine-tuning, dimostrando che tale approccio produce output fluenti e che le valutazioni basate su LLM si allineano meglio al giudizio umano rispetto alle metriche tradizionali.

Maite Heredia, Gorka Labaka, Jeremy Barnes, Aitor Soroa2026-03-09🤖 cs.AI

CAReDiO: Cultural Alignment via Representativeness and Distinctiveness Guided Data Optimization

Il paper introduce CAReDiO, un innovativo framework di ottimizzazione dei dati che, massimizzando la rappresentatività e la distintività culturale attraverso obiettivi teorico-informativi, permette di allineare efficientemente modelli linguistici a 15 diverse culture utilizzando un numero ridotto di campioni di addestramento.

Jing Yao, Xiaoyuan Yi, Jindong Wang, Zhicheng Dou, Xing Xie2026-03-09💬 cs.CL

RM-R1: Reward Modeling as Reasoning

Il paper introduce i Reasoning Reward Models (ReasRMs), in particolare la famiglia RM-R1, che trasformano la modellazione delle ricompense in un compito di ragionamento tramite un meccanismo di "catena di rubriche" e un addestramento su due fasi, ottenendo prestazioni superiori rispetto a modelli proprietari e open-weight più grandi su diversi benchmark.

Xiusi Chen, Gaotang Li, Ziqi Wang, Bowen Jin, Cheng Qian, Yu Wang, Hongru Wang, Yu Zhang, Denghui Zhang, Tong Zhang, Hanghang Tong, Heng Ji2026-03-09🤖 cs.AI

Maximizing Asynchronicity in Event-based Neural Networks

Il paper presenta EVA, un nuovo framework di apprendimento asincrono che, ispirandosi alla modellazione linguistica, genera caratteristiche evento-per-evento altamente espressive superando i metodi precedenti sia in compiti di riconoscimento che di rilevamento.

Haiqing Hao, Nikola Zubic, Weihua He, Zhipeng Sui, Davide Scaramuzza, Wenhui Wang2026-03-09🤖 cs.AI

Mitigating Content Effects on Reasoning in Language Models through Fine-Grained Activation Steering

Questo articolo propone K-CAST, un metodo di steering delle attivazioni basato su kNN che mitiga dinamicamente i bias di contenuto nei modelli linguistici, migliorando significativamente la loro accuratezza nel ragionamento formale senza compromettere le capacità linguistiche multilingue.

Marco Valentino, Geonhee Kim, Dhairya Dalal, Zhixue Zhao, André Freitas2026-03-09🤖 cs.AI

AdAEM: An Adaptively and Automated Extensible Measurement of LLMs' Value Difference

Il paper introduce AdAEM, un algoritmo di valutazione auto-estensibile che genera dinamicamente domande di test per rivelare in modo più informativo e distinguibile le differenze di valori tra i modelli linguistici su larga scala, superando i limiti delle metriche statiche attuali.

Jing Yao, Shitong Duan, Xiaoyuan Yi, Dongkuan Xu, Peng Zhang, Tun Lu, Ning Gu, Zhicheng Dou, Xing Xie2026-03-09🤖 cs.AI

← Precedente Successivo →