Measuring Complexity at the Requirements Stage: Spectral Metrics as Development Effort Predictors

Questo studio dimostra che le metriche spettrali estratte da reti strutturali di requisiti testuali, validate attraverso un esperimento con integrazioni molecolari, prevedono con elevata accuratezza lo sforzo di integrazione, colmando un divario metodologico tra l'analisi della complessità architetturale e l'ingegneria dei requisiti.

Maximilian Vierlboeck, Antonio Pugliese, Roshanak Nilchian, Paul Grogan, Rashika Sugganahalli Natesh Babu2026-03-10💬 cs.CL

Discovering Semantic Latent Structures in Psychological Scales: A Response-Free Pathway to Efficient Simplification

Questo articolo presenta un framework di modellazione tematica che utilizza le incorporazioni semantiche contestuali per semplificare le scale psicologiche senza richiedere dati di risposta, riducendo la lunghezza degli strumenti del 60,5% in media pur mantenendo la validità psicometrica e la coerenza strutturale.

Bo Wang, Yuxuan Zhang, Yueqin Hu, Hanchao Hou, Kaiping Peng, Shiguang Ni2026-03-10🤖 cs.LG

Towards interpretable models for language proficiency assessment: Predicting the CEFR level of Estonian learner texts

Questo studio presenta un modello di machine learning interpretabile che, utilizzando caratteristiche linguistiche selezionate, classifica con alta accuratezza i testi scritti da apprendenti dell'estone secondo il livello CEFR, offrendo allo stesso tempo approfondimenti sull'evoluzione della complessità linguistica e integrando tali risultati in un ambiente open-source per l'apprendimento delle lingue.

Kais Allkivi2026-03-10💬 cs.CL

Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion

Il paper presenta CogitoRAG, un framework RAG ispirato alla memoria episodica umana che, attraverso l'estrazione di "gist" semantici, la costruzione di un grafo della conoscenza multidimensionale e un meccanismo di diffusione semantica globale, supera i limiti delle rappresentazioni testuali discrete per migliorare significativamente l'integrazione della conoscenza e il ragionamento rispetto ai metodi RAG esistenti.

Pengcheng Zhou, Haochen Li, Zhiqiang Nie, JiaLe Chen, Qing Gong, Weizhen Zhang, Chun Yu2026-03-10💬 cs.CL

Condition-Gated Reasoning for Context-Dependent Biomedical Question Answering

Il paper introduce CondMedQA, il primo benchmark per la risposta condizionata alle domande biomediche, e CGR, un nuovo framework che migliora il ragionamento medico modellando esplicitamente le condizioni specifiche del paziente per selezionare le conoscenze appropriate.

Jash Rajesh Parekh, Wonbin Kweon, Joey Chan, Rezarta Islamaj, Robert Leaman, Pengcheng Jiang, Chih-Hsuan Wei, Zhizheng Wang, Zhiyong Lu, Jiawei Han2026-03-10💬 cs.CL

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

Il paper introduce MrBERT, una famiglia di encoder multilingue basata sull'architettura ModernBERT e pre-addestrata su 35 lingue, che combina prestazioni di punta in domini specifici e linguaggi locali con l'efficienza operativa grazie all'apprendimento di rappresentazioni Matryoshka (MRL).

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta Villegas2026-03-10🤖 cs.LG

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

Questo studio presenta un framework di previsione conforme che garantisce coperture finite per l'estrazione di entità mediche basata su LLM, rivelando come la calibrazione dipenda dal dominio clinico e dimostrando che l'adattamento specifico del settore permette di raggiungere un'affidabilità superiore al 90% sia su documenti strutturati che su rapporti radiologici liberi.

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL