A Causal Graph Approach to Oppositional Narrative Analysis

この論文は、事前定義されたオントロジーやブラックボックスモデルに依存せず、ナラティブをエンティティ相互作用グラフとして表現し、ノードレベルの因果推論を用いて最小因果部分グラフを導出することで、対立的ナラティブの検出・分析・分類を従来手法を上回る精度で行う新しいフレームワークを提案しています。

Diego Revilla, Martin Fernandez-de-Retana, Lingfeng Chen, Aritz Bilbao-Jayo, Miguel Fernandez-de-Retana2026-03-09🤖 cs.AI

CRIMSON: A Clinically-Grounded LLM-Based Metric for Generative Radiology Report Evaluation

本論文は、胸部 X 線レポート生成の評価において、診断の正確性や患者の安全性を重視し、臨床的コンテキストやガイドラインに基づいてエラーの重大度を重み付けする新しいメトリクス「CRIMSON」を提案し、複数のベンチマークで専門医の判断と高い一致を示したことを報告しています。

Mohammed Baharoon, Thibault Heintz, Siavash Raissi, Mahmoud Alabbad, Mona Alhammad, Hassan AlOmaish, Sung Eun Kim, Oishi Banerjee, Pranav Rajpurkar2026-03-09🤖 cs.AI

Wisdom of the AI Crowd (AI-CROWD) for Ground Truth Approximation in Content Analysis: A Research Protocol & Validation Using Eleven Large Language Models

この論文は、大規模なコンテンツ分析における人間による正解ラベル作成の限界を克服するため、複数の大規模言語モデルの集合知を活用して正解の近似値を導き出す「AI-CROWD」プロトコルを提案し、その検証手法を提示するものである。

Luis de-Marcos, Manuel Goyanes, Adrián Domínguez-Díaz2026-03-09💬 cs.CL

LIT-RAGBench: Benchmarking Generator Capabilities of Large Language Models in Retrieval-Augmented Generation

本論文は、RAG における生成モデルの能力を統合的に評価するための新たなベンチマーク「LIT-RAGBench」を提案し、統合、推論、論理、表処理、棄権の 5 つのカテゴリで構成されたデータセットを用いて、既存のモデルが 90% 以下の精度しか達成できない現状を明らかにするとともに、実用的な RAG 導入や専用モデル構築に向けた指標を提供しています。

Koki Itai, Shunichi Hasegawa, Yuta Yamamoto, Gouki Minegishi, Masaki Otsuki2026-03-09💬 cs.CL

FlashPrefill: Instantaneous Pattern Discovery and Thresholding for Ultra-Fast Long-Context Prefilling

本論文は、動的なアテンションパターンの瞬時発見と閾値処理を活用し、ソートや累積のオーバーヘッドを回避することで、長文脈から短文脈まで広範なシーケンス長において極めて高速なプレフィル処理を実現する「FlashPrefill」というフレームワークを提案しています。

Qihang Fan, Huaibo Huang, Zhiying Wu, Juqiu Wang, Bingning Wang, Ran He2026-03-09🤖 cs.AI

SPOT: Span-level Pause-of-Thought for Efficient and Interpretable Latent Reasoning in Large Language Models

この論文は、推論コストを削減しつつ解釈性を維持するために、推論セグメント全体の意味を柔軟に圧縮する「スパンレベルのセマンティックアライメント」と、事前学習済みモデルのヘッドで直接復号可能な「凍結ヘッド制約」を導入した、効率的かつ解釈可能な潜在推論フレームワーク「SPOT」を提案するものです。

Yunlong Chu, Minglai Shao, Yuhang Liu, Bing Hao, Yumeng Lin, Jialu Wang, Ruijie Wang2026-03-09💬 cs.CL

Mind the Gap: Pitfalls of LLM Alignment with Asian Public Opinion

この論文は、大規模言語モデルが英語中心のデータに依存しているため、特に宗教分野においてアジアの多様な世論やマイノリティの視点と乖離し、ネガティブなステレオタイプを増幅する傾向があることを、インド・東アジア・東南アジアを対象とした多言語監査を通じて実証し、軽微な介入ではこの文化的ギャップを解消できないことを示しています。

Hari Shankar, Vedanta S P, Sriharini Margapuri, Debjani Mazumder, Ponnurangam Kumaraguru, Abhijnan Chakraborty2026-03-09💬 cs.CL

The EpisTwin: A Knowledge Graph-Grounded Neuro-Symbolic Architecture for Personal AI

この論文は、ユーザーデータの断片化と非構造化ベクトル検索の限界を克服するため、多様なデータを意味トリプルに変換し、グラフ検索と深視覚的再照合を統合した神経記号アーキテクチャ「EpisTwin」を提案し、信頼性の高いパーソナル AI の実現に向けた新たな方向性を示すものです。

Giovanni Servedio, Potito Aghilar, Alessio Mattiace, Gianni Carmosino, Francesco Musicco, Gabriele Conte, Vito Walter Anelli, Tommaso Di Noia, Francesco Maria Donini2026-03-09🤖 cs.AI

Continual Adaptation for Pacific Indigenous Speech Recognition

本論文は、データ不足と忘却の課題に直面する太平洋先住民言語の音声認識において、低ランク適応(LoRA)などの手法を評価し、逐次学習における内部表現の漂移と安定性・可塑性のジレンマを明らかにするとともに、これらの言語に特化した堅牢な適応戦略の必要性を強調する実証研究である。

Yang Xiao, Aso Mahmudi, Nick Thieberger, Eliathamby Ambikairajah, Eun-Jung Holden, Ting Dang2026-03-09💬 cs.CL

The Art That Poses Back: Assessing AI Pastiches after Contemporary Artworks

この論文は、ルーマニアや英国などからの 12 名の現代美術家が参加した調査を通じて、ChatGPT による作品のパロディ生成が色彩やテクスチャの類似性は示しつつも、構図や概念、意図といった本質的な側面において欠如しており、単なる「言い換え」に留まることを明らかにし、AI 生成芸術の評価には単一の指標ではなく多角的なメトリクスを用いた「スタイル転換ダッシュボード」の導入を提唱しています。

Anca Dinu, Andreiana Mihail, Andra-Maria Florescu, Claudiu Creanga2026-03-09💬 cs.CL

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

本論文は、再帰的自己改善におけるアライメントのドリフトを防止し、コード生成や推論タスクでの性能向上を可能にするため、目標ドリフト指数、制約保持チェック、回帰リスク定量化の 3 つのセーフガードを組み合わせた実用的なフレームワーク「SAHOO」を提案するものである。

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

Transparent AI for Mathematics: Transformer-Based Large Language Models for Mathematical Entity Relationship Extraction with XAI

この論文は、数式テキストからオペランドと演算子の関係を抽出するタスクにトランスフォーマーベースのモデル(特に BERT)を適用し、SHAP による説明可能性を統合することで、99.39% の高精度を達成しつつ透明性を高めた数学的エンティティ関係抽出の解釈可能なフレームワークを提案しています。

Tanjim Taharat Aurpa2026-03-09💬 cs.CL

Evaluation of Deontic Conditional Reasoning in Large Language Models: The Case of Wason's Selection Task

この論文は、新しい義務的モダリティを明示的に符号化したワソン選択課題データセットを用いて大規模言語モデルを評価した結果、人間と同様に義務的ルールにおいて推論能力が高く、一致バイアスに似た誤りパターンを示すことを明らかにしました。

Hirohiko Abe, Kentaro Ozeki, Risako Ando, Takanobu Morishita, Koji Mineshima, Mitsuhiro Okada2026-03-09💬 cs.CL

From Prompting to Preference Optimization: A Comparative Study of LLM-based Automated Essay Scoring

この論文は、IELTS 英作文の自動採点において、エンコーダー微調整、プロンプティング、指示微調整、RAG、DPO などの主要な LLM ベースのアプローチを包括的に比較し、k-SFT と RAG を統合した構成が 93% の F1 スコアを達成して最も優れた性能を示すことを実証しています。

Minh Hoang Nguyen, Vu Hoang Pham, Xuan Thanh Huynh, Phuc Hong Mai, Vinh The Nguyen, Quang Nhut Huynh, Huy Tien Nguyen, Tung Le2026-03-09💬 cs.CL

Abductive Reasoning with Syllogistic Forms in Large Language Models

本論文は、大規模言語モデル(LLM)が演繹だけでなく帰納的推論(アブダクション)においても人間と同様のバイアスを示すかどうかを、三段論法形式のデータセットを変換して検証し、文脈に即した推論の重要性を明らかにするものである。

Hirohiko Abe, Risako Ando, Takanobu Morishita Kentaro Ozeki, Koji Mineshima, Mitsuhiro Okada2026-03-09🤖 cs.AI

PONTE: Personalized Orchestration for Natural Language Trustworthy Explanations

この論文は、ユーザーの専門性や目標に応じた信頼性の高い説明を生成するために、LLM のハルシネーションを防ぎつつフィードバックループで個人化を実現する XAI 枠組み「PONTE」を提案し、医療・金融分野での評価でその有効性を示したものである。

Vittoria Vineis, Matteo Silvestri, Lorenzo Antonelli, Filippo Betello, Gabriele Tolomei2026-03-09🤖 cs.AI