HateMirage: An Explainable Multi-Dimensional Dataset for Decoding Faux Hate and Subtle Online Abuse

この論文は、誤情報に基づく巧妙なヘイトスピーチの分析を可能にするため、3 つの解釈可能な次元(対象、意図、含意)で注釈付けされた新しい多面的データセット「HateMirage」を提案し、説明可能な AI 研究における新たな基準を確立することを目的としています。

Sai Kartheek Reddy Kasu, Shankar Biradar, Sunil Saumya + 1 more2026-03-04💬 cs.CL

Graph-GRPO: Stabilizing Multi-Agent Topology Learning via Group Relative Policy Optimization

本論文は、LLM ベースのマルチエージェントシステムにおける通信トポロジー学習の不安定さと課題を解決するため、単一サンプルの絶対報酬に代わり、グループ内での相対的な性能に基づいてエッジの優位性を評価する「Graph-GRPO」という新しい最適化フレームワークを提案し、実験によりその有効性を実証したものである。

Yueyang Cang, Xiaoteng Zhang, Erlu Zhao + 7 more2026-03-04💬 cs.CL

From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench

本論文は、LLM の数学指導能力を包括的に評価するための新しいベンチマーク「KMP-Bench」と大規模対話データセット「KMP-Pile」を提案し、最先端モデルが正解導出は得意だが教育的原則の適用に課題を抱えていること、そして教育的に豊かなデータによる微調整が効果的な AI 指導者開発に不可欠であることを示しています。

Weikang Shi, Houxing Ren, Junting Pan + 8 more2026-03-04💬 cs.CL

OCR or Not? Rethinking Document Information Extraction in the MLLMs Era with Real-World Large-Scale Datasets

本論文は、大規模な実世界データセットを用いたベンチマークと自動階層化エラー分析を通じて、強力なマルチモーダル大規模言語モデル(MLLM)は従来の OCR 処理を伴う手法と同等のドキュメント情報抽出性能を画像入力のみで達成し得ることを示し、スキーマや指示の設計がその性能向上に重要であることを明らかにした。

Jiyuan Shen, Peiyue Yuan, Atin Ghosh + 2 more2026-03-04💬 cs.CL

Guideline-Grounded Evidence Accumulation for High-Stakes Agent Verification

この論文は、臨床診断などの高リスク分野における LLM エージェントの判断を検証するために、専門家のガイドラインに基づき証拠を蓄積・集約し、ベイズ回帰で較正された確率を生成する「GLEAN」という検証フレームワークを提案し、その有効性を実証したものである。

Yichi Zhang, Nabeel Seedat, Yinpeng Dong + 3 more2026-03-04💬 cs.CL

The Distribution of Phoneme Frequencies across the World's Languages: Macroscopic and Microscopic Information-Theoretic Models

本論文は、音素頻度分布がマクロ的には対称ディリクレ分布の順序統計量として、ミクロ的には発音・音韻・語彙の制約を組み合わせた最大エントロピーモデルとして説明可能であることを示し、これにより音素頻度構造の統合的な情報理論的記述を提供している。

Fermín Moscoso del Prado Martín, Suchir Salhan2026-03-04💬 cs.CL

Nodes Are Early, Edges Are Late: Probing Diagram Representations in Large Vision-Language Models

大規模視覚言語モデル(LVLM)は、ノードや構造的特徴は視覚エンコーダ内で早期に線形に表現される一方で、エッジ情報は言語モデルのテキストトークン段階まで遅れて現れるため、関係性の理解に課題を抱えていることを、合成図データセットを用いた内部表現の探査により明らかにしました。

Haruto Yoshida, Keito Kudo, Yoichi Aoki + 4 more2026-03-04💬 cs.CL

TikZilla: Scaling Text-to-TikZ with High-Quality Data and Reinforcement Learning

本論文は、高品質で大規模な DaTikZ-V4 データセットと逆グラフィックスに基づく強化学習を活用し、小規模なオープンソースモデル「TikZilla」を開発することで、テキストから高品質な TikZ 図を生成する性能を大幅に向上させ、GPT-5 に匹敵する結果を達成したことを報告しています。

Christian Greisinger, Steffen Eger2026-03-04💬 cs.CL

TAO-Attack: Toward Advanced Optimization-Based Jailbreak Attacks for Large Language Models

本論文は、拒絶応答の抑制と疑似有害出力の回避を目的とした二段階の損失関数、および勾配方向を優先するトークン最適化戦略を導入することで、既存手法を上回る高い攻撃成功率を達成する新しい最適化ベースのジャイルブレイク手法「TAO-Attack」を提案するものである。

Zhi Xu, Jiaqi Li, Xiaotong Zhang + 2 more2026-03-04💬 cs.CL

Compact Prompting in Instruction-tuned LLMs for Joint Argumentative Component Detection

この論文は、指示調整済み大規模言語モデル(LLM)を用いたコンパクトなプロンプト生成アプローチを提案し、従来のセグメンテーションや分類の分離手法ではなく、文章から直接議論的構成要素を検出する生成タスクとして再定義することで、標準ベンチマークにおいて最先端の性能を達成したことを示しています。

Sofiane Elguendouze, Erwan Hain, Elena Cabrio + 1 more2026-03-04💬 cs.CL

Interpreting Speaker Characteristics in the Dimensions of Self-Supervised Speech Features

本論文は、自己教師あり学習による音声モデル(WavLM)の表現において、PCA によって抽出された個々の主成分次元がピッチや性別、強度、ノイズレベルなどの話者特性に対応しており、これら次元を操作することで音声合成における話者特性を制御可能であることを示しています。

Kyle Janse van Rensburg, Benjamin van Niekerk, Herman Kamper2026-03-04⚡ eess