Circuit Insights: Towards Interpretability Beyond Activations

この論文は、既存の活性化ベースの分析を超えて、学習済み重みから特徴を直接解釈する「WeightLens」と、コンポーネント間の相互作用による回路レベルの動態を捉える「CircuitLens」という 2 つの補完的な手法を提案し、スケーラブルで堅牢な機械的解釈性を実現することを目的としています。

Elena Golimblevskaia, Aakriti Jain, Bruno Puri + 3 more2026-03-05🤖 cs.AI

Composition-Grounded Data Synthesis for Visual Reasoning

この論文は、限られた種子質問を素因に分解・再構成することで合成データを生成し、強化学習を通じてチャートやウェブページなどの人工画像ドメインにおける多モーダル大規模言語モデルの推論能力を飛躍的に向上させる「COGS」というデータ効率型フレームワークを提案しています。

Xinyi Gu, Jiayuan Mao, Zhang-Wei Hong + 5 more2026-03-05🤖 cs.LG

Annotation-Efficient Universal Honesty Alignment

大規模な正解ラベル付けを必要とせず、自己一貫性による安価な指導と少量の正解注釈を組み合わせる二段階フレームワーク「EliCal」を提案し、大規模ベンチマーク「HonestyBench」を用いた実験で、極めて少ない注釈コストで LLM の普遍的な誠実性アライメントを達成できることを示しました。

Shiyu Ni, Keping Bi, Jiafeng Guo + 4 more2026-03-05💬 cs.CL

REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization

本論文は、淘宝の視覚検索システムにおける「クリックなし」リクエストから潜在的なユーザー意図を大規模言語モデルを用いてオフラインで分析・推論し、オンラインで最適化戦略を適応的に実行する新フレームワーク「REVISION」を提案し、クリック率の低下を顕著に改善したことを示しています。

Yiwen Tang, Qiuyu Zhao, Zenghui Sun + 3 more2026-03-05🤖 cs.AI

MuSaG: A Multimodal German Sarcasm Dataset with Full-Modal Annotations

本論文は、テキスト・音声・映像の全モダリティに人間による注釈が施された初のドイツ語多モーダル皮肉検出データセット「MuSaG」を提案し、既存モデルがテキストに依存する一方、人間は会話において音声を重視する傾向があることを示すことで、現実的なシナリオに適したモデル開発の必要性を浮き彫りにしています。

Aaron Scott, Maike Züfle, Jan Niehues2026-03-05🤖 cs.AI

Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

本論文は、多様なエージェントデータ形式を統一する軽量な「エージェントデータプロトコル(ADP)」を提案し、13 のデータセットを統合して大規模ファインチューニングを行うことで、ドメイン固有の調整なしに標準ベンチマークで最先端またはそれに準ずる性能を達成したことを示しています。

Yueqi Song, Ketan Ramaneti, Zaid Sheikh + 18 more2026-03-05🤖 cs.AI

CareMedEval dataset: Evaluating Critical Appraisal and Reasoning in the Biomedical Field

本論文は、フランスの医学部生が使用する本物の試験問題から作成された「CareMedEval」という新規データセットを提案し、大規模言語モデルが科学論文に基づく批判的評価や推論において、特に研究の限界や統計分析に関する質問で依然として高い難易度に直面していることを明らかにしています。

Doria Bonzi, Alexandre Guiggi, Frédéric Béchet + 2 more2026-03-05🤖 cs.AI

Dutch Metaphor Extraction from Cancer Patients' Interviews and Forum Data using LLMs and Human in the Loop

この論文は、がん患者のインタビューとオンラインフォーラムのデータから大規模言語モデル(LLM)と人間の介入を用いてオランダ語のメタファーを抽出し、医療コミュニケーションの改善や個別化されたケアの設計に貢献する「HealthQuote.NL」というコーパスを構築したことを報告しています。

Lifeng Han, David Lindevelt, Sander Puts + 2 more2026-03-05💬 cs.CL

Multimodal Large Language Models for Low-Resource Languages: A Case Study for Basque

本論文は、低リソース言語であるバスク語向けに独自に作成した画像・テキストデータセットを用いて大規模言語モデルを訓練し、バスク語のマルチモーダルデータが少量(約 20%)で十分であり、かつバスク語に特化した指示型 LLM をバックボーンとして必須としないことを示すことで、他の低リソース言語におけるマルチモーダル大規模言語モデルの開発への道を開いたことを報告しています。

Lukas Arana, Julen Etxaniz, Ander Salaberria + 1 more2026-03-05🤖 cs.AI

Dripper: Token-Efficient Main HTML Extraction with a Lightweight LM

本論文は、大規模言語モデルの計算コストと幻覚の問題を解決しつつ、従来のヒューリスティック手法を上回る精度でウェブページから主要コンテンツを抽出するための軽量フレームワーク「Dripper」を提案し、その性能を新ベンチマーク「WebMainBench」で検証するとともに、抽出された高品質データを用いて事前学習されたモデルの優位性を示しています。

Mengjie Liu, Jiahui Peng, Wenchang Ning + 14 more2026-03-05💬 cs.CL

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

本論文では、大規模マルチテナント検索システムにおける「ダークデータ」の活用と高コストなモデル更新の課題を解決するため、LLM を活用した完全自動化パイプラインで構築されたベンチマーク「DevRev-Search」を提案し、ドキュメントインデックスを固定したままクエリエンコーダーのみを微調整する「Index-Preserving Adaptation」戦略により、スケーラブルかつ実用的な検索適応を実現することを示しています。

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI

Knowledge Graphs are Implicit Reward Models: Path-Derived Signals Enable Compositional Reasoning

この論文は、知識グラフの経路から導出された報酬信号を用いた強化学習と教師あり微調整を組み合わせることで、専門分野における複雑な多段推論能力を大幅に向上させ、大規模な先行モデルや最先端システムを上回る性能を発揮する新しい学習パラダイムを提案しています。

Yuval Kansal, Niraj K. Jha2026-03-05✓ Author reviewed 🤖 cs.AI