cs.CL 件の論文 | Gist.Science

Multimodal Large Language Models for Low-Resource Languages: A Case Study for Basque

本論文は、低リソース言語であるバスク語向けに独自に作成した画像・テキストデータセットを用いて大規模言語モデルを訓練し、バスク語のマルチモーダルデータが少量（約 20%）で十分であり、かつバスク語に特化した指示型 LLM をバックボーンとして必須としないことを示すことで、他の低リソース言語におけるマルチモーダル大規模言語モデルの開発への道を開いたことを報告しています。

Lukas Arana, Julen Etxaniz, Ander Salaberria + 1 more2026-03-05🤖 cs.AI

Dripper: Token-Efficient Main HTML Extraction with a Lightweight LM

本論文は、大規模言語モデルの計算コストと幻覚の問題を解決しつつ、従来のヒューリスティック手法を上回る精度でウェブページから主要コンテンツを抽出するための軽量フレームワーク「Dripper」を提案し、その性能を新ベンチマーク「WebMainBench」で検証するとともに、抽出された高品質データを用いて事前学習されたモデルの優位性を示しています。

Mengjie Liu, Jiahui Peng, Wenchang Ning + 14 more2026-03-05💬 cs.CL

What Triggers my Model? Contrastive Explanations Inform Gender Choices by Translation Models

この論文は、対照的説明を用いて機械翻訳モデルが性別を決定する際にどの入力トークンがトリガーとなるかを分析し、モデルの注目パターンと人間の性別認識の類似性を示すことで、バイアス軽減に向けた新たな洞察を提供する研究です。

Janiça Hackenbuchner, Arda Tezcan, Joke Daems2026-03-05💬 cs.CL

NRR-Core: Non-Resolution Reasoning as a Computational Framework for Contextual Identity and Ambiguity Preservation

この論文は、従来の AI が早期に曖昧さを解消する限界を克服し、文脈依存のアイデンティティと曖昧さの保持を可能にする「非解決推論（NRR）」という新たな計算フレームワークを提案し、その有効性を示すものです。

Kei Saito2026-03-05🤖 cs.AI

A Systematic Analysis of Biases in Large Language Models

本論文は、4 つの主要な大規模言語モデル（LLM）を対象に、政治、イデオロギー、同盟、言語、ジェンダーの各次元におけるバイアスを体系的に分析し、中立性に調整されているにもかかわらず多様なバイアスや親和性が存在することを明らかにした。

Xulang Zhang, Rui Mao, Erik Cambria2026-03-05🤖 cs.AI

Generalization of RLVR Using Causal Reasoning as a Testbed

この論文は、因果推論をテストベッドとして用いた実証研究を通じて、RLVR（検証可能報酬による強化学習）が特定のモデル規模と初期推論能力を持つ場合に、教師あり微調整（SFT）よりも因果推論タスクにおける汎化性能を向上させることを示しています。

Brian Lu, Hongyu Zhao, Shuo Sun + 3 more2026-03-05🤖 cs.AI

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

本論文では、大規模マルチテナント検索システムにおける「ダークデータ」の活用と高コストなモデル更新の課題を解決するため、LLM を活用した完全自動化パイプラインで構築されたベンチマーク「DevRev-Search」を提案し、ドキュメントインデックスを固定したままクエリエンコーダーのみを微調整する「Index-Preserving Adaptation」戦略により、スケーラブルかつ実用的な検索適応を実現することを示しています。

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI

Knowledge Graphs are Implicit Reward Models: Path-Derived Signals Enable Compositional Reasoning

この論文は、知識グラフの経路から導出された報酬信号を用いた強化学習と教師あり微調整を組み合わせることで、専門分野における複雑な多段推論能力を大幅に向上させ、大規模な先行モデルや最先端システムを上回る性能を発揮する新しい学習パラダイムを提案しています。

Yuval Kansal, Niraj K. Jha2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

NRR-Phi: Text-to-State Mapping for Ambiguity Preservation in LLM Inference

本論文は、大規模言語モデルが曖昧な入力に対して早期に解釈を固定してしまう問題を解決するため、複数の解釈を共存させる非収束状態空間へのテキスト変換フレームワーク「NRR-Phi」を提案し、その有効性を検証したものである。

Kei Saito2026-03-05🤖 cs.AI

When Silence Is Golden: Can LLMs Learn to Abstain in Temporal QA and Beyond?

本論文は、Chain-of-Thought による推論と拒絶を考慮した報酬に基づく強化学習を組み合わせることで、LLM に時間的推論における「答えを控える」能力を習得させ、GPT-4o を上回る性能と不確実性の検出能力を達成したことを示す初の実証研究である。

Xinyu Zhou, Chang Jin, Carsten Eickhoff + 2 more2026-03-05🤖 cs.AI

Rewards as Labels: Revisiting RLVR from a Classification Perspective

この論文は、強化学習における報酬をスカラー重みではなくカテゴリラベルとして扱う「REAL」という新しいフレームワークを提案し、勾配の誤割り当てや支配問題を解消することで、数学的推論タスクにおいて既存の GRPO や DAPO などの手法を安定して上回る性能を実現することを示しています。

Zepeng Zhai, Meilin Chen, Jiaxuan Zhao + 3 more2026-03-05🤖 cs.LG

Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding

本論文は、マスクド拡散言語モデルの推論において、確率的に収束したトークン位置の計算を動的にスキップして注意機構のキャッシュを維持する「SureLock」を提案し、LLaDA-8B において生成品質を維持しつつ計算コストを 30〜50% 削減する手法を示しています。

Daisuke Oba, Danushka Bollegala, Masahiro Kaneko + 1 more2026-03-05🤖 cs.LG

To Think or Not To Think, That is The Question for Large Reasoning Models in Theory of Mind Tasks

本論文は、数学やコーディングで優れた推論能力を示す大規模推論モデルが、心の理論（ToM）タスクにおいては必ずしも非推論モデルを上回らず、むしろ思考の過剰や選択肢への依存といった課題に直面していることを実証し、社会推論には既存の推論手法を超えた独自の能力開発が必要であると結論付けています。

Nanxu Gong, Haotian Li, Sixun Dong + 3 more2026-03-05🤖 cs.AI

Meenz bleibt Meenz, but Large Language Models Do Not Speak Its Dialect

この論文は、ドイツのマイツ方言「メエンツェルリッシュ」の保存を目的として同方言初の NLP データセットを構築し、大規模言語モデル（LLM）による方言の定義生成や単語生成の能力を評価した結果、既存の LLM は極めて低い精度しか示さなかったため、ドイツの方言研究へのさらなる資源と取り組みが緊急に必要であることを明らかにしています。

Minh Duc Bui, Manuel Mager, Peter Herbert Kann + 1 more2026-03-05💬 cs.CL

Extending Czech Aspect-Based Sentiment Analysis with Opinion Terms: Dataset and LLM Benchmarks

この論文は、意見語の注釈を含む新しいチェコ語の分野別感情分析データセットを提案し、大規模言語モデルを用いた多言語・翻訳整合アプローチによるベンチマーク評価と低資源言語への適用可能性を検証するものです。

Jakub Šmíd, Pavel Přibáň, Pavel Král2026-03-05💬 cs.CL

Prompt Sensitivity and Answer Consistency of Small Open-Source Large Language Models on Clinical Question Answering: Implications for Low-Resource Healthcare Deployment

低リソース医療環境向けに、5 つのオープンソース小規模言語モデルの臨床質問応答におけるプロンプト感度と回答の一貫性を評価した本研究は、一貫性が高くても正解率が低い「確実に誤る」危険性を指摘し、Llama 3.2 が精度と信頼性のバランスにおいて最も優れていることを示しました。

Shravani Hariprasad2026-03-05🤖 cs.AI

← 前へ次へ →

cs.CL