Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

この論文は、リソースが限られたインド諸語の機械翻訳における品質推定(QE)の課題を解決するため、閉鎖型および開放型の大規模言語モデル(LLM)を対象にプロンプト手法を比較し、中間層への低ランク適応(ALOPE および LoRMA)を導入することで、特に高リスク領域において頑健な品質推定を実現する方法を提案し、関連データとコードを公開したことを報告しています。

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

本論文は、自律的な意思決定システムとしてのアージェント型 RAG を初めて統一的に定式化し、その分類体系・アーキテクチャ・評価手法の課題を体系的に整理するとともに、信頼性の高い大規模システム構築に向けた将来の研究方向性を提示する包括的な知見の体系化(SoK)論文である。

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Sparsity and Out-of-Distribution Generalization

この論文は、世界が区別された特徴を通じて提示され、オッカムの剃刀によって特徴数が少ない「疎な」仮説が選好されるという前提に基づき、訓練分布とテスト分布が関連特徴上で十分に重なり合っていれば、疎な仮説が分布外(OOD)でも一般化することを証明し、従来のサンプル複雑性の境界を OOD 文脈に拡張する原理的な枠組みを提案しています。

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

AQuA: Toward Strategic Response Generation for Ambiguous Visual Questions

本論文は、曖昧な視覚質問に対する戦略的な応答生成を可能にするため、曖昧さのレベルと最適な対応戦略を分類した新しいデータセット「AQuA」を提案し、これを用いて微調整された視覚言語モデルが曖昧さを認識し、不確実性を管理して文脈に適した戦略で応答する能力を実証したものです。

Jihyoung Jang, Hyounghun Kim2026-03-10💬 cs.CL

Adaptive Capacity Allocation for Vision Language Action Fine-tuning

この論文は、視覚言語行動モデル(VLA)の微調整において、タスクや環境に応じて適応的に容量を割り当てる新しい手法「LoRA-SP」を提案し、従来の固定ランクの LoRA やフル微調整と比較して、より少ない学習パラメータで高い汎化性能と多タスク成功率を実現することを示しています。

Donghoon Kim, Minji Bae, Unghui Nam, Gyeonghun Kim, Suyun Lee, Kyuhong Shim, Byonghyo Shim2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

既存の万能画像復元モデルが複数の劣化を同時に学習する際に発生する干渉と忘却の問題を解決するため、専門的なエキスパートを組み合わせるマルチブランチの混合エキスパートアーキテクチャを採用し、大規模かつ制御可能な万能画像復元を実現する「UnSCAR」を提案する。

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

本論文は、2012 年から 2025 年の 300 件の研究を分析し、機械学習が水中通信の物理層から応用層までの各層で性能を大幅に向上させ、エネルギー効率やスループットを改善する一方で、データ不足や計算制約といった実用化の課題と今後の展望を包括的に解説するチュートリアル調査である。

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

この論文は、継続学習における「文脈チャネル容量」という情報理論的枠組みを提唱し、パラメータを状態ではなく関数値として再定義する条件付き再生アーキテクチャ(ハイパーネットワーク)が、忘却をゼロにするための必要条件を満たすことを示すことで、忘却のメカニズムを統一的に説明し、アーキテクチャ設計の重要性を強調しています。

Ran Cheng2026-03-10🤖 cs.LG

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

この論文は、事前予約された乗客の要請に対して即座に受諾可否を確定しつつ、後続の最適化によって全受諾要請の確実な運行を保証する新たな動的車両経路問題の定式化と、強化学習を用いた非近視的目的関数を組み合わせた新規アルゴリズムを提案し、実世界のマイクロトランジットデータを用いた評価で既存手法を上回る要請受諾数を達成したことを示しています。

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

LLM の論理と物語を分離し、実行可能なコードで状態を確定的に管理することで論理の幻覚を抑制しつつ、70 のシナリオと 9 つの最先端モデルを用いた評価により、圧力下でのリスク急増やモデル強度に応じた多様なミスマッチパターンなど、自律エージェントの潜在的なリスクを浮き彫りにする「AutoControl Arena」という自動評価フレームワークを提案しています。

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

本論文は、潜在交絡因子に起因する相関的学習の限界を克服し、ニューラル制御関数を用いてトランスフォーマーの隠れ状態に操作変数推定を直接組み込むことで、分布外での頑健な因果的時系列モデルを実現する「OrthoFormer」を提案し、その理論的保証と実験的有効性を示すものである。

Charles Luo2026-03-10🤖 cs.LG

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

この論文は、規制上のストレステストにおける信用損失の予測を、推定不確実性と交絡不確実性を明確に分離する因果パネル予測フレームワークとして再定義し、連続的なマクロ経路の対比、交絡の限界下での同定集合の特定、予測誤差の増幅要因の理論的保証、および外挿コストを定量化する適合性バンドによる不確実性の分解を実現する手法を提案しています。

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

HLER: Human-in-the-Loop Economic Research via Multi-Agent Pipelines for Empirical Discovery

LLM を活用した経済学研究の自動化において、人間の監督を維持しつつ、データセットの制約を考慮した仮説生成や多段階のレビューループを通じて、実現可能な実証研究を低コストで効率的に生み出す「HLER」というマルチエージェント・アーキテクチャを提案し、その有効性を検証した論文です。

Chen Zhu, Xiaolu Wang2026-03-10💻 cs

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

本論文は、異なる SQL 方言を持つ多様なデータベースシステムに対応し、構文と意味の両面で正確なクエリ生成を実現するために、方言認識論理クエリ計画モジュール、階層的意図認識知識ベース、および実行駆動型デバッグループを導入した「Dial」という知識基盤型 NL2SQL 枠組みを提案し、新しいベンチマーク DS-NL2SQL による実験で最先端手法を上回る性能を示したものである。

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

本論文は、機械学習モデルのセキュリティ脅威として従来研究されてきたバックドア機構を、安全性や制御性を高める「有益なバックドア」として再定義し、LLM におけるその信頼性向上への応用を評価する統一ベンチマーク「Backdoor4Good (B4G)」を提案するものである。

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

この論文は、フリーランス労働者が AI 使用を「許可を求めるより事後の許しを得る」姿勢で受動的に扱う一方、クライアントはそれを検知できず能動的開示を望むという認識の隔たりと、不明確なクライアント方針が期待の誤解を招いていることを実証し、AI 利用における信頼と責任の明確なガイドラインの必要性を提言している。

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

この論文は、大規模言語モデル(LLM)を安全なワークフローに統合する際のリスクを評価・対処するために、システムモデリングと攻撃防御木、CVSS を組み合わせた目標指向のリスク評価フレームワークを提案し、医療分野の事例研究を通じてその有効性を示しています。

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

この論文は、アテンションとフィードフォワードをそれぞれ異なるストリームで処理する「デュアルストリームトランスフォーマー」を提案し、ヘッド間の混合戦略を調整することで解釈性と性能のトレードオフを明示的に制御可能にしつつ、注意機構の増幅に対する頑健性を示したものである。

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG