Scaling Self-Supervised Speech Models Uncovers Deep Linguistic Relationships: Evidence from the Pacific Cluster

自己教師あり音声モデルの言語カバレッジを 126 言語から 4,017 言語へ拡大することで、地理的接近性や表面的な類型論的類似性を超えて、パプア・オセアニア・オーストラリア諸語を含む太平洋マクロクラスターのような深層的な系統関係や長期的な言語接触の信号を捉えることが可能になることが示されました。

Minu Kim, Hoirin Kim, David R. Mortensen2026-03-10💬 cs.CL

How Much Noise Can BERT Handle? Insights from Multilingual Sentence Difficulty Detection

この論文は、ノイズの多いクラウドソーシングデータを用いた多言語文書難易度検出タスクにおいて、BERT ベースのモデルが一定の耐ノイズ性を有するものの、特に小規模データセットではガウス混合モデル(GMM)を用いたノイズ除去が性能を大幅に向上させることを示し、その結果として最大規模の多言語文難易度予測コーパスを公開したことを報告しています。

Nouran Khallaf, Serge Sharoff2026-03-10💬 cs.CL

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

この論文は、リソースが限られたインド諸語の機械翻訳における品質推定(QE)の課題を解決するため、閉鎖型および開放型の大規模言語モデル(LLM)を対象にプロンプト手法を比較し、中間層への低ランク適応(ALOPE および LoRMA)を導入することで、特に高リスク領域において頑健な品質推定を実現する方法を提案し、関連データとコードを公開したことを報告しています。

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

本論文は、自律的な意思決定システムとしてのアージェント型 RAG を初めて統一的に定式化し、その分類体系・アーキテクチャ・評価手法の課題を体系的に整理するとともに、信頼性の高い大規模システム構築に向けた将来の研究方向性を提示する包括的な知見の体系化(SoK)論文である。

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Can Large Language Models Keep Up? Benchmarking Online Adaptation to Continual Knowledge Streams

本論文は、動的に変化する知識ストリームへのオンライン適応能力を評価する新たなベンチマーク「OAKS」を提案し、最先端の言語モデルやエージェント型メモリシステムさえも、状態の追跡遅延や誘惑への脆弱性により、このタスクにおいて著しい限界を抱えていることを明らかにしています。

Jiyeon Kim, Hyunji Lee, Dylan Zhou, Sue Hyun Park, Seunghyun Yoon, Trung Bui, Franck Dernoncourt, Sungmin Cha, Minjoon Seo2026-03-10💬 cs.CL

AQuA: Toward Strategic Response Generation for Ambiguous Visual Questions

本論文は、曖昧な視覚質問に対する戦略的な応答生成を可能にするため、曖昧さのレベルと最適な対応戦略を分類した新しいデータセット「AQuA」を提案し、これを用いて微調整された視覚言語モデルが曖昧さを認識し、不確実性を管理して文脈に適した戦略で応答する能力を実証したものです。

Jihyoung Jang, Hyounghun Kim2026-03-10💬 cs.CL

Generalization in Online Reinforcement Learning for Mobile Agents

本論文は、モバイル GUI エージェントの汎化性能評価を目的とした新たなベンチマーク「AndroidWorld-Generalization」と、GRPO を活用したスケーラブルな強化学習システムを提案し、教師あり微調整ベースラインを上回る性能向上と、未見のタスクやアプリに対する汎化における課題を明らかにしたものです。

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

本論文は、大規模言語モデルの微調整における安全性の逸脱を防ぐため、有害なデータが含まれていなくても安全性に関連する少数のトークンに対するモデルの確信度を参照モデルと一致させるように制約をかける新たなフレームワーク「PACT」を提案し、タスク適応性を損なうことなく安全性を維持することを目的としています。

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

本論文は、異なる SQL 方言を持つ多様なデータベースシステムに対応し、構文と意味の両面で正確なクエリ生成を実現するために、方言認識論理クエリ計画モジュール、階層的意図認識知識ベース、および実行駆動型デバッグループを導入した「Dial」という知識基盤型 NL2SQL 枠組みを提案し、新しいベンチマーク DS-NL2SQL による実験で最先端手法を上回る性能を示したものである。

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

この論文は、アテンションとフィードフォワードをそれぞれ異なるストリームで処理する「デュアルストリームトランスフォーマー」を提案し、ヘッド間の混合戦略を調整することで解釈性と性能のトレードオフを明示的に制御可能にしつつ、注意機構の増幅に対する頑健性を示したものである。

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Cross-Modal Taxonomic Generalization in (Vision-) Language Models

この論文は、画像エンコーダと言語モデル(LM)を凍結したビジョン言語モデルにおいて、画像からの明示的なハイパーニム(上位概念)の証拠を完全に排除しても、言語モデルが事前学習した言語的知識とカテゴリー内の視覚的類似性に基づき、ハイパーニムを回復・一般化できることを示しています。

Tianyang Xu, Marcelo Sandoval-Castaneda, Karen Livescu, Greg Shakhnarovich, Kanishka Misra2026-03-10💬 cs.CL

Skip to the Good Part: Representation Structure & Inference-Time Layer Skipping in Diffusion vs. Autoregressive LLMs

この論文は、拡散言語モデルが自己回帰モデルとは異なる階層的な表現構造と早期層の冗長性を有していることを発見し、これに基づいてアーキテクチャ変更なしに推論時のレイヤースキップを適用することで、性能を維持しつつ最大 18.75% の FLOPs 削減を実現する手法を提案しています。

Raghavv Goel, Risheek Garrepalli, Sudhanshu Agrawal, Chris Lott, Mingu Lee, Fatih Porikli2026-03-10💬 cs.CL

A Joint Neural Baseline for Concept, Assertion, and Relation Extraction from Clinical Text

この論文は、臨床テキストからの概念認識、アサーション分類、関係抽出という 3 つのタスクを独立して処理する従来のパイプライン手法の課題を解決し、これらを統合的に最適化するエンドツーエンドのニューラルネットワーク基線モデルを提案し、その有効性を示すものです。

Fei Cheng, Ribeka Tanaka, Sadao Kurohashi2026-03-10💬 cs.CL

Bolbosh: Script-Aware Flow Matching for Kashmiri Text-to-Speech

本論文は、ゼロショット多言語モデルでは不十分であったカシミール語の音声合成に対し、OT-CFM に基づく監督適応と音響前処理パイプラインを導入した初のオープンソースシステム「Bolbosh」を提案し、話者評価や音質指標において大幅な性能向上を達成したことを報告するものである。

Tajamul Ashraf, Burhaan Rasheed Zargar, Saeed Abdul Muizz, Ifrah Mushtaq, Nazima Mehdi, Iqra Altaf Gillani, Aadil Amin Kak, Janibul Bashir2026-03-10💬 cs.CL