Measuring the Redundancy of Decoder Layers in SpeechLLMs

本論文は、音声大規模言語モデル(SpeechLLM)のデコーダー層に存在する冗長性が事前学習済み LLM から継承されることを示し、層の剪定と回復分析を通じて、大規模モデルではデコーダー層の 60% 程度でも音声認識タスクを維持でき、さらに音声翻訳など多言語・多タスクにわたって共通の冗長構造が存在することを明らかにした。

Adel Moumen, Guangzhi Sun, Philip C Woodland2026-03-06🤖 cs.AI

LBM: Hierarchical Large Auto-Bidding Model via Reasoning and Acting

本論文は、大規模言語モデルの推論能力を活用し、言語と数値入力を融合する二重埋め込み機構と、ハルシネーションを抑制するオフライン強化学習微調整手法「GQPO」を備えた階層型自動入札モデル「LBM」を提案し、動的な広告環境における入札戦略の最適化と汎化性能の向上を実現するものである。

Yewen Li, Zhiyi Lyu, Peng Jiang + 4 more2026-03-06🤖 cs.AI

C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning

本論文は、PRM800K を基に因果性と網羅性の 2 次元を評価対象としたベンチマーク「C2-Faith」を構築し、LLM による推論プロセスの忠実度評価において、タスクの枠組みや評価指標によってモデルの性能が変動し、エラー検出と特定、あるいは網羅性の判定にそれぞれ課題があることを明らかにした。

Avni Mittal, Rauno Arike2026-03-06🤖 cs.AI

Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions

本ガイドラインは、中国の司法判断における法的議論構造を体系的に記述・可視化するための枠組みを提案し、命題と関係性の分類、形式化ルール、および標準化作業手順を通じて、大規模な司法推論分析や法的議論マイニング研究への基盤を提供するものである。

Kun Chen, Xianglei Liao, Kaixue Fei + 2 more2026-03-06🤖 cs.AI

Transducing Language Models

本論文は、有限状態トランスデューサを用いた決定論的変換を確率的に統合する新しい言語モデルの枠組みを提案し、事前学習済みモデルのパラメータを変更することなく、トークンからバイトや単語、DNA からアミノ酸配列など、アプリケーション固有の出力形式への適応を可能にするアルゴリズムと実験結果を示しています。

Vésteinn Snæbjarnarson, Samuel Kiegeland, Tianyu Liu + 3 more2026-03-06💬 cs.CL

Distilling Formal Logic into Neural Spaces: A Kernel Alignment Approach for Signal Temporal Logic

本論文は、記号論理の幾何学的構造を潜在空間に蒸留する教師あり学習フレームワークを提案し、信号時相論理(STL)の記号カーネルの計算コストを大幅に削減しつつ、意味的類似性や頑健性を忠実に保持する可逆なニューラル表現を実現するものである。

Sara Candussio, Gabriele Sarti, Gaia Saveri + 1 more2026-03-06💬 cs.CL

SarcasmMiner: A Dual-Track Post-Training Framework for Robust Audio-Visual Sarcasm Reasoning

本論文は、マルチモーダルな皮肉検出における推論の頑健性を向上させるため、教師モデルからの軌道と生成報酬モデルを用いた双トラック蒸留戦略と、GRPO による最適化を組み合わせたポストトレーニングフレームワーク「SarcasmMiner」を提案し、MUStARD++ ベンチマークで既存手法を上回る性能を達成したことを報告するものです。

Zhu Li, Yongjian Chen, Huiyuan Lai + 3 more2026-03-06💬 cs.CL

WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

本論文は、WavLM の表現を単一のコードブックに量子化・蒸留し、テキスト教師なしで自己回帰的に学習する単一ストリーム音声言語モデル「WavSLM」を提案し、複雑なアーキテクチャやテキスト事前学習なしに、セマンティックと音響情報を統合的にモデル化しながら高品質な音声生成を実現することを示しています。

Luca Della Libera, Cem Subakan, Mirco Ravanelli2026-03-06🤖 cs.AI

Med-V1: Small Language Models for Zero-shot and Scalable Biomedical Evidence Attribution

本論文は、高価な最先端大規模言語モデルに匹敵する性能を持ちながら、合成データを用いた 30 億パラメータの軽量モデル「Med-V1」を開発し、生体医学分野における証拠帰属やハルシネーション検出、臨床ガイドラインの誤引用特定などの実用的タスクを効率的に実行可能にしたことを報告しています。

Qiao Jin, Yin Fang, Lauren He + 12 more2026-03-06🤖 cs.AI

PersianPunc: A Large-Scale Dataset and BERT-Based Approach for Persian Punctuation Restoration

この論文は、自動音声認識の出力可読性向上のために、1700 万件のサンプルからなる大規模なペルシア語句読点復元データセット「PersianPunc」と、過修正や計算コストの問題を回避しつつ高精度(F1 91.33%)を達成する軽量な BERT ベースのモデルを提案し、両者を公開したものである。

Mohammad Javad Ranjbar Kalahroodi, Heshaam Faili, Azadeh Shakery2026-03-06🤖 cs.AI

A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

この論文は、民主的な意思決定プロセスへの参加を支援するため、スペイン語、カタルーニャ語、イタリア語の3言語(特にカタルーニャ語では初)で、専門家が作成した高品質な平易化テキストを含む多言語コーパスを構築し、公開することを報告しています。

Stefan Bott, Verena Riegler, Horacio Saggion + 2 more2026-03-06💬 cs.CL

Exploring the potential and limitations of Model Merging for Multi-Domain Adaptation in ASR

この論文は、11 種類のモデル統合アルゴリズムを 10 のポルトガル語ドメインで評価し、特異値ブースティングを導入した新手法 BoostedTSV-M を提案することで、フルファインチューニングを上回る性能と分布外汎化能力を単一モデルで実現する ASR におけるモデル統合の可能性と限界を明らかにしています。

Carlos Carvalho, Francisco Teixeira, Thomas Rolland + 1 more2026-03-06💬 cs.CL