ThaiSafetyBench: Assessing Language Model Safety in Thai Cultural Contexts

この論文は、英語中心の安全性評価の限界を克服し、タイの文化的文脈に特化した攻撃を含む1,954の悪意あるプロンプトで構成されるオープンソースベンチマーク「ThaiSafetyBench」を提案し、24の言語モデルを評価して文化的文脈に特化した攻撃の脆弱性を明らかにするとともに、再現性とコスト効率を向上させるための分類器とリーダーボードを公開したものです。

Trapoom Ukarapol, Nut Chukamphaeng, Kunat Pipatanakul + 1 more2026-03-06💬 cs.CL

HiFlow: Hierarchical Feedback-Driven Optimization for Constrained Long-Form Text Generation

この論文は、大規模言語モデルによる制約付き長文生成の課題を解決するため、グローバルな構造と制約の計画、および条件付きテキスト生成を階層的に最適化し、閉ループフィードバックを通じて両者を協調させる「HiFlow」という新しいフレームワークを提案するものです。

Yifan Zhu, Guanting Chen, Bing Wei + 1 more2026-03-06💬 cs.CL

NeuronMoE: Neuron-Guided Mixture-of-Experts for Efficient Multilingual LLM Extension

本論文は、低リソース言語への大規模言語モデル拡張において、層レベルではなく個々のニューロンレベルの多様性を分析して専門家の割り当てを最適化する「NeuronMoE」を提案し、Llama-3.2-3B での実験により、ベースラインと同等の性能を維持しつつパラメータ数を約 40% 削減できることを実証しています。

Rongzhi Li, Hitomi Yanaka2026-03-06💬 cs.CL

MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection

本論文は、単語レベルで注釈されたデータセットを用いて、XLM-RoBERTa と CRF を組み合わせた「MUTEX」というフレームワークを提案し、コードスイッチングや形態論的変異などの課題を克服することで、ウルドゥー語の毒性スパン検出において初めて 60% のトークンレベル F1 スコアを達成したことを報告しています。

Inayat Arshad, Fajar Saleem, Ijaz Hussain2026-03-06🤖 cs.AI

Measuring the Redundancy of Decoder Layers in SpeechLLMs

本論文は、音声大規模言語モデル(SpeechLLM)のデコーダー層に存在する冗長性が事前学習済み LLM から継承されることを示し、層の剪定と回復分析を通じて、大規模モデルではデコーダー層の 60% 程度でも音声認識タスクを維持でき、さらに音声翻訳など多言語・多タスクにわたって共通の冗長構造が存在することを明らかにした。

Adel Moumen, Guangzhi Sun, Philip C Woodland2026-03-06🤖 cs.AI

LBM: Hierarchical Large Auto-Bidding Model via Reasoning and Acting

本論文は、大規模言語モデルの推論能力を活用し、言語と数値入力を融合する二重埋め込み機構と、ハルシネーションを抑制するオフライン強化学習微調整手法「GQPO」を備えた階層型自動入札モデル「LBM」を提案し、動的な広告環境における入札戦略の最適化と汎化性能の向上を実現するものである。

Yewen Li, Zhiyi Lyu, Peng Jiang + 4 more2026-03-06🤖 cs.AI

C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning

本論文は、PRM800K を基に因果性と網羅性の 2 次元を評価対象としたベンチマーク「C2-Faith」を構築し、LLM による推論プロセスの忠実度評価において、タスクの枠組みや評価指標によってモデルの性能が変動し、エラー検出と特定、あるいは網羅性の判定にそれぞれ課題があることを明らかにした。

Avni Mittal, Rauno Arike2026-03-06🤖 cs.AI

Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions

本ガイドラインは、中国の司法判断における法的議論構造を体系的に記述・可視化するための枠組みを提案し、命題と関係性の分類、形式化ルール、および標準化作業手順を通じて、大規模な司法推論分析や法的議論マイニング研究への基盤を提供するものである。

Kun Chen, Xianglei Liao, Kaixue Fei + 2 more2026-03-06🤖 cs.AI

Transducing Language Models

本論文は、有限状態トランスデューサを用いた決定論的変換を確率的に統合する新しい言語モデルの枠組みを提案し、事前学習済みモデルのパラメータを変更することなく、トークンからバイトや単語、DNA からアミノ酸配列など、アプリケーション固有の出力形式への適応を可能にするアルゴリズムと実験結果を示しています。

Vésteinn Snæbjarnarson, Samuel Kiegeland, Tianyu Liu + 3 more2026-03-06💬 cs.CL

Distilling Formal Logic into Neural Spaces: A Kernel Alignment Approach for Signal Temporal Logic

本論文は、記号論理の幾何学的構造を潜在空間に蒸留する教師あり学習フレームワークを提案し、信号時相論理(STL)の記号カーネルの計算コストを大幅に削減しつつ、意味的類似性や頑健性を忠実に保持する可逆なニューラル表現を実現するものである。

Sara Candussio, Gabriele Sarti, Gaia Saveri + 1 more2026-03-06💬 cs.CL