RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs

本論文は、大規模言語モデルに推論機能を強化し、多段階のトレーニング戦略を採用することで、生体医学文献から複雑な n 元薬物併用を高精度に抽出するフレームワーク「RexDrug」を提案し、既存手法を上回る性能を実証したものである。

Zhijun Wang, Ling Luo, Dinghao Pan, Huan Zhuang, Lejing Yu, Yuanyuan Sun, Hongfei Lin2026-03-10💬 cs.CL

Is continuous CoT better suited for multi-lingual reasoning?

この論文は、CODI フレームワークを用いた連続的な思考連鎖(Continuous CoT)が、標準的な教師あり微調整よりも低リソース言語やゼロショット設定において多言語推論能力を大幅に向上させ、かつ推論経路を最大 50 倍圧縮する効率的な手法であることを示しています。

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation

本論文は、データの不均衡を解決するためにデータアップサンプリングとカリキュラム学習を組み合わせた戦略を採用し、34 の欧州言語(特にバルト・フィン・ウゴル・スラブ諸語)における言語的公平性と性能を大幅に向上させた、300 億パラメータのオープンウェイト大規模言語モデル「TildeOpen LLM」を提案するものである。

Toms Bergmanis, Martins Kronis, Ingus J\=anis Pretkalninš, D\=avis Nicmanis, Jelizaveta Jelinska, Roberts Rozis, Rinalds V\=iksna, M\=arcis Pinnis2026-03-10💬 cs.CL

Supporting Workflow Reproducibility by Linking Bioinformatics Tools across Papers and Executable Code

この論文は、科学論文の記述と実行可能なワークフローコードの間にあるバイオインフォマティクスツールの関連性を自動的に結びつけることで、ワークフローの再現性と理解を向上させる手法「CoPaLink」を提案し、その有効性を検証したものです。

Clémence Sebe, Olivier Ferret, Aurélie Névéol, Mahdi Esmailoghli, Ulf Leser, Sarah Cohen-Boulakia2026-03-10💬 cs.CL

The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques

この論文は、既存の個人情報(PII)除去技術に対する攻撃評価がデータ漏洩や汚染の問題により過大評価されている可能性を指摘し、真のプライバシー保護を客観的に検証するには機密データへのアクセスが必要だが、それが公開研究の透明性と再現性を阻害するという根本的なジレンマを浮き彫りにしています。

Sebastian Ochs, Ivan Habernal2026-03-10💬 cs.CL

Quantifying Cross-Lingual Transfer in Paralinguistic Speech Tasks

この論文は、言語に依存するパラリンギスティック音声タスクにおけるクロスリンガル転移を体系的に定量化する「クロスリンガル転移行列(CLTM)」を導入し、HuBERT ベースのエンコーダを用いた実験を通じて、言語対やタスクごとに異なる転移パターンが存在することを明らかにしました。

Pol Buitrago, Oriol Pareras, Federico Costa, Javier Hernando2026-03-10💬 cs.CL

Sensivity of LLMs' Explanations to the Training Randomness:Context, Class & Task Dependencies

本論文は、同じデータで異なるランダム性を用いて訓練されたトランスフォーマーモデルの解釈が、文脈、クラス、タスクのいずれにも統計的に有意な影響を受けることを示し、その影響度が文脈<クラス<タスクの順で大きくなることを明らかにしています。

Romain Loncour, Jérémie Bogaert, François-Xavier Standaert2026-03-10💬 cs.CL

Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

この論文は、推論コストを均一に配分する従来の手法の限界を克服し、問題の難易度に応じて推論戦略を動的に調整する「CoFiCot」という粗から細への適応的フレームワークを提案し、状態依存の修正ループとプロセス報酬モデルを統合することで、単純なタスクの過剰処理を防ぎつつ複雑なタスクの論理的整合性を高めることを目的としています。

Dongxu Zhang, Hongqiang Lin, Yiding Sun, Pengyu Wang, Qirui Wang, Ning Yang, Jihua Zhu2026-03-10💬 cs.CL

NCL-UoR at SemEval-2026 Task 5: Embedding-Based Methods, Fine-Tuning, and LLMs for Word Sense Plausibility Rating

SemEval-2026 タスク 5 における NCL-UoR チームの論文は、埋め込みベース手法や微調整モデルと比較し、構造化されたプロンプトと明確な判断ルールを組み合わせた大規模言語モデル(LLM)のアプローチが、曖昧な同音異義語を含む物語の文脈における語義の妥当性評価において最も優れていることを示しています。

Tong Wu, Thanet Markchom, Huizhi Liang2026-03-10💬 cs.CL

AdaCultureSafe: Adaptive Cultural Safety Grounded by Cultural Knowledge in Large Language Models

本論文は、文化的安全性と文化的知識の相関が低いという発見に基づき、両者を統合的にモデル化し、専門的な知識を生成プロセスに組み込むことで大規模言語モデルの文化的安全性を向上させる新しいフレームワーク「AdaCultureSafe」を提案しています。

Hankun Kang, Di Lin, Zhirong Liao, Pengfei Bai, Xinyi Zeng, Jiawei Jiang, Yuanyuan Zhu, Tieyun Qian2026-03-10💬 cs.CL

Using Multimodal and Language-Agnostic Sentence Embeddings for Abstractive Summarization

本論文は、LaBSE や SONAR などの多モーダル・言語非依存な文埋め込みと、ファクト性向上のための固有名詞注入メカニズムを組み合わせた新しいフレームワーク「SBARThez」を提案し、テキストおよび音声入力に対応するクロスリンガル要約において、低資源言語でも高い性能と要約の抽象度を実現することを示しています。

Chaimae Chellaf, Salima Mdhaffar, Yannick Estève, Stéphane Huet2026-03-10💬 cs.CL

LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs

この論文は、LLM を活用した自動注釈と人間の品質管理を組み合わせたデータ中心パイプラインにより、米国最高裁判決およびテキサス州刑事控訴裁判の判例から構築された大規模な法的議論マイニングコーパス「LAMUS」を提案し、Chain-of-Thought プロンプトによる性能向上や注釈の精度検証など、法的 NLP 研究への新たな知見とリソースを提供するものです。

Serene Wang, Lavanya Pobbathi, Haihua Chen2026-03-10💬 cs.CL

Learning Multiple Utterance-Level Attribute Representations with a Unified Speech Encoder

本論文は、自己教師あり学習で訓練された音声基盤モデルを、単一のモデルで意味や話者など任意の発話レベル属性の表現を生成できるよう拡張する統一されたポストトレーニング枠組みを提案し、多言語音声検索や話者認識タスクにおける有効性を示すものです。

Maryem Bouziane, Salima Mdhaffar, Yannick Estève2026-03-10💬 cs.CL

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

SPD-RAG は、各ドキュメントを個別に処理する専門エージェントと調整エージェントを階層的に組み合わせ、大規模な多ドキュメント環境における複雑な質問への回答精度を向上させつつ、API コストを大幅に削減する新しい検索拡張生成フレームワークを提案するものです。

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda Akpinar2026-03-10💬 cs.CL