cs.CL 件の論文 | Gist.Science

RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs

本論文は、大規模言語モデルに推論機能を強化し、多段階のトレーニング戦略を採用することで、生体医学文献から複雑な n 元薬物併用を高精度に抽出するフレームワーク「RexDrug」を提案し、既存手法を上回る性能を実証したものである。

Zhijun Wang, Ling Luo, Dinghao Pan, Huan Zhuang, Lejing Yu, Yuanyuan Sun, Hongfei Lin2026-03-10💬 cs.CL

Is continuous CoT better suited for multi-lingual reasoning?

この論文は、CODI フレームワークを用いた連続的な思考連鎖（Continuous CoT）が、標準的な教師あり微調整よりも低リソース言語やゼロショット設定において多言語推論能力を大幅に向上させ、かつ推論経路を最大 50 倍圧縮する効率的な手法であることを示しています。

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation

本論文は、データの不均衡を解決するためにデータアップサンプリングとカリキュラム学習を組み合わせた戦略を採用し、34 の欧州言語（特にバルト・フィン・ウゴル・スラブ諸語）における言語的公平性と性能を大幅に向上させた、300 億パラメータのオープンウェイト大規模言語モデル「TildeOpen LLM」を提案するものである。

Toms Bergmanis, Martins Kronis, Ingus J\=anis Pretkalninš, D\=avis Nicmanis, Jelizaveta Jelinska, Roberts Rozis, Rinalds V\=iksna, M\=arcis Pinnis2026-03-10💬 cs.CL

Supporting Workflow Reproducibility by Linking Bioinformatics Tools across Papers and Executable Code

この論文は、科学論文の記述と実行可能なワークフローコードの間にあるバイオインフォマティクスツールの関連性を自動的に結びつけることで、ワークフローの再現性と理解を向上させる手法「CoPaLink」を提案し、その有効性を検証したものです。

Clémence Sebe, Olivier Ferret, Aurélie Névéol, Mahdi Esmailoghli, Ulf Leser, Sarah Cohen-Boulakia2026-03-10💬 cs.CL

The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques

この論文は、既存の個人情報（PII）除去技術に対する攻撃評価がデータ漏洩や汚染の問題により過大評価されている可能性を指摘し、真のプライバシー保護を客観的に検証するには機密データへのアクセスが必要だが、それが公開研究の透明性と再現性を阻害するという根本的なジレンマを浮き彫りにしています。

Sebastian Ochs, Ivan Habernal2026-03-10💬 cs.CL

DualTurn: Learning Turn-Taking from Dual-Channel Generative Speech Pretraining

この論文は、双チャンネル会話音声の生成的事前学習を通じてラベルなしで会話ダイナミクスを学習し、自然なターン交代とツール呼び出しを両立させる「DualTurn」モデルを提案し、既存の手法を上回る性能を実証したものである。

Shangeth Rajaa2026-03-10💬 cs.CL

Quantifying Cross-Lingual Transfer in Paralinguistic Speech Tasks

この論文は、言語に依存するパラリンギスティック音声タスクにおけるクロスリンガル転移を体系的に定量化する「クロスリンガル転移行列（CLTM）」を導入し、HuBERT ベースのエンコーダを用いた実験を通じて、言語対やタスクごとに異なる転移パターンが存在することを明らかにしました。

Pol Buitrago, Oriol Pareras, Federico Costa, Javier Hernando2026-03-10💬 cs.CL

Fibration Policy Optimization

本論文は、トークン、軌道、ドメインなどの多層的なスケールにまたがる大規模言語モデルの安定性制御を可能にするため、信頼領域最適化と代数的ファイバー束構造を統合した「Fibration Policy Optimization（FiberPO）」という新しい方策最適化フレームワークを提案するものです。

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Sensivity of LLMs' Explanations to the Training Randomness:Context, Class & Task Dependencies

本論文は、同じデータで異なるランダム性を用いて訓練されたトランスフォーマーモデルの解釈が、文脈、クラス、タスクのいずれにも統計的に有意な影響を受けることを示し、その影響度が文脈＜クラス＜タスクの順で大きくなることを明らかにしています。

Romain Loncour, Jérémie Bogaert, François-Xavier Standaert2026-03-10💬 cs.CL

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

この論文は、静止画と実音声から合成された視覚データを用いることで、ラベル付きマルチモーダルデータが存在しない言語においても、高品質な音声視覚認識システムを構築できることを示しています。

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier Hernando2026-03-10💬 cs.CL

Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

この論文は、推論コストを均一に配分する従来の手法の限界を克服し、問題の難易度に応じて推論戦略を動的に調整する「CoFiCot」という粗から細への適応的フレームワークを提案し、状態依存の修正ループとプロセス報酬モデルを統合することで、単純なタスクの過剰処理を防ぎつつ複雑なタスクの論理的整合性を高めることを目的としています。

Dongxu Zhang, Hongqiang Lin, Yiding Sun, Pengyu Wang, Qirui Wang, Ning Yang, Jihua Zhu2026-03-10💬 cs.CL

NCL-UoR at SemEval-2026 Task 5: Embedding-Based Methods, Fine-Tuning, and LLMs for Word Sense Plausibility Rating

SemEval-2026 タスク 5 における NCL-UoR チームの論文は、埋め込みベース手法や微調整モデルと比較し、構造化されたプロンプトと明確な判断ルールを組み合わせた大規模言語モデル（LLM）のアプローチが、曖昧な同音異義語を含む物語の文脈における語義の妥当性評価において最も優れていることを示しています。

Tong Wu, Thanet Markchom, Huizhi Liang2026-03-10💬 cs.CL

How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms

この論文は、RIKER 評価手法を用いた大規模な実証研究により、ドキュメント Q&A における LLM の幻覚発生率が文脈長とともに急増し、モデル選択が最も重要な要因である一方、ハードウェアプラットフォームには依存しないことを明らかにした。

JV Roig2026-03-10💬 cs.CL

← 前へ次へ →

cs.CL

RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs

Is continuous CoT better suited for multi-lingual reasoning?

TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation

Supporting Workflow Reproducibility by Linking Bioinformatics Tools across Papers and Executable Code

The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques

DualTurn: Learning Turn-Taking from Dual-Channel Generative Speech Pretraining

Quantifying Cross-Lingual Transfer in Paralinguistic Speech Tasks

Fibration Policy Optimization

Sensivity of LLMs' Explanations to the Training Randomness:Context, Class & Task Dependencies

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

NCL-UoR at SemEval-2026 Task 5: Embedding-Based Methods, Fine-Tuning, and LLMs for Word Sense Plausibility Rating

How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms

AdaCultureSafe: Adaptive Cultural Safety Grounded by Cultural Knowledge in Large Language Models

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Using Multimodal and Language-Agnostic Sentence Embeddings for Abstractive Summarization

LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs

Learning Multiple Utterance-Level Attribute Representations with a Unified Speech Encoder

SlowBA: An efficiency backdoor attack towards VLM-based GUI agents

SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation