RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs
本論文は、大規模言語モデルに推論機能を強化し、多段階のトレーニング戦略を採用することで、生体医学文献から複雑な n 元薬物併用を高精度に抽出するフレームワーク「RexDrug」を提案し、既存手法を上回る性能を実証したものである。
1072 件の論文
本論文は、大規模言語モデルに推論機能を強化し、多段階のトレーニング戦略を採用することで、生体医学文献から複雑な n 元薬物併用を高精度に抽出するフレームワーク「RexDrug」を提案し、既存手法を上回る性能を実証したものである。
この論文は、CODI フレームワークを用いた連続的な思考連鎖(Continuous CoT)が、標準的な教師あり微調整よりも低リソース言語やゼロショット設定において多言語推論能力を大幅に向上させ、かつ推論経路を最大 50 倍圧縮する効率的な手法であることを示しています。
本論文は、データの不均衡を解決するためにデータアップサンプリングとカリキュラム学習を組み合わせた戦略を採用し、34 の欧州言語(特にバルト・フィン・ウゴル・スラブ諸語)における言語的公平性と性能を大幅に向上させた、300 億パラメータのオープンウェイト大規模言語モデル「TildeOpen LLM」を提案するものである。
この論文は、科学論文の記述と実行可能なワークフローコードの間にあるバイオインフォマティクスツールの関連性を自動的に結びつけることで、ワークフローの再現性と理解を向上させる手法「CoPaLink」を提案し、その有効性を検証したものです。
この論文は、既存の個人情報(PII)除去技術に対する攻撃評価がデータ漏洩や汚染の問題により過大評価されている可能性を指摘し、真のプライバシー保護を客観的に検証するには機密データへのアクセスが必要だが、それが公開研究の透明性と再現性を阻害するという根本的なジレンマを浮き彫りにしています。
この論文は、双チャンネル会話音声の生成的事前学習を通じてラベルなしで会話ダイナミクスを学習し、自然なターン交代とツール呼び出しを両立させる「DualTurn」モデルを提案し、既存の手法を上回る性能を実証したものである。
この論文は、言語に依存するパラリンギスティック音声タスクにおけるクロスリンガル転移を体系的に定量化する「クロスリンガル転移行列(CLTM)」を導入し、HuBERT ベースのエンコーダを用いた実験を通じて、言語対やタスクごとに異なる転移パターンが存在することを明らかにしました。
本論文は、トークン、軌道、ドメインなどの多層的なスケールにまたがる大規模言語モデルの安定性制御を可能にするため、信頼領域最適化と代数的ファイバー束構造を統合した「Fibration Policy Optimization(FiberPO)」という新しい方策最適化フレームワークを提案するものです。
本論文は、同じデータで異なるランダム性を用いて訓練されたトランスフォーマーモデルの解釈が、文脈、クラス、タスクのいずれにも統計的に有意な影響を受けることを示し、その影響度が文脈<クラス<タスクの順で大きくなることを明らかにしています。
この論文は、静止画と実音声から合成された視覚データを用いることで、ラベル付きマルチモーダルデータが存在しない言語においても、高品質な音声視覚認識システムを構築できることを示しています。
この論文は、推論コストを均一に配分する従来の手法の限界を克服し、問題の難易度に応じて推論戦略を動的に調整する「CoFiCot」という粗から細への適応的フレームワークを提案し、状態依存の修正ループとプロセス報酬モデルを統合することで、単純なタスクの過剰処理を防ぎつつ複雑なタスクの論理的整合性を高めることを目的としています。
SemEval-2026 タスク 5 における NCL-UoR チームの論文は、埋め込みベース手法や微調整モデルと比較し、構造化されたプロンプトと明確な判断ルールを組み合わせた大規模言語モデル(LLM)のアプローチが、曖昧な同音異義語を含む物語の文脈における語義の妥当性評価において最も優れていることを示しています。
この論文は、RIKER 評価手法を用いた大規模な実証研究により、ドキュメント Q&A における LLM の幻覚発生率が文脈長とともに急増し、モデル選択が最も重要な要因である一方、ハードウェアプラットフォームには依存しないことを明らかにした。
本論文は、文化的安全性と文化的知識の相関が低いという発見に基づき、両者を統合的にモデル化し、専門的な知識を生成プロセスに組み込むことで大規模言語モデルの文化的安全性を向上させる新しいフレームワーク「AdaCultureSafe」を提案しています。
EPSRC の助成金申請書 6 件を用いた構造的摂動評価により、LLM による審査はセクション別分析が最も有効である一方、現状では完全な代替ではなく補完的な役割に留まり、明瞭さの欠陥の検出や評価の優先順位に課題があることを明らかにしました。
本論文は、LaBSE や SONAR などの多モーダル・言語非依存な文埋め込みと、ファクト性向上のための固有名詞注入メカニズムを組み合わせた新しいフレームワーク「SBARThez」を提案し、テキストおよび音声入力に対応するクロスリンガル要約において、低資源言語でも高い性能と要約の抽象度を実現することを示しています。
この論文は、LLM を活用した自動注釈と人間の品質管理を組み合わせたデータ中心パイプラインにより、米国最高裁判決およびテキサス州刑事控訴裁判の判例から構築された大規模な法的議論マイニングコーパス「LAMUS」を提案し、Chain-of-Thought プロンプトによる性能向上や注釈の精度検証など、法的 NLP 研究への新たな知見とリソースを提供するものです。
本論文は、自己教師あり学習で訓練された音声基盤モデルを、単一のモデルで意味や話者など任意の発話レベル属性の表現を生成できるよう拡張する統一されたポストトレーニング枠組みを提案し、多言語音声検索や話者認識タスクにおける有効性を示すものです。
本論文は、VLM ベースの GUI エージェントの応答効率を標的とし、特定のトリガーにより過剰な推論連鎖を誘発して遅延を引き起こす新たなバックドア攻撃「SlowBA」を提案し、その有効性と潜在的な脅威を実証しています。
SPD-RAG は、各ドキュメントを個別に処理する専門エージェントと調整エージェントを階層的に組み合わせ、大規模な多ドキュメント環境における複雑な質問への回答精度を向上させつつ、API コストを大幅に削減する新しい検索拡張生成フレームワークを提案するものです。