Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

本論文は、ポアンカレ球埋め込みを用いたモダリティ階層の表現と双方向メッセージ伝達によるハイパーグラフ融合、および双曲空間における対照学習を組み合わせた「Emotion Collider(EC-Net)」を提案し、ノイズやモダリティ欠損に対して頑健で高精度な多モーダル感情認識を実現することを示しています。

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon FongTue, 10 Ma🤖 cs.LG

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

本論文は、トレーニング中に意図的に特定のモダリティ情報を破壊的に縮小させることで、入力チャネルの欠損や破損に対して頑健なマルチモーダル表現を学習する「ModalImmune」というフレームワークを提案し、その有効性を示しています。

Rong Fu, Jia Yee Tan, Zijian Zhang, Ziming Wang, Zhaolu Kang, Muge Qi, Shuning Zhang, Simon FongTue, 10 Ma🤖 cs.LG

Condition-Gated Reasoning for Context-Dependent Biomedical Question Answering

本論文は、患者の条件に依存する臨床推論を評価する初のベンチマーク「CondMedQA」を提案し、クエリの条件に基づいて知識グラフの推論経路を選択的に活性化・剪定する「条件ゲート型推論(CGR)」フレームワークを開発することで、医療QAにおける条件依存性の明示的なモデル化の重要性を実証しています。

Jash Rajesh Parekh, Wonbin Kweon, Joey Chan, Rezarta Islamaj, Robert Leaman, Pengcheng Jiang, Chih-Hsuan Wei, Zhizheng Wang, Zhiyong Lu, Jiawei HanTue, 10 Ma💬 cs.CL

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

ModernBERT 基盤の多言語エンコーダ「MrBERT」は、35 言語とコードの事前学習、Matryoshka 表現学習による柔軟な次元適応、および特定ドメインへの最適化を通じて、地域言語の卓越性と専門分野での高性能、そして推論・保存コストの削減を同時に実現するモデルファミリーを提案し、Hugging Face でオープンソース化されています。

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta VillegasTue, 10 Ma🤖 cs.LG

KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging

本論文は、KV キャッシュの非対称性をスペクトルエネルギー分布に基づいて理論的に解明し、勾配不要かつ閉形式解を持つ効率的なアルゴリズム「KVSlimmer」を提案することで、LLM の推論メモリと遅延を削減しつつ性能を向上させることを目指しています。

Lianjun Liu, Hongli An, Weiqi Yan, Xin Du, Shengchuan Zhang, Huazhong Liu, Yunshan ZhongTue, 10 Ma💬 cs.CL

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

本論文は、構造化された医薬品ラベルと自由記述の放射線レポートという異なる臨床ドメインにおいて、LLM の抽出結果に対する信頼性の方向性が逆転することを発見し、ドメイン固有のコンフォーマル予測フレームワークを用いて、いずれの領域でも安全な臨床展開を可能にする有限サンプルの被覆保証を実現したことを報告しています。

Manil Shrestha, Edward KimTue, 10 Ma💬 cs.CL

CyclicJudge: Mitigating Judge Bias Efficiently in LLM-based Evaluation

この論文は、LLM 評価におけるシステマティックなバイアスを、追加コストなしで単一評価と同等のコストで正確に除去し、最適なランキングを実現する「CyclicJudge」というラウンドロビン方式の割り当て手法を提案し、その有効性を MT-Bench や MindEval などのベンチマークで実証したものです。

Ziyi Zhu, Olivier Tieleman, Alexey Bukhtiyarov, Jinghong ChenTue, 10 Ma💬 cs.CL

PrivMedChat: End-to-End Differentially Private RLHF for Medical Dialogue Systems

本論文は、医師と患者の会話から得られる機密情報を保護しつつ医療対話システムを調整するための、教師あり微調整から報酬モデル学習、方策最適化まで一貫して差分プライバシーを適用した「PrivMedChat」というエンドツーエンドのフレームワークを提案し、専門家のラベル付けを不要とするアノテーション不要の選好構築戦略を併せて導入したことを示しています。

Sudip BhujelTue, 10 Ma💬 cs.CL

ARC-AGI-2 Technical Report

本論文は、タスクの符号化、対称性に基づくデータ拡張、テスト時適応、および対称性認識デコーディングを組み合わせることで、ARC-AGI における推論能力を大幅に向上させ、人間レベルの一般化に近づけた新しいトランスフォーマーベースのシステムを提案するものである。

Wallyson Lemes de Oliveira, Mekhron Bobokhonov, Matteo Caorsi, Aldo Podestà, Gabriele Beltramo, Luca Crosato, Matteo Bonotto, Federica Cecchetto, Hadrien Espic, Dan Titus Salajan, Stefan Taga, Luca Pana, Joe CarthyTue, 10 Ma💬 cs.CL

How Attention Sinks Emerge in Large Language Models: An Interpretability Perspective

この論文は、大規模言語モデルにおける「アテンションシンク」の発生メカニズムを解明し、意味情報に依存せず位置 0 のトークンを認識する「P0 シンク回路」がトランスフォーマーの初期層で早期に形成されることを発見し、これが事前学習の収束状態を監視する指標となる可能性を示しています。

Runyu Peng, Ruixiao Li, Mingshu Chen, Yunhua Zhou, Qipeng Guo, Xipeng QiuTue, 10 Ma🤖 cs.LG

Hierarchical Latent Structures in Data Generation Process Unify Mechanistic Phenomena across Scale

この論文は、階層的な潜在構造を持つ確率的文脈自由文法(PCFG)を用いて合成コーパスを生成し、その階層性がインダクションヘッドやファンクションベクトル、ハイドラ効果といった一見無関係な機械的現象の出現を統一的に説明する鍵であることを示しています。

Jonas Rohweder, Subhabrata Dutta, Iryna GurevychTue, 10 Ma🤖 cs.LG

Hierarchical Embedding Fusion for Retrieval-Augmented Code Generation

この論文は、リポジトリ全体の情報を高密度な階層的ベクトルに圧縮し、擬似トークンとして生成モデルに効率的に統合する「階層的埋め込み融合(HEF)」手法を提案し、既存の検索拡張コード生成手法と同等の精度を維持しつつ、単一 GPU 上でサブ秒の低遅延を実現することを示しています。

Nikita Sorokin, Ivan Sedykh, Valentin MalykhTue, 10 Ma🤖 cs.LG

A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness

この論文は、LLM を裁判官とした自動評価フレームワークが、敵対的攻撃による分布のシフトや意味的曖昧さの影響を受け、人間の合意率とは対照的にほぼランダムな精度まで低下し、多くの攻撃が実際には有害なコンテンツを誘発するのではなく裁判官の欠陥を悪用して成功率を水増ししていることを実証し、より信頼性の高い評価のための新たなベンチマークとデータセットを提案しています。

Leo Schwinn, Moritz Ladenburger, Tim Beyer, Mehrnaz Mofakhami, Gauthier Gidel, Stephan GünnemannTue, 10 Ma💬 cs.CL

Rethinking Personalization in Large Language Models at the Token Level

この論文は、トークンごとの個人化の度合いを因果介入を用いて推定し、学習時にこれを適応的に重み付けする「PerContrast」と「PerCE」損失関数を提案することで、大規模言語モデルの個人化性能を大幅に向上させる手法を提示しています。

Chenheng Zhang, Yijun Lu, Lizhe Fang, Chunyuan Zheng, Jiajun Chai, Xiaohan Wang, Guojun Yin, Wei Lin, Yisen Wang, Zhouchen LinTue, 10 Ma💬 cs.CL

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

この論文は、技術文書の階層構造を活用した階層的検索と自動テストケース生成による自己デバッグを組み合わせたエージェント型フレームワーク「GraphSkill」を提案し、複雑なグラフ推論タスクにおけるコード生成の精度向上と推論コストの削減を実現するものです。

Fali Wang, Chenglin Weng, Xianren Zhang, Siyuan Hong, Hui Liu, Suhang WangTue, 10 Ma🤖 cs.LG

SR-TTT: Surprisal-Aware Residual Test-Time Training

この論文は、テスト時トレーニング(TTT)モデルが持つ文脈圧縮による「針の干し草」タスクでの失敗を解決するため、驚異的なトークンのみを従来の注意機構に動的にルーティングする「SR-TTT」という新しいアーキテクチャを提案し、O(1) メモリ効率を維持しながら完全な文脈記憶を実現することを示しています。

Swamynathan V PTue, 10 Ma🤖 cs.LG