Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

本論文は、大規模言語モデルの微調整における安全性の逸脱を防ぐため、有害なデータが含まれていなくても安全性に関連する少数のトークンに対するモデルの確信度を参照モデルと一致させるように制約をかける新たなフレームワーク「PACT」を提案し、タスク適応性を損なうことなく安全性を維持することを目的としています。

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

本論文は、異なる SQL 方言を持つ多様なデータベースシステムに対応し、構文と意味の両面で正確なクエリ生成を実現するために、方言認識論理クエリ計画モジュール、階層的意図認識知識ベース、および実行駆動型デバッグループを導入した「Dial」という知識基盤型 NL2SQL 枠組みを提案し、新しいベンチマーク DS-NL2SQL による実験で最先端手法を上回る性能を示したものである。

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

この論文は、アテンションとフィードフォワードをそれぞれ異なるストリームで処理する「デュアルストリームトランスフォーマー」を提案し、ヘッド間の混合戦略を調整することで解釈性と性能のトレードオフを明示的に制御可能にしつつ、注意機構の増幅に対する頑健性を示したものである。

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Interpretable-by-Design Transformers via Architectural Stream Independence

この論文は、トークンストリームと文脈セマンティクスを処理の最終段階まで分離して保持する「アーキテクチャ的ストリーム独立性」という設計原理を導入し、標準的なトランスフォーマーが早期に意味と位置情報の混同を起こすのに対し、後融合アーキテクチャ(LFA)は解釈可能な記号ヘッドを維持し、位置依存性への依存を減らしてモデルの安定性と構造的解釈可能性を向上させることを実証しています。

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Pushing Bistatic Wireless Sensing toward High Accuracy at the Sub-Wavelength Scale

本論文は、無線通信信号を用いた双基地型センシングにおいて、クロック非同期に起因する位相オフセットを補正し、従来の手法では失われていたサブ波長レベルの高精度な変位検出を実現する新しい手法を提案し、実世界の実験でその有効性を示しています。

Wenwei Li, Jiarun Zhou, Qinxiao Quan, Fusang Zhang, Daqing Zhang2026-03-10🤖 cs.LG

Enhanced Random Subspace Local Projections for High-Dimensional Time Series Analysis

この論文は、高次元時系列データにおける過学習と推定の不安定性を克服するため、重み付き部分空間集約や適応的部分空間サイズ選択などの改良を加えた「強化型ランダム部分空間局所投影(RSLP)」フレームワークを提案し、インパルス応答推定の安定性と信頼性を大幅に向上させる手法を提示しています。

Eman Khalid, Moimma Ali Khan, Zarmeena Ali, Abdullah Illyas, Muhammad Usman, Saoud Ahmed2026-03-10🤖 cs.LG

A Unified Framework for Knowledge Transfer in Bidirectional Model Scaling

本論文は、モデルの重みを連続信号と見なし、離散ウェーブレット変換を用いてアップサンプリングとダウンサンプリングとして扱うことで、小規模から大規模、大規模から小規模への双方向の知識転送を統合的に実現するフレームワーク「BoT」を提案し、大幅な計算コスト削減と最先端の性能達成を実現しています。

Jianlu Shen, Fu Feng, Jiaze Xu, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

Online Continual Learning for Anomaly Detection in IoT under Data Distribution Shifts

この論文は、非定常環境における IoT 異常検知のために、デバイス側でのインテリジェントなサンプル選択とエッジサーバー側での分布シフト検出という 2 つのメカニズムを備えた、通信効率とモデル更新の最適化を実現する新たな継続学習フレームワーク「OCLADS」を提案し、その有効性を TinyML 実験で実証したものである。

Matea Marinova, Shashi Raj Pandey, Junya Shiraishi, Martin Voigt Vejling, Valentin Rakovic, Petar Popovski2026-03-10🤖 cs.LG

A Unified View of Drifting and Score-Based Models

本論文は、Tweedie の公式を用いて「Drifting モデル」がガウス平滑化分布におけるスコアマッチングの原理と厳密に等価であることを示し、拡散モデルや DMD との理論的関係を明らかにするとともに、ラプラス核に対する誤差評価も提供しています。

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG

Beyond Data Splitting: Full-Data Conformal Prediction by Differential Privacy

この論文は、差分プライバシーの安定性を活用してデータを分割せずにフルデータで動作する新しい共形予測フレームワークを提案し、従来の分割ベースの手法よりも鋭い予測集合を実現しつつ、特定の条件下で名目上のカバレッジ水準を漸近的に回復できることを示しています。

Young Hyun Cho, Jordan Awan2026-03-10🤖 cs.LG

One-for-All Model Initialization with Frequency-Domain Knowledge

本論文は、事前学習済みモデルの低周波成分に「learngene(学習遺伝子)」が埋め込まれているという発見に基づき、離散コサイン変換を用いてサイズを問わず任意のモデルを効率的に初期化し、トレーニング不要で高速な収束と計算コスト削減を実現する新たな知識転送フレームワーク「FRONT」を提案するものである。

Jianlu Shen, Fu Feng, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

この論文は、事前定義された脳アトラスや線形仮定に依存する既存手法の限界を克服し、神経動態を考慮した事前学習フレームワークを導入することで、多様なシナリオにおける個人固有の脳機能ネットワーク構築を実現し、その汎用性と精度を大幅に向上させることを提案しています。

Hongjie Jiang, Yifei Tang, Shuqiang Wang2026-03-10🤖 cs.LG

Generative prediction of laser-induced rocket ignition with dynamic latent space representations

本論文は、乱流混合やレーザーエネルギー付与など複雑な物理現象を含むレーザー点火ロケットエンジンのシミュレーションを、畳み込みオートエンコーダとニューラル常微分方程式を組み合わせたデータ駆動型サロゲートモデルにより高速化し、リアルタイムなデジタルツイン実現に向けた重要な進展を報告するものである。

Tony Zahtila, Ettore Saetta, Murray Cutforth, Davy Brouzet, Diego Rossinelli, Gianluca Iaccarino2026-03-10🤖 cs.LG