Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

この論文は、データ不足に直面する NPU などのニッチなハードウェア生態系におけるカーネル合成の課題を解決するため、価値駆動型のメモリ機構と強化学習を用いて、大規模言語モデルがゼロスタートから自律的にカーネルを生成・改善するエージェントフレームワーク「EvoKernel」を提案し、大幅な正解率と高速化の向上を実証したものである。

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

Semantic Landmark Particle Filter for Robot Localisation in Vineyards

本論文は、ブドウ園の並行する列による知覚の曖昧さという課題に対し、LiDAR と trunk(幹)および pole(支柱)のセマンティックなランドマーク検出を統合した「セマンティックランドマーク粒子フィルタ(SLPF)」を提案し、実地実験で既存の幾何学的 SLAM や GNSS ベースの手法と比較して位置推定精度と行の識別能力を大幅に向上させたことを示しています。

Rajitha de Silva, Jonathan Cox, James R. Heselden, Marija Popovic, Cesar Cadena, Riccardo Polvara2026-03-12🤖 cs.AI

V0.5V_{0.5}: Generalist Value Model as a Prior for Sparse RL Rollouts

この論文は、事前学習された汎用価値モデルを事前分布として活用し、リアルタイム統計検定に基づいて希薄なロールアウトの予算を動的に割り当てることで、推定誤差を最小化し安定した方策勾配を実現する新しい価値モデル「V0.5」を提案し、数学的推論ベンチマークにおいて既存手法を大幅に上回る性能を示したことを述べています。

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

本論文は、グリッド、ロードマップ、連続空間など異なる抽象化レベルの環境で同一タスクを評価可能にする統合された2Dマルチロボット経路計画シミュレータおよびベンチマーク「GRACE」を提案し、表現と忠実度のトレードオフを定量化することで研究の比較可能性と実用化を促進するものです。

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang Hönig2026-03-12🤖 cs.AI

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

この論文は、大規模な英独バイリンガル目録記録と統合権限ファイル(GND)の注釈付きコーパス、および機械可読な GND 分類体系を公開し、権限に根ざした AI 支援による目録作成と評価を可能にする新しい極端多ラベルテキスト分類リソースを提案するものである。

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

この論文は、U-Net 基盤をトランスフォーマーと 2D CNN エンコーダーに置き換えたパラメータ効率の高い拡散トランスフォーマー(DiT)を提案し、細胞特異的な調節 DNA 配列の生成において、従来モデルよりもはるかに少ないエポック数で収束し、過学習を抑制するとともに、Enformer を報酬モデルとした DDPO 微調整により予測される調節活性を劇的に向上させたことを示しています。

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

この論文は、大規模推論モデルの強化学習ファインチューニングにおいて、コストのかかるロールアウトを伴う従来のオンラインプロンプト選択手法の問題を解決するため、学習ダイナミクスを隠れマルコフモデルでモデル化しベイズ推論を用いて事前予測を行う「Dynamics-Predictive Sampling (DPS)」を提案し、不要な計算コストを削減しながら推論性能を向上させることを示しています。

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

本論文は、大規模言語モデルの事実性や追跡可能性の欠如を克服するため、反復スキーマ洗練アルゴリズムで構築されたハイブリッド製薬知識ベースと、これを基盤とした検証チェーン(CoV)を組み合わせた「PharmGraph-Auditor」という新しいシステムを提案し、薬剤師による処方箋検証の安全性と効率性の向上を目指すものである。

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-12🤖 cs.AI

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

本論文は、ドラフト生成を不要としながら将来の情報を活用して KV キャッシュの重要度を高精度に予測する軽量フレームワーク「LookaheadKV」を提案し、既存の手法よりもはるかに低いコストで長文脈タスクにおけるエビクション精度と推論速度を大幅に向上させることを示しています。

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

When Fine-Tuning Fails and when it Generalises: Role of Data Diversity and Mixed Training in LLM-based TTS

この論文は、多様な訓練データを用いてLoRAで微調整されたQwen-0.5Bモデルが、音声クローンタスクにおいて話者一貫性、知覚品質、信号対雑音比のすべてにおいて凍結ベースモデルを上回ることを示し、データ多様性がLLMベースTTSの汎化性能を決定づける要因であることを実証しています。

Anupam Purwar, Aditya Choudhary2026-03-12🤖 cs.AI

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

本論文は、複数のガウス混合モデルクラスタリングの制約を反復的に選択・最適化する「Historical Consensus Training」を導入することで、アーキテクチャの制約やハイパーパラメータの調整なしに、変分オートエンコーダにおける後方崩壊を根本的に防止し、安定した潜在表現を学習可能にする手法を提案しています。

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

本論文は、従来の期待値ベースの制約では捉えきれない分布の尾部リスクや分布外故障に対処するため、最適輸送枠組みを用いた第一階確率支配制約を導入し、スペクトルリスク測度を普遍的に制御する新しい安全 RLHF 手法「RAD」を提案し、有害性の向上と分布外評価における堅牢性の両立を実証したものである。

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

本論文は、物体表面と手のキーポイントの接触状態を学習されたハッシュコードで条件付けされた接触カウンターを用いて、多様な接触パターンの探索を促進する「接触カバレッジ誘導探索(CCGE)」を提案し、複雑な器用な操作タスクにおける学習効率と成功率の向上、および実世界への堅牢な転移を実現したことを示しています。

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

本論文は、物体検出モデルから得られる明示的な空間的グラウンディング情報を視覚言語モデルに統合する「GroundCount」フレームワークを提案し、これにより数え上げタスクにおけるハルシネーションを軽減し、複数のモデルで精度向上と推論時間の短縮を実現することを示しています。

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

本論文は、AI(機械学習や自然言語処理)が要件管理からコード生成・テストまでの業務を自動化し、アジャイル開発の効率化とソフトウェア工学におけるイノベーションを促進する重要な触媒であることを、文献レビューと実証調査を通じて明らかにしています。

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-Cisneros2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

この論文は、前衛的AIシステムの評価に用いられる人間の能力向上研究(RCT)において、急速な技術進化や実環境の複雑さが因果推論の仮定と対立するという課題を16人の専門家へのインタビューを通じて明らかにし、高リスクな意思決定におけるエビデンスの限界と適切な活用方法を提言するものである。

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

この論文は、コンピュータサイエンスと美術史の専門家による共同研究を通じて、ビジョン・ランゲージモデルが芸術様式を認識するメカニズムを解明し、その判断根拠の約 9 割が美術史家の基準と整合していることを示しています。

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

既存のテキスト音楽生成モデルが抱える微細な時間制御の課題を、対データなしで動画イベントと音楽イベントの時間的変化構造をそれぞれ独立して捉える「イベント曲線」を用いることで解決し、動画に時間的に同期した音楽を生成するゼロショット手法「V2M-Zero」を提案した。

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

この論文は、表面温度の過渡測定から材料特性の定量的な 3 次元再構成を可能にする、微分可能な物理ソルバーを基盤としたニューラル場熱トモグラフィ(NeFTY)という新しいフレームワークを提案し、従来の手法が抱える側方拡散の無視や勾配の剛直性などの課題を克服して内部欠陥の高精度な特定を実現することを示しています。

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci