cs.AI 件の論文 | Gist.Science

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

AdaFuse は、トークン単位の事前ゲートングとカスタム CUDA カーネルによる融合最適化を組み合わせることで、動的アダプター推論におけるレイテンシを 2.4 倍以上削減しつつ、精度を維持する新しいフレームワークを提案する。

Qiyang Li, Rui Kong, Yuchen Li, Hengyi Cai, Shuaiqiang Wang, Linghe Kong, Guihai Chen, Dawei Yin2026-03-13🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

この論文は、大規模モデルに依存せず、厳密にキュレーションされたデータ幾何学構造（ミラー・デザインパターン）と線形モデルを用いることで、低遅延かつ高信頼性のプロンプトインジェクション検出を実現し、L1 レベルの防御においてモデルの規模よりもデータの厳密な設計が重要であることを示しています。

J Alex Corll2026-03-13🤖 cs.AI

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

本論文は、NVIDIA の Minitron 手法に着想を得た構造化プルーニングと知識蒸留、および高度なアライメントパイプラインを組み合わせることで、ポーランド語および欧州言語に特化した大規模言語モデル「Bielik-11B」をパラメータ数を約 33% 削減しつつ推論速度を最大 50% 向上させ、かつベースラインの性能の約 90% を維持する「Bielik-Minitron-7B」を構築したことを報告しています。

Remigiusz Kinas, Paweł Kiszczak, Sergio P. Perez, Krzysztof Ociepa, Łukasz Flis, Krzysztof Wróbel, Adrian Gwozdziej2026-03-13💬 cs.CL

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

この論文は、マルチターン対話における連続的な動画ストリームの推論を可能にするため、セグメントレベルのメモリを維持し、視聴と思考を並行して行う「Think While Watching」という新しいフレームワークを提案し、Qwen3-VL 基盤で StreamingBench や OVO-Bench などのベンチマークにおいて高い精度と効率的なトークン生成を実現したことを示しています。

Lu Wang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Zhuoran Jin (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yupu Hao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yubo Chen (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Kang Liu (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yulong Ao (Beijing Academy of Artificial Intelligence), Jun Zhao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China)2026-03-13💬 cs.CL

← 前へ次へ →

cs.AI

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

Fair Learning for Bias Mitigation and Quality Optimization in Paper Recommendation

Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting

Effective Resistance Rewiring: A Simple Topological Correction for Over-Squashing

Geometry-Aware Probabilistic Circuits via Voronoi Tessellations

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

Learning Transferable Sensor Models via Language-Informed Pretraining

Multimodal Emotion Recognition via Bi-directional Cross-Attention and Temporal Modeling

Normative Common Ground Replication (NormCoRe): Replication-by-Translation for Studying Norms in Multi-agent AI

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

LABSHIELD: A Multimodal Benchmark for Safety-Critical Reasoning and Planning in Scientific Laboratories

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

Few-for-Many Personalized Federated Learning

Can RL Improve Generalization of LLM Agents? An Empirical Study