cs.AI 편의 논문 | Gist.Science

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

AdaFuse 는 토큰 단위의 사전 게이트링 전략과 커스텀 CUDA 커널 최적화를 통해 동적 어댑터 추론 시 발생하는 CUDA 커널 오버헤드를 해결하여, 정확도 유지하면서 추론 지연 시간을 2.4 배 이상 단축하는 프레임워크를 제안합니다.

Qiyang Li, Rui Kong, Yuchen Li, Hengyi Cai, Shuaiqiang Wang, Linghe Kong, Guihai Chen, Dawei Yin2026-03-13🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

이 논문은 대규모 모델의 의존 없이 초저지연으로 작동하는 프롬프트 인젝션 탐지를 위해, 엄격한 데이터 기하학적 구조를 기반으로 한 '미러 (Mirror)' 설계 패턴이 모델 규모보다 더 효과적임을 입증합니다.

J Alex Corll2026-03-13🤖 cs.AI

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

이 논문은 NVIDIA 의 Minitron 접근 방식을 차용한 구조적 가지치기와 지식 증류, 그리고 정렬 파이프라인을 통해 폴란드어 및 유럽어에 최적화된 110 억 파라미터 모델인 Bielik-11B-v3.0 을 73.5 억 파라미터로 압축하면서도 베이스 모델 성능의 약 90% 를 유지하고 추론 속도를 최대 50% 향상시킨 Bielik-Minitron-7B 모델을 개발한 과정을 상세히 설명합니다.

Remigiusz Kinas, Paweł Kiszczak, Sergio P. Perez, Krzysztof Ociepa, Łukasz Flis, Krzysztof Wróbel, Adrian Gwozdziej2026-03-13💬 cs.CL

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

이 논문은 연속적으로 들어오는 비디오 스트림에서 멀티턴 상호작용을 위한 지속적인 세그먼트 수준의 기억을 보존하고, '보면서 동시에 생각하기' 방식을 통해 온라인 추론 성능을 획기적으로 개선하는 'Think While Watching' 프레임워크를 제안합니다.

Lu Wang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Zhuoran Jin (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yupu Hao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yubo Chen (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Kang Liu (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yulong Ao (Beijing Academy of Artificial Intelligence), Jun Zhao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China)2026-03-13💬 cs.CL

← 이전 다음 →

cs.AI

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

Fair Learning for Bias Mitigation and Quality Optimization in Paper Recommendation

Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting

Effective Resistance Rewiring: A Simple Topological Correction for Over-Squashing

Geometry-Aware Probabilistic Circuits via Voronoi Tessellations

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

Learning Transferable Sensor Models via Language-Informed Pretraining

Multimodal Emotion Recognition via Bi-directional Cross-Attention and Temporal Modeling

Normative Common Ground Replication (NormCoRe): Replication-by-Translation for Studying Norms in Multi-agent AI

HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios

LABSHIELD: A Multimodal Benchmark for Safety-Critical Reasoning and Planning in Scientific Laboratories

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

Few-for-Many Personalized Federated Learning

Can RL Improve Generalization of LLM Agents? An Empirical Study