Beyond Barren Plateaus: A Scalable Quantum Convolutional Architecture for High-Fidelity Image Classification

이 논문은 지역적 비용 함수와 하드웨어 효율적인 텐서 네트워크 초기화 전략을 도입하여 바렌 플래토 문제를 해결하고, MNIST 데이터셋에서 98.7% 의 정확도를 달성하며 기존 QCNN 보다 월등히 우수한 성능과 파라미터 효율성을 입증한 확장 가능한 양자 합성곱 신경망 아키텍처를 제안합니다.

Radhakrishnan Delhibabu2026-03-13🤖 cs.LG

Scaling Reasoning Efficiently via Relaxed On-Policy Distillation

이 논문은 온-정책 증류의 불안정성을 해결하고 샘플 효율성과 추론 속도를 극대화하기 위해, 교사의 보상을 유연하게 활용하는 'REOPOLD'라는 새로운 증류 프레임워크를 제안하고 수학, 시각, 도구 사용 추론 작업에서 기존 방법들을 능가하는 성능을 입증했습니다.

Jongwoo Ko, Sara Abdali, Young Jin Kim, Tianyi Chen, Pashmina Cameron2026-03-13🤖 cs.LG

Attention Gathers, MLPs Compose: A Causal Analysis of an Action-Outcome Circuit in VideoViT

이 논문은 비디오 비전 트랜스포머 모델에서 '성공 대 실패'라는 결과 신호가 어텐션 헤드가 증거를 수집하고 MLP 블록이 개념을 구성하는 분산된 인과 회로를 통해 점진적으로 증폭되는 메커니즘을 규명함으로써, 단순 분류 작업만 수행하는 모델 내부에도 신뢰할 수 있는 AI 를 구축하기 위해 파악해야 할 숨겨진 지식이 존재함을 보여줍니다.

Sai V R Chereddy2026-03-13🤖 cs.LG

Catalogue Grounded Multimodal Attribution for Museum Video under Resource and Regulatory Constraints

이 논문은 박물관의 오디오비주얼 아카이브에서 수동 작업을 자동화하고 데이터 주권 및 규제 준수를 보장하기 위해, 기존 컬렉션 데이터베이스에 기반한 오픈 소스 로컬 배포형 비디오 언어 모델을 활용한 다단계 멀티모달 속성 부여 프레임워크를 제안합니다.

Minsak Nanang, Adrian Hilton, Armin Mustafa2026-03-13🤖 cs.LG

Systematic Scaling Analysis of Jailbreak Attacks in Large Language Models

이 논문은 다양한 공격 방법과 모델에 걸쳐 FLOPs(연산량) 를 기준으로 한 체계적인 스케일링 분석을 통해, 최적화 기반 공격보다 프롬프트 기반 공격이 더 높은 계산 효율성과 은폐성을 가지며, 특히 허위정보 관련 해악이 다른 유형의 해악보다 더 쉽게 유발됨을 규명했습니다.

Xiangwen Wang, Ananth Balashankar, Varun Chandrasekaran2026-03-13🤖 cs.LG

Huntington Disease Automatic Speech Recognition with Biomarker Supervision

이 논문은 헌팅턴병 환자의 병리적 음성을 위한 자동 음성 인식 (ASR) 성능을 향상시키기 위해 고품질 임상 말뭉치를 활용하고, Parakeet-TDT 아키텍처의 우수성을 입증하며, 생체표지자 기반 보조 감독을 통해 오류 패턴을 질병 중증도에 맞게 재구성하는 새로운 방법을 제시합니다.

Charles L. Wang, Cady Chen, Ziwei Gong, Julia Hirschberg2026-03-13🤖 cs.LG

PACED: Distillation at the Frontier of Student Competence

이 논문은 지식 증류 시 학생 모델이 이미 숙달했거나 도달 불가능한 문제에서 발생하는 계산 낭비를 이론적으로 규명하고, 학생 모델의 역량 한계 부근의 문제에 집중하도록 설계된 'PACED' 프레임워크를 제안하여 다양한 증류 시나리오에서 성능을 획기적으로 향상시킨다는 내용입니다.

Yuanda Xu, Hejian Sang, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-13🤖 cs.AI

DNS-GT: A Graph-based Transformer Approach to Learn Embeddings of Domain Names from DNS Queries

이 논문은 DNS 쿼리 시퀀스 간의 맥락적 정보를 효과적으로 포착하여 도메인 이름 임베딩을 학습하는 자기지도 학습 기반의 그래프 트랜스포머 모델 'DNS-GT'를 제안하고, 도메인 분류 및 봇넷 탐지 작업에서 기존 방법보다 우수한 성능을 입증합니다.

Massimiliano Altieri, Ronan Hamon, Roberto Corizzo, Michelangelo Ceci, Ignacio Sanchez2026-03-13🤖 cs.LG

Security-by-Design for LLM-Based Code Generation: Leveraging Internal Representations for Concept-Driven Steering Mechanisms

이 논문은 코드 생성 LLM 이 취약점을 인식하고 있음을 규명하고, 이러한 내부 표현을 활용하여 보안 개념을 능동적으로 제어하는 'SCS-Code'라는 경량화 모듈 방식을 제안함으로써 기존 방법론보다 뛰어난 보안 및 기능적 정확도를 달성함을 보여줍니다.

Maximilian Wendlinger, Daniel Kowatsch, Konstantin Böttinger, Philip Sperl2026-03-13🤖 cs.LG

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

이 논문은 2024 년 8 월부터 2026 년 2 월까지 출시된 7 가지 최첨단 AI 모델을 기업 네트워크 및 산업 제어 시스템 사이버 공격 시나리오에서 평가한 결과, 추론 시 계산량 증가와 모델 세대 발전에 따라 다단계 공격 수행 능력이 비약적으로 향상되었음을 보여줍니다.

Linus Folkerts, Will Payne, Simon Inman, Philippos Giavridis, Joe Skinner, Sam Deverett, James Aung, Ekin Zorer, Michael Schmatz, Mahmoud Ghanem, John Wilkinson, Alan Steer, Vy Hong, Jessica Wang2026-03-13🤖 cs.AI