cs.LG 편의 논문 | Gist.Science

Beyond Barren Plateaus: A Scalable Quantum Convolutional Architecture for High-Fidelity Image Classification

이 논문은 지역적 비용 함수와 하드웨어 효율적인 텐서 네트워크 초기화 전략을 도입하여 바렌 플래토 문제를 해결하고, MNIST 데이터셋에서 98.7% 의 정확도를 달성하며 기존 QCNN 보다 월등히 우수한 성능과 파라미터 효율성을 입증한 확장 가능한 양자 합성곱 신경망 아키텍처를 제안합니다.

Radhakrishnan Delhibabu2026-03-13🤖 cs.LG

Higher-Order Modular Attention: Fusing Pairwise and Triadic Interactions for Protein Sequences

이 논문은 단백질 서열 예측을 위해 쌍별 상호작용과 명시적인 삼중 상호작용 경로를 통합한 '고차 모듈형 어텐션 (HOMA)'을 제안하며, TAPE 벤치마크에서 기존 어텐션 메커니즘보다 일관된 성능 향상을 입증했습니다.

Shirin Amiraslani, Xin Gao2026-03-13🤖 cs.LG

Conformal e-prediction in the presence of confounding

이 논문은 관측된 $X$ 와 $Y$ 간의 교란 (confounding) 이 존재하는 경우를 포함하도록 합동적 e-예측 (conformal e-prediction) 을 확장하며, 관측 데이터가 독립동일분포 (IID) 인 경우와 관측치 간 일부 의존성이 허용되는 경우를 모두 다룹니다.

Vladimir Vovk, Ruodu Wang2026-03-13📊 stat

Scaling Reasoning Efficiently via Relaxed On-Policy Distillation

이 논문은 온-정책 증류의 불안정성을 해결하고 샘플 효율성과 추론 속도를 극대화하기 위해, 교사의 보상을 유연하게 활용하는 'REOPOLD'라는 새로운 증류 프레임워크를 제안하고 수학, 시각, 도구 사용 추론 작업에서 기존 방법들을 능가하는 성능을 입증했습니다.

Jongwoo Ko, Sara Abdali, Young Jin Kim, Tianyi Chen, Pashmina Cameron2026-03-13🤖 cs.LG

Deep regression learning from dependent observations with minimum error entropy principle

이 논문은 강한 혼합 조건 하의 종속 관측치를 기반으로 최소 오차 엔트로피 원리를 적용한 비모수 회귀를 제안하고, 비페널티 및 희소 페널티 심층 신경망 추정량의 기대 초과 리스크 상한을 증명하여 가우스 오차 모델에서 최소극한 최적 수렴 속도를 달성함을 보여줍니다.

William Kengne, Modou Wade2026-03-13📊 stat

H2LooP Spark Preview: Continual Pretraining of Large Language Models for Low-Level Embedded Systems Code

이 논문은 임베디드 시스템 도메인 특화 데이터로 OLMo-3-7B 모델을 continual pretraining 한 'H2LooP Spark Preview'를 제안하여, 7B 규모의 오픈 소스 모델이 특정 기술 작업에서 최신 대형 모델들과 경쟁할 수 있음을 입증했습니다.

Amit Singh, Vedant Nipane, Pulkit Agrawal, Jatin Kishnani2026-03-13🤖 cs.LG

Procedural Fairness via Group Counterfactual Explanation

이 논문은 예측 결과의 공정성뿐만 아니라 모델의 추론 과정이 보호 그룹 간에 일관되게 유지되도록 하는 '그룹 반사실 통합 기울기 (GCIG)'라는 정규화 프레임워크를 제안하여, 설명의 불일치를 줄이고 절차적 공정성을 확보하는 새로운 접근법을 제시합니다.

Gideon Popoola, John Sheppard2026-03-13🤖 cs.LG

Attention Gathers, MLPs Compose: A Causal Analysis of an Action-Outcome Circuit in VideoViT

이 논문은 비디오 비전 트랜스포머 모델에서 '성공 대 실패'라는 결과 신호가 어텐션 헤드가 증거를 수집하고 MLP 블록이 개념을 구성하는 분산된 인과 회로를 통해 점진적으로 증폭되는 메커니즘을 규명함으로써, 단순 분류 작업만 수행하는 모델 내부에도 신뢰할 수 있는 AI 를 구축하기 위해 파악해야 할 숨겨진 지식이 존재함을 보여줍니다.

Sai V R Chereddy2026-03-13🤖 cs.LG

Catalogue Grounded Multimodal Attribution for Museum Video under Resource and Regulatory Constraints

이 논문은 박물관의 오디오비주얼 아카이브에서 수동 작업을 자동화하고 데이터 주권 및 규제 준수를 보장하기 위해, 기존 컬렉션 데이터베이스에 기반한 오픈 소스 로컬 배포형 비디오 언어 모델을 활용한 다단계 멀티모달 속성 부여 프레임워크를 제안합니다.

Minsak Nanang, Adrian Hilton, Armin Mustafa2026-03-13🤖 cs.LG

Systematic Scaling Analysis of Jailbreak Attacks in Large Language Models

이 논문은 다양한 공격 방법과 모델에 걸쳐 FLOPs(연산량) 를 기준으로 한 체계적인 스케일링 분석을 통해, 최적화 기반 공격보다 프롬프트 기반 공격이 더 높은 계산 효율성과 은폐성을 가지며, 특히 허위정보 관련 해악이 다른 유형의 해악보다 더 쉽게 유발됨을 규명했습니다.

Xiangwen Wang, Ananth Balashankar, Varun Chandrasekaran2026-03-13🤖 cs.LG

Algorithmic Capture, Computational Complexity, and Inductive Bias of Infinite Transformers

이 논문은 무한 폭 트랜스포머가 '알고리즘적 포획 (Algorithmic Capture)'을 정의하고, 효율적 다항 시간 휴리스틱 (EPTHS) 클래스 내의 저복잡도 알고리즘에 대한 귀납적 편향을 가지며 고복잡도 알고리즘 학습에는 실패함을 이론적으로 규명합니다.

Orit Davidovich, Zohar Ringel2026-03-13🤖 cs.LG

Learning to Unscramble: Simplifying Symbolic Expressions via Self-Supervised Oracle Trajectories

이 논문은 단순한 수식을 뒤섞어 생성한 오라클 궤적을 통해 자기지도 학습을 수행하는 트랜스포머 기반 정책 네트워크를 제안하여, 고에너지 물리학의 복잡한 대수적 표현 단순화 문제에서 기존 강화학습 및 회귀 기반 방법들을 압도하는 높은 성공률을 달성했음을 보여줍니다.

David Shih2026-03-13⚛️ hep-th

Huntington Disease Automatic Speech Recognition with Biomarker Supervision

이 논문은 헌팅턴병 환자의 병리적 음성을 위한 자동 음성 인식 (ASR) 성능을 향상시키기 위해 고품질 임상 말뭉치를 활용하고, Parakeet-TDT 아키텍처의 우수성을 입증하며, 생체표지자 기반 보조 감독을 통해 오류 패턴을 질병 중증도에 맞게 재구성하는 새로운 방법을 제시합니다.

Charles L. Wang, Cady Chen, Ziwei Gong, Julia Hirschberg2026-03-13🤖 cs.LG

PACED: Distillation at the Frontier of Student Competence

이 논문은 지식 증류 시 학생 모델이 이미 숙달했거나 도달 불가능한 문제에서 발생하는 계산 낭비를 이론적으로 규명하고, 학생 모델의 역량 한계 부근의 문제에 집중하도록 설계된 'PACED' 프레임워크를 제안하여 다양한 증류 시나리오에서 성능을 획기적으로 향상시킨다는 내용입니다.

Yuanda Xu, Hejian Sang, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-13🤖 cs.AI

Bayesian Optimization of Partially Known Systems using Hybrid Models

이 논문은 물리 법칙과 가우시안 프로세스를 결합한 하이브리드 모델을 통해 블랙박스 최적화 (BO) 의 수렴 속도를 획기적으로 개선하고, 기존 BO 보다 훨씬 적은 실험 횟수로 최적 설계를 도출하는 새로운 방법을 제안합니다.

Eike Cramer, Luis Kutschat, Oliver Stollenwerk, Joel A. Paulson, Alexander Mitsos2026-03-13🤖 cs.LG

DNS-GT: A Graph-based Transformer Approach to Learn Embeddings of Domain Names from DNS Queries

이 논문은 DNS 쿼리 시퀀스 간의 맥락적 정보를 효과적으로 포착하여 도메인 이름 임베딩을 학습하는 자기지도 학습 기반의 그래프 트랜스포머 모델 'DNS-GT'를 제안하고, 도메인 분류 및 봇넷 탐지 작업에서 기존 방법보다 우수한 성능을 입증합니다.

Massimiliano Altieri, Ronan Hamon, Roberto Corizzo, Michelangelo Ceci, Ignacio Sanchez2026-03-13🤖 cs.LG

Representation Finetuning for Continual Learning

이 논문은 가중치 공간이 아닌 표현 공간에서 저랭크 선형 부분 공간을 활용한 명시적 개입을 통해 기존 방법론의 한계를 극복하고, 지속적인 학습에서 안정성과 가소성을 동시에 확보하는 새로운 패러다임인 'CoRe'를 제안합니다.

Haihua Luo, Xuming Ran, Tommi Kärkkäinen, Huiyan Xue, Zhonghua Chen, Qi Xu, Fengyu Cong2026-03-13🤖 cs.LG

Reference-Guided Machine Unlearning

이 논문은 기존 근사적 기계 망각 방법의 불안정성을 해결하고, 분리된 검증 데이터를 활용한 참조 기반 증류 프레임워크인 ReGUn 을 제안하여 망각 데이터와 미관측 데이터 간의 분포적 구별 불가능성을 달성함으로써 망각과 유용성 간의 균형을 크게 개선함을 보여줍니다.

Jonas Mirlach, Sonia Laguna, Julia E. Vogt2026-03-13🤖 cs.LG

Security-by-Design for LLM-Based Code Generation: Leveraging Internal Representations for Concept-Driven Steering Mechanisms

이 논문은 코드 생성 LLM 이 취약점을 인식하고 있음을 규명하고, 이러한 내부 표현을 활용하여 보안 개념을 능동적으로 제어하는 'SCS-Code'라는 경량화 모듈 방식을 제안함으로써 기존 방법론보다 뛰어난 보안 및 기능적 정확도를 달성함을 보여줍니다.

Maximilian Wendlinger, Daniel Kowatsch, Konstantin Böttinger, Philip Sperl2026-03-13🤖 cs.LG

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

이 논문은 2024 년 8 월부터 2026 년 2 월까지 출시된 7 가지 최첨단 AI 모델을 기업 네트워크 및 산업 제어 시스템 사이버 공격 시나리오에서 평가한 결과, 추론 시 계산량 증가와 모델 세대 발전에 따라 다단계 공격 수행 능력이 비약적으로 향상되었음을 보여줍니다.

Linus Folkerts, Will Payne, Simon Inman, Philippos Giavridis, Joe Skinner, Sam Deverett, James Aung, Ekin Zorer, Michael Schmatz, Mahmoud Ghanem, John Wilkinson, Alan Steer, Vy Hong, Jessica Wang2026-03-13🤖 cs.AI

← 이전 다음 →