Embedding interpretable 1\ell_1-regression into neural networks for uncovering temporal structure in cell imaging

이 논문은 1\ell_1-규제 벡터 자기회귀 (VAR) 모델을 컨볼루션 오토인코더에 임베딩하여 세포 영상 데이터의 희소 시계열 구조를 해석 가능하게 추출하고, 비희소 공간 정보는 스킵 연결을 통해 분리 처리하는 새로운 딥러닝 프레임워크를 제안합니다.

Fabian Kabus, Maren Hackenberg, Julia Hindel, Thibault Cholvin, Antje Kilias, Thomas Brox, Abhinav Valada, Marlene Bartos, Harald Binder2026-03-10🤖 cs.LG

Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

이 논문은 Video Diffusion Transformers 가 텍스트 기반 운동 개념을 어떻게 비디오로 변환하는지 이해하기 위해, 그라디언트 계산 없이 운동과 비운동 개념 모두에 대한 시공간적 국소화 맵을 생성하는 새로운 해석 가능한 방법론 (GramCol 및 IMAP) 을 제안합니다.

Youngjun Jun, Seil Kang, Woojung Han, Seong Jae Hwang2026-03-10🤖 cs.LG

CGL: Advancing Continual GUI Learning via Reinforcement Fine-Tuning

이 논문은 SFT 와 RL 의 시너지를 극대화하고 정책 엔트로피 기반의 동적 조정 및 그라디언트 외과 기법을 도입하여 GUI 에이전트의 지속적인 학습 성능을 향상시키고, 이를 평가하기 위한 AndroidControl-CL 벤치마크를 제안하는 CGL 프레임워크를 소개합니다.

Zhenquan Yao, Zitong Huang, Yihan Zeng, Jianhua Han, Hang Xu, Chun-Mei Feng, Jianwei Ma, Wangmeng Zuo2026-03-10🤖 cs.LG

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails

이 논문은 이차 모멘트 정규화와 정지 시간/마팅겔 분석을 통해, 고확률 수렴에서 Adam 이 신뢰도 파라미터에 대해 δ1/2\delta^{-1/2} 의존성을 보이는 반면 SGD 는 적어도 δ1\delta^{-1} 의존성을 갖는다는 이론적 차이를 최초로 증명하여 Adam 의 SGD 대비 우월한 성능을 설명합니다.

Ruinan Jin, Yingbin Liang, Shaofeng Zou2026-03-10🤖 cs.LG

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

이 논문은 웹 기반 디지털 웰빙을 위해 '탐색 - 통찰 - 행동' 치료 패러다임에 부합하는 다중 에이전트 프레임워크인 XInsight 와 이를 평가하기 위한 벤치마크 XInsight-Bench 를 제안하며, 기존 시스템 대비 치료적 일관성, 해석 가능성 및 개입 깊이를 크게 향상시켰음을 보여줍니다.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng Wang2026-03-10🤖 cs.LG

How Attention Sinks Emerge in Large Language Models: An Interpretability Perspective

이 논문은 대규모 언어 모델에서 의미 정보 없이도 입력 시퀀스의 첫 번째 토큰에 집중되는 '어텐션 싱크'가 P0 싱크 회로를 통해 어떻게 형성되고 학습 초기에 두 번째 레이어까지 집중되며 사전 학습 수렴 상태를 추적하는 신호가 될 수 있는지를 규명합니다.

Runyu Peng, Ruixiao Li, Mingshu Chen, Yunhua Zhou, Qipeng Guo, Xipeng Qiu2026-03-10🤖 cs.LG

Khatri-Rao Clustering for Data Summarization

이 논문은 기존 중심점 기반 클러스터링의 중복성을 해결하고 데이터 요약의 간결성과 정확성 간의 균형을 개선하기 위해, 중심점이 두 개 이상의 간결한 프로토중심점 집합의 상호작용에서 비롯된다는 가정을 바탕으로 'Khatri-Rao k-Means' 알고리즘과 'Khatri-Rao 심층 클러스터링' 프레임워크를 제안합니다.

Martino Ciaperoni, Collin Leiber, Aristides Gionis, Heikki Mannila2026-03-10🤖 cs.LG

Scale Dependent Data Duplication

이 논문은 모델의 규모가 커질수록 의미적으로 유사한 문서들이 표면적 중복과 유사하게 작용하여 학습에 해로운 영향을 미치고 스케일링 법칙을 왜곡한다는 점을 규명하여, 데이터의 의미적 중복이 모델 성능 예측에 미치는 규모 의존적 영향을 분석하고 이를 보정하는 스케일링 법칙을 제시합니다.

Joshua Kazdan, Noam Levi, Rylan Schaeffer, Jessica Chudnovsky, Abhay Puri, Bo He, Mehmet Donmez, Sanmi Koyejo, David Donoho2026-03-10🤖 cs.LG

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

이 논문은 구조화된 태스크의 분류 레이블과 개방형 생성의 자기평가 응답을 기반으로 정규화된 신뢰도 점수를 도입하여 LLM 의 오류와 환각을 외부 검증 없이 탐지하는 프레임워크를 제시하고, 강화학습이 신뢰도를 저하시키는 반면 자기교란을 통한 사후 SFT 가 이를 회복시켜 RAG 시스템의 효율성을 극대화함을 증명합니다.

Xie Xiaohu, Liu Xiaohu, Yao Benjamin2026-03-10🤖 cs.LG

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

이 논문은 C-V2X 무선 자원 할당 문제를 다중 에이전트 강화 학습의 주요 난제를 분리하여 평가할 수 있는 일련의 간섭 게임과 대규모 데이터셋으로 체계화하고, 다양한 차량 토폴로지에서의 정책 견고성과 일반화가 가장 큰 도전 과제임을 규명하며 관련 코드와 벤치마크를 오픈소스로 공개합니다.

Siyuan Wang, Lei Lei, Pranav Maheshwari, Sam Bellefeuille, Kan Zheng, Dusit Niyato2026-03-10🤖 cs.LG