Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

이 논문은 GPT 스타일의 믹스처 오브 전문가 (MoE) 모델에서 총 연산량과 희소도에 따라 전문가 레이어와 어텐션 레이어 간의 최적 연산 배분 비율을 결정하는 새로운 스케일링 법칙을 제안하여, 고정된 연산 예산 내에서 MoE 모델의 효율적인 설계와 성능 최적화를 위한 실용적인 지침을 제공합니다.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Beyond Scalars: Evaluating and Understanding LLM Reasoning via Geometric Progress and Stability

이 논문은 LLM 의 추론 신뢰성을 평가하기 위해 확률적 스칼라 대신 '진전 (Progress)'과 '안정성 (Stability)'이라는 기하학적 개념을 도입한 TRACED 프레임워크를 제안하며, 이를 통해 할루시네이션과 올바른 추론을 구별하고 기계적 사고의 내부 역학을 해석할 수 있음을 보여줍니다.

Xinyan Jiang, Ninghao Liu, Di Wang, Lijie Hu2026-03-12🤖 cs.AI

Safe Probabilistic Planning for Human-Robot Interaction using Conformal Risk Control

이 논문은 제어 장벽 함수 (CBF) 와 순응적 위험 제어 (Conformal Risk Control) 를 결합하여 인간 행동의 복잡성을 고려하면서도 충돌 위험을 통계적으로 보장하는 새로운 확률적 안전 제어 프레임워크를 제안하고, 이를 통해 인간 - 로봇 상호작용 시 충돌률을 크게 낮추면서도 목표 도달 성공률을 유지하는 것을 입증합니다.

Jake Gonzales, Kazuki Mizuta, Karen Leung, Lillian J. Ratliff2026-03-12🤖 cs.AI

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

이 논문은 레이블 노이즈가 포함된 SGD 를 사용하는 2 층 선형 신경망의 학습 역학을 분석하여, 노이즈가 모델이 '게으른(regime)' 상태에서 '풍부한(rich)' 상태로 전환되도록 유도하고 일반화 성능을 향상시키는 두 단계 학습 메커니즘을 규명했다고 요약할 수 있습니다.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

이 논문은 기존 방법의 한계를 극복하기 위해 시공간 데이터의 시간과 공간 차원을 모두 압축하는 'STemDist'라는 새로운 데이터 증류 기법을 제안하여, 기존 방법 대비 훈련 속도를 최대 6 배, 메모리 효율을 최대 8 배 향상시키면서 예측 오차를 최대 12% 까지 낮추는 성과를 입증했습니다.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

이 논문은 GAN 과 FGSM 기반의 적대적 예제를 활용하여 생성된 악성 트래픽으로부터 ML 기반 네트워크 침입 탐지 시스템 (NIDS) 의 취약점을 완화하기 위해 스택링 분류기와 오토인코더를 결합한 다층 앙상블 방어 메커니즘을 제안하고, UNSW-NB15 와 NSL-KDD 데이터셋을 통해 그 효과성을 입증합니다.

Nasim Soltani, Shayan Nejadshamsi, Zakaria Abou El Houda, Raphael Khoury, Kelton A. P. Costa, Tiago H. Falk, Anderson R. Avila2026-03-12🤖 cs.AI

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

이 논문은 다양한 작동 조건에서 발생하는 분포 불일치 문제를 해결하기 위해, 열화 단계 동기화 배치 샘플링 (DSSBS) 과 교차 도메인 정렬 융합 대형 오토인코더 (CAFLAE) 를 도입하여 건강 지표 (HI) 학습의 정확도를 기존 최첨단 방법 대비 평균 24.1% 향상시킨 도메인 적응 프레임워크를 제안합니다.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

이 논문은 저비트 LLM 학습 시 발생하는 수치적 불안정성의 주된 원인이 랭크 1 의 평균 편향임을 규명하고, 이를 제거하는 간단한 평균 차감 기법을 통해 BF16 수준의 안정성과 성능을 FP4 양자화 환경에서도 효율적으로 회복할 수 있음을 제시합니다.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

이 논문은 소수의 시연 데이터에서 IsaacLab 을 활용한 데이터 증강과 적응형 잔차 정제 기법을 결합한 계층적 프레임워크 'FAR-Dex'를 제안하여, 다관절 손과 로봇 팔의 협업을 통한 정교한 조작 작업의 성공률과 일반화 성능을 획기적으로 향상시켰음을 보여줍니다.

Yushan Bai, Fulin Chen, Hongzheng Sun, Yuchuang Tong, En Li, Zhengtao Zhang2026-03-12🤖 cs.AI

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

이 논문은 단일 유동 설정에 국한된 기존 물리 정보 신경망 (PINN) 의 한계를 극복하고, 공유된 물리 법칙과 유동별 특성을 분리하며 간섭을 억제하고 손실 균형을 자동 조정하는 통합 아키텍처인 UniPINN 을 제안하여 다양한 나비에-스토크스 방정식 다중 태스크 학습의 정확도와 안정성을 획기적으로 향상시켰습니다.

Dengdi Sun, Jie Chen, Xiao Wang, Jin Tang2026-03-12🤖 cs.AI

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

이 논문은 장문의 다자간 중첩 음성을 처리할 때 chunk 단위 추론에서 회의 수준의 화자 일관성을 유지하면서 시간 스탬프가 포함된 화자 할당 전사문을 생성하기 위해, 시간 인식 화자 추적 모듈과 Speech-LLM 전사 백본을 결합한 종단간 시스템 'G-STAR'를 제안합니다.

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai Wang2026-03-12⚡ eess

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

이 논문은 상반된 페르소나를 가진 두 개의 LLM 이 구조화된 협상 대화를 통해 상호 이익을 도모하는 방식으로 훈련함으로써, 가치 충돌 상황에서 집단적 에이전시 (Collective Agency) 정렬을 유지하면서도 갈등 해결 능력을 획기적으로 향상시키는 새로운 다중 에이전트 정렬 프레임워크를 제안합니다.

Panatchakorn Anantaprayoon, Nataliia Babina, Nima Asgharbeygi, Jad Tarifi2026-03-12💬 cs.CL

JEDI: Jointly Embedded Inference of Neural Dynamics

이 논문은 제한적이고 노이즈가 많은 신경 기록 데이터에서도 다양한 과제를 포괄하는 단일 통합 모델로 뇌의 역동적 메커니즘을 확장 가능하고 일반화되게 추론할 수 있는 계층적 모델 'JEDI'를 제안하고, 이를 통해 신경 역학의 공유 구조를 밝히고 실제 원숭이 운동 피질 데이터에 적용하여 운동 제어의 기작적 통찰을 도출함을 보여줍니다.

Anirudh Jamkhandi, Ali Korojy, Olivier Codol, Guillaume Lajoie, Matthew G. Perich2026-03-12🧬 q-bio

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

이 논문은 생성형 AI 가 사용자에게 노출하는 무제한의 추론 및 이미지 개선 기능이 오히려 현대적인 딥페이크 탐지기의 핵심 기준을 역이용하여, 정책 위반 없이도 탐지를 회피하고 신원 및 화질을 유지하는 공격을 가능하게 함으로써 기존 탐지 프레임워크의 위협 모델이 현실과 괴리되어 있음을 보여줍니다.

Sunpill Kim, Chanwoo Hwang, Minsu Kim, Jae Hong Seo2026-03-12🤖 cs.AI