More Than Memory Savings: Zeroth-Order Optimization Mitigates Forgetting in Continual Learning

이 논문은 영차 (Zeroth-order) 최적화가 continual learning 에서의 망각을 완화하는 안정성 이점을 제공하지만 학습 속성 (plasticity) 을 저하시킨다는 점을 규명하고, 이를 해결하기 위해 영차 최적화를 어댑터 모듈에, 1 차 최적화를 분류기에 적용하는 메모리 효율적인 ZO-FC 방법을 제안합니다.

Wanhao Yu, Zheng Wang, Shuteng Niu, Sen Lin, Li Yang2026-03-13🤖 cs.LG

Cross-Space Synergy: A Unified Framework for Multimodal Emotion Recognition in Conversation

이 논문은 텍스트, 음성, 시각적 단서를 통합하여 대화 중 감정을 인식하는 기존 방법의 한계를 극복하기 위해 고차원 상호작용을 포착하는 '상호작용 다항식 융합 (SPF)'과 경량 최적화를 위한 '파레토 경사 조절기 (PGM)'를 결합한 '크로스-스페이스 시너지 (CSS)' 프레임워크를 제안하고, IEMOCAP 및 MELD 데이터셋에서 기존 방법보다 우수한 정확도와 학습 안정성을 입증했습니다.

Xiaosen Lyu, Jiayu Xiong, Yuren Chen + 3 more2026-03-13🤖 cs.LG

Domain Feature Collapse: Implications for Out-of-Distribution Detection and Solutions

이 논문은 단일 도메인 데이터로 학습된 모델이 정보 병목 현상으로 인해 도메인 특징을 완전히 잃어버리는 '도메인 특징 붕괴'가 발생하여 분포 외 (OOD) 검출에 실패한다는 이론적 근거를 제시하고, 사전 학습된 표현을 활용한 도메인 필터링을 통해 이를 해결할 수 있음을 증명합니다.

Hong Yang, Devroop Kar, Qi Yu, Alex Ororbia, Travis Desell2026-03-13🤖 cs.LG

Forests of Uncertaint(r)ees: Using tree-based ensembles to estimate probability distributions of future conflict

이 논문은 고도화된 불확실성을 가진 무력 충돌 사망자 수 예측의 한계를 극복하기 위해, 트리 기반 앙상블과 분포 회귀를 결합한 자동화 머신러닝 방식을 통해 점 예측에서 전체 예측 분포 추정으로 전환하고 지역별 모델 통합을 통해 예측 정확도를 입증했습니다.

Daniel Mittermaier, Tobias Bohne, Martin Hofer, Daniel Racek2026-03-13📊 stat

CTIGuardian: A Few-Shot Framework for Mitigating Privacy Leakage in Fine-Tuned LLMs

이 논문은 사이버 위협 정보 (CTI) 도메인을 사례로, 파인튜닝된 대규모 언어 모델 (LLM) 에서 발생할 수 있는 민감 정보 유출을 방지하기 위해 재학습 없이 소량의 예시를 활용한 '프라이버시 정렬' 프레임워크인 CTIGuardian 을 제안하고, 기존 NER 기반 방법보다 우수한 프라이버시와 유용성의 균형을 입증합니다.

Shashie Dilhara Batan Arachchige, Benjamin Zi Hao Zhao, Hassan Jameel Asghar + 2 more2026-03-13🤖 cs.LG

Provably Finding a Hidden Dense Submatrix among Many Planted Dense Submatrices via Convex Programming

이 논문은 기존 연구가 단일 밀집 서브그래프를 가정했던 것과 달리, 실제 네트워크에서 흔히 나타나는 여러 개의 밀집 서브그래프가 혼재된 환경에서도 볼록 프로그래밍을 통해 밀집 서브행렬 문제를 다항 시간 내에 해결할 수 있는 충분 조건을 제시하고 실험적으로 검증합니다.

Valentine Olanubi (University of Alabama, Department of Mathematics), Phineas Agar (University of Alabama, Department of Mathematics), Brendan Ames (University of Southampton, School of Mathematical Sciences)2026-03-13🤖 cs.LG

A Learnable Wavelet Transformer for Long-Short Equity Trading and Risk-Adjusted Return Optimization

이 논문은 금융 시계열의 잡음과 비정상성 문제를 해결하고 위험 조정 수익을 최적화하기 위해, 학습 가능한 웨이블릿 기반의 다중 스케일 분해와 리스크 인식 정규화를 통해 직접 시장 중립적 롱/숏 포트폴리오를 생성하는 'WaveLSFormer'라는 새로운 트랜스포머 모델을 제안하고 그 우수성을 입증합니다.

Shuozhe Li, Du Cheng, Leqi Liu2026-03-13💰 q-fin

Text-only adaptation in LLM-based ASR through text denoising

이 논문은 타겟 도메인의 텍스트 데이터만으로 대규모 언어 모델 (LLM) 기반 음성 인식 시스템을 적응시키는 과정에서 기존 정렬을 해치지 않도록, 텍스트 복원 (denoising) 태스크를 통해 경량화된 적응 방법을 제안하고 기존 최첨단 방법보다 우수한 성능을 입증합니다.

Andrés Carofilis, Sergio Burdisso, Esaú Villatoro-Tello, Shashi Kumar, Kadri Hacioglu, Srikanth Madikeri, Pradeep Rangappa, Manjunath K E, Petr Motlicek, Shankar Venkatesan, Andreas Stolcke2026-03-13⚡ eess

WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning

이 논문은 수직적 확장 (깊이) 에 집중해 온 기존 LLM 접근법의 한계를 넘어, 다중 에이전트 강화학습을 통해 병렬 실행과 확장 가능한 오케스트레이션을 가능하게 하는 'WideSeek-R1'을 제안하여, 4B 파라미터 모델이 671B 단일 에이전트 모델과 comparable 한 성능을 내며 폭넓은 정보 검색 과제를 효과적으로 해결함을 보여줍니다.

Zelai Xu, Zhexuan Xu, Ruize Zhang, Chunyang Zhu, Shi Yu, Weilin Liu, Quanlu Zhang, Wenbo Ding, Chao Yu, Yu Wang2026-03-13🤖 cs.AI

From Classical to Quantum: Extending Prometheus for Unsupervised Discovery of Phase Transitions in Three Dimensions and Quantum Systems

이 논문은 2 차원 고전 시스템에서 3 차원 고전 및 양자 다체 시스템으로 '프로메테우스' 프레임워크를 확장하여, 지도 학습 없이 3 차원 이징 모델의 임계 온도와 임계 지수를 정밀하게 탐지하고 양자 위상 전이 및 무질서한 시스템의 이국적 임계성을 성공적으로 발견했음을 보여줍니다.

Brandon Yee, Wilson Collins, Maximilian Rutkowski2026-03-13🔬 cond-mat

De novo molecular structure elucidation from mass spectra via flow matching

이 논문은 질량 스펙트럼으로부터 분자 구조를 직접 규명하기 위해 제안된 'MSFlow'라는 2 단계 인코더-디코더 흐름 매칭 생성 모델을 소개하며, 기존 최첨단 방법 대비 최대 14 배 향상된 성능으로 스펙트럼의 45% 까지 정확한 분자 표현으로 변환하는 성과를 입증했습니다.

Ghaith Mqawass (TUM School of Life Sciences Weihenstephan, Technical University of Munich, Germany, Machine Learning and Computational Sciences, Pfizer Research & Development, Berlin, Germany), Tuan Le (Machine Learning and Computational Sciences, Pfizer Research & Development, Berlin, Germany), Fabian Theis (TUM School of Life Sciences Weihenstephan, Technical University of Munich, Germany, TUM School of Computation, Information and Technology, Technical University of Munich, Germany, Institute of Computational Biology, Helmholtz Center Munich, Germany), Djork-Arné Clevert (Machine Learning and Computational Sciences, Pfizer Research & Development, Berlin, Germany)2026-03-13🤖 cs.LG