Text-Trained LLMs Can Zero-Shot Extrapolate PDE Dynamics, Revealing a Three-Stage In-Context Learning Mechanism

본 논문은 미세 조정이나 자연어 프롬프트 없이도 텍스트로 훈련된 대규모 언어 모델이 이산화된 편미분 방정식 (PDE) 해의 시공간 동역학을 제로샷으로 외삽할 수 있으며, 이는 문맥 길이에 비례하는 예측 정확도 향상과 함께 구문 모방, 탐색적 고엔트로피 단계, 그리고 수치적으로 확고한 예측으로 이어지는 3 단계 인-컨텍스트 학습 메커니즘을 통해 이루어짐을 규명했습니다.

Jiajun Bao, Nicolas Boullé, Toni J. B. Liu, Raphaël Sarfati, Christopher J. Earls2026-03-13🤖 cs.LG

Ultra-Fast Language Generation via Discrete Diffusion Divergence Instruct

이 논문은 사전 훈련된 이산 확산 언어 모델 (dLLM) 을 기반으로 KL 발산 최소화, 그룹화 보상 정규화, 중간 상태 매칭 및 보상 유도 조상 샘플러 등의 기법을 통해 64 배까지 가속화되면서도 기존 모델의 성능을 유지하거나 능가하는 초고속 언어 생성을 가능하게 하는 'DiDi-Instruct'라는 새로운 증류 방법을 제안합니다.

Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, Nan Jiang, Zheyuan Hu, Weijian Luo, Wei Deng, Guang Lin2026-03-13💬 cs.CL

Contrastive Diffusion Guidance for Spatial Inverse Problems

이 논문은 미분 불가능하고 부분적으로만 알려진 전방 연산자를 갖는 공간 역문제 (예: 보행 궤적로부터 평면도 복원) 를 해결하기 위해, 매끄러운 임베딩 공간에서 대비 학습을 통해 학습된 대리 가능도 점수를 활용하여 확산 모델의 역방향 샘플링을 안정적으로 유도하는 'CoGuide' 방법을 제안합니다.

Sattwik Basu, Chaitanya Amballa, Zhongweiyang Xu, Jorge Vančo Sampedro, Srihari Nelakuditi, Romit Roy Choudhury2026-03-13⚡ eess

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

이 논문은 최적 수송으로 유도된 리만 구조를 가진 워asserstein 공간에서 Busemann 함수의 존재성을 규명하고, 1 차원 분포 및 가우시안 측도에 대한 폐형 해를 도출하여 확률 분포의 투영 기법을 개발하고 이를 슬라이싱 워asserstein 거리 및 전이 학습에 적용하는 방법을 제시합니다.

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas Courty2026-03-13📊 stat

CodeEvolve: an open source evolutionary coding agent for algorithmic discovery and optimization

이 논문은 대규모 언어 모델 (LLM) 과 진화 연산을 결합한 오픈소스 프레임워크인 CodeEvolve 를 소개하며, 이는 AlphaEvolve 와 같은 기존 벤치마크에서 최첨단 성능을 달성하면서도 오픈 가중치 모델을 활용해 폐쇄형 모델 대비 훨씬 낮은 계산 비용으로 알고리즘 발견 및 최적화를 가능하게 함을 보여줍니다.

Henrique Assumpção, Diego Ferreira, Leandro Campos, Fabricio Murai2026-03-13🤖 cs.AI

A Foundational Theory of Quantitative Abstraction: Adjunctions, Duality, and Logic for Probabilistic Systems

이 논문은 카테고리 이론, 석상론, 양적 논리 및 최적 수송을 통합하여 확률적 시스템의 행동 유사성을 ε\varepsilon 수준으로 축소하는 가장 정교한 추상화인 보편적 성질을 가진 ε\varepsilon-몫을 제안하고, 이를 통해 추상화와 실현 사이의 쌍대성을 정립하며 양적 모달 μ\mu-계산의 표현 완전성을 입증하는 정량적 추상화의 기초 이론을 제시합니다.

Nivar Anwer (Georgia Institute of Technology, USA), Ezequiel López-Rubio (University of Málaga, Spain,IBIMA Plataforma BIONAND, Spain), David Elizondo (De Montfort University, United Kingdom), Rafael M. Luque-Baena (University of Málaga, Spain,IBIMA Plataforma BIONAND, Spain)2026-03-13🤖 cs.LG

More Than Memory Savings: Zeroth-Order Optimization Mitigates Forgetting in Continual Learning

이 논문은 영차 (Zeroth-order) 최적화가 continual learning 에서의 망각을 완화하는 안정성 이점을 제공하지만 학습 속성 (plasticity) 을 저하시킨다는 점을 규명하고, 이를 해결하기 위해 영차 최적화를 어댑터 모듈에, 1 차 최적화를 분류기에 적용하는 메모리 효율적인 ZO-FC 방법을 제안합니다.

Wanhao Yu, Zheng Wang, Shuteng Niu, Sen Lin, Li Yang2026-03-13🤖 cs.LG

Cross-Space Synergy: A Unified Framework for Multimodal Emotion Recognition in Conversation

이 논문은 텍스트, 음성, 시각적 단서를 통합하여 대화 중 감정을 인식하는 기존 방법의 한계를 극복하기 위해 고차원 상호작용을 포착하는 '상호작용 다항식 융합 (SPF)'과 경량 최적화를 위한 '파레토 경사 조절기 (PGM)'를 결합한 '크로스-스페이스 시너지 (CSS)' 프레임워크를 제안하고, IEMOCAP 및 MELD 데이터셋에서 기존 방법보다 우수한 정확도와 학습 안정성을 입증했습니다.

Xiaosen Lyu, Jiayu Xiong, Yuren Chen + 3 more2026-03-13🤖 cs.LG

Domain Feature Collapse: Implications for Out-of-Distribution Detection and Solutions

이 논문은 단일 도메인 데이터로 학습된 모델이 정보 병목 현상으로 인해 도메인 특징을 완전히 잃어버리는 '도메인 특징 붕괴'가 발생하여 분포 외 (OOD) 검출에 실패한다는 이론적 근거를 제시하고, 사전 학습된 표현을 활용한 도메인 필터링을 통해 이를 해결할 수 있음을 증명합니다.

Hong Yang, Devroop Kar, Qi Yu, Alex Ororbia, Travis Desell2026-03-13🤖 cs.LG

Forests of Uncertaint(r)ees: Using tree-based ensembles to estimate probability distributions of future conflict

이 논문은 고도화된 불확실성을 가진 무력 충돌 사망자 수 예측의 한계를 극복하기 위해, 트리 기반 앙상블과 분포 회귀를 결합한 자동화 머신러닝 방식을 통해 점 예측에서 전체 예측 분포 추정으로 전환하고 지역별 모델 통합을 통해 예측 정확도를 입증했습니다.

Daniel Mittermaier, Tobias Bohne, Martin Hofer, Daniel Racek2026-03-13📊 stat

CTIGuardian: A Few-Shot Framework for Mitigating Privacy Leakage in Fine-Tuned LLMs

이 논문은 사이버 위협 정보 (CTI) 도메인을 사례로, 파인튜닝된 대규모 언어 모델 (LLM) 에서 발생할 수 있는 민감 정보 유출을 방지하기 위해 재학습 없이 소량의 예시를 활용한 '프라이버시 정렬' 프레임워크인 CTIGuardian 을 제안하고, 기존 NER 기반 방법보다 우수한 프라이버시와 유용성의 균형을 입증합니다.

Shashie Dilhara Batan Arachchige, Benjamin Zi Hao Zhao, Hassan Jameel Asghar + 2 more2026-03-13🤖 cs.LG

Provably Finding a Hidden Dense Submatrix among Many Planted Dense Submatrices via Convex Programming

이 논문은 기존 연구가 단일 밀집 서브그래프를 가정했던 것과 달리, 실제 네트워크에서 흔히 나타나는 여러 개의 밀집 서브그래프가 혼재된 환경에서도 볼록 프로그래밍을 통해 밀집 서브행렬 문제를 다항 시간 내에 해결할 수 있는 충분 조건을 제시하고 실험적으로 검증합니다.

Valentine Olanubi (University of Alabama, Department of Mathematics), Phineas Agar (University of Alabama, Department of Mathematics), Brendan Ames (University of Southampton, School of Mathematical Sciences)2026-03-13🤖 cs.LG