cs.LG 편의 논문 | Gist.Science

Text-Trained LLMs Can Zero-Shot Extrapolate PDE Dynamics, Revealing a Three-Stage In-Context Learning Mechanism

본 논문은 미세 조정이나 자연어 프롬프트 없이도 텍스트로 훈련된 대규모 언어 모델이 이산화된 편미분 방정식 (PDE) 해의 시공간 동역학을 제로샷으로 외삽할 수 있으며, 이는 문맥 길이에 비례하는 예측 정확도 향상과 함께 구문 모방, 탐색적 고엔트로피 단계, 그리고 수치적으로 확고한 예측으로 이어지는 3 단계 인-컨텍스트 학습 메커니즘을 통해 이루어짐을 규명했습니다.

Jiajun Bao, Nicolas Boullé, Toni J. B. Liu, Raphaël Sarfati, Christopher J. Earls2026-03-13🤖 cs.LG

Ultra-Fast Language Generation via Discrete Diffusion Divergence Instruct

이 논문은 사전 훈련된 이산 확산 언어 모델 (dLLM) 을 기반으로 KL 발산 최소화, 그룹화 보상 정규화, 중간 상태 매칭 및 보상 유도 조상 샘플러 등의 기법을 통해 64 배까지 가속화되면서도 기존 모델의 성능을 유지하거나 능가하는 초고속 언어 생성을 가능하게 하는 'DiDi-Instruct'라는 새로운 증류 방법을 제안합니다.

Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, Nan Jiang, Zheyuan Hu, Weijian Luo, Wei Deng, Guang Lin2026-03-13💬 cs.CL

Contrastive Diffusion Guidance for Spatial Inverse Problems

이 논문은 미분 불가능하고 부분적으로만 알려진 전방 연산자를 갖는 공간 역문제 (예: 보행 궤적로부터 평면도 복원) 를 해결하기 위해, 매끄러운 임베딩 공간에서 대비 학습을 통해 학습된 대리 가능도 점수를 활용하여 확산 모델의 역방향 샘플링을 안정적으로 유도하는 'CoGuide' 방법을 제안합니다.

Sattwik Basu, Chaitanya Amballa, Zhongweiyang Xu, Jorge Vančo Sampedro, Srihari Nelakuditi, Romit Roy Choudhury2026-03-13⚡ eess

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

이 논문은 최적 수송으로 유도된 리만 구조를 가진 워asserstein 공간에서 Busemann 함수의 존재성을 규명하고, 1 차원 분포 및 가우시안 측도에 대한 폐형 해를 도출하여 확률 분포의 투영 기법을 개발하고 이를 슬라이싱 워asserstein 거리 및 전이 학습에 적용하는 방법을 제시합니다.

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas Courty2026-03-13📊 stat

Refereed Learning

이 논문은 두 명의 경쟁하는 증명자 중 한 명만 정직한 환경에서 '심판 학습 (refereed learning)'을 제안하여, 단일 증명자나 증명자 없이 접근하는 기존 방법보다 훨씬 적은 비용으로 두 블랙박스 모델 중 더 나은 모델을 고차원 공간에서 높은 정밀도로 선택할 수 있음을 증명하고 있습니다.

Ran Canetti, Ephraim Linder, Connor Wagaman2026-03-13📊 stat

UniFField: A Generalizable Unified Neural Feature Field for Visual, Semantic, and Spatial Uncertainties in Any Scene

이 논문은 로봇이 미지의 환경에서 시각, 의미, 기하학적 정보를 통합하고 각 모달리티의 불확실성을 예측하여 강건한 의사결정을 가능하게 하는 범용 신경 특징 필드 'UniFField'를 제안합니다.

Christian Maurer, Snehal Jauhri, Sophie Lueth, Georgia Chalvatzaki2026-03-13🤖 cs.LG

Counterfactually Fair Conformal Prediction

이 논문은 점 예측의 반사실적 공정성을 예측 집합으로 확장하여, 합동성 점수 대칭화를 통해 예측 집합 크기의 최소 증가로 반사실적 공정성과 마진 커버리지 보장을 동시에 달성하는 '반사실적 공정 합동 예측 (CF-CP)' 방법을 제안합니다.

Ozgur Guldogan, Neeraj Sarna, Yuanyuan Li, Michael Berger2026-03-13🤖 cs.LG

CodeEvolve: an open source evolutionary coding agent for algorithmic discovery and optimization

이 논문은 대규모 언어 모델 (LLM) 과 진화 연산을 결합한 오픈소스 프레임워크인 CodeEvolve 를 소개하며, 이는 AlphaEvolve 와 같은 기존 벤치마크에서 최첨단 성능을 달성하면서도 오픈 가중치 모델을 활용해 폐쇄형 모델 대비 훨씬 낮은 계산 비용으로 알고리즘 발견 및 최적화를 가능하게 함을 보여줍니다.

Henrique Assumpção, Diego Ferreira, Leandro Campos, Fabricio Murai2026-03-13🤖 cs.AI

A Foundational Theory of Quantitative Abstraction: Adjunctions, Duality, and Logic for Probabilistic Systems

이 논문은 카테고리 이론, 석상론, 양적 논리 및 최적 수송을 통합하여 확률적 시스템의 행동 유사성을 $\varepsilon$ 수준으로 축소하는 가장 정교한 추상화인 보편적 성질을 가진 $\varepsilon$ -몫을 제안하고, 이를 통해 추상화와 실현 사이의 쌍대성을 정립하며 양적 모달 $\mu$ -계산의 표현 완전성을 입증하는 정량적 추상화의 기초 이론을 제시합니다.

Nivar Anwer (Georgia Institute of Technology, USA), Ezequiel López-Rubio (University of Málaga, Spain,IBIMA Plataforma BIONAND, Spain), David Elizondo (De Montfort University, United Kingdom), Rafael M. Luque-Baena (University of Málaga, Spain,IBIMA Plataforma BIONAND, Spain)2026-03-13🤖 cs.LG

More Than Memory Savings: Zeroth-Order Optimization Mitigates Forgetting in Continual Learning

이 논문은 영차 (Zeroth-order) 최적화가 continual learning 에서의 망각을 완화하는 안정성 이점을 제공하지만 학습 속성 (plasticity) 을 저하시킨다는 점을 규명하고, 이를 해결하기 위해 영차 최적화를 어댑터 모듈에, 1 차 최적화를 분류기에 적용하는 메모리 효율적인 ZO-FC 방법을 제안합니다.

Wanhao Yu, Zheng Wang, Shuteng Niu, Sen Lin, Li Yang2026-03-13🤖 cs.LG

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

이 논문은 베이지안 관점에서 인-컨텍스트 학습과 활성화 조정이 모두 잠재 개념에 대한 모델의 신념을 변경한다는 통찰을 바탕으로, 두 가지 제어 방법을 통합적으로 설명하고 예측하는 폐쇄형 모델을 제시합니다.

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh Lubana2026-03-13📊 stat

Precision-Scalable Microscaling Datapaths with Optimized Reduction Tree for Efficient NPU Integration

이 논문은 기존 마이크로스케일링 (MX) MAC 설계의 한계를 극복하기 위해 하이브리드 정밀도 확장 가능 축소 트리를 제안하고 SNAX 플랫폼에 통합하여, 다양한 MX 포맷에서 높은 에너지 효율과 처리량을 달성한 NPU 통합 시스템을 제시합니다.

Stef Cuyckens, Xiaoling Yi, Robin Geens + 4 more2026-03-13⚡ eess

RefTr: Recurrent Refinement of Confluent Trajectories for 3D Vascular Tree Centerlines

이 논문은 트랜스포머 기반의 생산자 - 정제기 아키텍처와 순환적 개선 방식을 통해 3D 혈관 중심선의 위상적 정확성과 정밀도를 향상시키면서도 파라미터 수를 대폭 줄인 'RefTr' 프레임워크를 제안합니다.

Roman Naeem, David Hagerman, Jennifer Alvén, Fredrik Kahl2026-03-13🤖 cs.LG

Cross-Space Synergy: A Unified Framework for Multimodal Emotion Recognition in Conversation

이 논문은 텍스트, 음성, 시각적 단서를 통합하여 대화 중 감정을 인식하는 기존 방법의 한계를 극복하기 위해 고차원 상호작용을 포착하는 '상호작용 다항식 융합 (SPF)'과 경량 최적화를 위한 '파레토 경사 조절기 (PGM)'를 결합한 '크로스-스페이스 시너지 (CSS)' 프레임워크를 제안하고, IEMOCAP 및 MELD 데이터셋에서 기존 방법보다 우수한 정확도와 학습 안정성을 입증했습니다.

Xiaosen Lyu, Jiayu Xiong, Yuren Chen + 3 more2026-03-13🤖 cs.LG

Domain Feature Collapse: Implications for Out-of-Distribution Detection and Solutions

이 논문은 단일 도메인 데이터로 학습된 모델이 정보 병목 현상으로 인해 도메인 특징을 완전히 잃어버리는 '도메인 특징 붕괴'가 발생하여 분포 외 (OOD) 검출에 실패한다는 이론적 근거를 제시하고, 사전 학습된 표현을 활용한 도메인 필터링을 통해 이를 해결할 수 있음을 증명합니다.

Hong Yang, Devroop Kar, Qi Yu, Alex Ororbia, Travis Desell2026-03-13🤖 cs.LG

Forests of Uncertaint(r)ees: Using tree-based ensembles to estimate probability distributions of future conflict

이 논문은 고도화된 불확실성을 가진 무력 충돌 사망자 수 예측의 한계를 극복하기 위해, 트리 기반 앙상블과 분포 회귀를 결합한 자동화 머신러닝 방식을 통해 점 예측에서 전체 예측 분포 추정으로 전환하고 지역별 모델 통합을 통해 예측 정확도를 입증했습니다.

Daniel Mittermaier, Tobias Bohne, Martin Hofer, Daniel Racek2026-03-13📊 stat

Entropic Confinement and Mode Connectivity in Overparameterized Neural Networks

이 논문은 손실 지형의 곡률 변화와 최적화 과정의 노이즈가 상호작용하여 생성되는 엔트로피 장벽이, 낮은 손실 경로를 연결하면서도 최적화 동역학이 특정 Basin 에 국한되게 하는 모순을 해결한다고 설명합니다.

Luca Di Carlo, Chase Goddard, David J. Schwab2026-03-13📊 stat

CTIGuardian: A Few-Shot Framework for Mitigating Privacy Leakage in Fine-Tuned LLMs

이 논문은 사이버 위협 정보 (CTI) 도메인을 사례로, 파인튜닝된 대규모 언어 모델 (LLM) 에서 발생할 수 있는 민감 정보 유출을 방지하기 위해 재학습 없이 소량의 예시를 활용한 '프라이버시 정렬' 프레임워크인 CTIGuardian 을 제안하고, 기존 NER 기반 방법보다 우수한 프라이버시와 유용성의 균형을 입증합니다.

Shashie Dilhara Batan Arachchige, Benjamin Zi Hao Zhao, Hassan Jameel Asghar + 2 more2026-03-13🤖 cs.LG

Deep Eigenspace Network for Parametric Non-self-adjoint Eigenvalue Problems

이 논문은 비자기수반 연산자의 고유값 문제를 효율적으로 해결하기 위해 고유함수 대신 고유공간을 학습하는 '심층 고유공간 네트워크 (DEN)'를 제안하고, 이를 스테클로프 고유값 문제에 적용하여 이론적 수렴성과 수치적 유효성을 입증합니다.

H. Li, J. Sun, Z. Zhang2026-03-13🤖 cs.LG

Provably Finding a Hidden Dense Submatrix among Many Planted Dense Submatrices via Convex Programming

이 논문은 기존 연구가 단일 밀집 서브그래프를 가정했던 것과 달리, 실제 네트워크에서 흔히 나타나는 여러 개의 밀집 서브그래프가 혼재된 환경에서도 볼록 프로그래밍을 통해 밀집 서브행렬 문제를 다항 시간 내에 해결할 수 있는 충분 조건을 제시하고 실험적으로 검증합니다.

Valentine Olanubi (University of Alabama, Department of Mathematics), Phineas Agar (University of Alabama, Department of Mathematics), Brendan Ames (University of Southampton, School of Mathematical Sciences)2026-03-13🤖 cs.LG

← 이전 다음 →