cs.LG 편의 논문 | Gist.Science

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

이 논문은 블랙박스 신경망 정책의 해석 불가능성을 해결하기 위해 대규모 언어 모델을 활용해 인간이 읽을 수 있는 코드로 직접 정책을 생성하는 '코드-스페이스 응답 오라클 (CSRO)' 프레임워크를 제안하며, 이를 통해 경쟁력 있는 성능과 함께 설명 가능한 다양한 다중 에이전트 전략을 도출할 수 있음을 보여줍니다.

Daniel Hennes, Zun Li, John Schultz, Marc Lanctot2026-03-12🤖 cs.AI

Denoising the US Census: Succinct Block Hierarchical Regression

이 논문은 2020 년 미국 인구조사에 사용된 기존 'TopDown' 알고리즘보다 계층적 구조와 상관관계를 고려한 일반화 최소제곱 회귀 및 간결한 선형대수 연산을 통해 정확도와 일관성을 크게 향상시키면서 동일한 프라이버시 보장을 제공하는 새로운 후처리 방법인 'BlueDown'을 제안합니다.

Badih Ghazi, Pritish Kamath, Ravi Kumar, Pasin Manurangsi, Adam Sealfon2026-03-12🤖 cs.LG

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

이 논문은 기존 경량화 기법의 한계를 극복하기 위해 가장 중요한 비트 (MSB) 를 기반으로 한 '소프트 희소성' 패러다임을 제안하여, ReLU 및 Tanh 활성화 함수를 사용하는 CNN 에서 정확도 손실 없이 연산량을 대폭 줄이고 전력 효율을 극대화하는 하드웨어 친화적인 근사 컨볼루션 방법을 제시합니다.

Vishal Shashidhar, Anupam Kumari, Roy P Paily2026-03-12🤖 cs.LG

CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR

이 논문은 최종 정답뿐만 아니라 추론 과정의 정확성도 고려하기 위해 대비 학습을 정책 최적화에 통합한 CLIPO 를 제안함으로써, 기존 RLVR 의 환각 및 답사 복사 문제를 완화하고 LLM 의 일반화 및 강건성을 향상시킨다고 설명합니다.

Sijia Cui, Pengyu Cheng, Jiajun Song, Yongbo Gai, Guojun Zhang, Zhechao Yu, Jianhe Lin, Xiaoxi Jiang, Guanjun Jiang2026-03-12🤖 cs.LG

Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias

이 논문은 '중간 소실' 현상이 학습이나 위치 인코딩 이전에도 초기화 단계에서 이미 존재하는 인과적 디코더의 기하학적 속성임을 수학적으로 증명하고, 표준 학습만으로는 이 구조적 편향을 극복할 수 없음을 실험을 통해 확인했습니다.

Borun D Chowdhury2026-03-12🤖 cs.LG

Unbalanced Optimal Transport Dictionary Learning for Unsupervised Hyperspectral Image Clustering

이 논문은 잡음과 이상치에 강인하면서도 클래스를 흐리게 하지 않는 불균형 최적 수송 딕셔너리 학습을 통해 초분광 이미지의 비지도 클러스터링 성능을 향상시키는 새로운 방법을 제안합니다.

Joshua Lentz, Nicholas Karris, Alex Cloninger, James M. Murphy2026-03-12📊 stat

A neural operator for predicting vibration frequency response curves from limited data

이 논문은 물리 법칙을 명시적으로 정규화 항으로 사용하지 않고도 제한된 데이터로부터 동역학의 상태 공간 특성을 학습하여 선형 단일 자유도 시스템의 진동 주파수 응답 곡선을 99.87% 의 정확도로 예측하는 내재적 수치 기법과 결합된 신경 연산자 (Neural Operator) 모델을 제안합니다.

D. Bluedorn, A. Badawy, B. E. Saunders, D. Roettgen, A. Abdelkefi2026-03-12🤖 cs.LG

Mashup Learning: Faster Finetuning by Remixing Past Checkpoints

이 논문은 과거 학습 체크포인트를 식별하고 모델 병합을 통해 새로운 작업에 대한 초기값으로 활용하는 'Mashup Learning'을 제안하여, 기존 방식 대비 정확도를 높이고 학습 속도를 크게 단축한다고 설명합니다.

Sofia Maria Lo Cicero Vaina, Artem Chumachenko, Max Ryabinin2026-03-12🤖 cs.LG

ReMix: Reinforcement routing for mixtures of LoRAs in LLM finetuning

이 논문은 기존 Mixture-of-LoRAs 모델에서 발생하는 라우팅 가중치의 불균형 문제를 해결하기 위해, 강화 학습 기반의 RLOO 기법을 활용한 비학습형 라우팅 가중치를 도입하여 모든 LoRA 가 균등하게 활성화되도록 하는 'ReMix'를 제안하고, 이를 통해 제한된 활성화 파라미터 수로 최첨단 성능을 달성함을 보여줍니다.

Ruizhong Qiu, Hanqing Zeng, Yinglong Xia, Yiwen Meng, Ren Chen, Jiarui Feng, Dongqi Fu, Qifan Wang, Jiayi Liu, Jun Xiao, Xiangjun Fan, Benyu Zhang, Hong Li, Zhining Liu, Hyunsik Yoo, Zhichen Zeng, Tianxin Wei, Hanghang Tong2026-03-12🤖 cs.LG

DT-BEHRT: Disease Trajectory-aware Transformer for Interpretable Patient Representation Learning

이 논문은 진단 중심의 상호작용과 비동기적 진행 패턴을 명시적으로 모델링하여 해석 가능한 환자 표현 학습을 가능하게 하는 '질병 궤적 인식 트랜스포머 (DT-BEHRT)'를 제안하고, 이를 통해 임상적 추론과 정렬된 강력한 예측 성능을 입증합니다.

Deyi Li, Zijun Yao, Qi Xu, Muxuan Liang, Lingyao Li, Zijian Xu, Mei Liu2026-03-12🤖 cs.LG

Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent

이 논문은 스토캐스틱 미러 디센트 프레임워크를 기반으로 한 정규화 EXP3 알고리즘이 적응적 샘플링 환경에서도 안정적인 추론을 가능하게 하면서 동시에 최적의 후회 (regret) 보장을 제공하고, 적대적 오염에 대한 강인성까지 갖춘다는 것을 증명합니다.

Budhaditya Halder, Ishan Sengupta, Koustav Chowdhury, Koulik Khamaru2026-03-12📊 stat

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

이 논문은 재귀적 잔차 압축, 하이퍼프리오어 및 엑시테이션을 통합하여 기존 학습 기반 이미지 압축 방식의 계산 비용과 병렬성 한계를 극복하면서도 Balle, Minnen & Singh 모델 및 VVC 인트라 코덱 대비 우수한 비트율-왜곡 효율을 달성하는 ARCHE 프레임워크를 제안합니다.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios Skodras2026-03-12⚡ eess

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

이 논문은 신호 처리의 적응형 잡음 제거 개념을 차용하여, 추가 학습이나 외부 지식 없이 추론 시 실시간으로 환각 관련 뉴런을 선택적으로 억제함으로써 사실성 정확도를 높이는 동시에 모델의 일반적 성능을 전혀 저하시키지 않는 '적응형 활성화 취소 (AAC)' 프레임워크를 제안합니다.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Actor-Accelerated Policy Dual Averaging for Reinforcement Learning in Continuous Action Spaces

이 논문은 연속 행동 공간에서의 정책 듀얼 애버리징 (PDA) 의 계산적 한계를 해결하기 위해 학습된 정책 네트워크를 활용한 '액터 가속 PDA'를 제안하고, 이론적 수렴 보장을 유지하면서 로봇 공학 및 제어 분야에서 PPO 보다 우수한 성능을 입증했습니다.

Ji Gao, Caleb Ju, Guanghui Lan, Zhaohui Tong2026-03-12🤖 cs.LG

Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion

이 논문은 SPY 데이터를 기반으로 점프 - 확산 메커니즘과 포아송 기반의 점프 지속 시간 메커니즘을 결합한 하이브리드 은닉 마르코프 모델을 제안하여, 기존 모델들이 동시에 충족하지 못했던 중후미 분포, 낮은 자기상관성, 그리고 지속적 변동성 군집화라는 세 가지 핵심 통계적 특성을 모두 보존하는 고품질 합성 금융 시계열 생성을 가능하게 함을 보여줍니다.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-12💰 q-fin

Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training

이 논문은 훈련 후에도 각 원자별 컷오프 반경을 조정하여 정확도와 계산 비용의 균형을 최적화할 수 있는 새로운 기계학습 전위 (MLIP) 학습 방법인 '유연한 컷오프 학습 (FCL)'을 제안하고, 이를 통해 재학습 없이 다양한 응용 분야에 맞춰 단일 모델을 적응시킬 수 있음을 보여줍니다.

Rick Oerder (Institute for Numerical Simulation, University of Bonn, Fraunhofer Institute for Algorithms and Scientific Computing SCAI), Jan Hamaekers (Fraunhofer Institute for Algorithms and Scientific Computing SCAI)2026-03-12🔬 cond-mat.mtrl-sci

FusionNet: a frame interpolation network for 4D heart models

이 논문은 짧은 시간 동안 촬영된 심장 MRI 영상을 기반으로 고해상도의 4 차원 심장 운동을 복원하기 위해 인접한 3 차원 심장 형태를 추정하는 새로운 신경망 'FusionNet'을 제안하고, 기존 방법보다 높은 정밀도 (Dice 계수 0.897 이상) 를 입증했습니다.

Chujie Chang, Shoko Miyauchi, Ken'ichi Morooka, Ryo Kurazume, Oscar Martinez Mozos2026-03-12🤖 cs.LG

SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction

이 논문은 스펙트럼 그래프 이론에 기반한 분할 정복 알고리즘인 SDSR 을 제안하여, 다중 유전자 마커 데이터를 이용한 대규모 종 계통수 재구성 시 계산 효율성을 10 배 이상 향상시키면서도 기존 방법과 동등한 정확도를 유지함을 보여줍니다.

Ortal Reshef (Hebrew University of Jerusalem), Ofer Glassman (Weizmann Institute of Science), Or Zuk (Hebrew University of Jerusalem), Yariv Aizenbud (Tel Aviv University), Boaz Nadler (Weizmann Institute of Science), Ariel Jaffe (Hebrew University of Jerusalem)2026-03-12🧬 q-bio

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

이 논문은 확률적 밴딧 문제에 대한 정책 경사법의 연속 시간 확산 근사를 분석하여 학습률 조건에 따른 후회 (regret) 의 상한과 하한을 증명합니다.

Tor Lattimore2026-03-12📊 stat

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

이 논문은 교차 엔트로피 손실의 한계를 극복하고 해석 가능성과 지속 가능성을 향상시키기 위해 유클리드 거리를 다양한 거리 척도로 대체한 조화 손실 (harmonic loss) 을 체계적으로 연구하여, 비유클리드 거리 기반 손실이 비전 및 언어 모델에서 성능과 효율성을 동시에 개선함을 입증했습니다.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

← 이전 다음 →