cs.LG 편의 논문 | Gist.Science

Hindsight Credit Assignment for Long-Horizon LLM Agents

이 논문은 희소 보상 환경에서 장기적 할당 문제를 해결하기 위해 사후 추론을 통해 단계별 가치 추정과 기준선을 정교화하는 새로운 프레임워크인 HCAPO 를 제안하며, WebShop 과 ALFWorld 등 다양한 벤치마크에서 기존 최첨단 방법론보다 뛰어난 성과를 입증했습니다.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

이 논문은 군 $G$ 가 공간 $M$ 에 전이적으로 작용할 때, $X \times M$ 위의 $G$ -불변 함수를 $M$ 의 등방성 부분군 $H$ 가 $X$ 에 작용하는 불변 함수로 명시적으로 축소하는 이론을 제시하여, 기존 방법의 구조적 제약을 해소하고 임의의 군 작용과 균질한 조건부 공간에 적용 가능한 일반화된 등변 신경장 (Equivariant Neural Fields) 을 확장합니다.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

On the Formal Limits of Alignment Verification

이 논문은 AI 정렬 검증이 명제성, 일반성, 실용성이라는 세 가지 속성을 동시에 만족할 수 없음을 증명하여 정렬 인증의 형식적 한계를 규명하고, 이를 완화함으로써 실용적인 보장이 여전히 가능함을 시사합니다.

Ayushi Agarwal2026-03-11🤖 cs.LG

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

이 논문은 기존 방법의 한계를 극복하고 저차원 부분공간에서 기하학적 구조를 보존하는 SPREAD 프레임워크를 제안함으로써, 평생 모방 학습에서 새로운 기술 습득과 기존 지식 유지 간의 균형을 이루며 재앙적 망각을 방지하고 최첨단 성능을 달성합니다.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman Moghadam2026-03-11🤖 cs.LG

Micro-Diffusion Compression -- Binary Tree Tweedie Denoising for Online Probability Estimation

이 논문은 희소 관측으로 인한 예측 편향을 보정하기 위해 이진 트리 구조를 활용한 미세 확산 (Micro-Diffusion) 은닉층을 도입하여 적응형 통계 모델의 확률 추정 정확도를 향상시키고 무손실 압축 효율을 높이는 'Midicoth' 시스템을 제안합니다.

Roberto Tacconelli2026-03-11🤖 cs.LG

Multi-level meta-reinforcement learning with skill-based curriculum

이 논문은 하위 작업들을 계층적으로 압축하고 기술을 임베딩과 기능으로 분해하여 커리큘럼 학습 프레임워크 내에서 복잡한 의사결정 문제의 효율성을 높이고 작업 간 전이를 가능하게 하는 다단계 메타-강화 학습 방법을 제안합니다.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)2026-03-11🤖 cs.AI

The Temporal Markov Transition Field

이 논문은 시계열 데이터의 비정상적 동역학을 효과적으로 포착하기 위해, 전역 전이 행렬 대신 시간 구간별 국소 전이 행렬을 사용하여 시계열을 이미지로 변환하는 '시간적 마르코프 전이 필드 (TMTF)'를 제안합니다.

Michael Leznik2026-03-11🤖 cs.LG

SoftJAX & SoftTorch: Empowering Automatic Differentiation Libraries with Informative Gradients

이 논문은 JAX 와 PyTorch 의 단단한 연산자들에 대한 분산된 소프트 완화 기법을 통합하여, 최적화에 유용한 정보를 제공하는 미분 가능한 프로그래밍을 위한 오픈소스 라이브러리인 SoftJAX 와 SoftTorch 를 제안합니다.

Anselm Paulus, A. René Geist, Vít Musil, Sebastian Hoffmann, Onur Beker, Georg Martius2026-03-11🤖 cs.LG

Are Expressive Encoders Necessary for Discrete Graph Generation?

이 논문은 트랜스포머와 같은 고도로 표현력 있는 백본 없이도, GenGNN 이라는 모듈형 메시지 전달 프레임워크를 사용하여 이산 그래프 생성에서 높은 유효성과 빠른 추론 속도를 달성할 수 있음을 보여줍니다.

Jay Revolinsky, Harry Shomer, Jiliang Tang2026-03-11🤖 cs.AI

MASEval: Extending Multi-Agent Evaluation from Models to Systems

이 논문은 LLM 기반 에이전트 시스템의 성능에 모델뿐만 아니라 토폴로지나 오케스트레이션 로직과 같은 구현 선택도 결정적인 영향을 미친다는 점을 강조하며, 전체 시스템을 분석 단위로 삼아 프레임워크 간 비교를 가능하게 하는 'MASEval' 평가 프레임워크를 제안합니다.

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin Gubri2026-03-11🤖 cs.AI

Expressivity-Efficiency Tradeoffs for Hybrid Sequence Models

이 논문은 트랜스포머와 상태 공간 모델을 결합한 하이브리드 시퀀스 모델이 비하이브리드 모델의 이론적 한계를 극복하고, 더 적은 파라미터로 우수한 성능과 길이 일반화 능력을 달성함을 이론적 증명과 실험을 통해 입증합니다.

John Cooper, Ilias Diakonikolas, Mingchen Ma, Frederic Sala2026-03-11🤖 cs.LG

APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model

이 논문은 비전 - 언어 - 행동 (VLA) 모델을 활용하여 고전적 계획기의 매개변수를 적응적으로 학습하는 'APPLV'를 제안함으로써, 기존 방법들보다 뛰어난 항해 성능과 미시적 환경에 대한 일반화 능력을 달성함을 보여줍니다.

Yuanjie Lu, Beichen Wang, Zhengqi Wu, Yang Li, Xiaomin Lin, Chengzhi Mao, Xuesu Xiao2026-03-11🤖 cs.LG

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

이 논문은 사설 5G 환경에서 채널 중심 모델이 단말기 간 종단 간 처리량 (throughput) 을 과대평가하는 한계를 측정 캠페인을 통해 입증하고, 실제 시스템 동작을 학습하는 데이터 기반 접근법이 더 정확한 예측을 가능하게 함을 보여줍니다.

Nils Jörgensen2026-03-11🤖 cs.LG

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

이 논문은 하이브리드 정보 시스템에서 고차원 공간의 계산 비용과 노이즈 문제를 해결하기 위해, 객체 간 결합 거리를 기반으로 한 새로운 퍼지 근사 집합 기반 특성 선택 모델 (FSbuHD) 을 제안하고 이를 정상 및 낙관적 두 가지 모드에서 최적화 문제로 재구성하여 UCI 데이터셋을 통해 기존 방법들보다 효율성과 효과성이 입증되었음을 보여줍니다.

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein Dibachi2026-03-11🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

이 논문은 소스 도메인의 위험 프로파일을 활용하여 데이터가 부족한 환경에서도 더 엄격한 위험 보장을 제공하는 '전이 기반 베팅 (Transfer-Informed Betting)'을 포함한 선택적 예측을 위한 9 가지 유한 표본 경계 가족에 대한 포괄적인 분석과 벤치마크 평가를 제시합니다.

Abhinaba Basu2026-03-11🤖 cs.AI

← 이전 다음 →

cs.LG