cs.LG 편의 논문 | Gist.Science

Learning Page Order in Shuffled WOO Releases

이 논문은 네덜란드 정보공개 문서를 대상으로 페이지 순서 복원 연구를 수행하여, 시퀀스 2 시퀀스 트랜스포머가 긴 문서에서 일반화 실패를 보인 반면, 모델 특화 전략이 긴 문서의 순서 재배열 성능을 크게 향상시켰음을 밝혔습니다.

Efe Kahraman, Giulio Tosato2026-03-10🤖 cs.LG

Discovering Semantic Latent Structures in Psychological Scales: A Response-Free Pathway to Efficient Simplification

이 논문은 기존 응답 기반 방법의 한계를 보완하기 위해 문맥 임베딩과 토픽 모델링을 활용한 응답 없는 심리 척도 간소화 프레임워크를 제안하며, 이를 통해 척도 길이를 평균 60.5% 단축하면서도 원래의 심리측정적 특성과 구조를 효과적으로 유지할 수 있음을 실증했습니다.

Bo Wang, Yuxuan Zhang, Yueqin Hu, Hanchao Hou, Kaiping Peng, Shiguang Ni2026-03-10🤖 cs.LG

TrasMuon: Trust-Region Adaptive Scaling for Orthogonalized Momentum Optimizers

이 논문은 뉴턴-슈어츠 반복을 통한 직교화를 수행하는 Muon 옵티마이저의 크기 불안정성 문제를 해결하기 위해, 전역 RMS 보정과 에너지 기반 신뢰 영역 클리핑을 결합한 TrasMuon 을 제안하며, 이는 웜업 단계 없이도 기존 베이스라인보다 빠른 수렴과 향상된 안정성을 입증합니다.

Peng Cheng, Jiucheng Zang, Qingnan Li, Liheng Ma, Yufei Cui, Yingxue Zhang, Boxing Chen, Ming Jian, Wen Tong2026-03-10🤖 cs.LG

Benchmark Leakage Trap: Can We Trust LLM-based Recommendation?

이 논문은 LLM 기반 추천 시스템의 평가 신뢰성을 위협하는 '벤치마크 데이터 유출' 현상을 규명하고, 유출 데이터의 도메인 관련성에 따라 모델 성능이 왜곡되거나 저하될 수 있음을 실험을 통해 입증했습니다.

Mingqiao Zhang, Qiyao Peng, Yumeng Wang, Chunyuan Liu, Hongtao Liu2026-03-10🤖 cs.LG

Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation

이 논문은 학습 중 순간 속도 제약 (IVC) 을 통해 표현력을 보장하면서도 단일 단계로 행동을 생성할 수 있는 새로운 생성 정책인 평균 속도 정책 (MVP) 을 제안하여, 로봇 조작 작업에서 기존 흐름 기반 정책 대비 뛰어난 성공률과 빠른 추론 속도를 달성했습니다.

Guojian Zhan, Letian Tao, Pengcheng Wang, Yixiao Wang, Yiheng Li, Yuxin Chen, Hongyang Li, Masayoshi Tomizuka, Shengbo Eben Li2026-03-10🤖 cs.LG

Pawsterior: Variational Flow Matching for Structured Simulation-Based Inference

이 논문은 제약된 물리 파라미터와 이산적 잠재 구조를 모두 처리할 수 있도록 엔드포인트 유도 아핀 기하학적 구속과 변분 모델링을 도입하여 시뮬레이션 기반 추론 (SBI) 의 범위를 확장하고 정확도를 향상시킨 'Pawsterior'라는 새로운 변분 흐름 매칭 프레임워크를 제안합니다.

Jorge Carrasco-Pollo, Floor Eijkelboom, Jan-Willem van de Meent2026-03-10🤖 cs.LG

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

이 논문은 코드가 강화학습보다 학습 가능한 정보 구조를 가지고 있어 예측 가능한 확장이 가능한 반면, 대부분의 강화학습 문제는 피드백의 질적 차이로 인해 단순한 모델 크기 확장에 한계가 있음을 지적하며, 표현 가능성·계산 가능성·학습 가능성의 세 가지 속성 간 관계를 규명하는 5 단계 학습 가능성 계층 구조를 제안합니다.

Zhimin Zhao2026-03-10🤖 cs.LG

LongAudio-RAG: Event-Grounded Question Answering over Multi-Hour Long Audio

이 논문은 수시간 분량의 오디오를 구조화된 사건 레코드로 변환하여 SQL 데이터베이스에 저장하고, 이를 기반으로 자연어 질문을 해결하는 하이브리드 RAG 프레임워크인 LongAudio-RAG 를 제안하며, 엣지-클라우드 환경에서의 실용성과 기존 방법 대비 향상된 정확도를 입증합니다.

Naveen Vakada, Kartik Hegde, Arvind Krishna Sridhar, Yinyi Guo, Erik Visser2026-03-10🤖 cs.LG

Accelerated Predictive Coding Networks via Direct Kolen-Pollack Feedback Alignment

이 논문은 예측 코딩 (PC) 알고리즘의 오류 전파 지연과 소실 문제를 해결하기 위해 출력층에서 모든 은닉층으로 직접 피드백 연결을 도입한 '직접 콜렌 - 폴랙 예측 코딩 (DKP-PC)'을 제안하여, 이론적 오류 전파 복잡도를 O(L) 에서 O(1) 로 줄이고 성능과 효율성을 동시에 개선함을 보여줍니다.

Davide Casnici, Martin Lefebvre, Justin Dauwels, Charlotte Frenkel2026-03-10🤖 cs.LG

On the Power of Source Screening for Learning Shared Feature Extractors

이 논문은 이질적인 데이터 소스들 중에서도 상관관계와 품질이 유사한 '좋은' 소스들의 하위 집합을 선별하여 학습하는 것만으로도 공유 특징 추출기의 통계적 최적성을 달성할 수 있음을 이론적 분석과 실험을 통해 입증합니다.

Leo Muxing Wang, Connor Mclaughlin, Lili Su2026-03-10🤖 cs.LG

Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

이 논문은 쌍곡선 공간의 계층적 기하학과 하이퍼그래프 융합 메커니즘을 결합한 'Emotion Collider(EC-Net)'를 제안하여, 노이즈나 일부 모달리티가 결여된 상황에서도 강인하고 일관된 감정 표현을 학습하고 분류 정확도를 향상시킨다는 것을 보여줍니다.

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon Fong2026-03-10🤖 cs.LG

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

이 논문은 학습 중 의도적으로 특정 모달리티 정보를 붕괴시켜 다중 모달 시스템이 입력 채널의 손실이나 손상에도 견고한 표현을 학습하도록 하는 'ModalImmune' 프레임워크를 제안하고, 다양한 벤치마크에서 모달리티 제거 및 손상 상황에 대한 복원력과 안정성을 입증합니다.

Rong Fu, Jia Yee Tan, Zijian Zhang, Ziming Wang, Zhaolu Kang, Muge Qi, Shuning Zhang, Simon Fong2026-03-10🤖 cs.LG

Whole-Brain Connectomic Graph Model Enables Whole-Body Locomotion Control in Fruit Fly

이 논문은 성체 초파리의 완전한 뇌 연결체 (connectome) 구조를 그대로 활용하여 감각 입력에서 운동 출력으로의 정보 흐름을 구현한 'FlyGM'을 개발함으로써, 별도의 구조 조정이 없어도 다양한 이동 작업을 안정적으로 제어하고 기존 모델보다 우수한 샘플 효율성과 성능을 입증했다고 요약할 수 있습니다.

Zehao Jin, Yaoye Zhu, Chen Zhang, Yanan Sui2026-03-10🤖 cs.LG

Conformal Tradeoffs: Guarantees Beyond Coverage

이 논문은 분포 독립적 기준이 부재한 상황에서 분할 합동 예측 (split conformal prediction) 의 운영적 성과 (기여 빈도, 유보, 오류 노출 등) 를 보장하기 위해 소표본 베타 보정 (SSBC) 과 검증 및 감사 (Calibrate-and-Audit) 프레임워크를 제안하며, 이를 통해 운영 목표 간의 트레이드오프를 시각화하고 유한 시간 창에서의 불확실성을 정량화하는 방법을 제시합니다.

Petrus H. Zwart2026-03-10🤖 cs.LG

Latent Equivariant Operators for Robust Object Recognition: Promise and Challenges

이 논문은 회전 및 이동이 포함된 MNIST 데이터셋을 통해 잠재 공간에서 등변 연산자를 학습하는 아키텍처가 기존 및 등변 신경망의 한계를 극복하고 분포 외 객체 인식에 성공할 수 있음을 보이지만, 더 복잡한 데이터셋으로 확장하는 데는 여전히 과제가 있음을 논의합니다.

Minh Dinh, Stéphane Deny2026-03-10🤖 cs.LG

Characterizing MARL for Energy Control: A Multi-KPI Benchmark on the CityLearn Environment

이 논문은 CityLearn 환경을 활용하여 도시 에너지 관리에 대한 다중 에이전트 강화학습 (MARL) 알고리즘을 다양한 핵심 성과 지표 (KPI) 로 평가하고, 분산 훈련이 중앙 집중식 훈련보다 우수하며 시간적 의존성 학습이 배터리 수명 등 지속 가능성 지표 향상에 기여함을 입증했습니다.

Aymen Khouja, Imen Jendoubi, Oumayma Mahjoub, Oussama Mahfoudhi, Ruan De Kock, Siddarth Singh, Claude Formanek2026-03-10🤖 cs.LG

RAmmStein: Regime Adaptation in Mean-reverting Markets with Stein Thresholds -- Optimal Impulse Control in Concentrated AMMs

이 논문은 분산형 거래소의 집중 유동성 공급 문제를 최적 제어 문제로 정식화하고, Ornstein-Uhlenbeck 과정의 평균 회귀 속도를 활용한 딥 강화 학습 기법인 RAmmStein 을 제안하여, 불필요한 재조정 비용을 줄이면서도 자본 효율성을 극대화하는 지능형 유동성 관리 전략을 입증했습니다.

Pranay Anchuri2026-03-10🤖 cs.LG

← 이전 다음 →

cs.LG