cs.LG 편의 논문 | Gist.Science

Learning Clinical Representations Under Systematic Distribution Shift

이 논문은 훈련 데이터와 배포 환경 간의 체계적인 분포 변화를 해결하기 위해, 생리학적 신호와 환경 의존적 아티팩트를 분리하는 적대적 정규화 및 불변 위험 페널티를 결합한 새로운 표현 학습 프레임워크를 제안하여 다양한 병원 간 임상 예측 모델의 분포 외 일반화 성능과 보정 능력을 크게 향상시켰음을 보여줍니다.

Yuanyun Zhang, Shi Li2026-03-10🤖 cs.LG

A Distributed Gaussian Process Model for Multi-Robot Mapping

이 논문은 국소 경험과 계산만을 활용하여 전역 함수를 학습하는 분산 가우시안 프로세스 모델 'DistGP'를 제안하며, 이는 기존 트리 구조 GP 나 분산 신경망 최적화기보다 우수한 정확도와 동적 연결성 환경에서의 견고성을 보입니다.

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

이 논문은 농업 비전 분야에서 모델의 일반화 성능을 평가하기 위해 여러 팀이 독립적으로 수집한 이질적인 데이터셋을 활용하는 'AgrI Challenge'와 교차 팀 검증 (CTV) 패러다임을 제안하며, 단일 소스 학습의 한계를 드러내고 다중 소스 협업 학습이 도메인 간 격차를 크게 줄여준다는 것을 입증합니다.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

이 논문은 중첩 드롭아웃 (nested dropout) 을 활용하여 확산 모델, 정규화 흐름, 변이 오토인코더의 복잡도를 조절 가능한 방식으로 개선함으로써, 압축 센싱 및 다양한 역문제에서 고정 복잡도 기반 모델보다 낮은 재구성 오차를 달성하고 이론적 분석을 제공함을 보여줍니다.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

이 논문은 희소 사건 감독 하에서 장기 wildfire 위험 예측의 계산 효율성을 높이기 위해, 초기 탈노이즈 단계를 공유하고 후기 단계에서 분기하는 계층적 확산 모델인 N-Tree Diffusion (NT-Diffusion) 을 제안하여 정확도 향상과 추론 비용 감소를 동시에 달성함을 보여줍니다.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

이 논문은 100M 파라미터 미만의 '작은 모델' 영역에서 성능이 크기 증가에 따라 멱법칙을 따르지만, 오류의 구조와 보정 능력이 크게 변화하며 중간 크기 모델보다 가장 작은 모델이 더 잘 보정되는 등 에지 AI 배포를 위해서는 목표 모델 크기에서의 검증이 필수적임을 규명합니다.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

이 논문은 채널 상태 정보 (CSI) 추정 오버헤드를 제거하고 사용자 위치 정보를 활용하며, 계층적 다중 에이전트 강화학습 (HMARL) 을 통해 mmWave 빔 포커싱의 확장성과 성능을 극대화하는 새로운 프레임워크를 제안합니다.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

ConfHit: Conformal Generative Design with Oracle Free Guarantees

이 논문은 실험적 오라클 접근 없이도 생성된 분자 후보군에 대해 통계적으로 유효한 보장과 함께 타겟 속성을 만족하는 '히트' 화합물을 포함할 확신을 제공하는 새로운 분포 무관 프레임워크인 ConfHit 을 제안합니다.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

이 논문은 저자원 언어와 도메인별 기계 번역 품질 평가를 위해 오픈 가중치 LLM 에 중간 레이어 적응 기법 (ALOPE 및 LoRMA) 을 적용함으로써 프롬프트 기반 방법의 한계를 극복하고 견고한 품질 추정 성능을 달성하는 방안을 제시합니다.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Sparsity and Out-of-Distribution Generalization

이 논문은 세계가 구별된 특징을 통해 경험되며, Occam's 칼날에 따라 최소한의 특징에 의존하는 '희소성' 가설이 훈련 분포와 테스트 분포의 관련 특징 영역이 겹칠 때만 Out-of-Distribution 일반화가 가능하다는 원리를 제안하고 이를 수학적으로 증명합니다.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

이 논문은 다중 작업 학습에서 MGDA 계열 방법의 계산 비효율성을 해결하기 위해, 모델 학습과 그래디언트 균형 조정을 결합된 바이-레벨 최적화 문제로 재해석하고 제로차 최적화 기법을 활용하여 효율적으로 해결하는 통합 프레임워크인 MARIGOLD 를 제안합니다.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

이 논문은 HIPAA 및 NERC-CIP 와 같은 법적 준수 프레임워크와 정렬하기 위해, 투명하고 재현 가능한 결정론적 퍼지 분류 밴드와 이중 인코더를 활용하여 대규모 계약 증거를 자동 분류하고 인간 검토가 필요한 사례를 식별하는 실용적인 시스템을 제안합니다.

Rian Atri2026-03-10🤖 cs.LG

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

이 논문은 기존 선형 오토인코더 추천 시스템의 제한된 하이퍼파라미터 범위를 확장하고 $b>0$ 조건에서 더 나은 성능을 내는 해를 도출하기 위해 '분리된 기대 2 차 손실 (DEQL)'을 제안하고 효율적인 알고리즘을 제시합니다.

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

이 논문은 '맥락 채널 용량'이라는 정보이론적 프레임워크를 제시하여, continual learning 에서의 catastrophic forgetting 이 알고리즘이 아닌 아키텍처의 구조적 한계에서 기인함을 증명하고, 이를 해결하기 위한 새로운 설계 원칙과 진단 도구를 제안합니다.

Ran Cheng2026-03-10🤖 cs.LG

DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation

이 논문은 검색과 방문 행동의 이질성을 분석하여 경량화 검증기를 도입한 'DualSpec' 프레임워크를 제안함으로써, 심층 연구 에이전트의 정확도를 유지하면서 최대 3.28 배의 종단 간 속도 향상을 달성했습니다.

Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li2026-03-10🤖 cs.LG

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

이 논문은 잠재 교란변수로 인한 상관관계 학습의 한계를 극복하기 위해 신경 제어 함수를 통해 도구변수 추정을 트랜스포머의 은닉 상태에 직접 통합한 'OrthoFormer'를 제안하여, 분포 변화 하에서도 견고한 인과적 시퀀스 모델링을 가능하게 한다고 요약할 수 있습니다.

Charles Luo2026-03-10🤖 cs.LG

Generalization in Online Reinforcement Learning for Mobile Agents

이 논문은 모바일 GUI 에이전트의 일반화 능력을 평가하기 위한 새로운 벤치마크 'AndroidWorld-Generalization'과 확장 가능한 RL 학습 시스템을 제안하고, 그룹 상대적 정책 최적화 (GRPO) 를 적용한 실험을 통해 일반화 문제의 현재 한계와 잠재력을 규명했습니다.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

이 논문은 손실 기반의 난이도와 신뢰도 기반의 불확실성 신호를 통합한 보상 메커니즘을 통해 모델 최적화와 함께 진화하는 샘플별 선택 정책을 학습함으로써, 다양한 작업과 데이터셋에서 손실 없는 성능 유지 하에 훈련 비용을 50% 이상 절감하는 종단간 동적 데이터 선택 프레임워크인 'Data Agent'를 제안합니다.

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

이 논문은 부분 관측 및 고차원 데이터에서 누적 비용을 예측하여 잠재 상태 공간의 동역학 모델을 학습하는 비용 주도 표현 학습을 통해 무한 시간 선형 2 차 가우시안 (LQG) 제어에 대한 유한 샘플 보장과 함께 명시적 및 암시적 (MuZero 유사) 두 가지 접근법을 제시합니다.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

이 논문은 파인튜닝 중 안전 관련 토큰의 신뢰도만 참조 모델과 일치하도록 제한하는 'PACT' 프레임워크를 제안하여, 모델의 유용성을 해치지 않으면서도 안전 정렬의 붕괴를 방지하는 방법을 제시합니다.

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

← 이전 다음 →