cs.LG 편의 논문 | Gist.Science

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

이 논문은 비가분한 스코어 기반 선택의 한계를 극복하기 위해 연속적으로 완화된 베르누이 게이트를 도입하여, 가중치를 고정된 초기값으로 유지한 채 게이트 파라미터만 학습하는 완전히 미분 가능한 방식으로 강력한 로또 티켓 (Strong Lottery Ticket) 을 효율적으로 발견하는 새로운 프레임워크를 제안합니다.

Itamar Tsayag, Ofir Lindenbaum2026-03-11🤖 cs.AI

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

이 논문은 임상 가이드라인과 비전 - 언어 모델을 통합하여 의료 이미지의 특징, 개념, 병리를 연결하고 전문가의 추론을 모방한 구조화된 임상 서술을 생성하는 새로운 개념 기반 추론 프레임워크인 MedCBR 을 제안하며, 이를 통해 의료 영상 분석의 해석 가능성과 진단 정확도를 동시에 향상시켰음을 보여줍니다.

Mohamed Harmanani, Bining Long, Zhuoxin Guo, Paul F. R. Wilson, Amirhossein Sabour, Minh Nguyen Nhat To, Gabor Fichtinger, Purang Abolmaesumi, Parvin Mousavi2026-03-11🤖 cs.LG

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

이 논문은 물리적 네트워크와 디지털 트윈의 데이터를 최적 비율로 활용하여 강화학습 기반 안테나 틸트 제어를 수행함으로써 사용자 데이터 전송률을 극대화하고 물리적 데이터 수집 지연을 28.01%까지 감소시키는 계층적 강화학습 프레임워크를 제안합니다.

Hanzhi Yu, Hasan Farooq, Julien Forgeat, Shruti Bothe, Kristijonas Cyras, Md Moin Uddin Chowdhury, Mingzhe Chen2026-03-11🤖 cs.LG

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

이 논문은 실종 아동 수색을 위해 비정형 데이터를 시공간적 위험 표면으로 변환하고, 마르코프 체인, 강화 학습, 그리고 LLM 기반 품질 보증을 결합한 3 층 아키텍처를 가진 '가디언' 시스템의 예측 모델과 검증 결과를 제시합니다.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

이 논문은 소수의 앵커를 활용하여 도메인 간 시각 - 언어 특징을 정형화된 기하학적 변환으로 정렬하는 단순하고 매개변수가 적은 BiCLIP 프레임워크를 제안함으로써, 다양한 벤치마크에서 최첨단 성능을 달성하는 도메인 적응 방법을 제시합니다.

Pranav Mantini, Shishir K. Shah2026-03-11🤖 cs.AI

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

이 논문은 효율적 영향 함수의 명시적 유도 없이도 반모수적 효율성을 달성할 수 있는 범용 최소불리 하위모델 기반 커널 편향 보정 플러그인 추정량 (ULFS-KDPE) 을 제안하고, 이를 함수해석학적 근거와 수치적 안정성을 갖춘 알고리즘으로 정립했습니다.

Haiyi Chen, Yang Liu, Ivana Malenica2026-03-11🤖 cs.LG

Towards Reliable Simulation-based Inference

이 논문은 시뮬레이션 기반 추론에서 기계 학습 모델의 과신 (overconfidence) 문제를 진단하고, '밸런싱' 정규화 기법과 시뮬레이션에 특화된 베이지안 신경망을 도입하여 이를 완화하고 신뢰할 수 있는 통계적 추론을 가능하게 하는 방법을 제시합니다.

Arnaud Delaunoy2026-03-11🤖 cs.LG

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

이 논문은 72 시간이라는 골든타임을 활용하여 실종 아동 수색을 지원하기 위해, 여러 특화 LLM 과 합의 엔진을 조율하고 QLoRA 미세조정 기법을 적용한 '가디언' 시스템의 설계와 검증을 제시합니다.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

A Survey of Reinforcement Learning For Economics

이 논문은 차원의 저주로 인해 기존 동적 계획법의 적용에 한계가 있는 고차원 경제 모델에 대해 강화 학습이 제공하는 유연한 대안과 그 이론적 기반, 실용적 예시, 그리고 현재 직면한 한계점을 종합적으로 검토합니다.

Pranjal Rawat2026-03-11🤖 cs.LG

The $qs$ Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference

이 논문은 혼합 전문가 (MoE) 모델이 훈련 시 효율적이지만 추론 시 '이중 페널티'로 인해 대역폭 병목 현상이 발생하여 긴 컨텍스트 환경에서 밀집형 모델보다 성능이 저하될 수 있음을 'qs 부등식'을 통해 규명하고, MoE 를 훈련 최적화 기법으로 간주하고 추론 효율성을 위해 밀집형 모델로 증류하는 방안을 제안합니다.

Vignesh Adhinarayanan, Nuwan Jayasena2026-03-11🤖 cs.LG

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

이 논문은 쌍곡 다양체 상의 열 커널 확산을 통해 지식 그래프의 연속적인 해상도 조절을 가능하게 하고, 스펙트럼 갭을 기반으로 자동으로 의미적 추상화 수준을 탐지하는 '의미적 상세도 (SLoD)' 프레임워크를 제안합니다.

Edward Izgorodin2026-03-11🤖 cs.AI

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

이 논문은 IoT 데이터 스트림의 개념 변화와 시간적 의존성을 처리하기 위해 비틀스키의 사회문화적 학습 이론에 기반한 자율적 상호 지원 학습 패러다임인 'MAcPNN'을 제안하고, 이를 통해 기존 연동 학습 방식보다 효율적으로 성능을 향상시키는 방법을 제시합니다.

Federico Giannini, Emanuele Della Valle2026-03-11🤖 cs.LG

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

이 논문은 불확실한 교란 분포를 가진 마르코프 결정 과정 (MDP) 에 대해 경험적 분포 기반의 모호성 집합을 정의하고, 약수렴과 거리 함수 수렴을 연결하여 유한 표본에서의 높은 확률 성능 보장, 수렴 속도, 및 표본 복잡도 한계를 증명하는 데이터 기반 강건 MDP 프레임워크를 제시합니다.

Sivaramakrishnan Ramani2026-03-11✓ Author reviewed ⓘ🤖 cs.LG

MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment

이 논문은 복잡한 의료 시나리오에서 다수결 투표의 한계를 극복하고 Med-RPM 을 활용한 세분화된 전문가 기반 보상 신호로 강화 학습을 유도함으로써, 의료 AI 의 추론 신뢰성과 확장성을 획기적으로 개선하는 MAPLE 프레임워크를 제안합니다.

Kailong Fan, Anqi Pu, Yichen Wu, Wanhua Li, Yicong Li, Hanspeter Pfister, Huafeng Liu, Xiang Li, Quanzheng Li, Ning Guo2026-03-11🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

이 논문은 생성 모델을 통계적 추론의 관점에서 재해석하여 유동 매칭 (Flow Matching) 을 기반으로 결측치 대체, 반사실 분석, 생존 분석 등 구조화된 고차원 문제에서 추론의 유효성을 보장하는 새로운 통계적 프레임워크를 제시합니다.

Shinto Eguchi2026-03-11🤖 cs.LG

The Coupling Within: Flow Matching via Distilled Normalizing Flows

이 논문은 사전 훈련된 오토리거시티브 정규화 흐름 (AR-NF) 모델의 준결정적 결합 (coupling) 을 증류하여 독립 결합이나 최적 수송 결합보다 우수한 성능을 내면서도 교사 모델 자체를 개선하는 새로운 '정규화 흐름 매칭 (NFM)' 방법을 제안합니다.

David Berthelot, Tianrong Chen, Jiatao Gu, Marco Cuturi, Laurent Dinh, Bhavik Chandna, Michal Klein, Josh Susskind, Shuangfei Zhai2026-03-11🤖 cs.LG

An accurate flatness measure to estimate the generalization performance of CNN models

이 논문은 완전 연결 네트워크에 국한되거나 근사적인 기존 방법의 한계를 극복하기 위해, 합성곱 신경망 (CNN) 의 기하학적 구조를 정확히 반영하는 폐쇄형 평탄도 측정치를 제안하고 이를 통해 CNN 모델의 일반화 성능을 정밀하게 평가하고 아키텍처 설계에 활용할 수 있음을 입증합니다.

Rahman Taleghani, Maryam Mohammadi, Francesco Marchetti2026-03-11🤖 cs.LG

When to Retrain after Drift: A Data-Only Test of Post-Drift Data Size Sufficiency

이 논문은 개념 변화 (concept drift) 발생 후 재학습에 필요한 충분한 데이터 크기를 결정하기 위해, 동적 시스템의 상태 의존성을 활용한 단일 패스 가중 국소 회귀 기반의 데이터 전용 테스트 'CALIPER'를 제안하고 다양한 도메인에서 그 유효성을 입증합니다.

Ren Fujiwara, Yasuko Matsubara, Yasushi Sakurai2026-03-11🤖 cs.LG

Two Teachers Better Than One: Hardware-Physics Co-Guided Distributed Scientific Machine Learning

이 논문은 중앙 집중식 처리의 한계를 극복하기 위해 하드웨어와 물리 법칙을 공동으로 안내하는 분산 과학 머신러닝 프레임워크 'EPIC'을 제안하여, 경량 인코딩과 물리 인식 디코딩을 통해 통신 지연과 에너지 소모를 획기적으로 줄이면서도 물리적 정밀도를 유지하거나 향상시킨다는 점을 보여줍니다.

Yuchen Yuan, Junhuan Yang, Hao Wan, Yipei Liu, Hanhan Wu, Youzuo Lin, Lei Yang2026-03-11🤖 cs.LG

SCALAR: Learning and Composing Skills through LLM Guided Symbolic Planning and Deep RL Grounding

이 논문은 LLM 기반 계획과 강화학습을 양방향으로 결합하여 실행 피드백을 통해 기술 명세를 반복적으로 정제하는 'SCALAR' 프레임워크를 제안하며, Craftax 환경에서 기존 최선 방법론 대비 1.9 배 향상된 성능을 입증했습니다.

Renos Zabounidis, Yue Wu, Simon Stepputtis, Woojun Kim, Yuanzhi Li, Tom Mitchell, Katia Sycara2026-03-11🤖 cs.LG

← 이전 다음 →

cs.LG