cs.LG 편의 논문 | Gist.Science

MASEval: Extending Multi-Agent Evaluation from Models to Systems

이 논문은 LLM 기반 에이전트 시스템의 성능에 모델뿐만 아니라 토폴로지나 오케스트레이션 로직과 같은 구현 선택도 결정적인 영향을 미친다는 점을 강조하며, 전체 시스템을 분석 단위로 삼아 프레임워크 간 비교를 가능하게 하는 'MASEval' 평가 프레임워크를 제안합니다.

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin Gubri2026-03-11🤖 cs.AI

Expressivity-Efficiency Tradeoffs for Hybrid Sequence Models

이 논문은 트랜스포머와 상태 공간 모델을 결합한 하이브리드 시퀀스 모델이 비하이브리드 모델의 이론적 한계를 극복하고, 더 적은 파라미터로 우수한 성능과 길이 일반화 능력을 달성함을 이론적 증명과 실험을 통해 입증합니다.

John Cooper, Ilias Diakonikolas, Mingchen Ma, Frederic Sala2026-03-11🤖 cs.LG

APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model

이 논문은 비전 - 언어 - 행동 (VLA) 모델을 활용하여 고전적 계획기의 매개변수를 적응적으로 학습하는 'APPLV'를 제안함으로써, 기존 방법들보다 뛰어난 항해 성능과 미시적 환경에 대한 일반화 능력을 달성함을 보여줍니다.

Yuanjie Lu, Beichen Wang, Zhengqi Wu, Yang Li, Xiaomin Lin, Chengzhi Mao, Xuesu Xiao2026-03-11🤖 cs.LG

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

이 논문은 사설 5G 환경에서 채널 중심 모델이 단말기 간 종단 간 처리량 (throughput) 을 과대평가하는 한계를 측정 캠페인을 통해 입증하고, 실제 시스템 동작을 학습하는 데이터 기반 접근법이 더 정확한 예측을 가능하게 함을 보여줍니다.

Nils Jörgensen2026-03-11🤖 cs.LG

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

이 논문은 하이브리드 정보 시스템에서 고차원 공간의 계산 비용과 노이즈 문제를 해결하기 위해, 객체 간 결합 거리를 기반으로 한 새로운 퍼지 근사 집합 기반 특성 선택 모델 (FSbuHD) 을 제안하고 이를 정상 및 낙관적 두 가지 모드에서 최적화 문제로 재구성하여 UCI 데이터셋을 통해 기존 방법들보다 효율성과 효과성이 입증되었음을 보여줍니다.

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein Dibachi2026-03-11🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

이 논문은 소스 도메인의 위험 프로파일을 활용하여 데이터가 부족한 환경에서도 더 엄격한 위험 보장을 제공하는 '전이 기반 베팅 (Transfer-Informed Betting)'을 포함한 선택적 예측을 위한 9 가지 유한 표본 경계 가족에 대한 포괄적인 분석과 벤치마크 평가를 제시합니다.

Abhinaba Basu2026-03-11🤖 cs.AI

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

이 논문은 비독립적·동일분포 (Non-IID) 데이터 환경에서 클라이언트 선택을 위해 클러스터 유사성과 손실 값을 고려한 경량화 전략인 FedLECC 를 제안하여, 테스트 정확도를 최대 12% 향상시키고 통신 라운드 및 오버헤드를 각각 약 22% 및 50% 감소시킨다고 설명합니다.

Daniel M. Jimenez-Gutierrez, Giovanni Giunta, Mehrdad Hassanzadeh, Aris Anagnostopoulos, Ioannis Chatzigiannakis, Andrea Vitaletti2026-03-11🤖 cs.AI

Quantifying Memorization and Privacy Risks in Genomic Language Models

이 논문은 유전체 언어 모델 (GLM) 의 프라이버시 위험을 정량화하기 위해 퍼플렉시티 기반 탐지, 카나리 시퀀스 추출, 멤버십 추론을 통합한 다중 벡터 평가 프레임워크를 제안하고, 반복 횟수와 모델 용량이 암기 위험에 미치는 영향을 실증적으로 분석했습니다.

Alexander Nemecek, Wenbiao Li, Xiaoqian Jiang, Jaideep Vaidya, Erman Ayday2026-03-11🤖 cs.LG

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

이 논문은 비가분한 스코어 기반 선택의 한계를 극복하기 위해 연속적으로 완화된 베르누이 게이트를 도입하여, 가중치를 고정된 초기값으로 유지한 채 게이트 파라미터만 학습하는 완전히 미분 가능한 방식으로 강력한 로또 티켓 (Strong Lottery Ticket) 을 효율적으로 발견하는 새로운 프레임워크를 제안합니다.

Itamar Tsayag, Ofir Lindenbaum2026-03-11🤖 cs.AI

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

이 논문은 임상 가이드라인과 비전 - 언어 모델을 통합하여 의료 이미지의 특징, 개념, 병리를 연결하고 전문가의 추론을 모방한 구조화된 임상 서술을 생성하는 새로운 개념 기반 추론 프레임워크인 MedCBR 을 제안하며, 이를 통해 의료 영상 분석의 해석 가능성과 진단 정확도를 동시에 향상시켰음을 보여줍니다.

Mohamed Harmanani, Bining Long, Zhuoxin Guo, Paul F. R. Wilson, Amirhossein Sabour, Minh Nguyen Nhat To, Gabor Fichtinger, Purang Abolmaesumi, Parvin Mousavi2026-03-11🤖 cs.LG

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

이 논문은 물리적 네트워크와 디지털 트윈의 데이터를 최적 비율로 활용하여 강화학습 기반 안테나 틸트 제어를 수행함으로써 사용자 데이터 전송률을 극대화하고 물리적 데이터 수집 지연을 28.01%까지 감소시키는 계층적 강화학습 프레임워크를 제안합니다.

Hanzhi Yu, Hasan Farooq, Julien Forgeat, Shruti Bothe, Kristijonas Cyras, Md Moin Uddin Chowdhury, Mingzhe Chen2026-03-11🤖 cs.LG

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

이 논문은 실종 아동 수색을 위해 비정형 데이터를 시공간적 위험 표면으로 변환하고, 마르코프 체인, 강화 학습, 그리고 LLM 기반 품질 보증을 결합한 3 층 아키텍처를 가진 '가디언' 시스템의 예측 모델과 검증 결과를 제시합니다.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

← 이전 다음 →

cs.LG

MASEval: Extending Multi-Agent Evaluation from Models to Systems

Expressivity-Efficiency Tradeoffs for Hybrid Sequence Models

APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

Quantifying Memorization and Privacy Risks in Genomic Language Models

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

Towards Reliable Simulation-based Inference

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

A Survey of Reinforcement Learning For Economics

The $qs$ Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

cs.LG

MASEval: Extending Multi-Agent Evaluation from Models to Systems

Expressivity-Efficiency Tradeoffs for Hybrid Sequence Models

APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

Quantifying Memorization and Privacy Risks in Genomic Language Models

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

Towards Reliable Simulation-based Inference

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

A Survey of Reinforcement Learning For Economics

The qsqsqs Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

The $qs$ Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference