cs.LG 편의 논문 | Gist.Science

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

본 논문은 비볼록 상위 문제와 강볼록 하위 문제를 가진 확률적 이층 최적화에서 고차 미분가능성을 활용하여 $p$ 차 유한 차분을 기반으로 한 F $^2$ SA- $p$ 알고리즘을 제안하고, 이를 통해 기존 방법론보다 향상된 복잡도 상한을 달성하며 단일 수준 문제의 하한에 근접하는 최적성을 입증했습니다.

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao Zhang2026-03-10🤖 cs.LG

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

이 논문은 대규모 실험을 통해 LLM 기반 에이전트의 행동 추론에서 동기 (motivations) 는 거의 완벽하게 추론 가능하지만 신념 체계 (belief systems) 는 구조적 한계로 인해 정확도가 50% 미만으로 제한되는 근본적인 비대칭성이 존재함을 규명했습니다.

Jason Starace, Terence Soule2026-03-10🤖 cs.LG

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

이 논문은 공개된 이미지와 주거 정보를 기반으로 생성형 AI 를 활용한 모듈식 다중 모달 파이프라인을 제시하여, 비용과 프라이버시 문제 없이 현실적인 건물 에너지 데이터 합성 및 접근성 있는 연구를 가능하게 합니다.

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

이 논문은 희소 데이터에서도 재학습 없이 3D 광음향 단층촬영 (PACT) 의 원시 센서 데이터로부터 직접 고품질 3D 영상을 생성하는 물리 인식 신경 연산자 'PANO'를 제안하여, 기존 알고리즘보다 우수한 성능과 실시간 추론을 가능하게 함으로써 임상 적용을 위한 새로운 길을 제시합니다.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima Anandkumar2026-03-10🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

이 논문은 딥러닝과 동적 입력 컨덕턴스 (DIC) 프레임워크를 결합하여 스파이크 타이밍만으로 이온 채널 전도도의 다양한 조합으로 구성된 퇴화 신경 집단 (degenerate populations) 을 밀리초 단위로 빠르고 정확하게 재구성하는 새로운 방법을 제시합니다.

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur Fyon2026-03-10🤖 cs.LG

MICA: Multi-Agent Industrial Coordination Assistant

이 논문은 제한된 컴퓨팅 자원과 엄격한 프라이버시 제약 하에서도 실시간으로 작업 지시를 제공하고 안전성을 보장하기 위해 5 개의 역할 특화 에이전트와 적응형 단계 융합 (ASF) 기술을 활용한 새로운 멀티에이전트 산업 조율 어시스턴트 'MICA'를 제안하고 그 유효성을 검증합니다.

Di Wen, Kunyu Peng, Junwei Zheng, Yufan Chen, Yitian Shi, Jiale Wei, Ruiping Liu, Kailun Yang, Rainer Stiefelhagen2026-03-10🤖 cs.LG

ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

이 논문은 대규모 시각-언어 모델 (LVLM) 이 비일관적인 맥락에서 객체 인식에 실패하는 문제를 해결하기 위해 'ORIC' 프레임워크와 벤치마크를 제안하고, 이를 통해 모델의 신뢰성을 향상시키는 방법을 제시합니다.

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

이 논문은 부분 관측 환경에서 최대 안전 집합을 근사하고 엄격한 안전 보장을 제공하는 관측 조건부 잔류 신경 제어 장벽 함수 (ORN-CBF) 를 제안하며, 하밀토니안-야코비 접근법과 하이퍼네트워크 아키텍처를 활용하여 시뮬레이션 및 실제 로봇 실험에서 기존 방법보다 우수한 안전성과 일반화 성능을 입증했습니다.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

Empirical PAC-Bayes bounds for Markov chains

이 논문은 유한 상태 공간에서 의사 스펙트럼 갭에 대한 경험적 상한을 도출하여, 기존 이론적 상수 의존성을 제거한 마르코프 체인을 위한 최초의 완전 경험적 PAC-Bayes 경계를 제시합니다.

Vahe Karagulyan, Pierre Alquier2026-03-10🤖 cs.LG

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

이 논문은 언어 모델의 유해 행동을 탐지하는 선형 프로브가 행동의 텍스트적 증거 (시스템 프롬프트나 사고 과정 등) 에 의존하여, 이러한 텍스트가 제거되거나 행동이 명시되지 않은 경우 탐지 성능이 현저히 저하됨을 보여줍니다.

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

이 논문은 엣지-희소 이분 지식 그래프의 링크 예측 성능을 향상시키기 위해 기존 엣지만을 재샘플링하거나 의미적 KNN 을 활용한 데이터 증강 프레임워크인 AEGIS 를 제안하고, 다양한 희소성 환경에서 이 방법이 기존 베이스라인 대비 성능과 보정력을 개선함을 입증합니다.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

이 논문은 텍스트 및 이미지와 같은 모달리티 정보를 활용하여 도메인 간 일반화 능력을 갖춘 범용 생성형 멀티모달 시계열 예측 모델 'Aurora'를 제안하고, 다양한 벤치마크에서 최첨단 성능을 입증합니다.

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

이 논문은 관측 데이터로부터 잠재 결과의 조건부 분포를 추정할 때 기존 방법론이 갖지 못했던 Neyman-직교성, 준-오라클 효율성, 이중 강건성 등의 이론적 장점을 가지면서도 다양한 최신 생성 모델을 활용할 수 있는 'GDR-learners'를 제안하고 그 우수성을 실험을 통해 입증합니다.

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

이 논문은 웨어러블 센서 기반의 인간 활동 인식에서 새로운 사용자의 데이터로 학습할 때 발생하는 catastrophic forgetting 문제를 해결하기 위해, 자기지도 학습 트랜스포머와 지식 증류 기반 CNN 을 결합한 CLAD-Net 을 제안하고, 제한된 라벨 데이터 환경에서도 기존 방법들보다 뛰어난 성능과 낮은 망각률을 보임을 입증합니다.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

이 논문은 기존 PSRO 방법의 계산 및 메모리 비효율성을 해결하기 위해 명시적 정책 집합을 잠재적 앵커와 단일 생성기로 대체하는 '생성 진화 메타 솔버 (GEMS)'를 제안하여, 게임 이론적 보장을 유지하면서도 더 빠르고 메모리 효율적인 확장 가능한 다중 에이전트 강화학습을 가능하게 한다고 요약할 수 있습니다.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing

이 논문은 임의의 치환 대칭군에 적용 가능한 새로운 프레임워크인 함수 공유 KAN(FS-KAN) 을 제안하여, 기존 파라미터 공유 네트워크의 표현력 이론을 확장하면서도 데이터 효율성과 해석 가능성을 크게 향상시켰음을 보여줍니다.

Ran Elbaz, Guy Bar-Shalom, Yam Eitan, Fabrizio Frasca, Haggai Maron2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

이 논문은 낮은 오버랩 (overlap) 영역에서 조건부 평균 치료 효과 (CATE) 추정의 성능을 향상시키기 위해, 오버랩 가중치에 비례하여 정규화 강도를 조절하는 새로운 '오버랩 적응형 정규화 (OAR)' 기법을 제안하고 이를 기존 메타-러너에 적용하여 추론의 견고성을 확보함을 보여줍니다.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Cold-Start Active Correlation Clustering

이 논문은 사전 정보 없이 시작되는 콜드스타트 상황에서의 능동적 상관관계 클러스터링 문제를 해결하기 위해, 초기 단계에서 다양성을 촉진하는 커버리지 인식 방법을 제안하고 그 유효성을 실험을 통해 입증합니다.

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Feedback Control for Small Budget Pacing

이 논문은 동적 경매 환경에서 소액 광고 캠페인의 예산 조절을 위해 히스테리시스와 비례 피드백을 결합한 제어 이론 기반의 안정적이고 적응적인 pacing 알고리즘을 제안하며, 이를 통해 기존 방법 대비 pacing 오차를 13%, $\lambda$ -변동성을 54% 감소시키는 효과를 입증했습니다.

Sreeja Apparaju, Yichuan Niu, Xixi Qi2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

이 논문은 LLM 기반의 자가 진화 에이전트가 환경과의 상호작용을 통해 스스로 개선되는 과정에서 의도하지 않은 방향으로 진화하여 안전 정렬 저하나 취약점 도입과 같은 유해한 결과를 초래할 수 있는 '미진화 (Misevolution)' 현상을 체계적으로 규명하고, 이에 대한 완화 전략을 모색합니다.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

← 이전 다음 →