cs.LG 편의 논문 | Gist.Science

Towards Causal Market Simulators

이 논문은 기존 생성 모델의 한계를 극복하고 반사실적 분석을 가능하게 하기 위해 변이 오토인코더와 구조적 인과 모델을 결합한 '시계열 신경 인과 모델 VAE(TNCM-VAE)'를 제안하며, 인과적 제약을Decoder 아키텍처와 인과적 와asserstein 거리를 통해 구현하여 금융 시장 시뮬레이션의 정밀도를 크게 향상시켰음을 보여줍니다.

Dennis Thumm, Luis Ontaneda Mijares2026-03-12📊 stat

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

이 논문은 에너지 제약과 부분 관측 가능성 하에서 광무선 (OWC) 과 전파 (RF) 를 통합한 하이브리드 IoT 네트워크의 자원 할당 문제를 해결하기 위해, 그래프 신경망 (GNN) 과 트랜스포머를 결합한 다중 태스크 학습 프레임워크인 DGET 을 제안하여 최적의 스케줄링을 달성하고 정보의 신선도 (AoI) 를 크게 개선함을 보여줍니다.

Aymen Hamrouni, Sofie Pollin, Hazem Sallouha2026-03-12🤖 cs.LG

STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection

이 논문은 자동차 원격 측정 데이터의 느린 드리프트와 빠른 스파이크 동역학을 분리하여 처리하는 듀얼 경로 라우팅 메커니즘을 도입한 STREAM-VAE 를 제안함으로써, 기존 재구성 기반 방법들의 한계를 극복하고 다양한 작동 모드에서 안정적인 이상 탐지 성능을 달성했습니다.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

이 논문은 불완전하고 민감한 의료 데이터를 기반으로 대규모 언어 모델의 특정 지식을 정밀하게 삭제하면서도 핵심 의료 역량은 유지하기 위해 기하학적 제약과 개념 인식 토큰 개입을 통합한 계층적 이중 전략 언러닝 프레임워크를 제안하고, 이를 통해 높은 망각률과 지식 보존률을 달성함과 동시에 파라미터 수정을 최소화하여 규제 준수 및 윤리적 기준을 충족함을 보여줍니다.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

이 논문은 실제 상업적 타당성을 평가하기 위해 SEC filings 및 AIS 손상 보고서와 같은 산업 표준 데이터를 Isaac Sim 시뮬레이션과 결합한 최초의 물리 기반 경제 내비게이션 벤치마크인 'CostNav'를 제안하며, 기존 내비게이션 방법론들이 모두 경제적 손실을 초래한다는 점을 규명했습니다.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

이 논문은 대칭성이 부분적으로 깨지는 실제 환경에서 오차 전파를 방지하면서도 대칭성의 이점을 유지하기 위해, 대칭성이 성립하는 영역과 그렇지 않은 영역에 따라 벨만 백업을 선택적으로 적용하는 '부분적으로 불변 MDP(PI-MDP)' 프레임워크와 이를 구현한 강화학습 알고리즘 (PE-DQN, PE-SAC) 을 제안합니다.

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

Cross-embodied Co-design for Dexterous Hands

이 논문은 시뮬레이션과 실제 배포를 통해 24 시간 이내에 새로운 로봇 손의 형태와 제어 정책을 동시에 최적화하여 제작 및 배포할 수 있는 '크로스-임바디드' 공설계 프레임워크를 제안합니다.

Kehlani Fay, Darin Anthony Djapri, Anya Zorin, James Clinton, Ali El Lahib, Hao Su, Michael T. Tolley, Sha Yi, Xiaolong Wang2026-03-12🤖 cs.LG

A scalable and real-time neural decoder for topological quantum codes

이 논문은 표면 코드와 컬러 코드 모두에서 최적에 가까운 논리 오류율을 달성하고, 기존 고정밀 디코더보다 수 배 빠른 속도로 1 마이크로초 이내의 실시간 디코딩을 가능하게 하는 확장 가능한 신경망 디코더 'AlphaQubit 2'를 제안합니다.

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

이 논문은 분자 언어 모델, 강화 학습, 몬테카를로 트리 탐색을 통합한 'Trio' 프레임워크를 제안하여, 기존 생성 모델의 한계를 극복하고 결합 친화도, 약물 유사성, 합성 접근성을 모두 향상시키면서도 분자 다양성을 4 배 이상 확장하는 폐쇄 루프형 표적 분자 설계 패러다임을 제시합니다.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

Maximum Risk Minimization with Random Forests

이 논문은 다양한 환경에서 최대 리스크를 최소화하는 원칙 (MaxRM) 을 기반으로 한 랜덤 포레스트 변형 알고리즘을 제안하고, 효율적인 계산 방법과 통계적 일관성을 증명하며 MSE, 보상, 후회 (regret) 등 세 가지 리스크 지표에 적용 가능한 것을 보여줍니다.

Francesco Freni, Anya Fries, Linus Kühne, Markus Reichstein, Jonas Peters2026-03-12📊 stat

PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations

이 논문은 인간형 로봇의 데이터 효율적인 전신 제어를 위해 proprioceptive(고유수용감각) 와 privileged(우대) 상태 간의 상호보완성을 활용한 대비 학습 프레임워크인 PvP 와 인간형 로봇을 위한 상태 표현 학습 (SRL) 평가 프레임워크인 SRL4Humanoid 를 제안하고, 이를 통해 샘플 효율성과 최종 성능을 크게 향상시켰음을 보여줍니다.

Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng2026-03-12🤖 cs.LG

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

이 논문은 이질적인 배터리 데이터의 부족과 다양성이라는 과제를 해결하고, 13 개의 데이터셋으로 사전 학습된 '사전 학습 배터리 트랜스포머 (PBT)'라는 최초의 기초 모델을 통해 다양한 배터리 화학 조성과 조건에서 기존 최첨단 방법보다 평균 21.8% 높은 정밀도로 수명을 예측하는 범용 시스템을 제시합니다.

Ruifeng Tan, Weixiang Hong, Jia Li, Jiaqiang Huang, Tong-Yi Zhang2026-03-12🤖 cs.LG

NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra

NMIRacle 는 IR 과 NMR 스펙트럼 데이터를 기반으로 분자 구조를 정확하게 예측하기 위해 분자 조각 재구성과 스펙트럼 임베딩을 결합한 2 단계 생성형 프레임워크를 제안하여 기존 방법들보다 우수한 성능을 입증한 연구입니다.

Federico Ottomano, Yingzhen Li, Alex M. Ganose2026-03-12🔬 physics

Saddle-to-Saddle Dynamics Explains A Simplicity Bias Across Neural Network Architectures

이 논문은 다양한 신경망 아키텍처에서 경사 하강법이 안장점 (saddle) 에서 안장점으로 이동하는 동역학을 통해, 단순한 해 (낮은 랭크, 적은 커널 등) 에서 점차 복잡한 해로 진화하는 '단순성 편향 (simplicity bias)'을 설명하는 통합 이론적 프레임워크를 제시합니다.

Yedi Zhang, Andrew Saxe, Peter E. Latham2026-03-12🤖 cs.LG

Data relativistic uncertainty framework for low-illumination anime scenery image enhancement

이 논문은 자연 이미지와 달리 저조도 애니메이션 풍경 이미지 개선의 도메인 격차를 해소하기 위해, 불확실성 정보를 활용한 데이터 상대론적 불확실성 (DRU) 프레임워크를 제안하고 이를 통해 기존 최첨단 방법보다 우수한 지각적 및 미적 품질을 달성함을 보여줍니다.

Yiquan Gao, John See2026-03-12🤖 cs.LG

The Bayesian Geometry of Transformer Attention

이 논문은 '베이즈 풍동'이라는 통제된 환경을 통해 트랜스포머가 주어진 컨텍스트에서 베이즈 추론을 수행하며, 이는 잔류 스트림, 피드포워드 네트워크, 어텐션 메커니즘이 각각 믿음의 기반, 사후 확률 업데이트, 콘텐츠 기반 라우팅을 담당하는 기하학적 구조로 구현됨을 입증합니다.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds

이 논문은 교차 엔트로피 손실 함수를 통한 그래디언트 학습이 어텐션 점수와 값 벡터의 공진화적 특화를 유도하여 베이지안 매니폴드를 조각내며, 이것이 컨텍스트 내 확률적 추론을 가능하게 하는 기하학적 구조를 형성한다는 메커니즘을 분석합니다.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Geometric Scaling of Bayesian Inference in LLMs

본 논문은 Pythia, Llama-3 등 다양한 대규모 언어 모델에서도 소규모 모델에서 관찰된 베이지안 추론의 기하학적 특징 (예측 엔트로피와 상관된 주성분 축) 이 유지되며, 이를 통한 불확실성 추정이 이루어짐을 확인하고 해당 기하학적 구조가 불확실성의privileged한 읽기 도구임을 입증했습니다.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12🤖 cs.LG

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

이 논문은 H&E 염색 조직 슬라이드에서 직접 분자 아형 (기저형 및 고전형) 을 예측하여 비용 효율적이고 해석 가능한 췌장암 정밀 의학을 가능하게 하는 딥러닝 프레임워크 'PanSubNet'을 제안하고, 다기관 코호트에서 높은 정확도와 예후 예측 능력을 입증했습니다.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan Niazi2026-03-12⚡ eess

Over-Searching in Search-Augmented Large Language Models

이 논문은 검색 증강 LLM 의 과도한 검색 문제를 다각도로 분석하고, 효율성-정확도 균형을 측정하는 새로운 지표인 'Tokens Per Correctness(TPC)'를 제안하며, 이를 완화하기 위한 방법과 관련 데이터셋인 OverSearchQA 를 공개합니다.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

← 이전 다음 →