cs.LG 편의 논문 | Gist.Science

PixARMesh: Autoregressive Mesh-Native Single-View Scene Reconstruction

이 논문은 단일 RGB 이미지로부터 완전한 3D 실내 장면 메쉬를 직접 생성하는 자동회귀 기반 방법인 PixARMesh 를 제안하며, 기존 방법과 달리 통합된 모델을 통해 객체 배치와 기하학을 동시에 예측하여 고품질의 메쉬를 단일 순방향 통과로 생성합니다.

Xiang Zhang, Sohyun Yoo, Hongrui Wu, Chuan Li, Jianwen Xie, Zhuowen Tu2026-03-09🤖 cs.LG

Mitigating Bias in Concept Bottleneck Models for Fair and Interpretable Image Classification

이 논문은 개념 병목 모델 (CBM) 의 편향을 완화하기 위해 정보 누출을 줄이는 톱-k 개념 필터, 편향된 개념 제거, 그리고 적대적 편향 제거라는 세 가지 기법을 제안하여 공정성과 성능 간의 균형을 개선한 연구 결과를 제시합니다.

Schrasing Tong, Antoine Salaun, Vincent Yuan, Annabel Adeyeri, Lalana Kagal2026-03-09🤖 cs.LG

Reference-guided Policy Optimization for Molecular Optimization via LLM Reasoning

이 논문은 단일 참조 분자만 있는 분자 최적화 과제의 한계를 극복하기 위해, 참조 분자의 중간 추론 경로를 컨텍스트로 활용하여 탐험과 활용을 균형 있게 조율하는 '참조 기반 정책 최적화 (RePO)' 방법을 제안하고 이를 통해 기존 방법론보다 우수한 성능을 입증했습니다.

Xuan Li, Zhanke Zhou, Zongze Li, Jiangchao Yao, Yu Rong, Lu Zhang, Bo Han2026-03-09🤖 cs.AI

Stock Market Prediction Using Node Transformer Architecture Integrated with BERT Sentiment Analysis

이 논문은 BERT 기반 감정 분석과 노드 트랜스포머 아키텍처를 통합하여 주가 간 상관관계 및 시장 감정을 고려한 그래프 구조를 구축함으로써, 기존 ARIMA 및 LSTM 모델보다 월등히 낮은 오차율 (MAPE 0.80%) 과 높은 방향성 정확도를 달성한 주식 시장 예측 프레임워크를 제안합니다.

Mohammad Al Ridhawi, Mahtab Haj Ali, Hussein Al Osman2026-03-09🤖 cs.AI

Design Experiments to Compare Multi-armed Bandit Algorithms

이 논문은 다중 팔 밴딧 알고리즘 비교 실험의 비용을 절감하고 추정의 분산을 줄이기 위해, 한 정책의 실행 궤적을 재사용하여 다른 정책의 평가를 수행하는 '인공 리플레이 (Artificial Replay)'라는 새로운 실험 설계와 그 이론적 근거를 제안합니다.

Huiling Meng, Ningyuan Chen, Xuefeng Gao2026-03-09🤖 cs.LG

Weak-SIGReg: Covariance Regularization for Stable Deep Learning

이 논문은 레이어 정규화나 잔차 연결과 같은 아키텍처적 기법 없이도 심층 신경망의 학습 붕괴를 방지하고 안정성을 확보하기 위해, LeJEPA 프레임워크에서 유래한 SIGReg를 변형하여 공분산 행렬을 타겟으로 하는 경량화된 'Weak-SIGReg' 정규화 기법을 제안하고 이를 통해 비전 트랜스포머 (ViT) 와 심층 MLP 의 학습 성능을 획기적으로 개선함을 보여줍니다.

Habibullah Akbar2026-03-09🤖 cs.LG

Addressing the Ecological Fallacy in Larger LMs with Human Context

이 논문은 대규모 언어 모델 (8B Llama) 에 대해 저자의 언어적 맥락을 고려한 HuLM 과 HuFT 기법을 적용하여 생태학적 오류를 해결함으로써, 기존 표준 미세조정 방식보다 다양한 하위 작업에서 성능을 크게 향상시킬 수 있음을 입증했습니다.

Nikita Soni, Dhruv Vijay Kunjadiya, Pratham Piyush Shah, Dikshya Mohanty, H. Andrew Schwartz, Niranjan Balasubramanian2026-03-09🤖 cs.AI

A Persistent-State Dataflow Accelerator for Memory-Bound Linear Attention Decode on FPGA

이 논문은 FPGA 의 온칩 메모리에 GDN 의 재귀 상태를 영구적으로 유지하여 메모리 병목 현상을 해결하고, 데이터 흐름 파이프라이닝을 통해 GPU 대비 4.5 배 빠른 속도와 60 배 이상의 에너지 효율을 달성하는 선형 어텐션 디코딩 가속기를 제안합니다.

Neelesh Gupta, Peter Wang, Rajgopal Kannan, Viktor K. Prasanna2026-03-09🤖 cs.LG

Implicit Style Conditioning: A Structured Style-Rewrite Framework for Low-Resource Character Modeling

이 논문은 데이터 부족과 스타일 분리 복잡성으로 인해 소규모 언어 모델의 역할극 성능이 제한되는 문제를 해결하기 위해, 어휘·구문·화용론적 스타일을 명시적으로 분리하고 추론 과정에서의 연쇄 사고 (CoT) 증류 기반의 암묵적 스타일 조건부 전략을 제안하여, 추론 시 추가 토큰 없이도 소비자용 하드웨어에서 대형 모델보다 뛰어난 스타일 일관성과 의미 충실도를 달성하는 효율적인 프레임워크를 제시합니다.

Chanhui Zhu2026-03-09🤖 cs.LG

Who We Are, Where We Are: Mental Health at the Intersection of Person, Situation, and Large Language Models

이 논문은 개인적 성향과 상황적 맥락의 상호작용을 기반으로 한 이론적 프레임워크와 대규모 언어 모델을 결합하여, 해석 가능성과 예측 성능을 동시에 확보하는 동적 정신 건강 평가 모델을 개발하고 그 유효성을 입증합니다.

Nikita Soni, August Håkan Nilsson, Syeda Mahwish, Vasudha Varadarajan, H. Andrew Schwartz, Ryan L. Boyd2026-03-09🤖 cs.AI

Omni-Masked Gradient Descent: Memory-Efficient Optimization via Mask Traversal with Improved Convergence

이 논문은 GPU 메모리 병목 현상을 해결하면서도 비볼록 환경에서 $\tilde{\mathcal{O}}(\epsilon^{-3})$ 의 개선된 반복 복잡도를 보장하는 메모리 효율적 최적화 방법인 'Omni-Masked Gradient Descent (OMGD)'를 제안하고, 미세 조정 및 사전 학습 작업에서 기존 베이스라인보다 일관된 성능 향상을 입증합니다.

Hui Yang, Tao Ren, Jinyang Jiang, Wan Tian, Yijie Peng2026-03-09🤖 cs.LG

TADPO: Reinforcement Learning Goes Off-road

이 논문은 오프로드 주행의 긴 시간 범위와 낮은 보상 신호 문제를 해결하기 위해 제안된 TADPO 알고리즘을 통해 시뮬레이션 환경에서 학습된 RL 기반 제어 정책을 실제 전지형 차량에 제로샷으로 성공적으로 이전한 최초의 사례를 제시합니다.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

EvoESAP: Non-Uniform Expert Pruning for Sparse MoE

이 논문은 고정된 전체 예산 하에서 각 레이어의 희소성 할당을 균일하지 않게 최적화하여 생성 성능을 크게 향상시키는 진화적 탐색 프레임워크인 EvoESAP 과 이를 위한 안정적 척도인 ESAP 을 제안합니다.

Zongfang Liu, Shengkun Tang, Boyang Sun, Zhiqiang Shen, Xin Yuan2026-03-09🤖 cs.LG

Preventing Learning Stagnation in PPO by Scaling to 1 Million Parallel Environments

이 논문은 PPO 의 학습 정체 문제를 해결하기 위해 100 만 개 이상의 병렬 환경을 확장하고 이를 위한 하이퍼파라미터 조정 레시피를 제안함으로써, 1 조 개의 전이를 거치며 성능이 지속적으로 향상되도록 함을 보여줍니다.

Michael Beukman, Khimya Khetarpal, Zeyu Zheng, Will Dabney, Jakob Foerster, Michael Dennis, Clare Lyle2026-03-09🤖 cs.LG

Agnostic learning in (almost) optimal time via Gaussian surface area

이 논문은 가우스 표면적 $\Gamma$ 를 갖는 개념 클래스의 아노스틱 학습 복잡도를 기존 $O(\Gamma^2/\varepsilon^4)$ 차수에서 $\tilde{O}(\Gamma^2/\varepsilon^2)$ 차수로 개선하여 통계적 쿼리 모델에서 다항식 임계 함수 학습의 (거의) 최적 경계를 제시합니다.

Lucas Pesenti, Lucas Slot, Manuel Wiedmer2026-03-09🤖 cs.LG

Improved high-dimensional estimation with Langevin dynamics and stochastic weight averaging

이 논문은 노이즈 주입과 반복체 평균화를 결합하여 명시적인 평활화 없이도 텐서 PCA 및 단일 인덱스 모델에서 최적의 샘플 효율성 ( $n \gtrsim d^{k^\star/2}$ ) 을 달성하는 랑주뱅 동역학 기반 고차원 추정 방법을 제안합니다.

Stanley Wei, Alex Damian, Jason D. Lee2026-03-09🤖 cs.LG

TempoSyncDiff: Distilled Temporally-Consistent Diffusion for Low-Latency Audio-Driven Talking Head Generation

이 논문은 고도화된 교사-학생 증류 기법과 시간적 정규화를 통해 고해상도 얼굴 생성의 지연 시간과 불안정성을 해결하고 엣지 환경에서도 실시간으로 작동 가능한 효율적인 오디오 기반 대화형 얼굴 생성 프레임워크 'TempoSyncDiff'를 제안합니다.

Soumya Mazumdar, Vineet Kumar Rakesh2026-03-09🤖 cs.AI

Latent Diffusion-Based 3D Molecular Recovery from Vibrational Spectra

이 논문은 적외선 (IR) 스펙트럼에서 3 차원 분자 기하구조를 복원하기 위해 스펙트럼 정보를 분자 구조의 노드와 엣지 표현에 통합한 잠재 확산 모델 'IR-GeoDiff'를 제안하고, 이 모델이 주어진 스펙트럼에 대응하는 분자 분포를 성공적으로 복원하며 화학적 해석과 일치하는 기능기 영역에 주의를 기울일 수 있음을 입증합니다.

Wenjin Wu, Aleš Leonardis, Linjiang Chen, Jianbo Jiao2026-03-09🤖 cs.LG

Dynamic Momentum Recalibration in Online Gradient Learning

이 논문은 고정된 모멘텀 계수의 한계를 극복하기 위해 최적 선형 필터링 원리를 기반으로 온라인 가중치를 동적으로 조정하여 노이즈 억제와 신호 보존 사이의 최적 균형을 달성하는 새로운 옵티마이저 'SGDF'를 제안하고, 이를 통해 기존 모멘텀 기반 방법론을 능가하는 성능을 입증합니다.

Zhipeng Yao, Rui Yu, Guisong Chang, Ying Li, Yu Zhang, Dazhou Li2026-03-09🤖 cs.LG

Diffusion Language Models Are Natively Length-Aware

이 논문은 Diffusion 언어 모델이 고정된 길이로 생성되는 비효율성을 해결하기 위해, 잠재 프롬프트 표현을 기반으로 필요한 출력 길이를 추정하여 생성 전 컨텍스트 창을 동적으로 잘라냄으로써 연산 비용을 대폭 절감하면서도 성능을 유지하거나 향상시키는 제로샷 메커니즘을 제안합니다.

Vittorio Rossi, Giacomo Cirò, Davide Beltrame, Luca Gandolfi, Paul Röttger, Dirk Hovy2026-03-09🤖 cs.LG

← 이전 다음 →