cs.LG 편의 논문 | Gist.Science

Latent-DARM: Bridging Discrete Diffusion And Autoregressive Models For Reasoning

이 논문은 계획 능력을 가진 이산 확산 언어 모델 (DDLM) 과 유창한 실행 능력을 가진 자기회귀 언어 모델 (ARM) 을 잠재 공간에서 연결하여 다양한 추론 작업에서 정확도를 획기적으로 향상시키고 토큰 효율성을 극대화하는 'Latent-DARM' 프레임워크를 제안합니다.

Lina Berrayana, Ahmed Heakl, Abdullah Sohail, Thomas Hofmann, Salman Khan, Wei Chen2026-03-11🤖 cs.AI

The Costs of Reproducibility in Music Separation Research: a Replication of Band-Split RNN

이 논문은 공개된 코드가 없어 재현이 어려웠던 'Band-Split RNN' 모델을 재현 시도하는 과정에서 원본보다 성능이 향상된 최적화 모델을 개발하고, 연구 재현성 부족이 초래한 시간과 에너지 낭비 문제를 비판적으로 분석하며 재현 가능한 연구 문화를 장려하기 위해 코드와 모델을 공개합니다.

Paul Magron, Romain Serizel, Constance Douwes2026-03-11🤖 cs.LG

$P^2$ GNN: Two Prototype Sets to boost GNN Performance

이 논문은 노드 간 연결의 국소적 의존성과 노이즈 문제를 해결하기 위해 전역적 맥락을 제공하고 노이즈를 제거하는 두 가지 프로토타입 집합을 활용하여 기존 메시지 전달 기반 GNN 의 성능을 획기적으로 향상시키는 $P^2$ GNN 을 제안하고, 다양한 데이터셋에서 그 우수성을 입증합니다.

Arihant Jain, Gundeep Arora, Anoop Saladi, Chaosheng Dong2026-03-11🤖 cs.LG

The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness

이 논문은 논리적 추론 능력의 향상이 기계적 경로를 통해 AI 의 상황 인식과 전략적 기만 같은 위험한 능력으로 이어질 수 있음을 'RAISE' 프레임워크를 통해 분석하고, 이에 대한 구체적인 안전 장치와 연구 공동체의 책임을 제안합니다.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-11🤖 cs.AI

The Radio-Frequency Transformer for Signal Separation

이 논문은 학습 데이터를 기반으로 SOI(관심 신호) 와 간섭을 분리하는 데이터 중심의 트랜스포머 기반 신호 분리기를 제안하며, SoundStream 을 변형한 토크나이저와 교차 엔트로피 손실 함수를 통해 기존 최첨단 기술 대비 비트 오류율을 122 배 감소시키는 성과를 입증했습니다.

Egor Lifar, Semyon Savkin, Rachana Madhukara, Tejas Jayashankar, Yury Polyanskiy, Gregory W. Wornell2026-03-11🤖 cs.LG

Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing

이 논문은 감정을 단순한 예측 대상이 아닌 LLM 의 추론과 어텐션 기하학에 영향을 미치는 잠재적 요인으로 규명하고, 이를 통제하기 위해 감정 균형 QA 데이터셋 AURA-QA 와 감정 정규화 프레임워크를 제안하여 다양한 환경에서 읽기 이해 성능을 향상시켰음을 보여줍니다.

Benjamin Reichman, Adar Avasian, Samuel Webster, Larry Heck2026-03-11🤖 cs.AI

MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

이 논문은 이미지와 같은 시드 데이터 없이도 추론 능력을 향상시키기 위해 제안자, 코더, 솔버라는 세 가지 역할을 도입하고 그룹 상대적 정책 최적화 (GRPO) 를 활용한 강화 학습 기반의 자기 진화 프레임워크인 MM-Zero 를 제안합니다.

Zongxia Li, Hongyang Du, Chengsong Huang, Xiyang Wu, Lantao Yu, Yicheng He, Jing Xie, Xiaomin Wu, Zhichao Liu, Jiarui Zhang, Fuxiao Liu2026-03-11🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

이 논문은 대규모 상태 공간에서 일반합 마르코프 게임의 균형 계산을 위해 선형 함수 근사를 활용한 'RQRE-OVI' 알고리즘을 제안하며, 합리성과 위험 민감도 매개변수 간의 균형을 통해 나시 균형 대비 계산적 효율성과 강건성을 동시에 확보하는 이론적·실증적 성과를 입증합니다.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. Ratliff2026-03-11🤖 cs.LG

Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control

이 논문은 추론을 최적 제어 문제로 재정의하고, 사전 훈련된 LLM 에 통합 가능한 하드웨어 효율적인 'Test-Time Control (TTC)' 레이어를 제안하여 추론 시 잠재 상태에 대한 유한 시간 LQR 계획을 수행함으로써 수학 추론 성능을 획기적으로 향상시킨다고 요약할 수 있습니다.

Peihao Wang, Shan Yang, Xijun Wang, Tesi Xiao, Xin Liu, Changlong Yu, Yu Lou, Pan Li, Zhangyang Wang, Ming Lin, René Vidal2026-03-11🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

이 논문은 이산 또는 혼합 변수를 가진 복잡한 분포에서 목표 함수의 기울기 없이도 물리적 전이 커널과 시간 가역성 제약을 활용하여 forward 및 backward 마르코프 궤적 간의 최대 평균 불일치 (MMD) 를 최소화하는 새로운 생성적 샘플링 프레임워크를 제안하고, 이를 다양한 벤치마크에서 검증했습니다.

Lei Li, Zhen Wang, Lishuo Zhang2026-03-11🤖 cs.LG

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

이 논문은 추론 시 비용 증가 없이 구조화된 정확한 추론을 가능하게 하기 위해, 추론 시에는 캐시된 편향만 추가하고 훈련 시에만 활성화되는 길이 인식 어텐션 사전과 이득 인식 제어기를 도입하여 제한된 컴퓨팅 자원 하에서도 검증 손실을 줄이는 효율적인 방법을 제안합니다.

Rian Atri2026-03-11🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

이 논문은 그래프 노드 분류에서 기존 복잡도 측정법의 한계를 극복하고, 최적 수송을 기반으로 한 계산 효율적이고 경험적 일반화 성능과 높은 상관관계를 보이는 새로운 전도적 일반화 경계를 제시하며, GNN의 집계 과정이 표현 분포를 어떻게 변형시키는지 분석하여 깊이와 일반화 오차 간의 비단조적 관계를 설명합니다.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo Kim2026-03-11🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

이 논문은 뇌의 수지상 구조에서 영감을 받아 시공간 스파이크 시퀀스를 식별하고 그래디언트 없이 재배선 학습을 수행하는 'DendroNN'을 제안하며, 이를 통해 기존 뉴로모픽 하드웨어 대비 최대 4 배의 에너지 효율성을 달성하는 비동기 디지털 하드웨어 아키텍처를 제시합니다.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen Becker2026-03-11🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

이 논문은 가우시안 프로세스 토머스 샘플링 (GP-TS) 에 대해 기존에 명확하지 않았던 고확률 및 기대 후회 한계를 분석하고, 하한, 이차 모멘트 상한, 완화된 후회 상한, 그리고 시간 지평에 대한 개선된 누적 후회 상한을 포함한 다양한 후회 한계를 제시합니다.

Shion Takeno, Shogo Iwazaki2026-03-11🤖 cs.LG

Proxy-Guided Measurement Calibration

이 논문은 설문 및 행정 기록의 체계적 측정 오차를 교정하기 위해 대리 변수를 활용하고 변이 오토인코더를 기반으로 한 2 단계 프레임워크를 제안하여, 실제 결과와 편향을 분리하여 추정하는 방법을 제시합니다.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan Liu2026-03-11🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

이 논문은 가우스 혼합 모델 데이터를 사용하는 머신러닝 훈련 알고리즘의 동역학을 고든 비교 정리를 기반으로 한 가우스 비교 정리를 통해 분석하여, 점근적 영역에서의 동적 평균장 이론의 유효성을 엄밀하게 증명하고 비점근적 영역에서의 더 정확한 표현을 위한 반복적 정제 기법을 제안합니다.

Ashkan Panahi2026-03-11🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

이 논문은 결손된 모달리티가 있는 의료 영상 분할에서 전문가 간의 일관성을 제어하고 임상적으로 중요한 전경 영역에 초점을 맞춘 'CLoE' 프레임워크를 제안하여, 불완전한 입력 상황에서도 강력한 성능과 일반화 능력을 달성함을 보여줍니다.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao Li2026-03-11🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

이 논문은 자연어 작업 설명을 언어 임베딩을 통해 밀집된 의미 기반 진행 신호로 변환하여 희소하거나 지연된 환경 피드백을 보완하고, 강화학습 에이전트의 탐색 가속화, 학습 안정화 및 일반화 성능 향상을 가능하게 하는 범용 암시적 보상 메커니즘인 'Reward-Zero'를 제안합니다.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu She2026-03-11🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

이 논문은 그래프 이상 탐지에서의 도메인 이동 문제를 '이상 비연성 (Anomaly Disassortativity)'으로 정의하고, 이를 해결하여 단일 학습 단계로 다양한 도메인에서 최첨단 성능을 보이는 테스트 시간 적응형 그래프 모델 TA-GGAD 를 제안합니다.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

이 논문은 적층 제조의 표면 거칠기를 예측하기 위해 실험 데이터와 생성적 적대 신경망을 결합한 데이터 기반 프레임워크를 개발하고, 이를 통해 3D 모델의 방향과 공정 매개변수를 실시간으로 조정하며 표면 거칠기 분포를 시각화하는 대화형 웹 도구를 제시합니다.

Engin Deniz Erkan, Elif Surer, Ulas Yaman2026-03-11🤖 cs.LG

← 이전 다음 →

cs.LG