cs.LG 편의 논문 | Gist.Science

Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing

이 논문은 감정을 단순한 예측 대상이 아닌 LLM 의 추론과 어텐션 기하학에 영향을 미치는 잠재적 요인으로 규명하고, 이를 통제하기 위해 감정 균형 QA 데이터셋 AURA-QA 와 감정 정규화 프레임워크를 제안하여 다양한 환경에서 읽기 이해 성능을 향상시켰음을 보여줍니다.

Benjamin Reichman, Adar Avasian, Samuel Webster, Larry Heck2026-03-11🤖 cs.AI

MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

이 논문은 이미지와 같은 시드 데이터 없이도 추론 능력을 향상시키기 위해 제안자, 코더, 솔버라는 세 가지 역할을 도입하고 그룹 상대적 정책 최적화 (GRPO) 를 활용한 강화 학습 기반의 자기 진화 프레임워크인 MM-Zero 를 제안합니다.

Zongxia Li, Hongyang Du, Chengsong Huang, Xiyang Wu, Lantao Yu, Yicheng He, Jing Xie, Xiaomin Wu, Zhichao Liu, Jiarui Zhang, Fuxiao Liu2026-03-11🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

이 논문은 대규모 상태 공간에서 일반합 마르코프 게임의 균형 계산을 위해 선형 함수 근사를 활용한 'RQRE-OVI' 알고리즘을 제안하며, 합리성과 위험 민감도 매개변수 간의 균형을 통해 나시 균형 대비 계산적 효율성과 강건성을 동시에 확보하는 이론적·실증적 성과를 입증합니다.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. Ratliff2026-03-11🤖 cs.LG

Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control

이 논문은 추론을 최적 제어 문제로 재정의하고, 사전 훈련된 LLM 에 통합 가능한 하드웨어 효율적인 'Test-Time Control (TTC)' 레이어를 제안하여 추론 시 잠재 상태에 대한 유한 시간 LQR 계획을 수행함으로써 수학 추론 성능을 획기적으로 향상시킨다고 요약할 수 있습니다.

Peihao Wang, Shan Yang, Xijun Wang, Tesi Xiao, Xin Liu, Changlong Yu, Yu Lou, Pan Li, Zhangyang Wang, Ming Lin, René Vidal2026-03-11🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

이 논문은 이산 또는 혼합 변수를 가진 복잡한 분포에서 목표 함수의 기울기 없이도 물리적 전이 커널과 시간 가역성 제약을 활용하여 forward 및 backward 마르코프 궤적 간의 최대 평균 불일치 (MMD) 를 최소화하는 새로운 생성적 샘플링 프레임워크를 제안하고, 이를 다양한 벤치마크에서 검증했습니다.

Lei Li, Zhen Wang, Lishuo Zhang2026-03-11🤖 cs.LG

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

이 논문은 추론 시 비용 증가 없이 구조화된 정확한 추론을 가능하게 하기 위해, 추론 시에는 캐시된 편향만 추가하고 훈련 시에만 활성화되는 길이 인식 어텐션 사전과 이득 인식 제어기를 도입하여 제한된 컴퓨팅 자원 하에서도 검증 손실을 줄이는 효율적인 방법을 제안합니다.

Rian Atri2026-03-11🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

이 논문은 그래프 노드 분류에서 기존 복잡도 측정법의 한계를 극복하고, 최적 수송을 기반으로 한 계산 효율적이고 경험적 일반화 성능과 높은 상관관계를 보이는 새로운 전도적 일반화 경계를 제시하며, GNN의 집계 과정이 표현 분포를 어떻게 변형시키는지 분석하여 깊이와 일반화 오차 간의 비단조적 관계를 설명합니다.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo Kim2026-03-11🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

이 논문은 뇌의 수지상 구조에서 영감을 받아 시공간 스파이크 시퀀스를 식별하고 그래디언트 없이 재배선 학습을 수행하는 'DendroNN'을 제안하며, 이를 통해 기존 뉴로모픽 하드웨어 대비 최대 4 배의 에너지 효율성을 달성하는 비동기 디지털 하드웨어 아키텍처를 제시합니다.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen Becker2026-03-11🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

이 논문은 가우시안 프로세스 토머스 샘플링 (GP-TS) 에 대해 기존에 명확하지 않았던 고확률 및 기대 후회 한계를 분석하고, 하한, 이차 모멘트 상한, 완화된 후회 상한, 그리고 시간 지평에 대한 개선된 누적 후회 상한을 포함한 다양한 후회 한계를 제시합니다.

Shion Takeno, Shogo Iwazaki2026-03-11🤖 cs.LG

Proxy-Guided Measurement Calibration

이 논문은 설문 및 행정 기록의 체계적 측정 오차를 교정하기 위해 대리 변수를 활용하고 변이 오토인코더를 기반으로 한 2 단계 프레임워크를 제안하여, 실제 결과와 편향을 분리하여 추정하는 방법을 제시합니다.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan Liu2026-03-11🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

이 논문은 가우스 혼합 모델 데이터를 사용하는 머신러닝 훈련 알고리즘의 동역학을 고든 비교 정리를 기반으로 한 가우스 비교 정리를 통해 분석하여, 점근적 영역에서의 동적 평균장 이론의 유효성을 엄밀하게 증명하고 비점근적 영역에서의 더 정확한 표현을 위한 반복적 정제 기법을 제안합니다.

Ashkan Panahi2026-03-11🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

이 논문은 결손된 모달리티가 있는 의료 영상 분할에서 전문가 간의 일관성을 제어하고 임상적으로 중요한 전경 영역에 초점을 맞춘 'CLoE' 프레임워크를 제안하여, 불완전한 입력 상황에서도 강력한 성능과 일반화 능력을 달성함을 보여줍니다.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao Li2026-03-11🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

이 논문은 자연어 작업 설명을 언어 임베딩을 통해 밀집된 의미 기반 진행 신호로 변환하여 희소하거나 지연된 환경 피드백을 보완하고, 강화학습 에이전트의 탐색 가속화, 학습 안정화 및 일반화 성능 향상을 가능하게 하는 범용 암시적 보상 메커니즘인 'Reward-Zero'를 제안합니다.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu She2026-03-11🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

이 논문은 그래프 이상 탐지에서의 도메인 이동 문제를 '이상 비연성 (Anomaly Disassortativity)'으로 정의하고, 이를 해결하여 단일 학습 단계로 다양한 도메인에서 최첨단 성능을 보이는 테스트 시간 적응형 그래프 모델 TA-GGAD 를 제안합니다.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

이 논문은 적층 제조의 표면 거칠기를 예측하기 위해 실험 데이터와 생성적 적대 신경망을 결합한 데이터 기반 프레임워크를 개발하고, 이를 통해 3D 모델의 방향과 공정 매개변수를 실시간으로 조정하며 표면 거칠기 분포를 시각화하는 대화형 웹 도구를 제시합니다.

Engin Deniz Erkan, Elif Surer, Ulas Yaman2026-03-11🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

이 논문은 결정 트리나 콕스 회귀와 같은 비미분 가능 임상 모델에도 적용 가능한 차분 프라이버시를 갖춘 영차 최적화 기반 데이터 증류 프레임워크를 제안하여, 민감한 환자 정보를 보호하면서도 임상 예측 모델의 성능을 유지하는 데이터 공유를 가능하게 합니다.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

이 논문은 노드 및 하이퍼엣지 수준의 대조 학습과 클러스터 할당 학습을 결합하여 임베딩과 클러스터링 결과를 동시에 최적화하는 엔드투엔드 방식인 'CAHC'를 제안함으로써 기존 방법들의 한계를 극복하고 속성 하이퍼그래프 클러스터링 성능을 향상시켰습니다.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong Lin2026-03-11🤖 cs.LG

Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization

이 논문은 희소 센서 데이터의 라스터화, 센서 배치의 적응적 최적화, 그리고 다중 조건 흐름 재구성을 위한 공유 인코더-멀티 디코더 아키텍처를 통해 물리 정보 신경망 (PINN) 기반의 유동장 재구성 정확도와 견고성을 획기적으로 향상시킨 '보로노이 기반 센서 최적화 PINN(VSOPINN)'을 제안하고 검증합니다.

Renjie Xiao, Bingteng Sun, Yiling Chen, Lin Lu, Qiang Du, Junqiang Zhu2026-03-11🤖 cs.LG

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

이 논문은 오프라인 데이터의 행동 지원 범위 내에서 안전한 온라인 탐색을 보장하면서도 디코더의 재구성 손실로 인한 성능 한계를 우회하기 위해, 저차원 잠재 공간 탐색에서 원시 행동 공간 활용으로 점진적으로 전환하는 커리큘럼 학습 프레임워크인 SPAARS 를 제안하고 그 유효성을 입증합니다.

Swaminathan S K, Aritra Hazra2026-03-11🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

이 논문은 트랜스포머 기반의 확산 모델에 비해 계산 효율성과 훈련 속도가 월등히 뛰어난 'FCDM(Fully Convolutional Diffusion Model)'을 제안하며, 이를 통해 현대적인 합성곱 설계가 효율적인 생성 모델링을 위한 강력한 대안이 될 수 있음을 입증합니다.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius Azevedo2026-03-11🤖 cs.AI

← 이전 다음 →