Tiny Autoregressive Recursive Models

이 논문은 기존 트랜스포머를 점진적으로 변형하여 계산 자원을 동일하게 맞춘 실험을 통해, ARC-AGI 에서 성과를 보인 '작은 재귀적 모델 (TRM)' 메커니즘을 자기회귀 모델에 적용했을 때 오히려 신뢰할 수 있는 성능 향상이 나타나지 않았음을 규명하고, 이는 2 단계 정제 메커니즘 자체에는 잠재력이 있으나 '자기회귀 TRM'이라는 특정 아키텍처에 대한 연구 투자는 신중해야 함을 시사합니다.

Paulius Rauba, Claudio Fanconi, Mihaela van der Schaar2026-03-10🤖 cs.LG

DC-W2S: Dual-Consensus Weak-to-Strong Training for Reliable Process Reward Modeling in Biological Reasoning

이 논문은 생물학적 추론에서 전문가 검증이 불가능한 노이즈가 많은 약한 지도 데이터를 활용하여 신뢰할 수 있는 프로세스 보상 모델 (PRM) 을 훈련하기 위해 자기 일관성과 이웃 일관성 메트릭을 결합한 '이중 합의 약강 (DC-W2S)' 프레임워크를 제안합니다.

Chi-Min Chan, Ehsan Hajiramezanali, Xiner Li, Edward De Brouwer, Carl Edwards, Wei Xue, Sirui Han, Yike Guo, Gabriele Scalia2026-03-10🤖 cs.LG

Tau-BNO: Brain Neural Operator for Tau Transport Model

이 논문은 알츠하이머병 등 타우병증의 병리적 타우 확산을 연구하는 데 필요한 복잡한 미시적 생리학적 모델 (NTM) 의 시뮬레이션 속도를 획기적으로 단축하고 매개변수 추론을 가능하게 하기 위해, 뇌 구조 연결성을 반영한 신경 연산자 기반의 고효율 대리 모델인 'Tau-BNO'를 제안하고 그 뛰어난 예측 정확도와 성능을 입증했습니다.

Nuutti Barron, Heng Rao, Urmi Saha, Yu Gu, Zhenghao Liu, Ge Yu, Defu Yang, Ashish Raj, Minghan Chen2026-03-10🤖 cs.LG

Model-based Offline RL via Robust Value-Aware Model Learning with Implicitly Differentiable Adaptive Weighting

이 논문은 RAMBO 의 과도한 보수성과 불안정한 업데이트 문제를 해결하기 위해, 가치 인식 모델 학습과 암시적 미분 적응 가중치를 도입한 새로운 오프라인 강화학습 알고리즘인 ROMI 를 제안하고 D4RL 및 NeoRL 데이터셋에서 기존 방법들을 능가하는 성능을 입증합니다.

Zhongjian Qiao, Jiafei Lyu, Boxiang Lyu, Yao Shu, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

이 논문은 로봇 조작 및 적응적 인식에서 불확실성을 우연적 (aleatoric) 과 인식적 (epistemic) 요소로 분리하여 관측 복구와 제어 동작 조절 등 유형별 맞춤형 대응을 가능하게 함으로써, 기존 단일 불확실성 기반 접근법보다 성능을 획기적으로 향상시키는 경량 사후 프레임워크 'TRIAGE'를 제안합니다.

Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi2026-03-10🤖 cs.LG

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

이 논문은 헬리콥터 기어박스 등 안전이 중요한 시스템의 상태 감시를 위해 정상 데이터만을 기반으로 확률적 이상 탐지, 불확실성 정량화 및 해석 가능성을 결합한 새로운 방법론을 제안하고 실험을 통해 검증합니다.

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara Tanelli2026-03-10🤖 cs.LG

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

본 논문은 그래프 이상 탐지 시 발생하는 동질성 편차와 확장성 문제를 해결하기 위해, 노드별 적응적 융합과 주파수 선호도 가이드 손실 함수를 도입하여 대규모 그래프에서도 효율적이고 정확한 이상 탐지가 가능한 SAGAD 프레임워크를 제안합니다.

Yunhui Liu, Qizhuo Xie, Yinfeng Chen, Xudong Jin, Tao Zheng, Bin Chong, Tieke He2026-03-10🤖 cs.LG

C2^2FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

이 논문은 확산 과정의 역학을 기반으로 조건부 및 무조건부 분포 간의 스코어 불일치에 대한 엄격한 상한을 이론적으로 규명하고, 이를 바탕으로 고정된 가중치 전략의 한계를 극복하는 새로운 훈련 불필요 플러그인 방법인 제어 Classifier-Free Guidance(C2^2FG) 를 제안합니다.

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

이 논문은 장기 시계열 예측 분야에서 MSE 나 MAE 와 같은 단일 점수 기반의 평가 관행이 실제 응용 목표와 구조적으로 불일치할 수 있음을 지적하고, 통계적 충실도, 구조적 일관성, 의사결정 관련성을 통합한 다차원 평가 프레임워크를 제안하여 벤치마크 순위 경쟁에서 의미 있는 예측 기술 발전으로의 전환을 촉구합니다.

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

이 논문은 칼만 필터의 잡음 공분산 추정을 위해 혁신 수준의 적응적 임계값 처리와 Huber 비용 함수 기반의 IRLS 프레임워크를 결합한 'ALS-IRLS' 알고리즘을 제안하여, 기존 ALS 방법의 민감성을 극복하고 이상치 존재 하에서도 오차 범위를 두 자릿수 이상 줄이며 이상적인 오라클 하한선에 근접한 성능을 달성함을 보여줍니다.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

이 논문은 텍스트가 풍부한 네트워크 (TRN) 의 노드 표현 학습에 계층적 지식을 효과적으로 통합하기 위해, 유사도 기반 군집화와 LLM 정제를 통해 암시적 계층 분류 체계를 구축하고 이를 표현 학습에 반영하는 TIER 모델을 제안하여 기존 방법보다 우수한 성능을 입증합니다.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

이 논문은 블록체인 프로토콜을 통해 허가 없는 참여를 허용하고 SparseLoCo 최적화기를 활용한 Covenant-72B 를 통해, 대규모 글로벌 분산 학습이 중앙 집중식 모델과 경쟁력 있는 성능을 내며 실현 가능함을 입증했습니다.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

이 논문은 영어, 중국어, 독일어, 프랑스어, 우르두어 등 5 개 언어를 대상으로 한 실험을 통해, 명시적 추론보다 잠재 공간에서의 연속적 추론 (Continuous CoT) 이 저자원 언어와 제로샷 설정에서 더 강력한 성능을 보이며 추론 과정을 29 배에서 50 배까지 압축하는 효율적인 다국어 추론 해결책임을 입증했습니다.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG