cs.LG 편의 논문 | Gist.Science

EAGLE-Pangu: Accelerator-Safe Tree Speculative Decoding on Ascend NPUs

이 논문은 Ascend NPU 환경에서 Pangu 모델을 기반으로 EAGLE-3 스타일의 트리 구조 예측 디코딩을 이식하여, 캐시 관리 및 텐서화 최적화를 통해 추론 처리량을 평균 1.27 배, 최대 2.46 배까지 향상시킨 'EAGLE-Pangu' 시스템을 제안합니다.

Chang Han, Yijie Hu, Jingling Liu2026-03-10🤖 cs.LG

DC-W2S: Dual-Consensus Weak-to-Strong Training for Reliable Process Reward Modeling in Biological Reasoning

이 논문은 생물학적 추론에서 전문가 검증이 불가능한 노이즈가 많은 약한 지도 데이터를 활용하여 신뢰할 수 있는 프로세스 보상 모델 (PRM) 을 훈련하기 위해 자기 일관성과 이웃 일관성 메트릭을 결합한 '이중 합의 약강 (DC-W2S)' 프레임워크를 제안합니다.

Chi-Min Chan, Ehsan Hajiramezanali, Xiner Li, Edward De Brouwer, Carl Edwards, Wei Xue, Sirui Han, Yike Guo, Gabriele Scalia2026-03-10🤖 cs.LG

Invisible Safety Threat: Malicious Finetuning for LLM via Steganography

이 논문은 스테가노그래피 기법을 활용하여 LLM 의 안전성 정렬을 우회하는 보이지 않는 위협을 제시하며, GPT-4.1 을 포함한 다양한 모델에서 악성 콘텐츠가 숨겨진 채로 생성되더라도 안전성 필터가 이를 탐지하지 못함을 입증했습니다.

Guangnian Wan, Xinyin Ma, Gongfan Fang, Xinchao Wang2026-03-10🤖 cs.LG

Tau-BNO: Brain Neural Operator for Tau Transport Model

이 논문은 알츠하이머병 등 타우병증의 병리적 타우 확산을 연구하는 데 필요한 복잡한 미시적 생리학적 모델 (NTM) 의 시뮬레이션 속도를 획기적으로 단축하고 매개변수 추론을 가능하게 하기 위해, 뇌 구조 연결성을 반영한 신경 연산자 기반의 고효율 대리 모델인 'Tau-BNO'를 제안하고 그 뛰어난 예측 정확도와 성능을 입증했습니다.

Nuutti Barron, Heng Rao, Urmi Saha, Yu Gu, Zhenghao Liu, Ge Yu, Defu Yang, Ashish Raj, Minghan Chen2026-03-10🤖 cs.LG

Model-based Offline RL via Robust Value-Aware Model Learning with Implicitly Differentiable Adaptive Weighting

이 논문은 RAMBO 의 과도한 보수성과 불안정한 업데이트 문제를 해결하기 위해, 가치 인식 모델 학습과 암시적 미분 적응 가중치를 도입한 새로운 오프라인 강화학습 알고리즘인 ROMI 를 제안하고 D4RL 및 NeoRL 데이터셋에서 기존 방법들을 능가하는 성능을 입증합니다.

Zhongjian Qiao, Jiafei Lyu, Boxiang Lyu, Yao Shu, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

SaiVLA-0: Cerebrum--Pons--Cerebellum Tripartite Architecture for Compute-Aware Vision-Language-Action

이 논문은 뇌의 대뇌, 교뇌, 소뇌 구조에서 영감을 받아 고정된 고수준 지각과 실시간 운동 제어 모듈을 분리함으로써 계산 효율성과 재현성을 높이고 로봇 제어 성공률을 극대화하는 새로운 비전 - 언어 - 행동 (VLA) 아키텍처인 SaiVLA-0 를 제안합니다.

Xiang Shi, Wenlong Huang, Menglin Zou, Xinhai Sun2026-03-10🤖 cs.LG

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

이 논문은 마스킹 오디오 - 비주얼 정렬과 동적 조건부 흐름을 통해 비디오의 의미론적 및 리듬적 특성과 정밀하게 동기화된 고품질 사운드를 생성하는 'FoleyFlow' 모델을 제안합니다.

Shentong Mo, Yibing Song2026-03-10🤖 cs.LG

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

이 논문은 로봇 조작 및 적응적 인식에서 불확실성을 우연적 (aleatoric) 과 인식적 (epistemic) 요소로 분리하여 관측 복구와 제어 동작 조절 등 유형별 맞춤형 대응을 가능하게 함으로써, 기존 단일 불확실성 기반 접근법보다 성능을 획기적으로 향상시키는 경량 사후 프레임워크 'TRIAGE'를 제안합니다.

Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi2026-03-10🤖 cs.LG

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

이 논문은 헬리콥터 기어박스 등 안전이 중요한 시스템의 상태 감시를 위해 정상 데이터만을 기반으로 확률적 이상 탐지, 불확실성 정량화 및 해석 가능성을 결합한 새로운 방법론을 제안하고 실험을 통해 검증합니다.

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara Tanelli2026-03-10🤖 cs.LG

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

본 논문은 그래프 이상 탐지 시 발생하는 동질성 편차와 확장성 문제를 해결하기 위해, 노드별 적응적 융합과 주파수 선호도 가이드 손실 함수를 도입하여 대규모 그래프에서도 효율적이고 정확한 이상 탐지가 가능한 SAGAD 프레임워크를 제안합니다.

Yunhui Liu, Qizhuo Xie, Yinfeng Chen, Xudong Jin, Tao Zheng, Bin Chong, Tieke He2026-03-10🤖 cs.LG

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

본 논문은 인간 선호도의 불일치로 인한 평균 보상 최대화의 취약성을 해결하기 위해, 재학습 없이 KL-강건한 위험 민감적 의사결정을 통해 응답을 재순위화하는 추론 시 방법인 DARC 를 제안합니다.

Mingxi Zou, Jiaxiang Chen, Junfan Li, Langzhang Liang, Qifan Wang, Xu Yinghui, Zenglin Xu2026-03-10🤖 cs.LG

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

이 논문은 JAX 기반의 'Eventax' 프레임워크를 소개하여, 미분 가능한 ODE 솔버를 활용하여 임의의 뉴런 모델에 대해 정확한 기울기를 계산하면서도 높은 모델 유연성을 제공하는 방법을 제안합니다.

Lukas König, Manuel Kuhn, David Kappel, Anand Subramoney2026-03-10🤖 cs.LG

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

이 논문은 확산 과정의 역학을 기반으로 조건부 및 무조건부 분포 간의 스코어 불일치에 대한 엄격한 상한을 이론적으로 규명하고, 이를 바탕으로 고정된 가중치 전략의 한계를 극복하는 새로운 훈련 불필요 플러그인 방법인 제어 Classifier-Free Guidance(C $^2$ FG) 를 제안합니다.

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

이 논문은 장기 시계열 예측 분야에서 MSE 나 MAE 와 같은 단일 점수 기반의 평가 관행이 실제 응용 목표와 구조적으로 불일치할 수 있음을 지적하고, 통계적 충실도, 구조적 일관성, 의사결정 관련성을 통합한 다차원 평가 프레임워크를 제안하여 벤치마크 순위 경쟁에서 의미 있는 예측 기술 발전으로의 전환을 촉구합니다.

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

이 논문은 칼만 필터의 잡음 공분산 추정을 위해 혁신 수준의 적응적 임계값 처리와 Huber 비용 함수 기반의 IRLS 프레임워크를 결합한 'ALS-IRLS' 알고리즘을 제안하여, 기존 ALS 방법의 민감성을 극복하고 이상치 존재 하에서도 오차 범위를 두 자릿수 이상 줄이며 이상적인 오라클 하한선에 근접한 성능을 달성함을 보여줍니다.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

이 논문은 텍스트가 풍부한 네트워크 (TRN) 의 노드 표현 학습에 계층적 지식을 효과적으로 통합하기 위해, 유사도 기반 군집화와 LLM 정제를 통해 암시적 계층 분류 체계를 구축하고 이를 표현 학습에 반영하는 TIER 모델을 제안하여 기존 방법보다 우수한 성능을 입증합니다.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

이 논문은 블록체인 프로토콜을 통해 허가 없는 참여를 허용하고 SparseLoCo 최적화기를 활용한 Covenant-72B 를 통해, 대규모 글로벌 분산 학습이 중앙 집중식 모델과 경쟁력 있는 성능을 내며 실현 가능함을 입증했습니다.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

이 논문은 영어, 중국어, 독일어, 프랑스어, 우르두어 등 5 개 언어를 대상으로 한 실험을 통해, 명시적 추론보다 잠재 공간에서의 연속적 추론 (Continuous CoT) 이 저자원 언어와 제로샷 설정에서 더 강력한 성능을 보이며 추론 과정을 29 배에서 50 배까지 압축하는 효율적인 다국어 추론 해결책임을 입증했습니다.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

이 논문은 자율주행의 안전성을 높이기 위해 비전 - 언어 모델의 언어 표현을 LiDAR 객체 특징과 정렬하여, 훈련 데이터에 없는 분포 외 (OOD) 객체를 제로샷 분류 문제로 해결하는 새로운 ALOOD 방법을 제안합니다.

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

이 논문은 제한된 데이터와 높은 학습 비용으로 인해 전문 분야 적용이 어려운 대규모 언어 모델 (LLM) 의 도메인 적응 문제를 해결하기 위해, 지식 기반과 다중 에이전트 논쟁 시스템, 그리고 LLM 기반 서로게이트를 활용한 자동화된 프레임워크 'AutoAdapt'를 제안하고, 이를 통해 기존 자동 머신러닝 기법 대비 평균 25% 의 정확도 향상을 달성했다고 요약할 수 있습니다.

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

← 이전 다음 →

cs.LG