cs.AI 편의 논문 | Gist.Science

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

이 논문은 다중 LLM 시스템에서 오분류 위험을 통제하면서도 비용과 성능의 균형을 최적화하기 위해, 단일 모델 선택을 넘어 신뢰할 수 있는 모델 집합을 동적으로 구성하는 새로운 라우팅 방법인 RACER 를 제안하고 그 이론적 보장 및 성능 개선을 입증합니다.

Sai Hao, Hao Zeng, Hongxin Wei, Bingyi Jing2026-03-10🤖 cs.LG

Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

이 논문은 autoregressive 와 확산 (diffusion) 생성 방식을 통합한 'Evo'라는 새로운 대규모 언어 모델을 제안하며, 토큰의 의미적 성숙도에 따라 두 방식을 동적으로 균형 있게 조정하여 추론 속도와 생성 품질을 동시에 극대화한다는 점을 강조합니다.

Junde Wu, Minhao Hu, Jiayuan Zhu, Yuyuan Liu, Tianyi Zhang, Kang Li, Jingkun Chen, Jiazhen Pan, Min Xu, Yueming Jin2026-03-10🤖 cs.LG

Distilling and Adapting: A Topology-Aware Framework for Zero-Shot Interaction Prediction in Multiplex Biological Networks

이 논문은 맥락 인식 표현 학습과 지식 증류, 토폴로지 인식 그래프 토크나이저를 활용하여 기존 방법의 한계를 극복하고 다중 생물학적 네트워크에서 미지의 개체에 대한 제로샷 상호작용 예측 성능을 획기적으로 개선하는 새로운 프레임워크를 제안합니다.

Alana Deng, Sugitha Janarthanan, Yan Sun, Zihao Jing, Pingzhao Hu2026-03-10🤖 cs.LG

← 이전 다음 →

cs.AI

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

Distilling and Adapting: A Topology-Aware Framework for Zero-Shot Interaction Prediction in Multiplex Biological Networks

Not all tokens are needed(NAT): token efficient reinforcement learning

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

From ARIMA to Attention: Power Load Forecasting Using Temporal Deep Learning

Exploration Space Theory: Formal Foundations for Prerequisite-Aware Location-Based Recommendation

Pavement Missing Condition Data Imputation through Collective Learning-Based Graph Neural Networks

Grouter: Decoupling Routing from Representation for Accelerated MoE Training

Photons = Tokens: The Physics of AI and the Economics of Knowledge

SmartBench: Evaluating LLMs in Smart Homes with Anomalous Device States and Behavioral Contexts

HEARTS: Benchmarking LLM Reasoning on Health Time Series

RECAP: Local Hebbian Prototype Learning as a Self-Organizing Readout for Reservoir Dynamics

SR-TTT: Surprisal-Aware Residual Test-Time Training

Trust Aware Federated Learning for Secure Bone Healing Stage Interpretation in e-Health

Performance Comparison of IBN orchestration using LLM and SLMs

ObjChangeVR: Object State Change Reasoning from Continuous Egocentric Views in VR Environments

HURRI-GAN: A Novel Approach for Hurricane Bias-Correction Beyond Gauge Stations using Generative Adversarial Networks

Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

PaLMR: Towards Faithful Visual Reasoning via Multimodal Process Alignment