Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

이 논문은 다차원 보상 간섭과 이질적 데이터 경계 충돌을 해결하는 병렬 상대적 정책 최적화 (PRPO) 와 제어된 오류 주입을 통한 객관적 평가를 가능하게 하는 MCDR-Bench 를 제안하여, 차트 데이터의 심층 연구 능력을 체계적으로 향상시키는 통합 프레임워크를 구축했습니다.

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

이 논문은 학습 데이터가 부재한 환경에서도 심한 노이즈가 포함된 입자 가속기 빔 진단 데이터를 위해, 합성곱 필터링과 최적화된 조기 종료 전략을 활용한 비지도 학습 프레임워크를 제안하여 빔 헤일로 구조를 7 표준편차 이상으로 정밀하게 재구성하고 에미턴스를 고충실도로 복원하는 방법을 소개합니다.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

On the Generalization Capacities of MLLMs for Spatial Intelligence

이 논문은 RGB 입력만 사용하는 멀티모달 대규모 언어 모델 (MLLM) 의 공간 지능 일반화 한계를 지적하고, 카메라 파라미터를 명시적으로 인식하고 증강하는 '카메라 인식 MLLM' 프레임워크를 제안하여 교차 카메라 환경에서의 공간 추론 성능을 획기적으로 향상시켰음을 보여줍니다.

Gongjie Zhang, Wenhao Li, Quanhao Qian, Jiuniu Wang, Deli Zhao, Shijian Lu, Ran Xu2026-03-10🤖 cs.LG

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

이 논문은 작은 언어 모델 (SLM) 이 대규모 도구 환경에서도 효과적으로 작동할 수 있도록 컨텍스트 제어와 실행 구조를 학습 가능한 의사결정으로 간주하고, rubric 기반 강화 학습 미세 조정을 통해 긴 작업 흐름을 안정화하는 ATLAS 프레임워크를 제안합니다.

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

이 논문은 MIMIC-IV 데이터를 기반으로 대규모 환자 인공 데이터를 생성하고, 자동 감사 모듈을 통해 임상적 일관성을 검증하여 기존 통계적 정확도 이상의 임상적 신뢰성과 개인정보 보호를 동시에 확보한 통합 파이프라인을 제안합니다.

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

이 논문은 시계열 파운데이션 모델이 생성한 예측 특징을 회귀 모델에 통합하는 'FutureBoosting'이라는 새로운 하이브리드 AI 접근법을 제안하여, 전력 가격 예측의 정확도를 기존 최첨단 모델 대비 30% 이상 향상시켰다고 요약할 수 있습니다.

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

이 논문은 사전 훈련된 언어 모델의 레이어 사이에 명시적인 안전 비트를 삽입하여 모델의 안전 판단을 해석 가능하고 제어 가능하게 만들며, 경량 미세 조정을 통해 공격 성공률을 극도로 낮추는 'Safe Transformer' 아키텍처를 제안합니다.

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

이 논문은 MLIR 기반의 모듈형 컴파일러 인프라인 PolyBlocks 를 제안하여, 분석적 비용 모델과 휴리스틱을 활용한 자동 최적화를 통해 PyTorch 와 JAX 에서 Torch Inductor 나 XLA 와 경쟁력 있는 성능을 달성하고 새로운 AI 칩으로의 이식을 용이하게 한다는 내용을 담고 있습니다.

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

이 논문은 베이지안 신경망, 공정성 제약이 적용된 그래디언트 부스팅, 그리고 시프트 인식 융합 전략을 결합하여 데이터 분포 변화와 공정성 요구사항 하에서도 신뢰할 수 있는 신용 위험 점수를 산출하는 '보정된 신용 지능 (CCI)' 프레임워크를 제안하고, 이를 통해 기존 모델 대비 우수한 판별력, 보정 정확도, 안정성 및 공정성을 입증합니다.

Srikumar Nayak2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

이 논문은 FlashAttention 을 활용하여 초해상도 Transformer 의 확장성을 가능하게 하는 랭크 분해 암시적 신경 편향 (RIB) 을 제안하고, 이를 통해 기존 방법 대비 훈련 및 추론 시간을 획기적으로 단축하면서도 Urban100 데이터셋에서 35.63dB 의 높은 PSNR 성능을 달성했습니다.

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Heterogeneous Decentralized Diffusion Models

이 논문은 서로 다른 학습 목표 (DDPM 및 Flow Matching) 를 가진 전문가들을 동기화 없이 통합하고, 사전 학습된 체크포인트 변환과 효율적인 아키텍처를 통해 기존 분산 확산 모델 대비 연산 및 데이터 요구량을 획기적으로 줄이면서도 더 우수한 생성 품질을 달성하는 이질적 분산 확산 모델 프레임워크를 제안합니다.

Zhiying Jiang, Raihan Seraj, Marcos Villagra, Bidhan Roy2026-03-10🤖 cs.LG