BeyondBench: Contamination-Resistant Evaluation of Reasoning in Language Models

이 논문은 훈련 데이터 오염 문제를 해결하고 언어 모델의 진정한 추론 능력을 평가하기 위해, 10^15 개 이상의 고유한 알고리즘 문제 인스턴스를 동적으로 생성하여 검증 가능한 해답을 제공하는 'BeyondBench' 평가 프레임워크를 제안하고 다양한 모델에 대한 실험 결과를 제시합니다.

Gaurav Srivastava, Aafiya Hussain, Zhenyu Bi + 5 more2026-03-06💻 cs

Quantitative convergence of trained single layer neural networks to Gaussian processes

이 논문은 무한 폭 극한에서 경사 하강법으로 학습된 단일 층 신경망이 가우시안 프로세스로 수렴하는 정량적 거동을 분석하여, 학습 시간 t0t \ge 0에서 네트워크 출력과 가우시안 근사치 사이의 2 차 워asserstein 거리에 대한 명시적 상한을 제시하고 네트워크 폭에 따른 다항식 감쇠를 증명합니다.

Eloy Mosig, Andrea Agazzi, Dario Trevisan2026-03-06🔢 math

OPPO: Accelerating PPO-based RLHF via Pipeline Overlap

OPPO 는 PPO 기반 RLHF 훈련 파이프라인의 순차적 의존성과 긴 응답 길이로 인한 비효율성을 해결하기 위해 업스트림 모델 출력을 스트리밍하는 인트라-스텝 오버랩과 긴 생성을 지연시키는 인터-스텝 오버랩 기술을 도입하여, 수렴성을 저해하지 않고 훈련 속도를 1.8 배에서 2.8 배까지 가속화합니다.

Kaizhuo Yan, Yingjie Yu, Yifan Yu + 2 more2026-03-06💻 cs

True Self-Supervised Novel View Synthesis is Transferable

이 논문은 기존 자기지도 학습 방식의 새로운 뷰 합성 모델들이 전이성이 부족하다는 문제를 지적하고, 3D 기하학적 인덕티브 바이어스나 SE(3) 와 같은 명시적 포즈 파라미터화 없이도 입력과 출력의 증강을 통해 카메라 포즈와 장면 내용을 분리하여 진정한 전이 가능한 새로운 뷰 합성을 실현한 'XFactor' 모델을 제안합니다.

Thomas W. Mitchel, Hyunwoo Ryu, Vincent Sitzmann2026-03-06💻 cs

Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss

이 논문은 편미분방정식 (PDE) 기반 역문제에 대한 불확실성을 정량화하기 위해 PDE 손실 함수를 사전 지식으로 통합한 베이지안 확장 방법인 B-ODIL 을 제안하고, 다양한 차원의 합성 벤치마크 및 뇌종양 성장 모델링을 통한 실제 임상 사례를 통해 그 유효성을 입증합니다.

Lucas Amoudruz, Sergey Litvinov, Costas Papadimitriou + 1 more2026-03-06🔬 physics

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

이 논문은 기존 방어 기법들이 다중 에이전트 시스템의 제어 흐름 하이재킹 공격을 효과적으로 막지 못함을 지적하고, 제어 흐름 무결성과 최소 권한 원칙에 기반하여 허용된 제어 흐름 그래프를 생성하고 강제하는 새로운 방어 시스템인 'ControlValve'를 제안합니다.

Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov2026-03-06🔒 cs.CR

LLEMA: Evolutionary Search with LLMs for Multi-Objective Materials Discovery

이 논문은 대규모 언어 모델의 과학적 지식과 화학 기반 진화 규칙, 그리고 메모리 기반 정제 기법을 결합하여 다중 목적을 충족하는 새로운 소재 후보를 효율적으로 탐색하는 통합 프레임워크인 LLEMA 를 제안하고, 이를 통해 기존 방법론 대비 우수한 성능을 입증했습니다.

Nikhil Abhyankar, Sanchit Kabra, Saaketh Desai + 1 more2026-03-06🔬 cond-mat.mtrl-sci