ShIOEnv: A Command Evaluation Environment for Grammar-Constrained Synthesis and Execution Behavior Modeling

이 논문은 문법 제약과 자기지도식 비축약성 신호를 활용하여 셸 입력 - 출력 데이터를 생성하고 실행 행동을 모델링하는 새로운 환경인 ShIOEnv 를 제안하며, 이를 통해 기존 실행 기반 접근법보다 향상된 정확도를 달성하는 210 만 개의 데이터셋을 공개했습니다.

Jarrod Ragsdale, Rajendra Boppana2026-03-06💻 cs

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

이 논문은 강화 학습 미세 조정 (RFT) 을 통해 비주얼 언어 모델 (VLM) 이 텍스트와 중간 시각적 추론 단계를 교차하며 차트 및 표와 같은 구조화된 시각적 질문 답변을 수행할 때 '이미지로 사고'하는 능력을 학습하도록 하는 최초의 프레임워크인 VTool-R1 을 제안합니다.

Mingyuan Wu, Jingcheng Yang, Jize Jiang + 6 more2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

본 논문은 비허미션 결정체의 에너지 스펙트럼에서 추출된 1,160 만 개의 정적 및 510 만 개의 동적 공간 다중그래프를 포함하는 대규모 벤치마크 데이터셋 HSG-12M 과 이를 자동 생성하는 오픈소스 파이프라인 Poly2Graph 를 소개하여, 물리학적 발견과 기하학적 인식을 갖춘 그래프 학습의 새로운 지평을 엽니다.

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements

본 논문은 일본 기업의 10 년간 공시 자료를 기반으로 회계 부정 탐지 및 수익 예측 등 복잡한 금융 과제를 수행하는 LLM 의 능력을 평가하기 위해 'EDINET-Bench'를 제안하고, 최첨단 모델조차 전문가 수준의 추론이 필요한 이러한 과제에서는 인간 전문가나 단순 통계 모델과 큰 차이가 없는 성능을 보임을 밝혀내어, 실제 금융 업무 환경을 반영한 더 정교한 평가 프레임워크의 필요성을 강조합니다.

Issa Sugiura, Takashi Ishida, Taro Makino + 4 more2026-03-06💻 cs

Structured Kolmogorov-Arnold Neural ODEs for Interpretable Learning and Symbolic Discovery of Nonlinear Dynamics

이 논문은 구조화된 상태 공간 모델링과 Kolmogorov-Arnold 네트워크 (KAN) 를 통합한 SKANODE 프레임워크를 제안하여, 비선형 동역학 시스템의 관측 데이터로부터 물리적으로 해석 가능한 잠재 상태와 지배 방정식을 정확하게 복원하고 발견하는 방법을 제시합니다.

Wei Liu, Kiran Bacsa, Loon Ching Tang + 1 more2026-03-06🔬 physics

Learning Physical Systems: Symplectification via Gauge Fixing in Dirac Structures

이 논문은 다체 로봇 및 접촉이 풍부한 시스템과 같은 소산성 구속계를 고차원 매니폴드로 확장하여 비퇴화 심플렉틱 기하학을 복원하는 '프레심플렉티피케이션 네트워크 (PSNs)'를 제안함으로써, 물리 법칙을 기반으로 한 심층 학습과 구속된 기계적 시스템 간의 간극을 해소합니다.

Aristotelis Papatheodorou, Pranav Vaidhyanathan, Natalia Ares + 1 more2026-03-06💻 cs

Parameter Stress Analysis in Reinforcement Learning: Applying Synaptic Filtering to Policy Networks

이 논문은 고/저역 통과 및 펄스파 필터를 활용한 내부적 스트레스와 적대적 공격을 통한 외부적 스트레스를 결합하여 강화학습 정책의 매개변수를 취약, 강건, 반취약성으로 분류하고, Mujoco 환경에서 반취약성 매개변수가 스트레스 하에서 정책 성능을 향상시킬 수 있음을 입증합니다.

Zain ul Abdeen, Ming Jin2026-03-06💻 cs

MuRating: A High Quality Data Selecting Approach to Multilingual Large Language Model Pretraining

이 논문은 영어 데이터의 품질 신호를 17 개 언어로 확장하여 다국어 대규모 언어 모델의 사전 학습을 위한 고품질 데이터를 선별하는 확장 가능한 프레임워크인 'MuRating'을 제안하고, 이를 통해 영어 및 다국어 벤치마크에서 성능을 크게 향상시킨다는 것을 보여줍니다.

Zhixun Chen, Ping Guo, Wenhan Han + 10 more2026-03-06💻 cs

Overtone: Cyclic Patch Modulation for Clean, Efficient, and Flexible Physics Emulators

이 논문은 고정된 패치 크기로 인한 주파수 영역의 체계적 오차 누적과 비효율적인 계산 비용을 해결하기 위해, 추론 시 패치 크기를 동적으로 순환 조절하는 '오버톤 (Overtone)'이라는 새로운 PDE 대리 모델을 제안하여 장기 예측 정확도를 크게 향상시키고 계산 자원에 따라 유연하게 배포할 수 있음을 보여줍니다.

Payel Mukhopadhyay, Michael McCabe, Ruben Ohana + 1 more2026-03-06💻 cs