cs.LG 편의 논문 | Gist.Science

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference

이 논문은 Simpson 의 역설이나 선택 편향과 같은 통계적 함정을 식별하고 해결하는 능력을 평가하기 위해 'CausalPitfalls'라는 새로운 벤치마크를 제안하고, 이를 통해 현재 대규모 언어 모델 (LLM) 이 인과 추론에서 심각한 한계를 보임을 입증합니다.

Jin Du, Li Chen, Xun Xian + 6 more2026-03-06💻 cs

ShIOEnv: A Command Evaluation Environment for Grammar-Constrained Synthesis and Execution Behavior Modeling

이 논문은 문법 제약과 자기지도식 비축약성 신호를 활용하여 셸 입력 - 출력 데이터를 생성하고 실행 행동을 모델링하는 새로운 환경인 ShIOEnv 를 제안하며, 이를 통해 기존 실행 기반 접근법보다 향상된 정확도를 달성하는 210 만 개의 데이터셋을 공개했습니다.

Jarrod Ragsdale, Rajendra Boppana2026-03-06💻 cs

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

이 논문은 강화 학습 미세 조정 (RFT) 을 통해 비주얼 언어 모델 (VLM) 이 텍스트와 중간 시각적 추론 단계를 교차하며 차트 및 표와 같은 구조화된 시각적 질문 답변을 수행할 때 '이미지로 사고'하는 능력을 학습하도록 하는 최초의 프레임워크인 VTool-R1 을 제안합니다.

Mingyuan Wu, Jingcheng Yang, Jize Jiang + 6 more2026-03-06💻 cs

Attribute-Efficient PAC Learning of Sparse Halfspaces with Constant Malicious Noise Rate

이 논문은 특정 집중 및 마진 조건 하에서 단순한 힌지 손실 최소화 변형을 통해 상수 수준의 악성 노이즈가 존재하는 상황에서도 $s$ -희소 반공간을 $\text{poly}(s, \log d)$ 개의 샘플로 효율적으로 학습하는 새로운 알고리즘과 그 분석을 제시합니다.

Shiwei Zeng, Jie Shen2026-03-06💻 cs

Highly Efficient and Effective LLMs with Multi-Boolean Architectures

이 논문은 기존 방법들의 한계를 극복하고 잠재 가중치 없이 부울 도메인에서 직접 미세 조정이 가능한 멀티 커널 부울 파라미터를 기반으로 한 새로운 프레임워크를 제안하여 대규모 언어 모델의 복잡성을 획기적으로 줄이면서도 성능을 향상시켰음을 보여줍니다.

Ba-Hien Tran, Van Minh Nguyen2026-03-06💻 cs

Continuous Chain of Thought Enables Parallel Exploration and Reasoning

이 논문은 이산적 토큰 대신 연속적 토큰을 활용한 연쇄 사고 (CoT2) 를 통해 병렬 추론을 가능하게 하고, 새로운 감독 전략과 샘플링 기법을 통해 논리적 추론 성능과 효율성을 획기적으로 개선하는 이론적 근거와 알고리즘을 제시합니다.

Halil Alperen Gozeten, M. Emrullah Ildiz, Xuechen Zhang + 3 more2026-03-06💻 cs

SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

이 논문은 웹 검색 결과가 모순되거나 노이즈가 많을 때 사실 기반 추론 능력을 평가하기 위한 새로운 벤치마크인 SealQA 를 소개하고, 최신 최첨단 언어 모델들조차 이 환경에서 심각한 성능 저하와 계산량 증가에 따른 개선 한계를 보임을 규명합니다.

Thinh Pham, Nguyen Nguyen, Pratibha Zunjare + 3 more2026-03-06💻 cs

FPGA-Enabled Machine Learning Applications in Earth Observation: A Systematic Review

이 논문은 PRISMA 2020 가이드라인에 따라 지구 관측 분야에서 UAV 및 NewSpace 시대의 데이터 처리 요구를 충족하기 위해 FPGA 를 활용한 머신러닝 애플리케이션 68 건을 체계적으로 분석하고, 효율적인 모델 아키텍처와 FPGA 구현 전략에 대한 두 가지 분류 체계를 제시합니다.

Cédric Léonard, Dirk Stober, Martin Schulz2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

본 논문은 비허미션 결정체의 에너지 스펙트럼에서 추출된 1,160 만 개의 정적 및 510 만 개의 동적 공간 다중그래프를 포함하는 대규모 벤치마크 데이터셋 HSG-12M 과 이를 자동 생성하는 오픈소스 파이프라인 Poly2Graph 를 소개하여, 물리학적 발견과 기하학적 인식을 갖춘 그래프 학습의 새로운 지평을 엽니다.

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements

본 논문은 일본 기업의 10 년간 공시 자료를 기반으로 회계 부정 탐지 및 수익 예측 등 복잡한 금융 과제를 수행하는 LLM 의 능력을 평가하기 위해 'EDINET-Bench'를 제안하고, 최첨단 모델조차 전문가 수준의 추론이 필요한 이러한 과제에서는 인간 전문가나 단순 통계 모델과 큰 차이가 없는 성능을 보임을 밝혀내어, 실제 금융 업무 환경을 반영한 더 정교한 평가 프레임워크의 필요성을 강조합니다.

Issa Sugiura, Takashi Ishida, Taro Makino + 4 more2026-03-06💻 cs

SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning

이 논문은 중간 난이도의 프롬프트를 선택적으로 학습하여 추론 모델의 RL 훈련 효율성을 높이고 수렴 속도를 2 배에서 6 배까지 개선하는 'SPEED'라는 적응형 온라인 커리큘럼 학습 방법을 제안합니다.

Ruiqi Zhang, Daman Arora, Song Mei + 1 more2026-03-06💻 cs

Bures-Wasserstein Flow Matching for Graph Generation

이 논문은 그래프의 노드와 엣지가 분리된 선형 보간이 아닌 마르코프 랜덤 필드 기반의 최적 수송 변위를 통해 매끄러운 확률 경로를 구성함으로써 학습 동역학과 샘플링 수렴성을 개선한 새로운 그래프 생성 프레임워크인 BWFlow 를 제안합니다.

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs

From Bandit Regret to FDR Control: Online Selective Generation with Adversarial Feedback Unlocking

이 논문은 불완전한 피드백과 적대적 환경에서도 신뢰성 있는 생성을 보장하기 위해, 밴딧 알고리즘의 후회를 FDR(거짓 발견률) 상한으로 변환하는 새로운 온라인 학습 프레임워크인 ExSUL 을 제안하고 그 유효성을 입증합니다.

Minjae Lee, Yoonjae Jung, Sangdon Park2026-03-06💻 cs

Structured Kolmogorov-Arnold Neural ODEs for Interpretable Learning and Symbolic Discovery of Nonlinear Dynamics

이 논문은 구조화된 상태 공간 모델링과 Kolmogorov-Arnold 네트워크 (KAN) 를 통합한 SKANODE 프레임워크를 제안하여, 비선형 동역학 시스템의 관측 데이터로부터 물리적으로 해석 가능한 잠재 상태와 지배 방정식을 정확하게 복원하고 발견하는 방법을 제시합니다.

Wei Liu, Kiran Bacsa, Loon Ching Tang + 1 more2026-03-06🔬 physics

Learning Physical Systems: Symplectification via Gauge Fixing in Dirac Structures

이 논문은 다체 로봇 및 접촉이 풍부한 시스템과 같은 소산성 구속계를 고차원 매니폴드로 확장하여 비퇴화 심플렉틱 기하학을 복원하는 '프레심플렉티피케이션 네트워크 (PSNs)'를 제안함으로써, 물리 법칙을 기반으로 한 심층 학습과 구속된 기계적 시스템 간의 간극을 해소합니다.

Aristotelis Papatheodorou, Pranav Vaidhyanathan, Natalia Ares + 1 more2026-03-06💻 cs

Parameter Stress Analysis in Reinforcement Learning: Applying Synaptic Filtering to Policy Networks

이 논문은 고/저역 통과 및 펄스파 필터를 활용한 내부적 스트레스와 적대적 공격을 통한 외부적 스트레스를 결합하여 강화학습 정책의 매개변수를 취약, 강건, 반취약성으로 분류하고, Mujoco 환경에서 반취약성 매개변수가 스트레스 하에서 정책 성능을 향상시킬 수 있음을 입증합니다.

Zain ul Abdeen, Ming Jin2026-03-06💻 cs

MuRating: A High Quality Data Selecting Approach to Multilingual Large Language Model Pretraining

이 논문은 영어 데이터의 품질 신호를 17 개 언어로 확장하여 다국어 대규모 언어 모델의 사전 학습을 위한 고품질 데이터를 선별하는 확장 가능한 프레임워크인 'MuRating'을 제안하고, 이를 통해 영어 및 다국어 벤치마크에서 성능을 크게 향상시킨다는 것을 보여줍니다.

Zhixun Chen, Ping Guo, Wenhan Han + 10 more2026-03-06💻 cs

Overtone: Cyclic Patch Modulation for Clean, Efficient, and Flexible Physics Emulators

이 논문은 고정된 패치 크기로 인한 주파수 영역의 체계적 오차 누적과 비효율적인 계산 비용을 해결하기 위해, 추론 시 패치 크기를 동적으로 순환 조절하는 '오버톤 (Overtone)'이라는 새로운 PDE 대리 모델을 제안하여 장기 예측 정확도를 크게 향상시키고 계산 자원에 따라 유연하게 배포할 수 있음을 보여줍니다.

Payel Mukhopadhyay, Michael McCabe, Ruben Ohana + 1 more2026-03-06💻 cs

Some Super-approximation Rates of ReLU Neural Networks for Korobov Functions

이 논문은 희소 격자 유한 요소와 비트 추출 기법을 활용하여 ReLU 신경망이 코로보프 함수를 근사할 때 차원의 저주에 거의 영향을 받지 않는 거의 최적의 초근사 오차 한계를 증명합니다.

Yuwen Li, Guozhi Zhang2026-03-06💻 cs

Kernel Based Maximum Entropy Inverse Reinforcement Learning for Mean-Field Games

이 논문은 무한 시간 평균장 게임에서 RKHS 기반의 최대 인과 엔트로피 역강화학습을 제안하여, 기존 선형 보상 모델의 한계를 극복하고 비선형 보상 구조를 효과적으로 학습하며 이론적 일관성과 실제 교통 시나리오에서의 우수성을 입증합니다.

Berkay Anahtarci, Can Deha Kariksiz, Naci Saldi2026-03-06🔢 math

← 이전 다음 →