cs.LG 편의 논문 | Gist.Science

ReactDance: Hierarchical Representation for High-Fidelity and Coherent Long-Form Reactive Dance Generation

이 논문은 정교한 공간적 상호작용과 장기적인 시간적 일관성을 동시에 해결하기 위해 계층적 유한 스칼라 양자화 (HFSQ) 와 블록 단위 국소 컨텍스트 (BLC) 전략을 도입한 확산 기반 반응형 댄스 생성 프레임워크인 ReactDance 를 제안합니다.

Jingzhong Lin, Xinru Li, Yuanyuan Qi + 8 more2026-03-06💻 cs

Learning Virtual Machine Scheduling in Cloud Computing through Language Agents

이 논문은 클라우드 컴퓨팅의 가상 머신 스케줄링 문제를 해결하기 위해 대규모 언어 모델 (LLM) 을 활용한 계층적 에이전트 프레임워크 'MiCo'를 제안하며, 이를 통해 기존 방법들의 한계를 극복하고 대규모 시나리오에서 96.9% 의 높은 경쟁 비율을 달성함을 입증합니다.

JieHao Wu, Ziwei Wang, Junjie Sheng + 3 more2026-03-06💻 cs

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference

이 논문은 Simpson 의 역설이나 선택 편향과 같은 통계적 함정을 식별하고 해결하는 능력을 평가하기 위해 'CausalPitfalls'라는 새로운 벤치마크를 제안하고, 이를 통해 현재 대규모 언어 모델 (LLM) 이 인과 추론에서 심각한 한계를 보임을 입증합니다.

Jin Du, Li Chen, Xun Xian + 6 more2026-03-06💻 cs

ShIOEnv: A Command Evaluation Environment for Grammar-Constrained Synthesis and Execution Behavior Modeling

이 논문은 문법 제약과 자기지도식 비축약성 신호를 활용하여 셸 입력 - 출력 데이터를 생성하고 실행 행동을 모델링하는 새로운 환경인 ShIOEnv 를 제안하며, 이를 통해 기존 실행 기반 접근법보다 향상된 정확도를 달성하는 210 만 개의 데이터셋을 공개했습니다.

Jarrod Ragsdale, Rajendra Boppana2026-03-06💻 cs

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

이 논문은 강화 학습 미세 조정 (RFT) 을 통해 비주얼 언어 모델 (VLM) 이 텍스트와 중간 시각적 추론 단계를 교차하며 차트 및 표와 같은 구조화된 시각적 질문 답변을 수행할 때 '이미지로 사고'하는 능력을 학습하도록 하는 최초의 프레임워크인 VTool-R1 을 제안합니다.

Mingyuan Wu, Jingcheng Yang, Jize Jiang + 6 more2026-03-06💻 cs

Attribute-Efficient PAC Learning of Sparse Halfspaces with Constant Malicious Noise Rate

이 논문은 특정 집중 및 마진 조건 하에서 단순한 힌지 손실 최소화 변형을 통해 상수 수준의 악성 노이즈가 존재하는 상황에서도 $s$ -희소 반공간을 $\text{poly}(s, \log d)$ 개의 샘플로 효율적으로 학습하는 새로운 알고리즘과 그 분석을 제시합니다.

Shiwei Zeng, Jie Shen2026-03-06💻 cs

Highly Efficient and Effective LLMs with Multi-Boolean Architectures

이 논문은 기존 방법들의 한계를 극복하고 잠재 가중치 없이 부울 도메인에서 직접 미세 조정이 가능한 멀티 커널 부울 파라미터를 기반으로 한 새로운 프레임워크를 제안하여 대규모 언어 모델의 복잡성을 획기적으로 줄이면서도 성능을 향상시켰음을 보여줍니다.

Ba-Hien Tran, Van Minh Nguyen2026-03-06💻 cs

Continuous Chain of Thought Enables Parallel Exploration and Reasoning

이 논문은 이산적 토큰 대신 연속적 토큰을 활용한 연쇄 사고 (CoT2) 를 통해 병렬 추론을 가능하게 하고, 새로운 감독 전략과 샘플링 기법을 통해 논리적 추론 성능과 효율성을 획기적으로 개선하는 이론적 근거와 알고리즘을 제시합니다.

Halil Alperen Gozeten, M. Emrullah Ildiz, Xuechen Zhang + 3 more2026-03-06💻 cs

SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

이 논문은 웹 검색 결과가 모순되거나 노이즈가 많을 때 사실 기반 추론 능력을 평가하기 위한 새로운 벤치마크인 SealQA 를 소개하고, 최신 최첨단 언어 모델들조차 이 환경에서 심각한 성능 저하와 계산량 증가에 따른 개선 한계를 보임을 규명합니다.

Thinh Pham, Nguyen Nguyen, Pratibha Zunjare + 3 more2026-03-06💻 cs

FPGA-Enabled Machine Learning Applications in Earth Observation: A Systematic Review

이 논문은 PRISMA 2020 가이드라인에 따라 지구 관측 분야에서 UAV 및 NewSpace 시대의 데이터 처리 요구를 충족하기 위해 FPGA 를 활용한 머신러닝 애플리케이션 68 건을 체계적으로 분석하고, 효율적인 모델 아키텍처와 FPGA 구현 전략에 대한 두 가지 분류 체계를 제시합니다.

Cédric Léonard, Dirk Stober, Martin Schulz2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

본 논문은 비허미션 결정체의 에너지 스펙트럼에서 추출된 1,160 만 개의 정적 및 510 만 개의 동적 공간 다중그래프를 포함하는 대규모 벤치마크 데이터셋 HSG-12M 과 이를 자동 생성하는 오픈소스 파이프라인 Poly2Graph 를 소개하여, 물리학적 발견과 기하학적 인식을 갖춘 그래프 학습의 새로운 지평을 엽니다.

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements

본 논문은 일본 기업의 10 년간 공시 자료를 기반으로 회계 부정 탐지 및 수익 예측 등 복잡한 금융 과제를 수행하는 LLM 의 능력을 평가하기 위해 'EDINET-Bench'를 제안하고, 최첨단 모델조차 전문가 수준의 추론이 필요한 이러한 과제에서는 인간 전문가나 단순 통계 모델과 큰 차이가 없는 성능을 보임을 밝혀내어, 실제 금융 업무 환경을 반영한 더 정교한 평가 프레임워크의 필요성을 강조합니다.

Issa Sugiura, Takashi Ishida, Taro Makino + 4 more2026-03-06💻 cs

SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning

이 논문은 중간 난이도의 프롬프트를 선택적으로 학습하여 추론 모델의 RL 훈련 효율성을 높이고 수렴 속도를 2 배에서 6 배까지 개선하는 'SPEED'라는 적응형 온라인 커리큘럼 학습 방법을 제안합니다.

Ruiqi Zhang, Daman Arora, Song Mei + 1 more2026-03-06💻 cs

Bures-Wasserstein Flow Matching for Graph Generation

이 논문은 그래프의 노드와 엣지가 분리된 선형 보간이 아닌 마르코프 랜덤 필드 기반의 최적 수송 변위를 통해 매끄러운 확률 경로를 구성함으로써 학습 동역학과 샘플링 수렴성을 개선한 새로운 그래프 생성 프레임워크인 BWFlow 를 제안합니다.

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs

From Bandit Regret to FDR Control: Online Selective Generation with Adversarial Feedback Unlocking

이 논문은 불완전한 피드백과 적대적 환경에서도 신뢰성 있는 생성을 보장하기 위해, 밴딧 알고리즘의 후회를 FDR(거짓 발견률) 상한으로 변환하는 새로운 온라인 학습 프레임워크인 ExSUL 을 제안하고 그 유효성을 입증합니다.

Minjae Lee, Yoonjae Jung, Sangdon Park2026-03-06💻 cs

Structured Kolmogorov-Arnold Neural ODEs for Interpretable Learning and Symbolic Discovery of Nonlinear Dynamics

이 논문은 구조화된 상태 공간 모델링과 Kolmogorov-Arnold 네트워크 (KAN) 를 통합한 SKANODE 프레임워크를 제안하여, 비선형 동역학 시스템의 관측 데이터로부터 물리적으로 해석 가능한 잠재 상태와 지배 방정식을 정확하게 복원하고 발견하는 방법을 제시합니다.

Wei Liu, Kiran Bacsa, Loon Ching Tang + 1 more2026-03-06🔬 physics

Learning Physical Systems: Symplectification via Gauge Fixing in Dirac Structures

이 논문은 다체 로봇 및 접촉이 풍부한 시스템과 같은 소산성 구속계를 고차원 매니폴드로 확장하여 비퇴화 심플렉틱 기하학을 복원하는 '프레심플렉티피케이션 네트워크 (PSNs)'를 제안함으로써, 물리 법칙을 기반으로 한 심층 학습과 구속된 기계적 시스템 간의 간극을 해소합니다.

Aristotelis Papatheodorou, Pranav Vaidhyanathan, Natalia Ares + 1 more2026-03-06💻 cs

Parameter Stress Analysis in Reinforcement Learning: Applying Synaptic Filtering to Policy Networks

이 논문은 고/저역 통과 및 펄스파 필터를 활용한 내부적 스트레스와 적대적 공격을 통한 외부적 스트레스를 결합하여 강화학습 정책의 매개변수를 취약, 강건, 반취약성으로 분류하고, Mujoco 환경에서 반취약성 매개변수가 스트레스 하에서 정책 성능을 향상시킬 수 있음을 입증합니다.

Zain ul Abdeen, Ming Jin2026-03-06💻 cs

MuRating: A High Quality Data Selecting Approach to Multilingual Large Language Model Pretraining

이 논문은 영어 데이터의 품질 신호를 17 개 언어로 확장하여 다국어 대규모 언어 모델의 사전 학습을 위한 고품질 데이터를 선별하는 확장 가능한 프레임워크인 'MuRating'을 제안하고, 이를 통해 영어 및 다국어 벤치마크에서 성능을 크게 향상시킨다는 것을 보여줍니다.

Zhixun Chen, Ping Guo, Wenhan Han + 10 more2026-03-06💻 cs

Overtone: Cyclic Patch Modulation for Clean, Efficient, and Flexible Physics Emulators

이 논문은 고정된 패치 크기로 인한 주파수 영역의 체계적 오차 누적과 비효율적인 계산 비용을 해결하기 위해, 추론 시 패치 크기를 동적으로 순환 조절하는 '오버톤 (Overtone)'이라는 새로운 PDE 대리 모델을 제안하여 장기 예측 정확도를 크게 향상시키고 계산 자원에 따라 유연하게 배포할 수 있음을 보여줍니다.

Payel Mukhopadhyay, Michael McCabe, Ruben Ohana + 1 more2026-03-06💻 cs

← 이전 다음 →