cs.LG 편의 논문 | Gist.Science

Curriculum Learning for Efficient Chain-of-Thought Distillation via Structure-Aware Masking and GRPO

이 논문은 구조 인식 마스킹과 GRPO 를 활용한 3 단계 커리큘럼 학습 프레임워크를 제안하여, Qwen2.5-3B-Base 모델이 GSM8K 에서 정확도를 11.29% 향상시키면서 동시에 출력 길이를 27.4% 단축하는 효율적인 체인 오브 씽킹 증류 방법을 제시합니다.

Bowen Yu, Maolin Wang, Sheng Zhang + 7 more2026-03-06💻 cs

CityGuard: Graph-Aware Private Descriptors for Bias-Resilient Identity Search Across Urban Cameras

이 논문은 도시 전역의 분산된 카메라 네트워크에서 사생활 보호를 준수하면서도 시점, 가림, 도메인 변화에 강인한 개인 식별을 가능하게 하는 'CityGuard'라는 위상 인식 트랜스포머 기반의 프라이버시 보존 프레임워크를 제안합니다.

Rong Fu, Yibo Meng, Jia Yee Tan + 5 more2026-03-06💻 cs

RA-QA: A Benchmarking System for Respiratory Audio Question Answering Under Real-World Heterogeneity

이 논문은 실제 세계의 이질성 하에서 호흡기 오디오 질문 응답 (QA) 의 성능을 평가하기 위해, 공개 데이터셋을 통합하여 900 만 개의 다양한 QA 쌍을 포함하는 표준화된 벤치마크 시스템인 RA-QA 를 제안하고 현재 모델들의 한계를 분석합니다.

Gaia A. Bertolino, Yuwei Zhang, Tong Xia + 2 more2026-03-06💻 cs

cc-Shapley: Measuring Multivariate Feature Importance Needs Causal Context

이 논문은 기존 Shapley 값이 관찰 데이터의 인과적 맥락을 무시할 때 콜라이더 편향 등으로 인해 잘못된 특징 중요도를 산출할 수 있음을 지적하고, 데이터의 인과 구조를 반영하여 이러한 오류를 해결하는 새로운 방법인 'cc-Shapley'를 제안합니다.

Jörg Martin, Stefan Haufe2026-03-06💻 cs

On Imbalanced Regression with Hoeffding Trees

이 논문은 불균형 회귀 데이터 스트림을 위해 커널 밀도 추정을 확장하고 계층적 수축을 통합하여, Hoeffding 트리의 초기 성능을 개선하는 방법을 제안하고 실험적으로 검증합니다.

Pantia-Marina Alchirch, Dimitrios I. Diochnos2026-03-06💻 cs

Zatom-1: A Multimodal Flow Foundation Model for 3D Molecules and Materials

이 논문은 분자와 물질을 모두 다루는 3D 화학 모델링을 위해 생성 및 예측 작업을 통합한 최초의 오픈소스 기반 모델인 'Zatom-1'을 제안하며, 멀티모달 흐름 매칭을 통해 기존 특화 모델 대비 우수한 성능과 빠른 추론 속도를 달성하고 도메인 간 전이 학습 효과를 입증했습니다.

Alex Morehead, Miruna Cretu, Antonia Panescu + 14 more2026-03-06🔬 cond-mat.mtrl-sci

Regularized Online RLHF with Generalized Bilinear Preferences

이 논문은 일반화된 이차선형 선호 모델 (GBPM) 과 강한 볼록성 정규화를 기반으로, 고차원 온라인 RLHF 환경에서 Nash 균형을 효율적으로 찾는 두 가지 알고리즘 (그리드 샘플링 및 탐색 후 고정) 을 제안하고 각각 다항 로그 및 다항 차원 자유의 후회 한계를 증명합니다.

Junghyun Lee, Minju Hong, Kwang-Sung Jun + 2 more2026-03-06💻 cs

Lap2: Revisiting Laplace DP-SGD for High Dimensions via Majorization Theory

이 논문은 고차원 모델에서 L1 노름 클리핑의 한계를 극복하고 L2 클리핑을 적용할 수 있는 새로운 'Lap2' 방법을 제안하여, 주야노프 이론을 활용하여 강력한 프라이버시 보장 하에 가우스 DP-SGD 와 견주거나 능가하는 성능을 달성함을 보여줍니다.

Meisam Mohammady, Qin Yang, Nicholas Stout, Ayesha Samreen, Han Wang, Christopher J Quinn, Yuan Hong2026-03-06🔒 cs.CR

Inference-time optimization for experiment-grounded protein ensemble generation

이 논문은 실험 데이터와 물리적 제약을 동시에 만족하는 단백질 앙상블을 생성하기 위해 잠재 표현 최적화와 볼츠만 가중치 샘플링을 결합한 추론 시간 최적화 프레임워크를 제안하며, 기존 생성 모델의 한계를 극복하고 실험 데이터와의 일치도를 향상시킴과 동시에 모델 신뢰도 지표의 취약점을 규명합니다.

Advaith Maddipatla, Anar Rzayev, Marco Pegoraro + 5 more2026-03-06💻 cs

Jailbreak Foundry: From Papers to Runnable Attacks for Reproducible Benchmarking

이 논문은 LLM 재일브랙 기술의 빠른 진화에 대응하여 논문 내용을 실행 가능한 모듈로 자동 변환하고 표준화된 평가를 가능하게 하는 다중 에이전트 시스템인 'Jailbreak Foundry(JBF)'를 제안합니다.

Zhicheng Fang, Jingjie Zheng, Chenxu Fu, Wei Xu2026-03-06🔒 cs.CR

DiffusionHarmonizer: Bridging Neural Reconstruction and Photorealistic Simulation with Online Diffusion Enhancer

이 논문은 NeRF 및 3D 가우스 스플래팅과 같은 신경 재구성 기법의 아티팩트와 동적 객체 통합의 한계를 극복하기 위해, 사전 훈련된 확산 모델을 기반으로 실시간 시뮬레이션 환경에서 단일 GPU 로 작동하는 온디바이스 생성 향상 프레임워크인 DiffusionHarmonizer 를 제안합니다.

Yuxuan Zhang, Katarína Tóthová, Zian Wang + 7 more2026-03-06💻 cs

Fine-grained Soundscape Control for Augmented Hearing

이 논문은 제한된 컴퓨팅 자원을 가진 청각 보조 장치에서 실시간으로 여러 소리 소스를 개별적으로 추출하고 볼륨을 조절할 수 있는 최초의 시스템인 'Aurchestra'를 제안하여, 단순한 소음 제거를 넘어 환경을 프로그래밍 가능하게 만드는 정교한 사운드스케이프 제어 기술을 제시합니다.

Seunghyun Oh, Malek Itani, Aseem Gauri + 1 more2026-03-06💻 cs

Agents Learn Their Runtime: Interpreter Persistence as Training-Time Semantics

이 논문은 도구 활용 에이전트의 학습 데이터에 인터프리터 상태 지속성이 포함되는지 여부가 해결 능력에는 영향을 주지 않지만 토큰 효율성과 안정성에는 결정적인 차이를 만든다는 점을 규명하고, 학습 데이터와 배포 런타임의 정렬을 강조합니다.

Victor May, Aaditya Salgarkar, Yishan Wang + 2 more2026-03-06💻 cs

Learn Hard Problems During RL with Reference Guided Fine-tuning

이 논문은 강화학습 (RL) 중 발생하는 보상 희소성 문제를 해결하기 위해 인간이 작성한 참조 해답을 모델의 추론 공간에 맞게 부분적으로 활용하여 긍정적 학습 경로를 생성하는 '참조 유도 미세 조정 (ReGFT)' 방법을 제안하고, 이를 통해 수학 추론 성능과 RL 학습 효율성을 동시에 향상시킨다는 것을 보여줍니다.

Yangzhen Wu, Shanda Li, Zixin Wen + 5 more2026-03-06💻 cs

VoxKnesset: A Large-Scale Longitudinal Hebrew Speech Dataset for Aging Speaker Modeling

이 논문은 2009 년부터 2025 년까지의 15 년간 393 명의 연사 약 2,300 시간 분량의 헤브리어 의회 연설을 포함한 대규모 종단적 음성 데이터셋 'VoxKnesset'을 공개하고, 이를 통해 화자 검증 및 나이 예측 모델의 노화 적응 성능을 평가한 결과를 제시합니다.

Yanir Marmor, Arad Zulti, David Krongauz + 4 more2026-03-06💻 cs

MatRIS: Toward Reliable and Efficient Pretrained Machine Learning Interatomic Potentials

이 논문은 선형 복잡도의 분리형 어텐션 메커니즘을 도입하여 3 체 상호작용을 모델링함으로써, 기존 등변성 모델과 동등한 정확도를 유지하면서도 계산 비용을 획기적으로 줄인 새로운 불변 MLIP 인 MatRIS 를 제안합니다.

Yuanchang Zhou, Siyu Hu, Xiangyu Zhang + 3 more2026-03-06💻 cs

Conformal Graph Prediction with Z-Gromov Wasserstein Distances

이 논문은 그래프 출력에 대한 분포 없는 커버리지 보장을 제공하기 위해 Z-그로모프-워터스테인 거리를 비동일성 척도로 정의하고, 복잡한 출력 공간을 처리할 수 있는 적응형 예측 집합을 생성하는 새로운 정합 예측 프레임워크를 제안합니다.

Gabriel Melo, Thibaut de Saivre, Anna Calissano + 1 more2026-03-06💻 cs

IoUCert: Robustness Verification for Anchor-based Object Detectors

이 논문은 복잡한 비선형 좌표 변환과 IoU(교집합 비율) 지표를 극복하기 위해 IoUCert라는 새로운 형식적 검증 프레임워크를 제안하여, SSD 및 YOLOv2/v3 와 같은 앵커 기반 객체 탐지 모델의 강건성을 최초로 검증할 수 있음을 보여줍니다.

Benedikt Brückner, Alejandro J. Mercado, Yanghao Zhang, Panagiotis Kouvaros, Alessio Lomuscio2026-03-06🔒 cs.CR

Incremental Graph Construction Enables Robust Spectral Clustering of Texts

이 논문은 텍스트 임베딩의 스펙트럼 클러스터링에서 표준 k-NN 그래프의 연결성 부족 문제를 해결하기 위해, 새로운 노드가 기존 노드들과 연결되도록 설계된 점진적 k-NN 그래프 구축 방법을 제안하여 저 k 값 영역에서도 안정적인 클러스터링 성능을 보장함을 보여줍니다.

Marko Pranjić, Boshko Koloski, Nada Lavrač + 2 more2026-03-06💻 cs

Inverse Reconstruction of Shock Time Series from Shock Response Spectrum Curves using Machine Learning

이 논문은 충격 반응 스펙트럼 (SRS) 에서 가속도 시간 이력을 역추정하는 비선형 다대일 문제를 해결하기 위해, 기존 반복 최적화 방식보다 훨씬 빠르고 정확한 데이터 기반 역매핑을 학습하는 조건부 변분 오토인코더 (CVAE) 를 제안합니다.

Adam Watts, Andrew Jeon, Destry Newton + 1 more2026-03-06💻 cs

← 이전 다음 →