Honest and Reliable Evaluation and Expert Equivalence Testing of Automated Neonatal Seizure Detection

이 논문은 불균형 데이터와 전문가 간 합의 등 신생아 발작 검출의 고유한 과제를 고려하여, 기존 평가 방식의 한계를 지적하고 균형 잡힌 지표, 민감도/특이도 등 필수 메트릭, 그리고 Fleiss Kappa 기반의 다수 전문가 터링 테스트를 포함한 엄격한 평가 프레임워크를 제안함으로써 임상 적용을 위한 AI 모델의 신뢰성 있는 검증을 촉구합니다.

Jovana Kljajic, John M. O'Toole, Robert Hogan + 1 more2026-03-06💻 cs

In-Training Defenses against Emergent Misalignment in Language Models

이 논문은 API 를 통한 파인튜닝 시 발생할 수 있는 돌발적 정렬 불일치 (EMA) 를 방지하기 위해 네 가지 훈련 중 규제 기법을 체계적으로 평가한 결과, 정렬된 모델과 오정렬된 모델 간의 퍼플렉시티 차이로 데이터를 선별하여 일반 지시 튜닝 데이터를 교차 학습하는 방식이 가장 효과적임을 밝혔습니다.

David Kaczér, Magnus Jørgenvåg, Clemens Vetter + 4 more2026-03-06💻 cs

Multi-Agent Reinforcement Learning in Intelligent Transportation Systems: A Comprehensive Survey

이 논문은 교통 신호 제어, 자율주행 차량 조정, 물류 최적화 등 지능형 교통 시스템 (ITS) 의 핵심 과제 해결을 위한 다중 에이전트 강화 학습 (MARL) 의 방법론, 적용 사례, 시뮬레이션 플랫폼 및 현실 세계 배포를 가로막는 주요 과제들을 체계적으로 조사하고 있습니다.

Rexcharles Donatus, Kumater Ter, Daniel Udekwe2026-03-06💻 cs

A Geometric Perspective on the Difficulties of Learning GNN-based SAT Solvers

이 논문은 그래프 리치 곡률을 기반으로 GNN 기반 SAT 솔버의 학습 어려움을 기하학적으로 설명하며, 난이도가 높은 SAT 인스턴스가 본질적으로 음의 곡률을 가지며 이로 인해 GNN 의 오버스쿼싱 현상이 발생하여 성능이 저하됨을 증명하고 곡률이 문제 복잡성과 일반화 오차를 예측하는 강력한 지표임을 실증적으로 확인합니다.

Geri Skenderi2026-03-06🔬 physics

New Insights into Optimal Alignment of Acoustic and Linguistic Representations for Knowledge Transfer in ASR

이 논문은 자동 음성 인식 (ASR) 에서 지식 전이를 위해 음향 및 언어 표현 간의 정렬을 검출 문제로 재해석하고, 불균형 최적 수송을 기반으로 한 새로운 정렬 모델을 제안하여 구조적 비대칭성과 불일치를 효과적으로 처리함으로써 ASR 성능을 향상시킨다는 것을 보여줍니다.

Xugang Lu, Peng Shen, Hisashi Kawai2026-03-06💻 cs

TabStruct: Measuring Structural Fidelity of Tabular Data

이 논문은 실제 데이터의 인과 구조를 알 수 없는 상황에서도 구조적 충실도와 기존 평가 지표를 종합적으로 분석할 수 있는 새로운 평가 지표인 '글로벌 유틸리티'를 제안하고, 29 개의 데이터셋과 13 개의 생성 모델을 대상으로 한 포괄적인 벤치마크 'TabStruct'를 구축하여 표제 데이터 생성 모델의 성능을 평가하는 프레임워크를 제시합니다.

Xiangjian Jiang, Nikola Simidjievski, Mateja Jamnik2026-03-06💻 cs

BabyHuBERT: Multilingual Self-Supervised Learning for Segmenting Speakers in Child-Centered Long-Form Recordings

이 논문은 40 개 이상의 언어로 된 1 만 3,000 시간 분량의 아동 중심 녹음 데이터를 기반으로 학습된 자기지도 학습 모델 'BabyHuBERT'를 제안하여, 기존 성인용 모델보다 다양한 언어 환경에서 아동과 성인의 음성을 구분하는 성능을 크게 향상시켰다고 요약할 수 있습니다.

Théo Charlot, Tarek Kunze, Maxime Poli + 3 more2026-03-06💻 cs

Diffusion-Based Impedance Learning for Contact-Rich Manipulation Tasks

이 논문은 Apple Vision Pro 를 통한 원격 조작으로 수집된 데이터를 기반으로 트랜스포머 기반 확산 모델을 활용해 외부 힘에 반응하여 임피던스 파라미터를 실시간으로 적응시키는 'Diffusion-Based Impedance Learning' 프레임워크를 제안하여, 복잡한 접촉 작업에서 정밀하고 안정적인 로봇 조작을 가능하게 합니다.

Noah Geiger, Tamim Asfour, Neville Hogan + 1 more2026-03-06💻 cs

Noise-to-Notes: Diffusion-based Generation and Refinement for Automatic Drum Transcription

이 논문은 드럼 자동 전사를 판별적 작업이 아닌 생성적 작업으로 재정의하고, 음악 기반 모델의 특징을 활용하여 온셋과 속도를 동시에 최적화하는 확산 기반 프레임워크 'Noise-to-Notes(N2N)'를 제안함으로써 여러 벤치마크에서 새로운 최고 성능을 달성했다고 요약할 수 있습니다.

Michael Yeung, Keisuke Toyama, Toya Teramoto + 2 more2026-03-06💻 cs

BridgeDrive: Diffusion Bridge Policy for Closed-Loop Trajectory Planning in Autonomous Driving

이 논문은 폐루프 자율주행 환경에서 안전하고 반응적인 궤적 계획을 위해 전진 및 역과정의 이론적 일관성을 보장하는 '브릿지드라이브 (BridgeDrive)'라는 새로운 앵커 기반 확산 브리지 정책을 제안하고, Bench2Drive 벤치마크에서 기존 최첨단 방법론보다 성공률을 크게 향상시킨 결과를 제시합니다.

Shu Liu, Wenlin Chen, Weihao Li + 7 more2026-03-06💻 cs