Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

이 논문은 약한 교사 모델의 불완전한 레이블로 훈련된 강한 학생 모델이 무작위 특징 리지 회귀 (RFRR) 를 통해 교사 모델의 스케일링 법칙을 능가하고, 심지어 교사 모델의 오차가 감소하지 않더라도 최소최대 최적 수렴 속도를 달성할 수 있음을 보임으로써 약한-to-강한 일반화의 잠재력을 규명합니다.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco Mondelli2026-03-09🤖 cs.LG

Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks

이 논문은 Llama-3.1-70B 와 405B 와 같은 밀집형 LLM 의 배포 시 텐서 병렬화 (TP) 가 지연 시간 최적화에, 파이프라인 병렬화 (PP) 가 처리량 최적화에 유리하며, 두 기법을 혼합하여 지연 시간과 처리량 간의 트레이드오프를 조절할 수 있음을 실증적으로 분석합니다.

Burak Topcu, Musa Oguzhan Cim, Poovaiah Palangappa, Meena Arunachalam, Mahmut Taylan Kandemir2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

이 논문은 무작위 내적 그래프 (RDPG) 에서 시계열 네트워크의 진화를 지배하는 미분방정식을 학습할 때 발생하는 게이지 자유도, 실현 가능성 제약, 궤적 복원 아티팩트 등 세 가지 근본적 장애물을 기하학적 프레임워크로 규명하고, 대칭적 역학이 게이지 모호성을 해결할 수 있음을 증명하여 통계적 어려움과 기하학적 구조가 불가분하게 연결되어 있음을 보여줍니다.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

이 논문은 AI 기반 기후 정보의 급속한 발전이 고사양 컴퓨팅과 데이터 인프라의 불균형으로 인해 남북 간 격차를 심화시킬 수 있음을 지적하며, 데이터 중심 접근법, 기후 디지털 공공 인프라 구축, 그리고 지식 공동 생산을 통해 이러한 불평등을 해소하고 진정한 시스템 회복력을 확보해야 한다고 주장합니다.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

본 논문은 라벨이 없는 타겟 도메인 데이터를 활용하여 합성 데이터로 학습된 감마 분광법 기반 방사성 동위원소 식별 모델의 실세계 일반화 성능을 향상시키는 비지도 도메인 적응 (UDA) 기법의 유효성을 입증하고, 특히 최대 평균 불일치 (MMD) 최소화를 통한 특징 정렬이 가장 일관된 성능 개선을 가져온다고 제시합니다.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

이 논문은 다중 목표 다단계 공급망 최적화 문제를 해결하기 위해, 소량의 데이터로도 다양한 작업에 일반화될 수 있도록 구조화된 하위 문제 분해와 파레토 기반 적응 전략을 결합한 새로운 메타 다목적 강화학습 프레임워크인 MIRACL 을 제안하고 그 우수성을 입증합니다.

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

이 논문은 기존 방법론들의 한계를 극복하고 결정론적 최적화와 확률적 샘플링을 통합하는 'Score-Guided Proximal Projection(SGPP)' 프레임워크를 제안하여, 사전 훈련된 스코어 필드를 활용한 정규 축소 속성을 통해 분포 외 입력을 데이터 매니폴드로 효과적으로 정렬하면서도 유연한 이미지 편집과 복원을 가능하게 합니다.

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

이 논문은 대형 언어 모델의 안전 메커니즘이 '위험 인식'과 '거부 실행'이라는 두 개의 분리된 기하학적 하위 공간으로 작동한다는 '분리된 안전 가설 (DSH)'을 제시하고, 이를 통해 거부 메커니즘을 선택적으로 무력화하는 새로운 공격 기법과 모델별 아키텍처 차이를 규명했습니다.

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

이 논문은 확률적 제약 하의 분산 확률적 최소 - 최대 최적화 문제를 해결하기 위해 제안된 새로운 1 차 Softmax-가중 스위칭 경사법을 통해, 부분 참여 환경에서도 기존 2 단계 방법론의 민감성과 진동 없이 최적성 및 실현성 보장을 위한 수렴 이론과 실험적 유효성을 입증합니다.

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

이 논문은 다중 에이전트 협력의 질을 평가할 때 기존 성과 기반 지표가 시간적 구조를 간과하여 협력 실패를 놓칠 수 있음을 지적하고, 이를 해결하기 위해 '완벽한 교대 (Perfect Alternation)'를 기준으로 한 새로운 시간 민감성 지표 (ALT) 를 제안하며, 이를 통해 학습된 정책이 전통적 지표에서는 높은 점수를 받지만 무작위 정책보다 협력 성능이 현저히 낮을 수 있음을 실증합니다.

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

이 논문은 대규모 언어 모델의 테스트 시간 적응을 위한 다수 샷 프롬프팅의 효과와 한계를 실증적으로 분석하여, 구조화된 작업에서는 유익하지만 개방형 생성 작업에서는 선택 전략에 민감하고 효과가 제한적일 수 있음을 규명했습니다.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG